DE VARIABILITEITSMATEN
1 VARIABILITEITSMATEN (SPREIDINGSMATEN)
VARIABILITEITSMATEN: geven aan hoe verspreid de data is.
VOORWAARDE VOOR VARIABILITEIT:
- Meetniveau is van belang:
- Minimaal: ordinaal
Ordinaal: variabiliteit via interkwartielafstand
Interval/ratio: meerdere variabiliteitsmaten
1.1 RANGE (OF BEREIK)
RANGE = het verschil tussen de grootste en de kleinste waarden.
- Kan ook kwalitatief (helemaal niet akkoord – helemaal akkoord)
- Meetniveau: minstens ordinaal
- Voordeel: simpel
- Nadeel: geeft weinig informatie omdat het alleen naar twee waarden kijkt
Voorbeeld 1: In de dataset [2, 4, 6, 10] is de range 10 - 2 = 8. Maar als de dataset [2, 3,
3, 3, 10] is, blijft de range nog steeds 8, ondanks de grote concentratie van waarden rond
3.
Voorbeeld 2: In de dataset [zeer ontevreden, ontevreden, neutraal, tevreden, zeer
tevreden] is de range zeer tevreden en zeer ontevreden.
Voorbeeld 3: In de dataset [-1, 0, 1365, 165] is de range 1365 – (-1) = 1366.
1.2 INTERKWARTIELAFSTAND (Q)
INTERKWARTIELAFSTAND = het verschil tussen het 25ste en 75ste percentiel.
Hiermee meet je de spreiding van de middelste 50% van de data.
- Meetniveau: minstens ordinaal
- Q = Q3 – Q1 = Pc 75 – Pc 25
- Hoe meer verschil tussen de uitslagen, hoe groter Q.
Boxplot: De interkwartielafstand wordt vaak visueel weergegeven in een boxplot, die
ook de symmetrie en eventuele uitschieters van de verdeling laat zien.
Q = middelste 50%
25% scoorde lager of evenveel
25% scoorde hoger of
evenveel
Middelste streep = mediaan =
Voorbeeld: In de dataset [3,5,7,8,10,12,15,18,20] is het eerste kwartiel Q1 = 7 en het
derde kwartiel Q3 = 15 (weten we door berekening cumulatieve proportie). De
, interkwartielafstand is dan Q = Q3 − Q1 = 15 – 7 = 8. Dit laat zien dat de middelste 50%
van de waarden een spreiding van 8 heeft, ongeacht de aanwezigheid van uitschieters
zoals 3 en 20.
1.3 GEMIDDELDE AFWIJKINGSSCORE (OF DEVIATIESCORE)
GEMIDDELDE AFWIJKINGSSCORE = het verschil tussen elke score en het
gemiddelde. De som van deze afwijkingen is altijd gelijk aan nul (zonder gebruik van
absolute waarden).
- Stap 1: gemiddelde berekenen
- Stap 2: afwijkingsscore = score – gemiddelde score
- Stap 3: som van de afwijkingsscores = 0
- Stap 4: gemiddelde van de afwijkingsscores (optioneel) = 0
Meetniveau: minstens interval
Eigenschappen rekenkundig gemiddelde:
- De som van de afwijkingen van de scores tot het gemiddelde is gelijk aan nul.
Voorbeeld: Bij de dataset [2, 4, 6], is het gemiddelde (2 + 4 + 6) : 3 = 4. De
afwijkingsscores zijn 2 – 4 = -2, 4 – 4 = 0, en 6 – 4 = 2. Als je deze optelt, krijg je (-2) + 0
+ 2 = 0. Als je hier het gemiddelde van berekent, krijg je ((-2) + 0 + 2) : 3 = 0.
1.4 GEMIDDELDE ABSOLUTE AFWIJKINGSSCORE
GEMIDDELDE ABSOLUTE AFWIJKINGSSCORE = de gemiddelde afwijking van elke
score t.o.v. het gemiddelde, maar zonder negatieve waarden mee te rekenen.
- Stap 1: gemiddelde berekenen
- Stap 2: afwijkingsscore = score – gemiddelde score
- Stap 3: absolute afwijkingen berekenen
- Stap 4: gemiddelde van de absolute afwijkingen berekenen
Meetniveau: minstens interval
Eigenschappen rekenkundig gemiddelde:
- De som van de afwijkingen van de scores tot het gemiddelde is gelijk aan nul.
Voorbeeld: Bij de dataset [2, 4, 6], is het gemiddelde (2 + 4 + 6) : 3 = 4. De
afwijkingsscores zijn 2 – 4 = -2, 4 – 4 = 0, en 6 – 4 = 2. Hun absolute waarden zijn 2, 0,
en 2. Wat een gemiddelde afwijking van (2 + 0 + 2) : 3 = 1,33 geeft. De meeste scores
bevinden zich tussen 2,67 (4 – 1,33) en 5,33 (4 + 1,33).
1.5 VARIANTIE (S²)
VARIATIE = de gemiddelde gekwadrateerde afwijking van het gemiddelde. Dit geeft
een idee van de spreiding, maar de uitkomst is gekwadrateerd, wat interpretatie lastiger
maakt.
- Stap 1: gemiddelde berekenen
- Stap 2: afwijkingsscore = score – gemiddelde score
- Stap 3: afwijkingsscores kwadrateren
- Stap 4: som van de afwijkingen
- Stap 5: deel door n of n – 1
Formule S² van de steekproef (gegeven op examen):