Statistische methoden – Tentamen 2
H8 Variantieanalyse .
In dit hoofdstuk behandelen we variantieanalyse of ANOVA (Analysis of Variance). Met de
variantieanalyse kunnen we toetsen of de gemiddelden van meer dan twee onafhankelijke
groepen gelijk zijn. De variantieanalyse is een parametrische techniek. Net als bij de t-toets
worden de groepen onderscheiden op basis van een categorische variabele. Deze
groepsvariabele wordt ook wel de onafhankelijke variabele of factor genoemd.
Met de variantieanalyse wordt getoetst of de populatiegemiddelden van alle (k) groepen aan
elkaar gelijk zijn. De nulhypothese is dus: H0 : µ1 = µ2 = µ3 = … = µk. Als de nulhypothese
wordt verworpen, is er minstens één groep met een gemiddelde dat significant verschilt van
de overige groepen.
Voorbeeld waarbij een variantieanalyse wordt toegepast:
* We willen onderzoeken of er verschillen bestaan in gemiddeld eindexamencijfer tussen de
vier VWO-profielen (C&M, E&M, N&G en N&T). We trekken een aselecte steekproef van
bijvoorbeeld 25 scholen, en vervolgens trekken we op deze scholen een aselect aantal
eindexamenleerlingen (getrapte steekproef). We delen de scholieren in naar profiel en
toetsen met een variantieanalyse of er verschillen zijn tussen de gemiddelde
eindexamencijfers.
8.1 Variantieanalyse: principe .
Bij de variantieanalyse wordt getoetst of de gemiddelden van verschillende groepen aan
elkaar gelijk zijn. We onderscheiden de steekproefgemiddelden en de Grand Mean. De
Grand Mean is het totale gemiddelde van alle waarnemingen, ongeacht tot welke groep ze
behoren. De Grand Mean wordt aangeduid met x̄t. Indien de groepen gelijk zijn verwachten
we dat de steekproefgemiddelden niet veel van elkaar verschillen en dicht bij de Grand Mean
liggen. De nulhypothese zal dan niet worden verworpen. Indien de groepen verschillen,
zullen de steekproefgemiddelden ook sterk verschillen, en liggen ze relatief ver van de
Grand Mean. In dat geval wordt de nulhypothese verworpen.
Kwadraatsommen
De berekening van de variantieanalyse is gebaseerd op de variatie tussen de
waarnemingen. We maken daarbij gebruik van de kwadraatsommen of Sum of squares.
De kwadraatsom is de som van gekwadrateerde afwijkingen van alle waarnemingen ten
opzichte van het gemiddelde. De totale kwadraatsom is de totale variatie van alle
waarnemingen in de steekproef. We kunnen de totale kwadraatsom uitsplitsen in twee
componenten:
- tussenkwadraatsom (Sum of squares between).
- binnenkwadraatsom (Sum of squares within).
SStotal = SSbetween + SSwithin
De totale kwadraatsom is de som van de gekwadrateerde afwijkingen van alle
waarnemingen ten opzichte van het totale gemiddelde. De tussenkwadraatsom is de som
van de gekwadrateerde afwijkingen van alle groepsgemiddelden ten opzichte van het totale
gemiddelde, gewogen voor het aantal waarnemingen in elke groep. Het geeft dus de
verschillen tussen groepen aan. Indien de groepen gelijk zijn, zullen de groepsgemiddelden
ook (praktisch) gelijk zijn, en is de tussenkwadraatsom gering.
,Wanneer het andersom is wordt een relatief groot deel van de totale variatie dan statisch
‘verklaard’ door de groepsindeling. De binnenkwadraatsom is de spreiding van alle
waarnemingen binnen elke groep. Dit is de ruis (error), ofwel de variatie die niet veroorzaakt
wordt door de verschillen tussen groepen. De binnenvariatie wordt ook wel de
‘onverklaarde’ variatie genoemd. De binnenkwadraatsom is de som van de
gekwadrateerde afwijkingen van alle waarnemingen ten opzichte van hun
groepsgemiddelde.
Totale, tussen- en binnenvariantie.
Door de kwadraatsommen te delen door hun vrijheidsgraden (df = n-1) krijgen we de
variantie of Mean Square (MS).
ANOVA-tabel berekening F-waarde (deze krijg je op de toets!).
Toetsingsgrootheid F
Bij de variantieanalyse wordt de nulhypothese getoetst met een F-toets. De
toetsingsgrootheid F is de verhouding tussen de tussen- en binnenkwadraatsom. Als de F-
waarde relatief groot is, wordt het merendeel van de variantie veroorzaakt door het verschil
tussen groepen (MSB > MSW). We verwerpen dan de nulhypothese dat de
groepsgemiddelden gelijk zijn. Als de F-waarde relatief klein is, wordt een aanzienlijk deel
van de variantie veroorzaakt door de verschillen binnen de groepen. De nulhypothese wordt
dan niet verworpen.
Rekenformules (deze krijg je op de toets!)
Totale kwadraatsom: SST = S2t(n-1)
Binnen kwadraatsom: SSW = ∑S2j(nj-1) (nj = De groepsomvang)
Tussen kwadraatsom: SSB = SST - SSW
Vooronderstellingen bij de variantieanalyse: (niet voldaan? Kruskal-Wallis toets).
1. De steekproeven zijn aselect en onafhankelijk.
2. De groepen worden onderscheiden op basis van een categorische variabele. De
toetsvariabele heeft een ratio- of intervalschaal.
3. De toetsvariabele is normaal verdeeld voor iedere groep.
→ Centrale limiet stelling: ni > 30 → Anders technieken paragraaf 5.9.
→ Variantieanalyse is een robuuste techniek. Als de groepen (ongeveer) even groot zijn,
wordt voldaan aan de voorwaarde van normaliteit!
4. Gelijke populatievarianties (homogeniteit).
→ Handmatig: Fmax < 4 (grootste gedeeld door de kleinste variantie).
→ SPSS: Levene’s test met Homogeneity of variance test.
→ Variantieanalyse is een robuuste techniek. Als de groepen (ongeveer) even groot zijn,
wordt voldaan aan de voorwaarde van homogeniteit!
,8.2 Variantieanalyse: voorbeeld .
In een onderzoek naar de huisvestingssituatie van studenten werd in drie studentensteden,
Groningen, Amsterdam en Utrecht, een aselecte steekproef getrokken van elk 10
studentenkamers. Van deze 30 kamers werd de kamerhuur en kameromvang vastgesteld.
Om de kamers vergelijkbaar te maken werd de kamerhuur per vierkante meter berekend. De
onderzoekers willen weten of de gemiddelde kamerhuur per vierkante meter in de drie
steden verschilt.
* Omdat het steekproefgegevens betreft, zijn de standaarddeviaties berekend door te delen door n-1
Vraag:
Zijn de gemiddelde kamerhuren (per m2) in Groningen, Utrecht en Amsterdam aan elkaar
gelijk of bestaat er een significant verschil tussen de drie steden?
1. Vooronderstellingen
* De steekproeven (groepen) zijn aselect en onafhankelijk.
* De groepen worden onderscheiden op basis van een categorische variabele. De
toetsvariabele heeft een interval- of ratioschaal.
* De toetsvariabele is normaal verdeeld voor iedere groep.
Omdat de groepen even groot zijn wordt aan deze voorwaarde voldaan.
* De populaties hebben gelijke varianties (homogeniteit).
Omdat de groepen even groot zijn wordt aan deze voorwaarde voldaan.
Indien de groepen niet even groot zijn, kan je de homogeniteit checken met Fmax < 4.
Fmax = (7,,32) = 2,7.
2. Hypothesen
H0: µ1 = µ2 = µ3.
HA: De populatiegemiddelden zijn niet allemaal gelijk (verworpen wanneer ten minste één
groepsgemiddelde verschilt van de overigen).
, 3. Significantieniveau en kritiek gebied
* Significantieniveau: α = 0,05.
* Df1 = k-1 = 3-1 = 2 (k = het aantal onderscheidende groepen, in dit geval 3).
* Df2 = n-k = 30-3 = 27 (n = aantal personen die meedoen).
* Tabel E → 27 staat er niet in dus we kiezen voor de veiligheid 20.
F (2,27) = 3,49.
* Altijd een éénzijdige verdeling, met het kritieke gebied rechts. De nulhypothese wordt dus
verworpen als F≥3,49.
4. Berekening toetsingsgrootheid
SST = sT2 (n − 1) = 6,342 29 = 1166
SSw = s 2j (n j − 1) = 4,32 9 + 5,32 9 + 7,12 9 = 873
SSB = 1166 − 873 = 293
Tabel invullen:
Kwadraatsommen Vrijheidsgraden Variantie Toetsingsgrootheid
(SS) df MS = SS/df
Tussen SSB = 293 k-1 = 3-1 = 2 MSB = 293/2 F = 147/32 = 4,6
= 147
Binnen SSW = 873 n-k = 30-3 = 27 MSW =
873/27 = 32
Totaal SST = 1166 n -1 = 29
5. Conclusie
* Toetsingsgrootheid F ligt in het kritieke gebied.
* Nulhypothese verwerpen met 95% betrouwbaarheid.
* De gemiddelde kamerhuren (per m2) verschillen significant tussen de drie studentensteden.
6. Effect size
SSB 293
2 = = = 0,25
SST 1166
Deze maat geeft het aandeel van de variantie afhankelijke variabele dat statistisch wordt
verklaard door de verschillen tussen de groepen.
25% van de variantie van de kamerhuur wordt verklaard door de verschillen tussen
studentensteden; een sterk effect.
Zie bijlage op de toets → Eta = √0,25 = 0,5 → Sterk effect.