Toetsingsprocedure 7: Variantieanalyse (ANOVA)
= Toetsing van meer dan 2 steekproeven: je toetst of de gemiddelden van meer
dan 2 onafhankelijke groepen (steekproeven) gelijk zijn (dus H0: µ1=µ2=µ3=…
t/m µk). Als deze nulhypothese wordt verworpen is er ten minste 1 groep met
een gemiddelde dat significant verschilt van de andere groepen. Het is een
parametrische techniek. Onafhankelijke variabele of factor is de categorische
variabele op basis waarvan we de groepen onderscheiden. Elke groep is een
soort onafhankelijke aselecte steekproef. De afhankelijke variabele (toets
variabele) moet een interval- of ratioschaal hebben.
Grand mean is het totale gemiddelde van alle waarnemingen ongeacht tot
welke groep ze horen.
Als de groepen gelijk zijn zouden de gemiddelden ervan dicht bij de grand mean
moeten liggen. De H0 zou dan niet moeten worden verworpen. Als de groepen
wel verschillen wordt de hypothese wel verworpen.
De totale steekproef bestaat uit k groepen. Groep wordt aangeduid met j en x j en
sj en totale standaarddeviatie is ST.
Kwadraatsommen: de berekening van de variantieanalyse is gebaseerd op de
variatie van waarnemingen. Hierbij maken we gebruik van kwadraatsommen =
de som van de gekwadrateerde afwijkingen van alle waarnemingen t.o.v. het
gemiddelde.
- Totale kwadraatsom SSt(otal) = de variatie van alle waarnemingen in de
steekproef
- Tussenkwadraatsom SSB(etween) = de verschillen tussen de groepen
- Binnenkwadraatsom SSW(ithin) = de verschillen binnen de groepen
SST = SSB + SSW Dus al SSb groot is is SSwiklein en andersom.
Door de kwadraatsommen (variatie) te delen door hun vrijheidsgraden krijgen we
de variantie of mean square (MS).
- Bij SSt is het aantal vrijheidsgraden df = n-1
- Bij SSb is het aantal vrijheidsgraden df = k-1 (k is het aantal verschillende
groepen)
- Bij SSw is het aantal vrijheidsgraden df = n-k
ANOVA-tabel:
K is hierin aantal groepen en n is het totaal aantal waarnemingen.
1
,Toetsingsgrootheid F: H0 wordt bij de variantieanalyse getoetst met de F-toets.
Toetsingsgrootheid F is de verhouding van de tussen- en binnenkwadraatsom. Bij
grote F wordt meerendeel van de variantie veroorzaakt door verschillen tussen
de groepen (MSb>MSw) H0 dat gemiddelden gelijk zijn wordt verworpen. Bij
kleine F wordt aanzienlijk deel van de variantie veroorzaakt door verschillen
binnen de groepen, H0 niet verwerpen.
Voorbeeld:
Vraag: Verschilt gemiddelde kamerhuur per m2 in 3 studentensteden?
Procedure:
1. Vooronderstellingen
• Drie (of meer) onafhankelijke aselecte steekproeven
• Meetschaal: groepen: onderscheiden door categorische variabele;
toetsvariabele: interval/ratio
• Toetsvariabele normaal verdeeld voor elke groep
• als alle groepen ≥ 30: OK
• als groepen < 30: OK als groepen (ongeveer) even groot zijn
• anders: controleren
• Populaties hebben gelijke varianties (‘homogeniteit’)
• als alle groepen (ongeveer) even groot: OK
• zo niet: vuistregel F = s2max / s2min< 4
2. Hypothesen
• H0: μ1 = μ2 = μ3 (dus gemiddelden zijn gelijk)
• HA: gemiddelden zijn niet allemaal gelijk (ten minste 1 groep
verschilt)
! Let hierbij op want misschien zijn 2 gemiddelden wel gelijk maar 1 verschilt, het
is dus niet μ1 ≠ μ2 ≠ μ3 want misschien wel μ1 = μ2 ≠ μ3
3. Kritiek gebied:
• Tabel E: df=k-1 =2 (kolom) en df=n-k=27 (rij) → F kr
(2,27) = 3,49
• Alleen H0 verwerpen bij groter dan/gelijk aan 3,49
4. Rekenformules:
want ssb = sst - ssw
V
2
, 5. Conclusie:
F in kritiek gebied dus H0 verwerpen met 95% betrouwbaarheid.
Gemiddelde kamerhuren in de steden verschillen significant.
Effect size:
Eta-squared = aandeel verklaarde variantie agv. de groepsindeling
Interpretatie:
Ø Groot effect: 25% van de variantie van de kamerhuur wordt verklaard door
de verschillen tussen de steden.
Anova met SPSS !!
Voor we de variantieanalyse gaan uitvoeren, moeten we eerst een beeld krijgen
van de kenmerken van de steekproeven (groepen). Hiervoor berekenen we de
statistische maten. Tabel Beschrijvende statistiek: knop Options - Descriptives
aanzetten V
In de tabel zie je de groepsomvang, het gemiddelde en de standaarddeviatie van
de verschillende groepen. Je ziet dat de groepen even groot zijn (normaliteit √ en
homogeniteit √). Uit de betrouwbaarheidsintervallen is ook te zien dat de
populatiegemiddelde van amsterdam en utrecht nauwelijks verschillen, maar dat
groningen hiervan afwijkt. Ook zie je dat in de grafiek van groepsgemiddelden.
Om de homogeniteit toch te checken kan je een levene’s test doen (test of
homogeneity of variances). Hiermee test je of de varianties gelijk zijn. Verworpen
als p≤0,5.
! SPSS uitvoer ANOVA – voorbeeld kamerhuur
Compare Means, One-way ANOVA
In de ANOVA-tabel staan de kwadraatsommen (Sum of Squares), vrijheidsgraden
(df), varianties (Mean Squares) en de toetsingsgrootheid F met
overschrijdingskans p (Sig.).
3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Maudv1. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €3,99. Je zit daarna nergens aan vast.