Toetsingsprocedure 7: Variantieanalyse (ANOVA)
= Toetsing van meer dan 2 steekproeven: je toetst of de gemiddelden van meer
dan 2 onafhankelijke groepen (steekproeven) gelijk zijn (dus H0: µ1=µ2=µ3=…
t/m µk). Als deze nulhypothese wordt verworpen is er ten minste 1 groep met
een gemiddelde dat significant verschilt van de andere groepen. Het is een
parametrische techniek. Onafhankelijke variabele of factor is de categorische
variabele op basis waarvan we de groepen onderscheiden. Elke groep is een
soort onafhankelijke aselecte steekproef. De afhankelijke variabele (toets
variabele) moet een interval- of ratioschaal hebben.
Grand mean is het totale gemiddelde van alle waarnemingen ongeacht tot
welke groep ze horen.
Als de groepen gelijk zijn zouden de gemiddelden ervan dicht bij de grand mean
moeten liggen. De H0 zou dan niet moeten worden verworpen. Als de groepen
wel verschillen wordt de hypothese wel verworpen.
De totale steekproef bestaat uit k groepen. Groep wordt aangeduid met j en x j en
sj en totale standaarddeviatie is ST.
Kwadraatsommen: de berekening van de variantieanalyse is gebaseerd op de
variatie van waarnemingen. Hierbij maken we gebruik van kwadraatsommen =
de som van de gekwadrateerde afwijkingen van alle waarnemingen t.o.v. het
gemiddelde.
- Totale kwadraatsom SSt(otal) = de variatie van alle waarnemingen in de
steekproef
- Tussenkwadraatsom SSB(etween) = de verschillen tussen de groepen
- Binnenkwadraatsom SSW(ithin) = de verschillen binnen de groepen
SST = SSB + SSW Dus al SSb groot is is SSwiklein en andersom.
Door de kwadraatsommen (variatie) te delen door hun vrijheidsgraden krijgen we
de variantie of mean square (MS).
- Bij SSt is het aantal vrijheidsgraden df = n-1
- Bij SSb is het aantal vrijheidsgraden df = k-1 (k is het aantal verschillende
groepen)
- Bij SSw is het aantal vrijheidsgraden df = n-k
ANOVA-tabel:
K is hierin aantal groepen en n is het totaal aantal waarnemingen.
1
,Toetsingsgrootheid F: H0 wordt bij de variantieanalyse getoetst met de F-toets.
Toetsingsgrootheid F is de verhouding van de tussen- en binnenkwadraatsom. Bij
grote F wordt meerendeel van de variantie veroorzaakt door verschillen tussen
de groepen (MSb>MSw) H0 dat gemiddelden gelijk zijn wordt verworpen. Bij
kleine F wordt aanzienlijk deel van de variantie veroorzaakt door verschillen
binnen de groepen, H0 niet verwerpen.
Voorbeeld:
Vraag: Verschilt gemiddelde kamerhuur per m2 in 3 studentensteden?
Procedure:
1. Vooronderstellingen
• Drie (of meer) onafhankelijke aselecte steekproeven
• Meetschaal: groepen: onderscheiden door categorische variabele;
toetsvariabele: interval/ratio
• Toetsvariabele normaal verdeeld voor elke groep
• als alle groepen ≥ 30: OK
• als groepen < 30: OK als groepen (ongeveer) even groot zijn
• anders: controleren
• Populaties hebben gelijke varianties (‘homogeniteit’)
• als alle groepen (ongeveer) even groot: OK
• zo niet: vuistregel F = s2max / s2min< 4
2. Hypothesen
• H0: μ1 = μ2 = μ3 (dus gemiddelden zijn gelijk)
• HA: gemiddelden zijn niet allemaal gelijk (ten minste 1 groep
verschilt)
! Let hierbij op want misschien zijn 2 gemiddelden wel gelijk maar 1 verschilt, het
is dus niet μ1 ≠ μ2 ≠ μ3 want misschien wel μ1 = μ2 ≠ μ3
3. Kritiek gebied:
• Tabel E: df=k-1 =2 (kolom) en df=n-k=27 (rij) → F kr
(2,27) = 3,49
• Alleen H0 verwerpen bij groter dan/gelijk aan 3,49
4. Rekenformules:
want ssb = sst - ssw
V
2
, 5. Conclusie:
F in kritiek gebied dus H0 verwerpen met 95% betrouwbaarheid.
Gemiddelde kamerhuren in de steden verschillen significant.
Effect size:
Eta-squared = aandeel verklaarde variantie agv. de groepsindeling
Interpretatie:
Ø Groot effect: 25% van de variantie van de kamerhuur wordt verklaard door
de verschillen tussen de steden.
Anova met SPSS !!
Voor we de variantieanalyse gaan uitvoeren, moeten we eerst een beeld krijgen
van de kenmerken van de steekproeven (groepen). Hiervoor berekenen we de
statistische maten. Tabel Beschrijvende statistiek: knop Options - Descriptives
aanzetten V
In de tabel zie je de groepsomvang, het gemiddelde en de standaarddeviatie van
de verschillende groepen. Je ziet dat de groepen even groot zijn (normaliteit √ en
homogeniteit √). Uit de betrouwbaarheidsintervallen is ook te zien dat de
populatiegemiddelde van amsterdam en utrecht nauwelijks verschillen, maar dat
groningen hiervan afwijkt. Ook zie je dat in de grafiek van groepsgemiddelden.
Om de homogeniteit toch te checken kan je een levene’s test doen (test of
homogeneity of variances). Hiermee test je of de varianties gelijk zijn. Verworpen
als p≤0,5.
! SPSS uitvoer ANOVA – voorbeeld kamerhuur
Compare Means, One-way ANOVA
In de ANOVA-tabel staan de kwadraatsommen (Sum of Squares), vrijheidsgraden
(df), varianties (Mean Squares) en de toetsingsgrootheid F met
overschrijdingskans p (Sig.).
3
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Maudv1. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.29. You're not tied to anything after your purchase.