1.5 & 1.6 “Variantieanalyse”
Wat is variantie(analyse)
Variantieanalyse is een statistische
analysetechniek die wordt gebruikt om na
te gaan of er verschillen zijn tussen de
gemiddelden van meer dan twee groepen.
Middels een variantieanalyse kun je
antwoord geven op vragen als ‘Bestaan er
verschillen in het aantal operaties bij
rughernia’s tussen Friesland, Zuid-Holland
en Limburg?’ en ‘Zijn er verschillen in het
aantal consulten tussen artsen die worden
betaald volgens een systeem van ‘fee-for-
service’, salaris en ‘capitation’?’.
• Uitbreiding t-toets voor twee onafhankelijke groepen
• Variantieanalyse is verschillenanalyse
• Variantie als maat voor spreiding rondom gemiddelde
• Variantie is de standaardafwijking in het kwadraat
• Notatie
• Populatie: σ en σ2
• Steekproef: S en S2
berekenen van variantie steekproef
S=steekproef
N= aantal waarnemingen
Yi= een waarneming die je
pakt
Y= gemiddelde
waarnemingen)
Waarom zou je een variantieanalyse willen uitvoeren?
• Doel: uitspraak doen over de vraag of de
gemiddelden van een zekere variabele Y in
meer dan 2 populaties aan elkaar gelijk
zouden kunnen zijn.
• Probleem: populatiegemiddelden zijn
onbekend
• Oplossing: analyse van verschillen
(=variantie!) van Y in steekproeven uit de
afzonderlijke populaties
,We gebruiken informatie uit de steekproef om iets te kunnen zeggen over de populatie.
Wanneer kun en mag je variantieanalyse toepassen?
• Afhankelijk van onderzoeksvraag
• >2 groepen vergelijken
• Y is een kwantitatieve variabele (minimaal intervalniveau): bijv. Genezingsduur, aantal
euro’s besteed aan zorg, aantal behandelingen
De factor is een kwalitatieve variabele (nominaal meetniveau): bijv. medicijn A, B en C
• Variantieanalyse wordt relatief veel gebruikt binnen de medische wetenschap
(experimentele setting): causaliteit
Waarom geen t-toetsen uitvoeren en paarsgewijs gemiddelden vergelijken?
• De kans op het vinden van een statistisch significant verschil stijgt met het aantal
onderlinge vergelijkingen.
• Stel je wilt 15 steekproeven onderling vergelijken, dat is erg veel, dan moet je 105 t-
toetsen uitvoeren, elke keer met 5% kans om H0 ten onrechte te verwerpen. Je
concludeert dat er significante verschillen zijn terwijl dat in de praktijk helemaal niet zo
is. Als je meer dan 2 groepen gaat vergelijken ga je dus een variantieanalyse
gebruiken.
• Dat betekent naar verwachting: 0,05 x 105 = 5 foute conclusies
Wanneer kun en mag je variantieanalyse toepassen?
Drie voorwaarden:
1. (Populaties zijn normaal verdeeld)
2. (Steekproeven hebben gelijk aantal waarnemingen) het moet dus eerlijk verdeeld worden.
Elke groep evenveel. q
3. Populaties hebben gelijke variantie
Vuistregel: Grootste standaardafwijking is niet meer dan 2x de kleinste standaardafwijking
Toets voor gelijkheid varianties
Stap 1: Wat is de nulhypothese en de Stap 2: Wat is de toetsingsgrootheid en
alternatieve hypothese? verdeling?
H0: σ12 = σ22 = … σa2 (is gelijk aan) Toets van Hartley Hmax = S2max / S2min met Ha,
Ha: σ12 ≠ σ22 ≠ … σa2 (is niet gelijk aan) m-1, α verdeling
• a=aantal groepen • S2max is de grootste en S2min de kleinste
• Op het moment als je zegt “is gelijk variantie in de steekproeven
aan” 0, dan toets je of ze gelijk zijn • Heb je standaardafwijking (S)?
aan nul en dat is niet de voorwaarde Kwadrateer en je hebt de variantie!
die je wil toetsen
Stap 3: Wat is de kritieke grens? Stap 4: Wat is de conclusie?
Opzoeken in Hmax–tabel: Ha, m-1, α Gevonden waarde < kritieke grens? H0 niet
• a = aantal groepen verwerpen
• m = aantal waarnemingen per groep Gevonden waarde > kritieke grens? H0 wel
• α = significantieniveau (e.g. 0,05) verwerpen
H0: σ12 = σ22 = … σa2
Verwerpen van H0 gunstig of niet?
Als ze niet aan elkaar gelijk zijn dan ga je H0
verwerpen en het verwerpen van H0 is niet
gunstig. Want een van de voorwaardes van
een variantieanalyse is dat de varianties
gelijk zijn.
Geen gelijke varianties… Wat nu?!
• Lang leve SPSS, SAS, Stata, R, …!
• Non-parametrische toetsen
• Data transformaties
, • Voert te ver voor dit vak
Tijd voor een voorbeeld!
We hebben gezondheidsverbetering Y in de vorm van 3 soorten behandelingen bij 30
patiënten met een bepaalde ziekte.
Behandeling Aantal in Gemiddelde Variantie
steekproef
1 10 2,92 (=1) 6,25 (=S12)
2 10 6,58 (=2) 11,36 (=S22)
3 (=a) 10 (=m) 8,20 (=3) 5,02 (=S32)
Totaal 30 (=n=a*m) 5,90 (=
Kernvraag: Zijn er statistisch significante verschillen in gezondheidsverbetering tussen de drie
soorten behandelingen?
ANOVA met 1 factor: 1 variabele op basis waarvan je groepen kunt indelen
De F-waarde als ‘test-statistic’
• Statistisch significante
verschillen? ‘Test-statistic’
nodig
• F = variantie tussen
groepen (between) /
variantie binnen groepen
(within)
• ANOVA tabel is een heel
handig hulpmiddel om
variantieanalyses
gestructureerd aan te
pakken en F te bepalen.
Probleem: We weten de individuele waarden niet… Hoe nu verder?
Kunnen we GKS(binnen) wel berekenen?
Kunnen we GKS(binnen) wel berekenen?
Ja! Deze kunnen we schatten op basis van de varianties in de 3 steekproeven
GKS(binnen) = (S12 + S22 + S32) / aantal varianties
= (6,25 + 11,36 + 5,02) / 3
= 7,543
Kunnen we KS(binnen) nu wel berekenen?
GKS(binnen) = KS(binnen) / degrees of freedom
KS(binnen) = GKS(binnen) x degrees of freedom
= 7,543 x 27
= 203,670
Bereken F
F = GKS(tussen) / GKS(binnen)
= 73,,543
= 9,7
Bron van Degrees of Kwadraatsom Gemiddelde F
variantie freedom (KS) kwadraatsom
(df) (GKS)
Tussen 2 (a-1) 146,328 (SOM 73,164 = 9,7 =
groepen (Yj-Y)2 (KS(T)/d.o.f) (gks/gks)
Binnen 27 (n-a) 203,670 (Yi-Yj)2 7,543 =
groepen (KS(B)/d.o.f)
of GKS x d.o.f
Leuk
Of (S12 + S22 + S32) /
zo’n
aantal varianties
Totaal 29 (n-1) 349,998
tabel, maar wat moet je er mee? (1)
Terug naar de kernvraag: Zijn er statistisch significante verschillen in
gezondheidsverbetering tussen de drie soorten behandelingen?
Stap 1: Wat is de nulhypothese en alternatieve hypothese?
H0: µ1 = µ2 = µ3
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller elinehaas. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $11.26. You're not tied to anything after your purchase.