Chapter 12
Introduction to Analysis Variance
12.1 Introduction
Analyse van de variantie (ANOVA) is een hypothese-testende procedure
die wordt gebruikt om verschillen tussen de gemiddeldes van twee of
meer behandelingen (of populaties) te evalueren. ANOVA gebruikt
steekproefgegevens als basis voor het trekken van algemene conclusies
over populaties. Het doel van de analyse is om vast te stellen of het
verschil tussen gemiddeldes dat is geobserveerd onder de steekproeven
genoeg bewijs levert om te concluderen dat er gemiddeldeverschillen zijn
tussen de populaties. We moeten beslissen tussen twee interpretaties:
1. Er zijn echt geen verschillen. Het geobserveerde verschil is
veroorzaakt door willekeurige, onsystematische factoren (sampling
error).
2. De populaties of behandelingen hebben echt verschillende
gemiddeldes, en deze zijn verantwoordelijk voor het veroorzaken
van systematische verschillen tussen de steekproefgemiddelden.
Deze corresponderen met de twee hypotheses.
Wanneer een onderzoeker een niet-gemanipuleerde variabele gebruikt om
groepen aan te wijzen, wordt de variabele een quasionafhankelijke
variabele genoemd geslacht, leeftijd. In de context van ANOVA wordt
een (quasi)onafhankelijke variabele een factor genoemd.
In ANOVA, de variabele ((quasi)onafhankelijke), die de groepen die
worden vergeleken aanwijst wordt een factor genoemd.
De individuele groepen of behandelingscondities die worden gebruikt om
en factor te vormen worden de levels van de factor genoemd. Bij een
onderzoek dat de prestatie onder 3 verschillende condities meet 3
levels van de factor.
De individuele condities of waarden die de factor opmaken worden de
levels van de factor genoemd.
ANOVA kan worden gebruikt bij zowel een onafhankelijke meting of een
herhaalde meting.
Onafhankelijk er is een aparte groep participanten voor elk van de
behandelingen of populaties die worden vergeleken.
,Herhaald dezelfde groep wordt getest in alle verschillende
behandelingscondities.
Een onderzoek dat twee factoren gebruikt, een onafhankelijke meting
factor en een herhaalde meting factor:
1. Factor 1: Therapietechniek. Een aparte groep wordt gebruikt voor
elke techniek
2. Factor 2: Tijd. Elke groep wordt getest op 3 verschillende tijden
TIME
Before After 6 Months
Therapy Therapy After
Therapy
Therapy Therapy 1
Technique (Group 1)
Therapy 2
(Group 2)
In dit geval zou ANOVA zowel de verschillen tussen de gemiddeldes tussen
twee therapieën als tussen de scores verkregen op verschillende tijden
evalueren.
Een onderzoek dat twee factoren combineert twee-factoren
((quasi)onafhankelijk) ontwerp of factorial ontwerp.
H0: µ1 = µ2 = µ3
Dus geen effect gemiddeldes gelijk.
H1: er is ten minste één verschil in gemiddeldes tussen de populaties
Soms geeft de onderzoeker wel een aantal voorbeelden van alternatieve
hypotheses.
Bv. H1: µ1 = µ3, maar µ2 is anders.
De toetsstatistiek voor ANOVA is erg gelijk aan de onafhankelijke meting
t-statistiek. Voor de t-statistiek berekenen we eerst de standaardfout, die
meet hoeveel verschil er wordt verwacht tussen de twee
steekproefgemiddeldes, wanneer er geen behandelingseffect is.
h et versc hil verwac h t mt geen be h andelingseffect
standaardfout ¿
t= verkregen versc h il tussen de twee steekproefgemiddeldes
¿
,Bij meerdere gemiddeldes, zoals bij ANOVA, moet je de variantie
gebruiken om de grootte van de verschillen tussen de
steekproefgemiddeldes te definiëren en meten.
Variantie s2= som van gekwadrateerde deviaties, deel je door aantal (N).
variantie ( versc hillen ) tussende steekproefgemiddelden
F= variantie ( versc h illen ) verwac h t bij geen be h andelingseffect
Zelfde structuur als t-statistiek, alleen gebaseerd op variantie.
Numerator teller bovenste.
Alpha level stelt het risico van een Type I error vast.
Een enkel experiment vereist vaak meerdere hypothesetoesten om alle
verschillen tussen de gemiddeldes te evalueren. Hoe meer toetsen, hoe
meer kans op een Type I error. Daarom maken onderzoekers vaak
onderscheid tussen testwise alphalevel en de experimentwise alphalevel.
Testwise het alphalevel dat je selecteert voor elke individuele
hypothesetoets.
Experimentwise de totale waarschijnlijkheid van een Type I error
opgeteld van alle aparte testen in een experimenten.
De testwise alpha level is het risico van een Type I error, of alpha level,
voor een individuele hypothesetoets.
Wanneer een experiment verschillende hypothesetoetsen bevat, is de
experimentwise alpha level de totale waarschijnlijkheid van een Type I
error dat is opgeteld van alle individuele testen in een experiment.
Typisch, de experimentwise alpha level is in hoofdzaak groter dan de
waarde van alpha gebruikt voor elk van de individuele toetsen.
12.2 The logic of ANOVA
Wij willen de variabiliteit meten en verklaren waarom de scores
verschillend zijn.
De eerste stap is om de totale variabiliteit voor de hele set gegevens vast
te stellen. We combineren alle scores van alle aparte steekproeven om
één algemene meting van variabiliteit voor het hele experiment te
verkrijgen. Wanneer we de totale variabiliteit hebben gemeten, kunnen we
het afbreken in aparte componenten. Het woord analyse betekent opdelen
in kleinere delen. Omdat we variabiliteit gaan analyseren analyse van
variantie:
1. Between-Treatments Variance. We berekenen de variantie
tussen behandelingen om een meting van de overall verschillen
tussen de behandelingscondities te leveren. De variantie tussen de
, behandelingen is eigenlijk het meten van verschillen tussen
steekproefgemiddelden.
2. Within-Treatment Variance. Levert een meting van de variabiliteit
binnen elke behandelingsconditie.
De tussen-behandeling variantie meet hoeveel verschil er bestaat tussen
de behandelingscondities. Er zijn twee mogelijke verklaringen voor deze
tussen-behandeling verschillen:
1. De verschillen tussen behandelingen zijn niet veroorzaakt door een
behandelingseffect maar zijn simpelweg natuurlijk verschijnende,
willekeurige en onsystematische verschillen die bestaan tussen de
ene en andere steekproef.
2. Wel veroorzaakt door behandelingseffecten.
Om te laten zien dat er een echt behandelingseffect is, moeten we
vaststellen dat de verschillen tussen behandeling groter zijn dan zou
worden verwacht door alleen een sampling error.
We moeten dus vaststellen hoe groot het verschil is wanneer er geen
systematisch behandelingseffect is. Om deze verschillen te meten,
berekenen we de variantie binnen behandelingen.
In elke behandelingsconditie ontvangt een set individuen dezelfde
behandeling. De verschillen die binnen één behandeling bestaan,
representeren willekeurige en onsystematische verschillen die verschijnen
wanneer er geen behandelingseffecten zijn veroorzaken dat de scores
verschillend zijn.
Dus de binnen-behandelingen variantie levert een meting van hoe groot
de verschillen zijn wanneer H0 klopt.
Daarna vergelijken we beide componenten door de F-ratio te berekenen.
Voor de onafhankelijke meting ANOVA;
variantie tussenbehandelingen verschillen inclusief elk behandelingseffect
F = variantie binnenbehandelingen = verschillen zonder behandelingseffecten
systematic treatment effects+random unsystematic differences
F= random , unsysematic differences
De waarde verkregen helpt vast te stellen of er een behandelingseffect
bestaat, 2 mogelijkheden:
1. Geen systematische behandelingseffecten, dan zijn de verschillen
tussen behandelingen volledig veroorzaakt door willekeurige,
onsystematische factoren. Dus de waarde van F zal rond de 1.00
liggen.
, 2. Wel een behandelingseffect dat systematische verschillen tussen de
steekproeven veroorzaakt, dan is de teller groter dan de noemer,
dus F > 1.00. een grote F-ratio is bewijs voor het bestaan van
systematische behandelingseffecten.
Omdat de noemer alleen de willekeurige en onsystematische variabiliteit
meet, wordt het de error term genoemd.
Voor ANOVA, wordt de noemer van de F-ratio de error term genoemd. De
error term levert een meting van de variantie veroorzaakt door
willekeurig, onsystematische verschillen. Wanneer het behandelingseffect
nul is (H0 klopt), meet de error term de zelfde bronnen variantie als de
teller van de F-ratio, dus de waarde van de F-ratio wordt verwacht vlak bij
de 1.00 te liggen.
12.3 ANOVA notation and formulas
1. k om het aantal behandelingscondities te identificeren – dat is,
het aantal levels van de factor. Voor een onafhankelijk meting
onderzoek specificeert k ook het aantal aparte steekproeven.
2. n aantal scores in een behandeling. Elke steekproef ander aantal,
werk dan met subscripties.
3. N totaal aantal scores. Wanneer alle steekproeven dezelfde
grootte hebben N=kn.
4. Som van de scores (∑X) voor elke behandelingsconditie wordt
geïdentificeerd door T (treatment total).
5. De som van alle scores in het onderzoek G = ∑T.
6. Ook berekenen we SS en M voor elke steekproef, en hebben we ∑X2
berekend.
1. De uiteindelijke berekening voor ANOVA is de F-ratio:
variantie tussenbe h andelingen
F = variantie binnenbe h andelingen
2. Elk van de twee varianties in de F-ratio is berekend door het gebruik
SS
van de basisformule voor steekproefvariantie: s2 = df
Eerst moeten we de SS berekenen voor het totale onderzoek en het
analyseren in 2 componenten: tussen en binnen. Vervolgens moeten
we df berekenen voor de totale studie en deze analyseren in twee
componenten.
Het uiteindelijke doel voor de F=
ANOVA is een F-ratio
, variantie tussenbe h andelingen
variantie binnenbe h andelingen
Elke variantie in de F-ratio wordt Variantie tussen behandelingen =
berekend as SS/df SSbetween/dfbetween
Variantie binnen behandelingen =
SSwithin/dfwithin
Om elk van de SS en df waarden SS total df total
te verkrijgen, wordt de totale
variabiliteit geanalyseerd in twee
componenten SSbetween SSwithin dfbetween dfwithin
1. Total Sum of Squares, SStotal. De som van kwadraten voor de hele
(∑ X 2)
set N scores. SS=∑X2 - N
2. Within-Treatments Sum of Squares, SSwithin treatments.
SSwithin treatments = ∑SSinside each treatment
3. Between-Treatments Sum of Squares, SSbetween treatments. SSbetween
= SStotal - SSwithin
De analyse van df, zelfde patroon als SS. 2 componenten.
1. Elke df waarde is geassocieerd met een specifieke SS waarde
2. De waarde van df wordt verkregen door het aantal items dat is
gebruikt om SS te berekenen – 1
a. Total Degrees of Freedom, dftotal = N – 1
b. Within-Treatments Degrees of Freedom, dfwithin. We
moeten kijken naar hoe SS is berekend. Dfwithin = ∑(n-1) =
∑dfin each treatment
Dfwithin = N-k
3. Between-Treatments Degrees of Freedom, dfbetween. Tel het
aantal behandelingen – 1. Dfbetween = k-1.
dftotal = dfwithin + dfbetween
1. De term totaal verwijst naar de totale set scores. We berekenen
SS voor de hele set van N scores en de df waarde is simpelweg
N-1.
2. De term binnen behandelingen verwijst naar de verschillen die
bestaan binnen de individuele behandelingscondities.
3. De term tussen behandelingen verwijst naar de verschillen van
de ene behandeling naar de andere.
De volgende stap in ANOVA procedure is om de variante tussen
behandelingen en de variantie binnen behandelingen te berekenen, die
worden gebruikt om de F-ratio te meten.