Hoorcollege 7 (25-10-2020)
Hoofdstuk 13
One-factor-ANOVA
ANOVA-Tabel
- Between Treatments (verklaarde variantie)/ Within Treatments (onverklaarde variantie)
- Sum of squares (spreiding omdat je werkt met variantie, gebruiken standaard deviatie)
- Df (variantie moet dezelfde schaal hebben)
- Mean of squares
- F -toets = verklaarde variantie : onverklaarde variantie. Je bent geïnteresseerd in dit verband.
Als je weet in welke groep iemand zit, zegt dat iets over hoe deze persoon scoort? Heeft manipulatie
geholpen m.b.t. controle groep?
➔ Onderscheid in welke groep ze zitten is interessant (controlegroep, experimentele groep) →
De rest van de individuen zijn gelijk.
Between / verklaarde variantie = df = aantal groepen – 1
Within / onverklaarde variantie = df = totale steekproef – aantal groepen
Totaal spreiding
Model wat de Nulhypothese aangeeft > welke waarde F is aannemelijk en welke niet onder H0 als de
groepen GELIJK zijn aan elkaar in H0.
F waarde vergelijken met het model van de Nulhypothese en verwerpen of niet.
◼ Verhouding steekproef is bekend met MS en F
◼ Verhouding met de H0 (om op te stellen) hiervoor is de df sowieso nog nodig
Het model van de Nulhypothese hangt af van hoogte en breedte van de data en de df (hoeveel
groepen / hoeveel mensen).
TABEL E
Df between → (aantal groepen, hoe hoger aantal groepen, hoe hoger deze df, lagere F-waarde,
sneller verassend/tevreden)
Df within ↓ (aantal mensen er groep, hoe meer mensen per groep, hoe groter deze df, lagere F-
waarde, sneller verassend, smaller)
Voorbeeld: F-waarde van 5,32 zou verassend zijn bij significantie 0.05. Met Df is 4 heb je dus niet
significant bewijs en ga je H0 niet verwerpen.
Df geeft aan of iets verassend is, hoe snel je tevreden bent en dit hangt af van bij hoeveel
groepen/mensen je bekeken hebt. Zie referentieverdeling.
Hoe meer mensen → nauwkeuriger meten
1
, Two-factor-ANOVA
T-toets = twee groepen vergelijken.
1-factor-ANOVA = meer dan twee groepen met elkaar vergelijken in 1x. Groepen vergelijken
continue variable en factor en de verschillende niveaus (categorische onafhankelijke variable) op
verschil in gemiddelden.
2-Factor-ANOVA = meer dan twee groepen met elkaar vergelijken met logische clustering op verschil
in gemiddelden. Ze zijn te onderscheiden op twee factoren. Er zijn twee oorzaken voor verschillen
tussen groepen.
Voorbeeld: Daarbij ga je de 4 groepen dus nog op andere factoren/groepen (daarin) vergelijken.
- Opleidingen: peda, psyho, socio, bestuurs
- Geslacht: Man en vrouw
➔ 8 groepen
- Land (3-factor-ANOVA)
Voordeel 2-way-ANOVA i.p.v. 1-way-ANOVA: meer efficient en geeft nog meer informatie over de
interactie. Verminderd de residual variantie in het model. 2-way is meer werk dan one-way maar
minder werk dan als je meerdere one-ways zou moeten uitvoeren.
De naam voor de ANOVA
We hebben verschillende groepen – vallen ze onder 1 factor / groep of vallen ze onder meerdere
factoren / groepen.
Zo min mogelijk toetsen, min mogelijk fouten maken (ANOVA ipv t-toets)
Herhaling 1-factor ANOVA
H0 = GEEN VERSCHIL tussen alle drie de groepen (zelfde score-verdeling, zelfde gemiddelde). Sprake
van steekproeffluctuatie (steekproeftrekking) waardoor het klein verschilt.
Spreiding tussen steekproefgemiddelde is ongeveer gelijk zijn aan de spreiding binnen de groep.
H0 niet waar = 1 of meer van de groepen heeft een ander gemiddelde dan de andere groepen.
Het verschil in gemiddelde komt niet alleen door streekproeffluctuatie, het verschil in gemiddelde is
ook echt hoger dan de ander.
De gemiddelde tussen groepen met steekproefgemiddelde is groter dan de spreiding binnen de
groepen.
HA van ANOVA in het algemeen: tenminste 1 gemiddelde verschilt
1-factor ANOVA
Varianties bekijken
Analysis of variance
H0 = welke waarde breuk aannemelijk en welke verassend
1) F-waarde berekenen. Formule >
2) Referentieverdeling op basis van df. Formule >
DF teller
DF noemer
Welke waarde aannemelijk en niet?
2