Bijspijkerles 1: t-toets en ANOVA
Welke statistische toets
Om te bepalen welke statistische toets je dient te gebruiken, moet je goed kijken naar de
opzet van de studie. Eigenlijk beredeneer je in 3 stappen welke toets je nodig hebt.
1. Allereerst kijk je naar het type data. Wat voor soort data heb je?
Numerieke/ continue waarde: kan in een bepaald interval iedere waarde aannemen.
Lengte, gewicht en temperatuur zijn continue variabelen (bijvoorbeeld 37.3 graden Celsius).
Categorische/ discrete waarde: Er wordt onderscheid gemaakt tussen binaire, nominale
en ordinale discrete variabelen.
- Binair/ dichotoom: deze uitkomstmaat heeft slechts 2 mogelijke uitkomsten of
waarden. Voorbeelden zijn geslacht (man of vrouw), overleving (dood of levend) of
hersteld (wel of niet).
- Nominaal: Op nominaal niveau gemeten variabelen zijn kwalitatieve variabelen,
waarvan de categorieën niet in een vaste of zinvolle volgorde zijn te plaatsen. Voorbeeld.
'Bloedgroep' met als waarden A, B, AB en O of
- Ordinaal: Op ordinaal niveau gemeten variabelen zijn kwalitatieve variabelen, waarvan
de categorieën wel in een vaste en zinvolle volgorde zijn te plaatsen. Bijvoorbeeld een
stelling in een vragenlijst, zoals 'ik heb de laatste tijd vaak sombere gedachten', met als
antwoordcategorieën: 'geheel mee eens', 'mee eens', 'geen mening', 'niet mee eens' en
'geheel niet mee eens'.
Als je een continue uitkomstmaat hebt, is het belangrijk om te checken of deze wel of
niet normaal verdeeld is.
Normale verdeling: Bij een frequentieverdeling hoort een kromme die lijkt op een
klok (klokvormig). Deze klokvormige kromme is symmetrisch waarbij het gemiddelde
(μ), de mediaan en de modus precies samenvallen.
Daarnaast is sigma (‘σ’) een belangrijke component van de normale verdeling. Dit is
de maat van spreiding. Studenten kunnen met hun tentamencijfer dichtbij het
gemiddelde zitten, maar hier ook ver van afwijken. We hanteren een paar vuistregels
bij de normale verdeling:
● Ongeveer 68% van de waarden liggen binnen één standaarddeviatie van het
gemiddelde. Enerzijds -1 standaardafwijking en anderzijds +1 standaardafwijking .
● Ongeveer 95% van de waarden liggen binnen twee standaardafwijkingen van het
gemiddelde. Wederom enerzijds -2 afwijkingen aan de ene kant en +2 afwijkingen
aan de andere kant.
, 2. Vervolgens kijk je naar het type vergelijking: hoeveel groepen vergelijk je met elkaar?
De categorieën zijn:
- meten binnen 1 groep
- 2 groepen vergelijken
- meer dan 2 groepen vergelijken.
3. Tot slot kijk je soms naar hoeveel en wat voor variabelen (determinanten) je wilt
onderzoeken.
- Wil je 1 determinant onderzoeken, 2 of meer?
- Is de determinant continue, dichotoom of bijvoorbeeld categoriaal?
T-toets: bij een continue uitkomstwaarde (en 2 groepen)
ANOVA: bij meer dan 2 groepen
Chi-kwadraat: bij nominale/ dichotome uitkomstwaarden
T-toetsen
→ worden gebruikt om de gemiddelden van maximaal twee groepen met elkaar te
vergelijken.
1. Uitkomstmaat is continu/numeriek
2. Kan alleen bij een normale verdeling
3. Je kan meten binnen 1 groep (one-sample t-test) of tussen 2 groepen: independent t-
test bij 2 onafhankelijke groepen of paired samples t-test bij afhankelijke groepen
One sample t-test
,Gebruik de one sample t-test om te analyseren of het gemiddelde van een steekproef
verschilt van een bepaalde waarde.
*Een gezonde bloeddruk is onder de 140/90. Ook voor ouderen gelden dezelfde
bloeddrukwaarden. Je wilt weten of de 30 ouderen in verpleeghuis X gemiddeld gezien een
gezonde bloeddruk hebben.ol
Independent samples t-test
De independent samples t-test (of ongepaarde t-test) gebruik je om te kijken of twee
steekproefgemiddelden van elkaar verschillen.
*Je wilt de bloeddruk tussen mannen en vrouwen vergelijken.
Paired samples t-test
Gebruik de paired samples t-test om twee gemiddelden van gepaarde steekproeven met
elkaar te vergelijken. Gepaarde steekproeven zijn van elkaar afhankelijk.(meestal wordt
dezelfde groep gebruikt en 2x gemeten over tijd).
*Je meet de bloeddruk van dezelfde personen in 2015 en 2018. Deze waardes zijn duidelijk
van elkaar afhankelijk en daarom gebruik je een paired samples t-test.
T-test SPSS output interpreteren
De SPSS-output voor de independent samples t-test (t-test voor onafhankelijke
steekproeven) bevat twee tabellen:
1. Group Statistics
De eerste tabel, Group Statistics, bevat beschrijvende statistieken van beide groepen, zoals
het gemiddelde, de standaarddeviatie en de standaardfout van het gemiddelde.
2. Independent Samples Test
De tweede tabel, Independent Samples Test, geeft het resultaat van de t-test weer. Het
eerste (meest linkse) deel is Levene’s Test. De Levene’s Test analyseert of de variantie* van
beide groepen gelijk is. Dit bepaalt of je naar de bovenste of onderste rij moet kijken.
In de Levene’s test gelden de volgende hypotheses:
H0= er is geen verschil in de varianties van de twee steekproeven
H1= er is wél verschil in de varianties van de twee steekproeven
Wanneer de uitkomst van de Levene’s test p > 0,05 wordt de nulhypothese niet afgewezen
(dus zijn de varianties in de populatie ongeveer gelijk en houden we de rij aan van equal
, variances assumed)
Wanneer de uitkomst van de Levene’s test p < 0,05 wordt de nulhypothese wel afgewezen
(dus zijn de varianties in de populatie niet gelijk en houden we de rij aan van equal variances
not assumed)
Wanneer de significantie van de Levene’s Test onder de gebruikelijke ,05 ligt, wordt de
nulhypothese van gelijke variantie NIET verworpen. In het voorbeeld is de waarde ,551, dus
we mogen aannemen dat de varianties in beide groepen gelijk zijn. We kijken dus naar de
bovenste rij van de output.
Vervolgens wordt de t-waarde (-4,343) genoemd met bijbehorende vrijheidsgraden (df = 28).
Ten slotte volgt de p-waarde in kolom ‘Sig. (2-tailed)’. Bij een p-waarde kleiner dan .050
moet de nulhypothese worden verworpen en kan je concluderen dat er significante
verschillen zijn in de gemiddelden van de twee groepen.
Conclusie ? De gemiddelde bloeddruk van vrouwen (M = 166,3; SD = 10,03) lag lager dan
die van de mannen (M = 183,1; SD = 11,21). Dit verschil van 16,9 BI-95%= [-24,821, -8,912]
was zeer significant: t (28) = -4,34, p < .001.
*Variantie: Gelijke varianties is naast normaliteit een van de meest voorkomende
assumpties. Hij komt in vele vormen, voornamelijk als 'Levene's toets. Variantie is de
standaarddeviatie in het kwadraat, en geeft ons dus de mate van spreiding aan. De
spreiding dient per groep die je vergelijkt bij benadering gelijk te zijn.
Oefenopdracht
Voor een leeronderzoek wil student Gitte weten of de systolische bloeddruk van studenten
Gezondheid en Leven afwijkt van het landelijke gemiddelde van 117 voor mensen in
dezelfde leeftijdscategorie. Ze meet hiertoe van een groep jaargenoten de systolische
bloeddruk. Ze besluit deze gegevens te toetsen tegen de norm.
a. Welke t-toets gebruik je?
Een one-sample t-test
b. Hoe luiden H0 en Ha van dit onderzoekje? Gebruik in de formulering ook de
waarde voor de populatieparameter die je bestudeert.
H0= de gemiddelde systolische bloeddruk van de groep jaargenoten wijkt niet af van 117
H1= de gem. sys. Bloeddruk van de groep jaargenoten wijkt af van 117
b. Argumenteer of je één- of tweezijdig toetst.
Er wordt tweezijdig getoetst aangezien de waarde op twee manieren kan afwijken van het
gemiddelde: het kan zowel lager als hoger zijn.
Gitte wil een vervolgonderzoek inzetten, als zou blijken dat de bloeddruk van haar
medestudenten in dit vooronderzoek statistisch significant afwijkt van het landelijk
gemiddelde. Maar ze heeft geen zin om haar energie te spenderen aan een toevallig
resultaat in het vooronderzoek. Ze besluit daarom voor een andere waarde dan de
gebruikelijke 5% te gebruiken.