Week 1
Kennisclip 1
1-steekproef t-toets
Gebruik van t-toetsen
• Uitkomsten zijn kwantitatief
• Gemiddelde van steekproef, x , staat model voor
populatieparameter μ
• Standaardafwijking, sd , staat model voor populatieparameter σ
• Gemiddelde(n) moet(en) kunnen worden beschouwd als
trekking uit een Normale verdeling
Belangrijke conceptuele gedachte
• De waarden van x en sd zijn onderling onafhankelijk van elkaar
• Heb je x berekend, dan zegt dit dus nog niets over de waarde
van sd
• Vanwege deze dubbele onzekerheid maken we gebruik van de
t-verdeling
• Aantal vrijheidsgraden bepaalt in hoeverre
t-verdeling lijkt op een z-verdeling meer
waarnemingen minder onzekerheid meer lijken op
een z-verdeling
Normale verdelingen
0,6
0,5
0,4
0,3
0,2
0,1
0
-5 -4 -3 -2 -1 0 1 2 3 4 5
Studieontwerp
• Bij 1-steekproef t-toets (one sample t-test)
• Vergelijk je een uitkomst met een normwaarde
• De normwaarde staat onder H0
• Het onderzoek betreft (bijna altijd) een transversaal cohort
• Centrale vraag: “Hoe verhoudt de situatie zich in vergelijking
tot de norm”?
• Voorwaarden aan het gebruik
, • Gegevens zijn onderling onafhankelijk – dus niet gegroepeerd
(groepjes herkenning)
• Schatting voor μis Normaal verdeeld (zie kennisclip Centrale
Limietstelling)
Voorbeeld
• Hypothetische gedachte:
• Topsporters hoger basaal metabolisme dan ‘gewone’ mensen
• Verbranding levert (lichaams)warmte
• Hebben topsporters gemiddeld dan ook een hogere
lichaamstemperatuur dan de 37° die we bij andere mensen
verwachten?
• Onderzoekje aan 14 topsporters
Hypothese
• Eén of tweezijdig? (tweezijdig, want niet de waarde
• H 0 :μ topsport =37 °
• H 1: μtopsport ≠37 °
x−μ0
• Toetsingsgrootheid (TG): t=
sd / √ n
• Als H0 klopt, dan volgt de TG een t -verdeling
• …als aan veronderstellingen van toets wordt voldaan!
• Deze t-verdeling heeft 14−1=13 d.f. (n−1 per onderzoeksgroep)
Check de aannames
1. Gegevens onafhankelijk?
• Daar is geen informatie over gegeven
• Terug te vinden in logboek of Methodensectie van artikel
• Aanname zou zijn overtreden als bijvoorbeeld ‘Snowball-
sampling’ was gebruikt voor de werving
• Vraag deelnemers aan studie om nieuwe deelnemers te
recruteren
• Gevolg: deelnemers kennen elkaar, gebruiken misschien
zelfde trainingsmethoden etc.
• Voor dit voorbeeld gaan we ervan uit dat gegevens
onafhankelijk zijn
2. Gemiddelde getrokken uit normale verdeling?
• Bekijk Q-Q-plot of histogram op het oog, niet met een toets
• Reden:
• Vrijwel alle kansvariabelen zijn niet perfect normaal
verdeeld
• Zolang n maar groot genoeg is zul je bij toetsing
afwijkingen t.a.v. normaliteit vinden
, • Bij kleine n
zullen
relevante
afwijkingen
t.a.v.
normaliteit
niet aantoonbaar zijn
• Daarom is een toets op normaliteit zelden/nooit van
toegevoegde waarde
Toetsingsgrootheid
• De toetsingsgrootheid is de maat, waarmee we meten hoeveel onze
bevindingen afwijken van de verwachting onder H0
• In dit geval is dat de toetsingsgrootheid t
x−μ0
• t=
sd / √ n
• Resultaat is een aantal standaarddeviaties binnen de t-verdeling
x−μ0 37 , 10−37 , 0
• t= = =1,96
sd / √ n 0 , 195/ √ 14
Overschrijdingskans
• “Hoeveel bedraagt de kans om een resultaat te vinden dat 1,96 sd’s
of meer afwijkt van de verwachting onder H0, als het basaal
metabolisme van topsporters en niet-topsporters in werkelijkheid
niet verschilt?”
• Pr (|t|> 1,96 )=0,071 (in SPSS of in tabel met t-waarden)
t-verdeling met 13 vrijheidsgraden
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-4 -3 -2 -1 0 1 2 3 4
1,96 + 1,96 = 7,1%
> 0,%
Topsporters hebben dus niet een hogere lichaamswarmte dan niet-
topsporters
, Dus < 95% ligt in het zekerheidsinterval, dit is dus te weinig zekerheid
daarom wordt de nulhypothese verworpen.
Conclusie
• De overschrijdingskans is > 5%
• “Er kon niet worden aangetoond dat topsporters een hogere
lichaamstemperatuur hebben dan niet-topsporters”
• Deze uitspraak is gedaan bij een betrouwbaarheid van 95%
Aanmerkingen op de proefopzet
• Wie zegt dat de populatieverwachting van
lichaamstemperatuur 37 graden is?
• n=14 is niet bepaald veel; bij een dergelijk klein aantal
deelnemers moet een groot effect worden verwacht om op
p<0,05 te mogen rekenen
• Er kan absoluut niet worden uitgesloten dat topsporters
hyperthermisch zijn
• Er is geen informatie over de meetprocedure en de
steekproefname gegeven
• Met slimme opzet kan spreiding in temperaturen worden
verminderd
Betrouwbaarheidsinterval
• Met dezelfde informatie uit de steekproef kan ook een BI( μ ) worden
geconstrueerd
sd
• BI 95 % ( μ )=x ±t a=0,05 ;df =13 ×
√n
• t a=0,05 ; df =13: bij welk aantal standaardafwijkingen in een t -
verdeling met 13 vrijheidsgraden geldt een
overschrijdingskans van 5%?
• Eventueel opzoeken in tabel / Excel / iets anders levert
2,160
sd
• BI 95 % ( μ )=x ±t a=0,05 ;df =13 × =37,10 ±2,160 ×0 , 195/ √ 14
√n
• BI 95 % ( μ )= [ 36 , 99 ; 37 , 21 ]
• Aan dit interval zie je dat 37 graden ‘past’ bij onze steekproef
*deze tekst geeft aan hoe je een schatting van het gemiddelde maakt,
samen met een marge van onzekerheid, door gebruik te maken van de t-