HOORCOLLEGE AANTEKENINGEN
EPIDEMIOLOGIE EN BIOSTATISTIEK 2
HC 1 HERHALING EN T-TOETSEN
HERHALING EPIDEMIOLOGIE EN BIOSTATISTIEK 1
MODULE 1: ONDERZOEKSDESIGN
Ecologisch Gezondheidswetenschappelijk
onderzoek onderzoek
Observationeel Experimenteel
Cohort Transversaal Case-control RCT Cross-over
Prospectief Nested C-C Retrospectief Prospectief
Experimenteel onderzoek
- Onderzoekers veranderen bewust één factor en houden andere mogelijke factoren die van invloed zijn
hetzelfde
- Sterke bewijskracht oorzaak – gevolg relatie
- RCT: mensen worden op basis van toeval ingedeeld in groepen→ de deelnemers in de verschillende
groepen zijn hierdoor vergelijkbaar. Vervolgens wordt er bij de ene groep een interventie toegepast
en is er een controle groep waarbij de verandering niet wordt doorgevoerd.
- Cross over: de deelnemer van het onderzoek kan met zichzelf worden vergeleken, de deelnemer is zo
zijn eigen controle groep omdat het zowel de interventie ondergaat als de controlebehandeling→
heeft een hogere bewijskracht als resultaat
Observationeel onderzoek
- Onderzoekers verzamelen gegevens zonder de werkelijke situatie te veranderen
- Minder sterke bewijskracht voor oorzaak-gevolg relatie
- Vaak grote onderzoeksgroep
- Prospectief cohortonderzoek: onderzoek wordt uitgevoerd bij grote groep mensen, die worden
gevolgd in de tijd. Onderzoekers vragen een vragenlijst in te vullen en herhalen dit meestal in de loop
van de tijd → kijken vervolgens aantal jaar later of de ziekte is ontstaan
1
, o Mogelijke uitkomst: relatie hoeveelheid vet in voeding en het krijgen van een hartinfarct
o Lastig om te bepalen in hoeverre overige factoren, zoals bijvoorbeeld roken invloed hebben
op de uitkomst (confounding)
- Case control: onderzoekers kijken naar het verleden en zoeken bijvoorbeeld naar relaties tussen
eetpatronen en bepaalde ziektes→ vergelijken mensen met bepaalde ziekte met mensen die lijken op
de zieke mensen maar niet ziek zijn
o Naast confounding grote kans op recall-bias
o In een nested case-control onderzoek worden de 'cases' en de 'controls' uit de populatie van
een cohortonderzoek gerekruteerd.
- Cross-sectioneel: onderzoekers nemen op een specifiek moment een dwarsdoorsnede van een groep
mensen
o Bij elke proefpersoon wordt bijvoorbeeld de bloeddruk of lichaamsgewicht gemeten en
vragen gesteld over hoeveelheid koffie inname→ verband tussen bloeddruk of het aantal
koppen koffie per dag
o Geen uitspraak over causaal verband → dus invloed van koffiedrinken op bloeddruk (of
andersom) kan niet worden aangetoond
- Bij transversaal (cross-sectioneel) onderzoek wordt ieder individu in een groep eenmaal en op
hetzelfde tijdstip geobserveerd of gemeten.
MODULE 1: FREQUENTIEMATEN EN EFFECTMATEN
Dichotoom vs continu
- Dichotoom; een kenmerk dat slechts twee mogelijke waarden kan aannemen (man-vrouw, goed-fout)
- Continu: een variabele die gemeten kan worden in getallen, waarbij de tussenliggende waarden
betekenis hebben (lengte, gewicht)
Frequentiematen
- Prevalentie: aantal zieken in een populatie op een bepaald moment (het aantal bestaande gevallen)
- Incidentie: het aantal nieuwe ziekte gevallen in een populatie
➔ Weergave in percentages
- Incidentiedichtheid: het aantal nieuwe ziektegevallen gedeeld door het aantal personen in de
populatie at risk→ is een maat voor de snelheid waarmee nieuwe ziektegevallen in een populatie
ontstaan in een bepaalde tijdsperiode
- Cumulatieve incidentie (CI): (risico) de proportie van het aantal personen in een populatie dat binnen
een bepaalde tijdsperiode een ziekte ontwikkelt
o Aantal nieuwe gevallen tijdens de onderzoeksperiode delen door het aantal personen zonder
de ziekte in de populatie in het begin van de onderzochte tijdsperiode
Associatiematen
- Relatief risico: voor variabelen met twee uitkomstcategorieën→ drukt de sterfte uit van het verband
tussen een determinant en een uitkomst (ligt tussen 0 en oneindig, 1= geen associatie)
o Berekenen door: je deelt de kans op het optreden van sterfte in de behandelgroep door de
kans op het optreden van sterfte in de placebogroep
o Voorbeeld:
2
, Wel sterfte Geen sterfte Totaal
Interventie 182 (a) 2039 (b) 2221
Placebo 256 (c) 1967 (d) 2223
Het RR wordt berekend door: (a/(a+b)) / (c/(c+d)) = (182/2221) / (256/2223) = 0.71
o RR< 1: gunstig behandeleffect
o RR>1: ongunstig effect
o Interpretatie: de interventie reduceert de kans op sterfte met een factor 0,71
- Odds ratio: associatie tussen variabelen met twee uitkomstcategorieën, wanneer de absolute kans
niet berekend kan worden, zoals bij een case control of retrospectief onderzoek (uitkomst tussen 0 en
oneindig, 1= geen associatie)
o Berekenen door de verhouding van kansen te delen→ de kans op het wel en niet hebben op
de aandoening onder bijvoorbeeld rokers delen door de kans op het wel en niet hebben op
de aandoening onder niet rokers
o Voorbeeld:
Aandoening Geen aandoening
Roken 86 (a) 14 (b)
Niet roken 61 (c) 39 (d)
OR wordt berekend door: (a/b)/(c/d)= (86/14)/(61/39)=3,9
o OR<1 in dit geval een beschermend effect van determinant op de uitkomst
o OR>1 schadelijk effect
o Interpretatie: de odds op het hebben van de aandoening is onder de groep rokers 3,9 zo
groot als de odds op het hebben van deze aandoening voor niet rokers
o De OR is altijd een overschatting van de RR. Deze wordt groter naarmate de prevalentie van
de uitkomstvariabele groter wordt
- Incidentie dichtheidsratio: aantal nieuwe gevallen delen door het aantal geobserveerde
persoonsjaren
- Number needed to treat: gebruikt indien de determinant een bepaalde interventie is→ hoeveel
patiënten moeten behandeld worden op 1 sterfgeval (beoogde uitkomst) te voorkomen
o NNT = 1/AR
o Indien de determinant niet met de ziekte is geassocieerd dan AR=0
o Voorbeeld:
Negatieve uitkomst Positieve uitkomst
Behandeling 30 (a) 100 (b)
Controle groep 70 (c) 60 (d)
Berekening NNT: 1/ ((C/C+D)-(A/A+B))= 1/((70/130)-(30/130)=3,25
o Interpretatie: 3,25 patiënten moeten behandeld worden om 1 sterfte geval te voorkomen
- Attributieve proportie onder geëxponeerde (blootgestelden): de hoeveelheid ziekte bij
geëxponeerde, aan de expositie zelf te wijten is→Welk gedeelte van het risico kan worden
toegeschreven aan de risicofactor?
3
, 𝐼1 −𝐼0
o 𝐴𝑃𝐵 = Risico voor geëxponeerde, gecorrigeerd voor het ‘basisrisico
𝐼1
(dus (roken + kanker/ totaal) – (niet roken + kanker/ totaal)
Totaalrisico voor blootgestelden (roken + kanker/totaal)
𝐼1 −𝐼0 1
o 𝐴𝑃𝐵 = =1− = 0.94
𝐼1 𝑅𝑅
o Bij 94% van de rokers die longkanker krijgen, kan dit worden toegeschreven aan het roken
- Attributief risico voor de totale populatie (APt): de hoeveelheid ziekte in de totale populatie, aan een
bepaalde expositie te wijten is
𝐼𝑇 −𝐼0
o 𝐴𝑃𝑇 =
𝐼𝑇
𝑎+𝑐 800
o 𝐼𝑇 = = = 0.02
𝑎+𝑏+𝑐+𝑑 40000
𝑐 20
o 𝐼0 = = = 0.00167
𝑐+𝑑 12000
𝐼𝑇 −𝐼0 0.02−0.00167
o 𝐴𝑃𝑇 = = = 0.917
𝐼𝑇 0.02
o Bij 92% van de gevallen van longkanker krijgen kan dit worden toegeschreven aan het roken
Longkanker Gezond Totaal
Roker 780 (a) 27220 (b) 28000
Niet-roker 20 (c) 11980 (d) 12000
Totaal 800 39200 40000
MODULE 2: VERTEKENING, SELECTIE EN MISCLASSIFICATIE
Vertekening
- De gevonden associatie weerspiegeld de werkelijke niet
Selectie
- De steekproef representeert de doelpopulatie niet
- Differentiële selectie: de geselecteerde groep heeft een andere associatie dan de niet-geselecteerde
groep→ selectiefout die tot systematische verschillen tussen twee groepen (ziek vs. niet ziek) leidt
- Non-differentiële selectie: de associatie is voor de geselecteerde en de niet-geassocieerde groep
gelijk→ selectiefout zonder dat het tot systematische verschillen tussen twee groepen (ziek vs. niet
ziek) leidt → prevalentie van uitkomst is niet representatief voor werkelijke prevalentie
Misclassificatie
- De meting klopt niet: het toekennen van een verkeerde status aan de proefpersoon → leidt vaak tot
informatie bias
- Differentiële misclassificatie: De meetfout verschilt tussen de blootgestelden en niet blootgestelden,
of tussen mensen mét en zonder de uitkomst→ kan tot overschatting of onderschatting van de relatie
tussen determinant en uitkomst leiden
o De meetfout van de uitkomst hangt af van de determinant, of de meetfout van de
determinant afhangt van de uitkomst
o Voorbeeld: Neem bijvoorbeeld een onderzoek naar risicofactoren voor aangeboren
afwijkingen dat wordt uitgevoerd onder vrouwen die juist zijn bevallen. Het is voor te stellen
dat moeders van kinderen met een aangeboren afwijking zich bepaalde determinanten (zoals
het gebruik van geneesmiddelen of voedingsgewoonten tijdens de zwangerschap) anders
herinneren dan moeders van kinderen zonder die afwijking. Wanneer de determinant wordt
gemeten met een vragenlijst – en dus afhankelijk is van de herinnering van de moeder – zal
een mogelijke meetfout in de determinant waarschijnlijk afhankelijk zijn van de uitkomst.
4
, (Grobbee DE, Hoes AW. Clinical Epidemiology: principles, methods, and applications for clinical research. 1st ed.
Sudbury: Jones and Bartlett; 2008.)
- Non differentiële misclassificatie: de meetfout is voor iedereen in de studie gelijk→ Wanneer de
meetfout van de uitkomst niet afhangt van de determinant, of de meetfout van de determinant niet
afhangt van de uitkomst
o Ontstaat door toevallige meetfouten→ leidt meestal tot een onderschatting van de relatie
tussen determinant en uitkomst
o Voorbeeld: Stel dat in het onderzoek naar risicofactoren voor aangeboren afwijkingen de
determinant ‘maternale BMI’ (gemeten tijdens de eerste prenatale controle bij de
verloskundige) zou zijn. Ongetwijfeld worden er meetfouten gemaakt bij het bepalen van de
BMI, maar deze meetfouten zijn niet afhankelijk van de uitkomst: de aangeboren afwijking,
die op dat moment nog onbekend is.
(Grobbee DE, Hoes AW. Clinical Epidemiology: principles, methods, and applications for clinical research. 1st ed.
Sudbury: Jones and Bartlett; 2008.)
Wat moet je weten?
- Is vertekening op grond van selectie en/of misclassificatie te verwachten op grond van gegeven
artikel?
- In welke richting ligt deze vertekening?
MODULE 3: VALIDITEIT EN BETROUWBAARHEID
Meetinstrumenten en meetprocedures
- Wordt gemeten wat je wilt meten
- Zijn ze betrouwbaar? Zijn de metingen herhaalbaar?
- Vertonen ze vertekening? Is er een systematische afwijking?
- Meten is daarom niet perse weten
Validiteit= heb je gemeten wat je wilde meten
Betrouwbaarheid= zouden de resultaten hetzelfde zijn indien deze worden herhaald
MODULE 4: CONFOUNDING EN EFFE CTMODIFCATIE
Confounding= het effect binnen de supgroepen verschilt van het effect in de gehele onderzoekspopulatie
- Het effect binnen de groepen is wel vergelijkbaar
Effectmodificatie= het effect binnen de subgroepen is ook verschillend
Wat moet je kunnen?
- Beredeneren van mogelijke confounding en effectmodificatie in bepaalde onderzoeksopzet
- Rapporteren van gecorrigeerde effecten
o Gewogen gemiddelde: vermenigvuldigen van elke waarde met hun belang (de wegingsfactor)
en dit vervolgens delen door het aantal getallen dat in het gemiddelde wordt meegenomen
o Mantel-Haenzel OR: voor ieder stratum vermenigvuldig je het OR met de wegingsfactor en
deze getallen worden bij elkaar opgeteld → vaak bij case control studie
- In E&B 2 worden geavanceerde technieken toegepast om met confounding en effectmodificatie om te
gaan
o Door regressie analyse waarin multivariabele modellen worden toegepast
5
,MODULE 5: BESCHRIJVENDE STATISTIEK
Soorten variabelen en metingen
- Continu: kan alle waardes aannemen
- Discreet: kan slechts beperkt aantal getallen of opties aannemen
- Ordinaal: de data kunnen worden gecategoriseerd en gerangschikt
- Nominaal: de data kan alleen worden gecategoriseerd, niet gerangschikt
Samenvattende maten
- Proporties: bij dichotome uitkomsten: uitkomst gedeeld door het totaal aantal waarnemingen
- Gemiddelde en mediaan: bij continue of numerieke uitkomsten
- Standaardafwijking: maat voor de spreiding van een variabele of van een verdeling of populatie
- Interkwartielafstand: maat voor de spreiding van een verdeling, dus de mate waarin de waarden
onderling verschillen
o De helft van alle waarden ligt tussen Q3 en Q1 dus IQR=Q3-Q1
MODULE 6: KANSREKENEN
Stelling van Bayes i.r.t. sensitiviteit, specificiteit en diagnostische waarde
- Sensitiviteit: Het aantal (%) lijders aan de ziekte met positieve test. (positief voorspellende waarde: de
test is positief als de patiënt de aandoening daadwerkelijk heeft)
- Specificiteit: Het aantal (%) personen zonder de ziekte met negatieve test. (negatief voorspellende
waarde: de test is negatief als de patiënt de aandoening niet heeft)
- Diagnostische waarde: onderzoeken of de test een bijdrage levert aan het aantonen of uitsluiten van
de ziekte, aan de keuze van behandeling, of dat leidt tot gezondheidswinst
- In E&B2 /Metho2 doen we ‘diagnostiek’ op statistisch toetsen
o Een statistische toets is óók een diagnostische test – niet op ziekte, maar op de juistheid van
een wetenschappelijke theorie
o Je wilt weten hoe het gesteld is met de positief voorspellende waarde: wanneer ik de H0
hypothese verwerp, wat is dan de kans dat dat een terechte beslissing geweest is
MODULE 7: KANSMODELLEN
Soorten verdelingen
- Binomiale verdeling: een verdeling van het aantal successen X in een reeks van n onafhankelijke
alternatieven alle met succeskans p (het aantal experimenten en aantal successen/verliezen)
o Discreet
o Deze gebruik je wanneer je herhaaldelijk hetzelfde kansexperiment uitvoert→ de kans op
succes moet bij elk experiment gelijk zijn en er moet sprake zijn van succes of mislukking
- Normale verdeling: een verdeling die beschrijft hoe de data verspreid zijn→ observaties rond het
gemiddelde zijn het waarschijnlijkst. Hoe verder de waardes van het gemiddelde af liggen, hoe
onwaarschijnlijker het is deze waarden te observeren
- Lognormale verdeling: is een continue kansverdeling van een willekeurige variabele waarvan de
logaritme is normaal verdeeld. Kansverdeling die rechtsscheef verdeeld is (staart aan rechterkant en
piek aan linkerkant)→ verandering wordt in procenten weergegeven en de oorsprong is gelijk aan 0
Standaardisatie van een statistische waarneming voor één of meerdere kenmerken is een handigheidje om via
weging te corrigeren voor ongelijke verdelingen tussen groepen naar die kenmerken. (voor leeftijd corrigeren)
6
,MODULE 8: TOETSEN
Structuur van een toets
- H0: er is geen effect
- Ha: er is wel een effect
- Toetsingsgrootheid: geeft aan hoever de schatting af ligt van de parameter waarde van H0→ het
aantal standaardfouten tussen de schatting en de H0 waarde → z en t waarden → een vertaalslag
tussen wat jij uit je gegevens haalt tot een kansmodel waar jij een kans uit kunt berekenen
Toets op proporties/ toets op gemiddelden
- Proporties: z toets of chi kwadraat toets
- Gemiddelden: Bij alle andere populaties kun je kiezen uit de t-toets bij gelijke varianties, de t-toets bij
ongelijke varianties, de Wilcoxon rangtoets, de F-toets voor gelijke varianties en de test van Levene.
MODULE 9: BETROUWBAARHEIDSINTERVA LLEN
Betekenis en interpretatie
- BI wordt gebruikt om aan te geven hoe zeker je bent van een geschatte waarde→ dit is het interval
waarin je verwacht dat de werkelijke waarde ligt
- Interpretatie: er is met 95% betrouwbaarheid (kans) te zeggen dat de waarde tussen … en … ligt
- Wanneer de studie wordt herhaald is er 95% kans dat het volgens 95% BI de werkelijke RR (bijv.)
omvat
T en Z verdeling
- Z: een statistische toets voor de verwachtingswaarde van een normale verdeling met een bekende
standaardafwijking, met als toetsingsgrootheid het gestandaardiseerde steekproefgemiddelde.
- T: standaardafwijking is niet bekend→ een parametrische statistische toets die onder andere gebruikt
kan worden om na te gaan of het (populatie-)gemiddelde van een normaal verdeelde grootheid
afwijkt van een bepaalde waarde, dan wel of er een verschil is tussen de gemiddelden van twee
groepen in de populatie. Met behulp van een t-toets kan men dan een overschrijdingskans of een
betrouwbaarheidsinterval bepalen. → om te kijken of het gemiddelde van een normaal verdeelde
populatie gelijk is aan een vooraf gespecificeerde waarde.
SAMENVATTING T-TOETSEN
One-sample t-test
De one-sample t-test beantwoordt de vraag: Is het verschil tussen het gemiddelde in de steekproef en het
verwachte gemiddelde (in de populatie) groter dan we op basis van kans zouden verwachten?
7
,Gepaarde t-toets / Paired (dependent) sample t-toets
De gepaarde t-toets wordt gebruikt als je steekproeven niet onafhankelijk zijn, bijvoorbeeld omdat je dezelfde
persoon twee keer meet (voor- en nameting, twee koffiemerken laat beoordelen) of omdat je broers en zussen
met elkaar vergelijkt (kinderen uit een gezin).
De vraag die we willen beantwoorden is: is de gevonden gemiddelde verandering/ het gevonden gemiddelde
verschil tussen de twee meetpunten in onze steekproef toe te schrijven aan kans, of bestaat de verandering/
dit verschil waarschijnlijk ook in de populatie?
Voor de gepaarde t-toets wordt het verschil tussen de twee meetpunten berekend, vaak aangetoond met een
'difference score'. We kunnen de gepaarde t-toets op twee manieren uitvoeren:
- We berekenen een 'difference score' en toetsen of het verschil gelijk/ongelijk aan nul is,
gebruikmakend van een one-sample t-toets
- We gebruiken de paired samples t test (in SPSS) om de twee gemiddelden met elkaar te vergelijken.
T-toets voor onafhankelijke steekproeven / Two-sample t-test / Independent samples t-test
De t-toets voor onafhankelijke steekproeven beantwoordt de vraag: Is het gevonden verschil tussen de
gemiddelden van twee groepen in onze steekproef toe te schrijven aan kans, of bestaat dit verschil
waarschijnlijk ook in de populatie? Wat we eigenlijk willen weten, anders uitgedrukt: Verschilt het gemiddelde
in de ene steekproef significant en substantieel van het gemiddelde in de andere steekproef?
Twee belangrijke punten zijn: de twee groepen zijn onafhankelijk (komen voort uit twee samples), bijvoorbeeld
mannen en vrouwen. Daarnaast wordt er verondersteld dat de varianties in de twee steekproeven ongeveer
even groot zijn (en dat is vaak niet zo!)
Levene's test for equality of variances
SPSS voert altijd de Levene's test uit om de assumptie te checken of de varianties in de twee steekproeven
ongeveer even groot zijn. De nulhypothese van de Levene's test is: De varianties van de twee steekproeven zijn
in de populatie gelijk. In SPSS vind je de uitspraak over deze hypothese in de rij 'equal variances assumed'.
- Als de uitkomst van de Levene's test een p-waarde geeft van groter dan 0.05, dan wordt de
nulhypothese niet afgewezen en we mogen ervan uitgaan dat de twee varianties ook in de populatie
ongeveer gelijk zijn. Voor de uitkomst van de t-toets houden we dan de rij in de output aan getiteld
'equal variances assumed'.
- Als de uitkomst van de Levene's test een p-waarde geeft van kleiner dan 0.05, dan wordt de
nulhypothese wel afgewezen en gaan we ervan uit dat de twee varianties in de populatie niet gelijk
zijn. Voor de uitkomst van de t-toets houden we dan de rij in de output aan getiteld 'equal variances
not assumed'.
8
,KENNISCLIPS WEEK 1
KENNISCLIP 1 STEEKPROEF T-TOETS
T-toets
- Gebruik je in eenvoudige set wanneer de uitkomst kwantitatief is
- Gemiddelde van steekproef, 𝑥̅ , staat model voor populatieparameter 𝜇
- Standaardafwijking, 𝑠𝑑, staat model voor populatieparameter 𝜎
- Gemiddelde(n) moet(en) kunnen worden beschouwd als trekking uit een Normale verdeling
- Belangrijke conceptuele gedachte
o De waarden van 𝑥̅ en 𝑠𝑑 zijn onderling onafhankelijk van elkaar
o Heb je 𝑥̅ berekend, dan zegt dit dus nog niets over de waarde van 𝑠𝑑
o Vanwege deze dubbele onzekerheid maken we gebruik van de t-verdeling
▪ Aantal vrijheidsgraden bepaalt in hoeverre t-verdeling lijkt op een z-verdeling
▪ Hoe meer waarnemingen, hoe kleiner de onzekerheid, hoe meer deze lijkt op een z
verdeling
Normale verdelingen
0,6
0,5
0,4
0,3
0,2
0,1
0
-5 -4 -3 -2 -1 0 1 2 3 4 5
Studieontwerp 1 steekproef t toets
- Je vergelijkt een uitkomst met een normwaarde
- De normwaarde staat onder H0 en je toetst of de steekproef getrokken kan zijn uit waarde onder de
H0, je hebt 1 groep waaraan je meet
- Het onderzoek betreft (bijna altijd) een transversaal cohort
- Centrale vraag: “Hoe verhoudt de situatie zich in vergelijking tot de norm”?
Voorwaarden aan het gebruik
- Gegevens zijn onderling onafhankelijk – dus niet gegroepeerd binnen de data set
- Schatting voor (populatieverwachting) 𝜇 is Normaal verdeeld (zie kennisclip Centrale Limietstelling)
Voorbeeld
- Topsporters hebben een sneller metabolisme in rust dan gewone mensen, zij hebben een sneller
metabolisme en de verbranding levert dus ook meer (lichaams) warmte
- De vraag is: hebben topsporters gemiddeld dan ook een hogere lichaamstemperatuur dan de 37
graden die we bij andere mensen verwachten
- Onderzoekje onder 14 topsporters
36,6 36,7 36,8 36,9 37 37,1 37,2 37,3 37,4
9
, Hypotheses
Willen we een of twee zijdig toetsen?
- 𝐻0: 𝜇topsport = 37°
- 𝐻1: 𝜇topsport ≠ 37°
- We kiezen ervoor om tweezijdig te toetsen omdat de H1 simpelweg een andere waarde als 37 aan kan
nemen en er niet staat aangegeven hoger of lager
𝑥̅ −𝜇0
Toetsingsgrootheid (TG): 𝑡 =
𝑠𝑑 ⁄√𝑛
- Als H0 klopt, dan volgt de TG een 𝑡-verdeling
o …als aan veronderstellingen van toets wordt voldaan!
- Deze t-verdeling heeft 14 − 1 = 13 d.f. (𝑛 − 1 → 1 per onderzoeksgroep)
Check aannames
1. Gegevens onafhankelijk?
- Daar is geen informatie over gegeven
- Terug te vinden in logboek of Methodensectie van artikel
- Aanname zou zijn overtreden als bijvoorbeeld ‘Snowball-sampling’ was gebruikt voor de werving
o Vraag deelnemers aan studie om nieuwe deelnemers te recruteren
o Gevolg: deelnemers kennen elkaar, gebruiken misschien zelfde trainingsmethoden etc.
- Voor dit voorbeeld gaan we ervan uit dat gegevens onafhankelijk zijn
2. Gemiddelde getrokken uit normale verdeling?
- Bekijk Q-Q-plot of histogram op het oog, niet met een toets
- Niet met een toets omdat:
o Vrijwel alle kansvariabelen zijn niet perfect normaal verdeeld
o Zolang 𝑛 maar groot genoeg is zul je bij toetsing afwijkingen t.a.v. normaliteit vinden
o Bij kleine 𝑛 zullen relevante afwijkingen t.a.v. normaliteit niet aantoonbaar zijn
o Daarom is een toets op normaliteit zelden/nooit van toegevoegde waarde
4
3
2
1
0
36,7-36,8
37,4-37,5
36,6-36,7
36,8-36,9
37,1-37,2
37,2-37,3
37,3-37,4
36,9-37
37-37,1
Toetsingsgrootheid
- De toetsingsgrootheid is de maat, waarmee we meten hoeveel onze bevindingen afwijken van de
verwachting onder H0
- In dit geval is dat de toetsingsgrootheid t
𝑥̅ −𝜇0
- 𝑡=
𝑠𝑑 ⁄√𝑛
o Teller: gevonden verschil tussen steekproefgemiddelde en verwachting onder H0
o Noemer: gerelateerd aan de variabiliteit van dit verschil
10