Klassieke Statistische Methoden
Inhoudsopgave
H19: Inferentie voor één proportie (dichotome uitkomst) 2
- Steekproefverdeling proportie p̂ / Large Sample Interval / Plus Four Methode,
steekproefgrootte bij een bepaalde margin of error / hypothese testen / z-statistiek
H20: Vergelijken van twee populatie proporties uit twee onafhankelijke steekproeven 8
- BHI m.b.v. Large Sample Methode / Plus Four methode / hypothese toetsen / z-statistiek
(RR / OR / RRR / ARR / NNT)
H22: Chi-kwadraat toets voor kruistabellen beide categorische variabelen, meer dan 2 groepen 12
- Marginale / conditionele kansen, proporties / geobserveerde aantallen versus verwachte aantallen /
hypothese toetsen: chi-kwadraat statistiek
H23: Inferentie voor regressie en correlatie, verband tussen 2 numerieke (continue) variabelen 17
- Schatten van regressielijn met beginpunt α en helling β / schatten SD / regressie standaard fout s /
correlatie en QQ-plot / hypothese testen en BHI voor helling β / voorspellen gemiddelde en predictie
interval met bijbehorend BHI / t-statistiek
H24: OneWay ANOVA: 29
verband tussen een continue uitkomstvariabele en een categorische verklarende variabele
- ANOVA F-toets: algemene toets op een verschil tussen de steekproefgemiddelden die je wilt
vergelijken / f-statistiek
H26: OneWay ANOVA vervolganalyses en TwoWay ANOVA 34
- Kijkt welke gemiddelden verschillen en hoeveel / BHI m* / toetsen / Bonferroni, Tukey, LSD /
Twoway ANOVA / hoofdeffecten / interactie / toetsen / grafieken interpreteren
twee verklarende (onafhankelijke) variabele in combinatie met een kwantitatieve responsvariabele
H-Betrouwbaarheid: 50
- Discrete variabelen: Cohens Kappa /
Continu variabelen: ICC (één getal), SEM, SDC, Bland Altman (grafiek), Pearsons correlatie coëfficiënt
H-Groepsgroottebepaling: 61
-Achtergrond informatie formule / Eén groep, normaal verdeelde data, σ bekend /
Eén groep, normaal verdeelde variabele, σ onbekend / Twee groepen, normaal verdeelde data, σ onbekend /
Twee groepen, dichotome data / relatie tussen power en groepsgrootte
Wanneer de toetsingsgrootheid waarde groter is dan de kritieke waarde, dan verwerp je de nulhypothese.
Wanneer de waarde 0 niet in je BHI zit, dan verwerp je de nulhypothese
,Toetsen van één en twee proporties
- Inferentie voor één proportie
- Vergelijken van twee proporties
Inferentiele statistiek: de bevindingen in de steekproef (dichotome uitkomst, vb. ziek-niet ziek) generaliseren naar de
populatie waar die uitkomt.
Dat doe je door de binomiale verdeling te benaderen met de Normale verdeling.
De steekproef verdeling is nooit precies normaal, omdat de normaal verdeling loopt van – oneindig tot + oneinding
(continue verdeling) terwijl de binomiale verdeling ligt tussen 0 en 1 (discrete verdeling). En de uitkomsten van de
steekproef zijn gebaseerd op de discrete verdeling: uitkomsten, 1,2,3 etc. Er kunnen geen 30,2 mensen beter
worden. Dus het is een benadering met de Normale verdeling continuïteitscorrectie OF grote steekproefgrootte
(centrale limietstelling).
- Toetsen m.b.v. nul- alternatieve hypothese of de kans in de populatie een bepaalde waarde heeft.
- Schatten: betrouwbaarheidsinterval laten uitrekenen voor de steekproefproportie.
Chapter 19: het maken van een schatting van één populatie proportie met een dichotome uitkomst (2 mogelijkh.)
De steekproef proportie p̂ [“p hat”] is een schatter van de populatie proportie p.
De steekproefverdeling van een proportie p̂ : een deel van de populatie dat voldoet aan een bepaald kenmerk,
uitgedrukt als percentage. Je probeert een idee te krijgen van de toevalsvariatie in de steekproef. Hoeveel % van de
populatie is ziek/heeft een bepaalde aandoening?
X is een telling van het aantal gevallen van een categorische uitkomst in een vast aantal waarnemingen. Je gaat uit
van een variabele die slechts twee waarden aan kan nemen (0 en 1, ziek en gezond, succes en mislukking).
Als het aantal waarnemingen n is, dan is de steekproefverhouding (proportie)
p̂ = (aantal successen in steekproef / omvang van steekproef) = X / n
Richtlijn voor het gebruik van een normale verdeling bij een binomiale verdeling:
• Wanneer de steekproefgrootte groot is, is de steekproefverdeling bij benadering Normaal en werkt de
centrale limietstelling.
De formule is niet nauwkeurig tenzij de populatie veel groter is dan de steekproef, ten minste 20 keer groter.
Je veronderstelt dat je trekt met teruglegging, maar in de praktijk doe je dat niet. Personen kunnen er niet
twee keer in zitten: dit is prima zolang de populatie minstens 20x zo groot is als de steekproef
• De data moet voortkomen uit een Simple Random Sample (SRS) uit de populatie. Enkelvoudige aselecte
steekproeftrekking is een vorm van kanssteekproeftrekking waarbij de onderzoeker willekeurig een
deelverzameling van deelnemers uit een populatie selecteert.
• De normale benadering is het nauwkeurigst voor een vaste n als p dicht bij 0,5 ligt, en het minst nauwkeurig
als p dicht bij 0 (geen successen) of 1 (alleen maar successen) ligt. Het aantal successen en mislukkingen
moet minstens 15 zijn.
Bij een aselecte steekproeftrekking uit een populatie met proportie p van geslaagden heeft de steekproefverdeling
van de proportie p̂ een gemiddelde en standaardafwijking van:
p(1 p)
pˆ p pˆ
n
Echter weten we de waarde van p niet. Daarom
wordt de standaard deviatie van p̂ vervangen door
de standaard fout van p̂ :
2
,Iedere steekproef geeft weer een net iets andere steekproefproportie = schatting.
Als de n groot genoeg is kan je de Normale verdeling gebruiken. Wat we verwachten is dat de steekproefverdeling p̂
dan dezelfde waarde heeft als de werkelijke waarde p.
Je doet uitspraken over de popuatie met die ene steekproef die je hebt getrokken.
Voor het krijgen van een Level C betrouwbaarheidsinterval:
1. The large-sample interval
Niveau betrouwbaarheidsinterval, vaak 95% (CI) =
Om het betrouwbaarheidsinterval voor p te krijgen met
kritieke waarde z*:
Dit interval heeft de vorm: schatting ± z* SEschatting
Dit is valide wanneer: het aantal successen en het aantal
mislukkingen beide minstens 15 is.
Het interval wordt breder naarmate de groepsgrootte kleiner is en de proportie dichter bij 0.5 zit.
VB: NHANES vond dat 515 vrouwen van een steekproef van 1921 vrouwen in de leeftijd van 14 tot 59 jaar positief
testte op HPV. Dit geeft een p̂ = 0.2681.
- Standaard fout van p̂ : SE = √((0.2681 x 0.7319) / 1921) = 0.01011
- De standaard normale kritieke waarde van een 95% betrouwbaarheidsinterval: z* = 1.960
- Margin of error: m = z*SE = 1.960 x 0.01011 = 0.0198
- 95% betrouwbaarheidsinterval voor p: p̂ ± m = 0.2681 ± 0.0198 geeft range 0.2483 tot 0.2879
We zijn er 95% zeker van dat het percentage vrouwen met een leeftijd tussen de 14 en 59 procent in de Verenigde
Staten wie een positieve HPV test heeft ligt tussen de 24,8% en 28,8%
Bij het interpreteren van de resultaten in de context van het onderzoek moet je ook kijken naar in dit geval de non-
response van 23%, welke veelal jongere vrouwen en van bepaalde ethische groepen waren. Het feit dat de
nonresponders verschillend zijn van de responders zorgt voor bias.
Daarnaast zorgt bijvoorbeeld een online poll voor een vrijwillige respons steekproef die niet beschouwd kan worden
als een SRS van een grotere populatie. Vaak zal ook deze groep responders een gemiddeld lagere leeftijd hebben.
Echter is dit betrouwbaarheidsinterval vaak minder accuraat (vooral bij kleinere steekproeven, kies dan altijd voor de
plus-four methode). Om de accuraatheid te verhogen wordt de volgende “plus four” methode gebruikt waarbij je 4
denkbeeldige observaties toevoegt, 2 successen en 2 mislukkingen. Je schatting wordt altijd dichter naar de 0.5
getrokken. Wordt meer opgeschoven naar het midden toe. Geeft een beter betrouwbaarheidsinterval. Bij een grote
steekproef zijn die extra paar waarnemingen verwaarloosbaar.
3
, 2. Plus four methode
Plus four schatting van p:
• Is te gebruiken bij een betrouwbaarheidsinterval van minimaal 90%
• Is te gebruiken bij een steekproefgrootte n van minimaal 10, met successen en mislukkingen.
Level C confidence interval:
Confidence level
VB: Onderzoekers keken naar een willekeurige steekproef van 97 artikelen die uit gingen van placebo gecontroleerde
willekeurige trials in de top 5 medische tijdschriften. Enkel 7 van de 97 artikelen beschreven het succes van het
blinderen.
Je kan hier niet uitgaan van de large-sample methode omdat het aantal successen maar 7 is. Wel is de totale
steekproef heel groot waardoor we de Plus Four methode gebruiken:
- Schatting van p = ~p = (7+2) / (97+4) = 0.0891
- Standaard fout (SE) van ~p = √(0.0891 x 0.9109/101) = 0.02835
- z* waarde bij een 95% BHI = 1.960 (Table C)
- Margin of error: m = z*SE = 1.960 x 0.02835 = 0.05556
- Plus Four 95% BHI voor p = ~p ± m = 0.0891 ± 0.0556 met een interval van 0.0335 tot 0.1447
We zijn 95% zeker dat tussen de 3,4% en 14,5% van alle artikelen die beschrijven een placebo gecontroleerde trial te
doen ook beschrijven in hoeverre het blinderen succesvol was.
Deze plus-four methode is hetzelfde als de large sample methode wanneer je deze gebaseerd had op 9 successen in
101 observaties.
Het kiezen van de steekproefgrootte voor een gewenste margin of error:
Als p onbekend is, zijn zowel het centrum als de spreiding van de steekproefverdeling onbekend = probleem.
Met p* als een gegokte waarde voor de steekproef proportie p̂ , die is onbekend. Deze gok je op basis van:
- Wanneer je verwacht dat de daadwerkelijke p̂ minder dan 0.3 of meer dan 0.7 zal zijn een pilot studie of
ervaring uit het verleden met dezelfde studies
- Wanneer je verwacht dat de daadwerkelijke p̂ tussen 0.3 en 0.7 ligt p* = 0.5 als gok. De margin of error m is het
grootst wanneer p̂ = 0.5. De margin of error zal daadwerkelijk minder of gelijk zijn aan m als je p* waarde gokt op 0.5.
Kleinere margin of error (grotere betrouwbaarheid van de resultaten, meer zekerheid) = grotere steekproeven. Maar
de populatie moet nog steeds veel groter zijn dan de steekproef.
4