Samenvatting stof Klassieke Statistische Methoden
Hoofdstuk 19: interference about a population proportion
Wanneer het gaat om het bestuderen van categorische variabelen.
Het schatten van één populatieproportie middels een steekproefproportie.
Het vergelijken van twee populatieproporties komt in hoofdstuk 20 aan de orde.
Populatieproportie: p
𝑎𝑎𝑛𝑡𝑎𝑙 𝑠𝑢𝑐𝑐𝑒𝑠𝑠𝑒𝑛 𝑖𝑛 𝑑𝑒 𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓
Steekproefproportie: p̂ =
𝑡𝑜𝑡𝑎𝑎𝑙 𝑎𝑎𝑛𝑡𝑎𝑙 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑒𝑛 𝑖𝑛 𝑑𝑒 𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓
We gaan weer uit van de steekproefverdeling, maar dan voor proporties.
De steekproefverdeling van p̂
X = random variabele, is een telling van de voorvallen van een categorische variabele in een bepaald aantal
𝑎𝑎𝑛𝑡𝑎𝑙 𝑠𝑢𝑐𝑐𝑒𝑠𝑠𝑒𝑛 𝑖𝑛 𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓 𝑋
observaties. Bij n voorvallen is de steekproefproportie: p̂ = =
𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓𝑔𝑟𝑜𝑜𝑡𝑡𝑒 𝑛
De steekproevenverdeling van de steekproefproportie bij een categorische variabele werkt op dezelfde manier
als de steekproevenverdeling van x̄: je neemt een grote steekproefgrootte en veel steekproeven →
steekproevenverdeling van de steekproefproportie.
- Het gemiddelde van de steekproefverdeling is p (daadwerkelijke proportie). Daarom is p̂ een zuivere
schatter van p.
- De standaarddeviatie is √𝑝(1 − 𝑝)/𝑛. Dit geldt alleen wanneer de populatie veel (minstens 20 keer)
groter is dan de steekproef. De standaarddeviatie wordt kleiner met de snelheid van √𝑛. Als we de
standaarddeviatie met 10 willen verkleinen hebben 100 keer zo veel observaties nodig.
- Als de steekproefgrootte toeneemt wordt de steekproefverdeling bij benadering normaal (geen
normale benadering gebruiken wanneer de steekproef klein is). Deze is het minst accuraat wanneer p
dicht bij 0 of 1 ligt (dan zijn grotere steekproeven nodig) als je normaal wil benaderen.
- Hoe groter de steekproefgrootte, hoe kleiner de spreiding, hoe dichter bij p.
Voorwaarden voor inferentie van een proportie:
- We hebben een SRS uit de populatie;
- De steekproefgrootte n is groot genoeg om zeker te zijn dat de steekproefverdeling van p̂ dicht bij
normaal ligt;
- De populatie is vele malen groter dan de steekproef (is bijna altijd zo).
Betrouwbaarheidsintervallen voor een proportie bij grote steekproeven
Betrouwbaarheidsinterval = p̂ ± foutmarge
Foutmarge m = kritische waarde × SE
We weten p niet. We gebruiken de standaardfout van p̂ .
𝑝̂(1−𝑝̂)
SEp̂ = √
𝑛
𝑝̂(1−𝑝̂)
Level C betrouwbaarheidsinterval voor p: p̂ ± z* √
𝑛
Dus: schatter ± z* SEschatter
Dit is alleen te gebruiken als zowel het aantal successen als het aantal mislukkingen minimaal 15 zijn.
We gebruiken hier dus kritieke z-scores en gaan niet uit van de t-verdeling (wat we wel doen wanneer we
inferentie willen doen van een gemiddelde waarbij de populatiestandaarddeviatie onbekend is).
,Voorbeeld:
Successen en mislukkingen zijn beiden groter dan 15.
p̂ = 0.27
n = 1921
0.27(1−0.27)
SEp̂ = √ = 0.01
1921
Z* voor een 95% BHI is 1.96 (tabel C).
m = 1.96 × 0.01 = 0.02
95% BHI voor p: p̂ ± m = 0.27 ± 0.02 = 0.25-0.29
Hiermee kunnen we zeggen dat we 95% zeker zijn dat de ware populatieproportie ergens tussen 0.25% en
0.29% ligt.
Liever niet afronden tussendoor, afronden op 4 decimalen in de meeste gevallen.
Bekijk ook altijd of er sprake is van non-respons en of dit tot bias leidt.
Meer accurate berekening van het betrouwbaarheidsinterval voor een proportie
Hier volgt een accurater betrouwbaarheidsinterval voor een proportie. In principe moet je deze altijd
gebruiken, maar je kunt het eens tegenkomen dat de manier voor grote steekproeven, zoals hierboven
beschreven, gebruikt is.
Dit noemen we de plus vier methode. Er worden 4 waarnemingen bij opgeteld, waarvan 2 successen en 2
mislukkingen. De plus vier schatter van p bereken je als volgt:
𝑎𝑎𝑛𝑡𝑎𝑙 𝑠𝑢𝑐𝑐𝑒𝑠𝑠𝑒𝑛 𝑖𝑛 𝑑𝑒 𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓+2
p~ =
𝑛+4
Het betrouwbaarheidsinterval is precies hetzelfde, maar dan met de nieuwe steekproefgrootte en het nieuwe
aantal successen. Dus hiermee het BHI voor grote steekproeven gebruiken.
Je kunt dit gebruiken bij minimaal een 90% BHI en een minimale steekproefgrootte van 10. Het aantal
successen en mislukkingen maakt niet uit.
De plus vier methode is accurater omdat deze ervoor zorgt dat de geschatte proportie p̂ dichter naar 0.5
getrokken wordt en weg van 0 of 1 (welke dichterbij ligt).
𝑝~(1−𝑝~)
De SE wordt dan: √
(𝑛+4)
Het kiezen van de steekproefgrootte
Op deze manier zowel voor de methode van grote steekproeven als de plus vier methode.
Steekproefgrootte kiezen voor een gewenste foutmarge (je wil bijv. een 95% BHI):
𝑧∗ 2
n = ( ) p* (1-p*)
𝑚
z* is de kritische waarde voor het niveau BHI dat we willen.
𝑝̂(1−𝑝̂)
m = z* √ → er wordt meestal dus gegeven hoe groot de m maximaal mag zijn, deze vul je dan in
𝑛
bovenstaande formule in. De m ligt altijd ver onder de 1.
,We hebben om n te berekenen dus vooraf een geschatte waarde van p̂ nodig (p*), omdat we die voor het
kiezen van de steekproef dus nog niet weten. Dit kan op de volgende manieren:
- Gebruik p* = 0.5, m is het grootst wanneer p̂ = 0.5, dus bij iedere andere waarde van p̂ zullen we een
kleinere m krijgen dan gepland. Dit kun je doen wanneer je verwacht dat p̂ ergens tussen 0.3 en 0.7 zal
liggen.
- Kies een schatting op basis van een pilotstudie of een voorgaande ervaring met vergelijkbare studies.
Doe dit wanneer je verwacht dat p̂ onder 0.3 of boven 0.7 zal liggen. Anders zul je een veel grotere n
krijgen dan je eigenlijk nodig hebt als je dan p* = 0.5 gebruikt.
Voorbeeld:
Je wil weten hoe groot de sample moet zijn om een m=0.04 (4%) en 95% betrouwbaarheid te krijgen. Je
verwacht dat p̂ tussen 0.3 en 0.7 zal liggen, dus gebruikt p* = 0.5
1.96 2
Dit geeft: n = ( ) (0.5)(1 - 0.5) = 600.25 → altijd naar boven afronden dus n = 601.
0.04
Hoe kleiner je de m wilt, hoe groter je steekproef moet zijn. Let wel op dat de populatie een stuk groter moet
zijn dan je steekproef.
Hypothesetoets voor een proportie
Wanneer H0 waar is, is de steekproefverdeling voor p̂ ongeveer normaal verdeeld met p0 in het centrum en
standaarddeviatie √𝑝0(1 − 𝑝0)/𝑛
De toets statistiek voor H0: p = p0 is de steekproefproportie p̂ gestandaardiseerd door gebruik te maken van de
waarde onder p0 (omdat H0 ons een hypothetische waarde geeft hoeven hier verder geen aanpassingen
gedaan te worden):
̂−p0
p
z=
√𝑝0(1−𝑝0)
𝑛
De z-waarde is ongeveer normaal verdeeld wanneer H0 waar is. De p-waarde kun je als volgt weer aflezen in
tabel B.
Toets stappen:
- Neem een SRS uit een grote populatie met onbekende proportie van successen.
- Neem H0: p = p0
̂ −p0
p
- Bereken de z-waarde: z =
√𝑝0(1−𝑝0)
𝑛
- De p-waarde van een toets van H0 tegen:
Ha: p > p0 is P(Z ≥ z)
Ha: p < p0 is P(Z ≤ z)
Ha: p ≠ p0 is 2P(Z ≥ |z|)
Gebruik deze toets wanneer n is zo groot dat np0 en n(1-p0) gelijk of groter zijn dan 10.
Dit zijn de verwachte successen en mislukkingen wanneer H0 waar is.
Voorbeeld:
N=20
H0: p = 0.5, Ha: p > 0.5
p̂ = 0.95
, ̂−p0
p 0.95 −0.5
z= = (1−0.5)
= 4.025
√𝑝0(1−𝑝0) √0.5
𝑛 20
p-waarde: dit is het gebied rechts van z = 4.025. Normalcdf (4.025, 1e99, 0, 1) = 2.85e-5, wat ongeveer
neerkomt op 0.00003. Tabel C vertelt alleen dat P kleiner is dan 0.0005 omdat z = 4.025 groter is dan de
grootste kritische waarde 3.291 in de rij met de z-waardes.
Hoofdstuk 20: het vergelijken van twee proporties
Het vergelijken van de proporties van successen in twee populaties bij categorische variabelen.
We vergelijken de populaties middels inferentie over het verschil p1-p2, deze schatten we met p̂ 1- p̂ 2.
De steekproefverdeling van een verschil tussen proporties
- Wanneer de steekproeven groot zijn is de verdeling van p̂ 1- p̂ 2 ongeveer normaal verdeeld.
- Het gemiddelde van de steekproefverdeling van p̂ 1- p̂ 2 is p1-p2. Dat betekent dat de het verschil
tussen de steekproefproporties een zuivere schatter is voor het verschil tussen de
populatieproporties.
𝑃1 (1−𝑃1 ) 𝑃2 (1−𝑝2 )
- De standaarddeviatie van de steekproefverdeling: √ +
𝑛1 𝑛2
Betrouwbaarheidsinterval voor grote steekproeven voor het vergelijken van proporties
De bovenstaande standaarddeviatie bevat de onbekende parameters p1 en p2. Deze moeten we vervangen
met de schatters. We kunnen deze vervangen voor de steekproefproporties, zo krijgen we de standaardfout
van de statistiek p̂ 1- p̂ 2:
p̂1 (1−p̂1 ) p̂2 (1−p̂2 )
SE = √ +
𝑛1 𝑛2
Het betrouwbaarheidsinterval bereken je weer op dezelfde manier als in het vorige hoofdstuk:
(p̂ 1 - p̂ 2) ± z*SE
Gebruik dit alleen wanneer het aantal successen en het aantal mislukkingen in beide groepen minimaal 10 is.
Voorbeeld:
n1 = 355, aantal successen = 174, p̂ 1 = 0.4901
n2 = 342, aantal successen = 134, p̂ 2 = 0.3918
p̂ 1 - p̂ 2 = 0.0983
0.4901 (1−0.4901) 0.3918 (1−0.3918)
SE = √ + = 0.03743
355 342
Kritische waarde z* voor een 95% BHI = 1.96
Fourtmarge = 1.96 × 0.03743 = 0.0734
95% BHI voor p1 – p2 : 0.0983 ± 0.0734 = 0.0249 tot 0.1717
We zijn voor 95% zeker dat het percentage [successen] in groep 1 tussen de 0.0249% en 0.1717% (of 2 en 17
procentpunten) hoger ligt dan het percentage [successen] in groep 2.
Accuratere betrouwbaarheidsintervallen voor het vergelijken van proporties
Plus vier betrouwbaarheidsinterval: voeg vier fictieve observaties toe, één succes en één mislukking in beide
steekproeven. Bereken met deze nieuwe waarden het betrouwbaarheidsinterval volgens de grote
steekproeven methode. Gebruik dit wanneer de steekproefgrootte van beide groepen minimaal 5 is. Het aantal
successen of mislukkingen maakt niet uit.