Samenvatting over Statistiek II tijdens schooljaar aan de VUB (voor TEW en HI), gedoceerd door L. Vanhaverbeke.
Korte, volledige en duidelijke samenvatting over de slides, hoorcolleges en het handboek. Alle behandelde hoofdstukken zitten in deze SV vervat. De hoofdstukken staan in de volgorde w...
, H9 - STEEKPROEVENVERDELING EN
BETROUWBAARHEIDSINTERVALLEN VOOR FRACTIES
9.1 Verdeling van steekproeffracties
Populatie: grote groep waarover we een uitspraak doen onbekende parameter populatiefractie p
Steekproef: selectie van de populatie die we observeren ̂
statistiek: steekproeffractie 𝒑
Steekproevenvariabliteit: andere steekproef van evenveel klanten kan dezelfde waarden opleveren.
Om meer te weten te komen over variabiliteit in steekproeffractie 𝑝̂ , moeten we voorstellen hoe
steekproeffractie kan variëren over alle mogelijke steekproeven we kunnen dit beschrijven met een
histogram
Steekproeffractie: 1 steekproef uit een volledige populatie
Variabiliteit: hoe zou steekproef variëren over alle mogelijke steekproeven?
Simulatie van 10 000 steekproeffracties met 2 uitkomsten: succes/mislukking volgt normale verdeling
• Niet elke steekproef heeft eenzelfde fractie (zie dia 8 h9)
• Meeste steekproeffracties liggen tussen +- 1SD van het gemiddelde
• Histogram toont simulatie van steekproefverdeling van 𝑝̂
Verdeling van de fracties over veel onafhankelijke steekproeven van de populaties =
steekproevenverdeling van de fracties.
Aantal successen kan benaderd worden met binomiaal model en dit kan benaderd worden met de
𝑝𝑞
normale verdeling (p, √ 𝑛 ) zolang np en nq groot
genoeg zijn.
𝑎𝑎𝑛𝑡𝑎𝑙 𝑠𝑢𝑐𝑐𝑒𝑠𝑠𝑒𝑛 𝑋
Steekproeffractie: = = 𝑝̂
𝑛 𝑛
̂ √𝑝𝑞
Standaarddeviatie: 𝑆𝐷(𝑝) 𝑛
(hoe groter n hoe kleiner SD; voor verdelingen die
klokvorming zijn en gecentreerd rond p kunnen we n
gebruiken om SD te vinden)
9.2 Aannames en voorwaarden
Voorwaarden om normale verdeling te gebruiken:
1. Aanname onafhankelijkheid: steekproefwaarden moeten onafhankelijk zijn van elkaar
2. Aanname steekproefgrootte: n moet voldoende groot zijn
3. Voorwaarde aselecte keuze: Bij data van een experiment moet toekenning van deelnemers aan
groepen aselect gebeurd zijn. Enquête: aselecte steekproef, ander opzet: representatieve data
4. 10% voorwaarde: n mag niet groter zijn dan 10% van populatie (indien steekproef niet met
teruglegging wordt getrokken)
5. Succes/mislukking voorwaarde: aantal successen np en aantal mislukkingen nq minstens 10
2
, 𝑝̂−𝑝
Z-score: 𝑆𝐷(𝑝)
̂
9.3 Betrouwbaarheidsinterval voor een fractie
Als we weten hoeveel steekproeven variëren en vorm van hun verdeling, dan krijgen we een beter beeld
van hoe de echte fractie zal zijn.
• We weten dat steekproevenverdelingsmodel gecentreerd is rond de reële fractie p (maar we
weten p niet) en dat de standaardafwijking gegeven wordt door
• We weten ook door de centrale limietstelling dat de vorm van de steekproevenverdeling Normaal
is en we 𝑝̂ kunnen gebruiken om de standaardfout te berekenen (“schatten”)
̂ = √𝑝̂𝑞̂ met gebruik van 𝑝̂ om een schatting te maken van SD(𝑝̂ )
𝑆𝐸(𝑝) 𝑛
Wanneer we SD van een steekproevenverdeling berekenen noemen we deze de standaardfout
Omdat de verdeling Normaal is kunnen we verwachten dat 95% van alle steekproeven van bijvoorbeeld
3000 Amerikaanse volwassenen een steekproeffractie zou hebben binnen 2SE’s van p. zie vb slide 18
Interpretatie: We kunnen met 95% betrouwbaarheid
stellen dat tussen de 40,4% en 43,6% van de
Amerikaanse volwassenen dacht dat de economie
zou verbeteren
9.4 Wat betekent 95% echt?
• 95% van de steekproef produceert een betrouwbaarheidsinterval waar de echte fractie inzit.
• “We zijn 95% zeker dat de werkelijke fractie in ons interval zit”
• Fracties variëren per steekproef en bevatten ook verschillende betrouwbaarheidsintervallen
• Stel 20 steekproeven: meeste betrouwbaarheidsintervallen bevatten de echte waarde, maar
eentje niet
• “werkt ons interval?” kunnen we nooit weten want we zullen nooit de echte fractie weten van
de hele populatie.
9.5 Aannames en voorwaarden voor berekenen van betrouwbaarheidsinterval
1. Aanname onafhankelijkheid: data moet aselect gekozen zijn
2. 10% voorwaarde: minder dan 10% van populatie
3. Aanname steekproefgrootte: 10 successen en 10 mislukkingen
3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Anonymous55. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €9,39. Je zit daarna nergens aan vast.