Statistiek 2
Dichotome gegevens à 0/1-waarde à succes of geen succes
1. H10: Steekproevenverdeling en
betrouwbaarheidsintervallen voor proporties
1.1 Verdeling van de steekproef proporties
Over populaties en steekproeven:
- populatie = over wie/wat wil je een uitspraak doen?
- steekproef = indien niet haalbaar om de volledige populatie te
bevragen/bemonsteren à steekproef trekken
- parameter = proportie p in de populatie (‘werkelijke waarde’) à dit willen we
weten maar kennen we meestal niet
- statistiek = proportie p^ in de steekproef (# successen) à daarom gebruiken we
p^om iets over p te zeggen
Steekproevenverdeling = Wat is de variabiliteit in de steekproefproportie pˆ? Stel je
theoretisch voor hoe de steekproefproportie kan variëren over alle mogelijke
steekproeven.
Steekproefproportie = berekend op basis van één enkele steekproef uit een volledige
populatie
Variabiliteit à hoe zou de steekproefproportie variëren over alle mogelijke
steekproeven?
à vb: Indien 20% van de klanten hun uitgaven met een kredietkaart verhogen, zal de
marketingcampagne geslaagd zijn.
In een steekproef van 1000 klanten, verhoogden 211 klanten hun uitgaven.
Is dit voldoende om de campagne te lanceren?
, à eerste steekproef geeft 0,211, een
tweede steekproef geeft 0,196, stel dat we
er zo 10000 uitvoeren = 10 000
simulaties met steekproefgrootte 1000
à zie onderaan
à gemiddelde = populatieproportie
à blauwe lijn = standaard deviatie =
waarde voor de spreiding/variabiliteit van
de steekproefproporties
- niet elke steekproef heeft een proportie gelijk aan 0.2
- steekproefproporties groter dan 0.24 en kleiner dan 0.16 zijn zeldzaam
- meeste steekproefproporties liggen tussen 0.18 en 0.22
- dit histogram toont de simulatie van de steekproevenverdeling van pˆ
Steekproevenverdeling = de verdeling van de proporties over veel onafhankelijke
steekproeven van de populatie noemen we de steekproevenverdeling van de
proporties.
à de verschillende steekproeven moeten dezelfde steekproefgrootte hebben
Voor verdelingen die klokvormig zijn en gecentreerd rond de reële proportie p, kunnen
we de steekproefgrootte n gebruiken om de standaardafwijking van de
steekproevenverdeling te vinden:
,Verschil tussen steekproefproporties = steekproevenfout à niet echt een fout,
misschien beter: steekproevenvariabiliteit
Steekproevenverdeling van steekproefproporties:
Steekproevenverdelingsmodel voor de steekproefproportie:
à Normale verdeling
Steekproevenverdeling in de praktijk:
Wat als we populatieproportie niet kennen? (20% van vb hierhierboven)
- we kunnen de variabiliteit tussen steekproeven niet controleren, want in de
praktijk hebben we (meestal) maar 1 steekproef getrokken à we kunnen niet
simuleren
- we kunnen aan de hand van deze ene steekproef wel voorspellen hoe de
verschillende steekproefproporties zullen variëren van steekproef tot steekproef
(indien aan bepaalde voorwaarden voldaan is)
- dankzij deze gekende variatie kunnen we toch een (bedrijfs)beslissing nemen
a.d.h.v. 1 enkele steekproef
à hoe dit concreet in zijn werk gaat vormt een belangrijk onderdeel van deze
cursus
Z-scores:
- vermits we met het Normaalmodel werken kunnen we z-scores berekenen voor
gekende populatieproportie p en vooropgestelde pˆ: z = (pˆ− p)/SD(pˆ)
à z-score berekenen = standaardiseren
- via deze z-scores kunnen we dan de probabiliteit berekenen om een proportie te
bekomen groter dan de vooropgestelde pˆ
- zo kunnen we bij het maken van een bedrijfsbeslissing inschatten hoe
uitzonderlijk het bekomen van een proportie groter dan de vooropgestelde pˆ is
, Voorbeeld:
We weten dat in de populatie 30% van de internetgebruikers ingeschreven is voor een
’pakket’ (met telefonie en tv erbij). Stel dat een onderzoeker een survey opzet en 100
respondenten bekomt. Bij onderzoek van de resultaten blijkt dat 49 respondenten
ingeschreven zijn voor een ’pakket’.
Hoe uitzonderlijk is het om een steekproefproportie van 49% te bekomen, gegeven de
populatieproportie en steekproefgrootte?
!" $,&∗$,(
SD(p^) = ! # = ! )$$
= 0,046
z = (0,49 – 0,30)/0,046 = 4,13 à de steekproefproportie is meer dan 4
standaarddeviaties groter dan het gemiddelde à dus zeer uitzonderlijk deze
steekproefproportie te bekomen
Aannames en condities
Aanname van onafhankelijkheid = de steekproefwaarden moeten onafhankelijk zijn
van elkaar
- redeneer of onafhankelijkheid in de data te verwachten is
- check de conditie van aselecte keuze:
à indien de data komt van een experiment, moet de toekenning van de
deelnemers aan de groepen aselect (random) gebeurd zijn
à voor een enquête heeft men een enkelvoudige aselecte steekproef uit de
populatie nodig
à indien een ander opzet wordt gebruikt, moet men zeker zijn dat de steekproef
niet vertekend is en dat de data representatief zijn voor de populatie
- check de 10% conditie:
à indien de steekproef niet met teruglegging wordt getrokken, mag de
steekproefgrootte n niet groter zijn dan 10% van de populatie
Aanname over steekproefgrootte = de steekproefgrootte n moet voldoende groot zijn
(Normaal steekproevenverdelingsmodel van pˆ).
- succes/mislukking voorwaarde: de steekproefgrootte moet groot genoeg zijn
zodat zowel het aantal successen np als het aantal mislukkingen nq verwacht
wordt minstens 10 te zijn.
Kijk kennisclip steekproevenverdeling + werken met de applet
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper phebevanderoost1. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €8,16. Je zit daarna nergens aan vast.