Statistiek 2
Dichotome gegevens à 0/1-waarde à succes of geen succes
1. H10: Steekproevenverdeling en
betrouwbaarheidsintervallen voor proporties
1.1 Verdeling van de steekproef proporties
Over populaties en steekproeven:
- populatie = over wie/wat wil je een uitspraak doen?
- steekproef = indien niet haalbaar om de volledige populatie te
bevragen/bemonsteren à steekproef trekken
- parameter = proportie p in de populatie (‘werkelijke waarde’) à dit willen we
weten maar kennen we meestal niet
- statistiek = proportie p^ in de steekproef (# successen) à daarom gebruiken we
p^om iets over p te zeggen
Steekproevenverdeling = Wat is de variabiliteit in de steekproefproportie pˆ? Stel je
theoretisch voor hoe de steekproefproportie kan variëren over alle mogelijke
steekproeven.
Steekproefproportie = berekend op basis van één enkele steekproef uit een volledige
populatie
Variabiliteit à hoe zou de steekproefproportie variëren over alle mogelijke
steekproeven?
à vb: Indien 20% van de klanten hun uitgaven met een kredietkaart verhogen, zal de
marketingcampagne geslaagd zijn.
In een steekproef van 1000 klanten, verhoogden 211 klanten hun uitgaven.
Is dit voldoende om de campagne te lanceren?
, à eerste steekproef geeft 0,211, een
tweede steekproef geeft 0,196, stel dat we
er zo 10000 uitvoeren = 10 000
simulaties met steekproefgrootte 1000
à zie onderaan
à gemiddelde = populatieproportie
à blauwe lijn = standaard deviatie =
waarde voor de spreiding/variabiliteit van
de steekproefproporties
- niet elke steekproef heeft een proportie gelijk aan 0.2
- steekproefproporties groter dan 0.24 en kleiner dan 0.16 zijn zeldzaam
- meeste steekproefproporties liggen tussen 0.18 en 0.22
- dit histogram toont de simulatie van de steekproevenverdeling van pˆ
Steekproevenverdeling = de verdeling van de proporties over veel onafhankelijke
steekproeven van de populatie noemen we de steekproevenverdeling van de
proporties.
à de verschillende steekproeven moeten dezelfde steekproefgrootte hebben
Voor verdelingen die klokvormig zijn en gecentreerd rond de reële proportie p, kunnen
we de steekproefgrootte n gebruiken om de standaardafwijking van de
steekproevenverdeling te vinden:
,Verschil tussen steekproefproporties = steekproevenfout à niet echt een fout,
misschien beter: steekproevenvariabiliteit
Steekproevenverdeling van steekproefproporties:
Steekproevenverdelingsmodel voor de steekproefproportie:
à Normale verdeling
Steekproevenverdeling in de praktijk:
Wat als we populatieproportie niet kennen? (20% van vb hierhierboven)
- we kunnen de variabiliteit tussen steekproeven niet controleren, want in de
praktijk hebben we (meestal) maar 1 steekproef getrokken à we kunnen niet
simuleren
- we kunnen aan de hand van deze ene steekproef wel voorspellen hoe de
verschillende steekproefproporties zullen variëren van steekproef tot steekproef
(indien aan bepaalde voorwaarden voldaan is)
- dankzij deze gekende variatie kunnen we toch een (bedrijfs)beslissing nemen
a.d.h.v. 1 enkele steekproef
à hoe dit concreet in zijn werk gaat vormt een belangrijk onderdeel van deze
cursus
Z-scores:
- vermits we met het Normaalmodel werken kunnen we z-scores berekenen voor
gekende populatieproportie p en vooropgestelde pˆ: z = (pˆ− p)/SD(pˆ)
à z-score berekenen = standaardiseren
- via deze z-scores kunnen we dan de probabiliteit berekenen om een proportie te
bekomen groter dan de vooropgestelde pˆ
- zo kunnen we bij het maken van een bedrijfsbeslissing inschatten hoe
uitzonderlijk het bekomen van een proportie groter dan de vooropgestelde pˆ is
, Voorbeeld:
We weten dat in de populatie 30% van de internetgebruikers ingeschreven is voor een
’pakket’ (met telefonie en tv erbij). Stel dat een onderzoeker een survey opzet en 100
respondenten bekomt. Bij onderzoek van de resultaten blijkt dat 49 respondenten
ingeschreven zijn voor een ’pakket’.
Hoe uitzonderlijk is het om een steekproefproportie van 49% te bekomen, gegeven de
populatieproportie en steekproefgrootte?
!" $,&∗$,(
SD(p^) = ! # = ! )$$
= 0,046
z = (0,49 – 0,30)/0,046 = 4,13 à de steekproefproportie is meer dan 4
standaarddeviaties groter dan het gemiddelde à dus zeer uitzonderlijk deze
steekproefproportie te bekomen
Aannames en condities
Aanname van onafhankelijkheid = de steekproefwaarden moeten onafhankelijk zijn
van elkaar
- redeneer of onafhankelijkheid in de data te verwachten is
- check de conditie van aselecte keuze:
à indien de data komt van een experiment, moet de toekenning van de
deelnemers aan de groepen aselect (random) gebeurd zijn
à voor een enquête heeft men een enkelvoudige aselecte steekproef uit de
populatie nodig
à indien een ander opzet wordt gebruikt, moet men zeker zijn dat de steekproef
niet vertekend is en dat de data representatief zijn voor de populatie
- check de 10% conditie:
à indien de steekproef niet met teruglegging wordt getrokken, mag de
steekproefgrootte n niet groter zijn dan 10% van de populatie
Aanname over steekproefgrootte = de steekproefgrootte n moet voldoende groot zijn
(Normaal steekproevenverdelingsmodel van pˆ).
- succes/mislukking voorwaarde: de steekproefgrootte moet groot genoeg zijn
zodat zowel het aantal successen np als het aantal mislukkingen nq verwacht
wordt minstens 10 te zijn.
Kijk kennisclip steekproevenverdeling + werken met de applet
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur phebevanderoost1. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €8,16. Vous n'êtes lié à rien après votre achat.