7.1 Hoe steekproef proporties verschillen rond de populatie proportie
Vaak doen we voorspellingen over de parameters van de populatie met behulp van de statistic uit een
steekproef. Hoe weten we of de steekproef proportie een goede schatting is van de populatie proportie?
à Steekproefverdeling (een soort kansverdeling). Deze helpt ons te bepalen hoe groot een bepaalde kans is
hoe dicht bij de populatie parameter een steekproef statistic valt.
Stel dat X = stemmingsuitslag, met x=1 voor Obama en x=0 voor alle andere. De uitkomst is hier binair (twee
keuzes: wel of niet voor Obama stemmen).
à De steekproef proportie is een numerieke samenvatting van de binaire uitkomst en is een statistic.
Populatieverdeling: dit is de verdeling van waaruit we een steekproef nemen. Waarden van de
parameters (bijv. populatie proportie p) staan vast, maar zijn meestal niet
bekend. We willen wel graag een uitspraak over de parameters kunnen doen.
Dataverdeling: dit is de verdeling van steekproefdata en zien we het meest. Het wordt vaak
beschreven met steekproef statistics (bijv. steekproef proportie). Omdat data uit
elke willekeurige steekproef verschilt, geldt dat hoe meer steekproeven, hoe
dichter de dataverdeling gaat lijken op de populatieverdeling.
Steekproefverdeling: dit is de verdeling van een steekproef statistic (bijv. steekproef proportie). Bij een
willekeurige steekproef, geeft de steekproefverdeling een kansverdeling (van
waarschijnlijkheid of onwaarschijnlijkheid) voor alle mogelijke uitkomsten van de
statistic. De steekproefverdeling is de sleutel naar beschrijven hoe dichtbij een
steekproef statistic (bijv. steekproef proportie) ligt bij de werkelijke onbekende
parameter (bijv. populatie proportie).
Binominale verdeling is bij benadering normaal als het verwacht aantal keer succes of mislukking, np en n(1-p),
op z’n minst 15 zijn.
Formules
Gemiddelde en standaarddeviatie van de steekproefverdeling van een proportie.
Voor een willekeurige steekproef met de grootte n van een populatie met de proportie p als uitkomst in een
specifieke categorie, de steekproefverdeling van de steekproef proportie in die categorie heeft:
Gemiddelde: p
!(#$!)
Standaarddeviatie:
&
7.2 Hoe steekproefgemiddelden verschillen rond de populatiegemiddelden
Steekproefgemiddelde: '
Populatiegemiddelde: (
Resultaten laten ons toe te kunnen voorspellen hoe dichtbij een specifiek steekproefgemiddelde bij het
populatiegemiddelde ligt. Hetzelfde als bij een steekproefverdeling van de steekproefproportie, gelden ook hier
twee resultaten over de steekproefverdeling van het steekproefgemiddelde:
× De een geeft formules voor het gemiddelde en de standaarddeviatie van de steekproefverdeling.
× De ander indiceert dat de verdeling bij benadering een normaalverdeling is.
Voor een willekeurige steekproef met grootte n van een normaal verdeelde populatie met gemiddelde ( en
standaarddeviatie ), dan geldt onafhankelijk van de steekproefgrootte n, de steekproefverdeling van het
steekproefgemiddelde ' dat deze ook normaal verdeeld is met z’n center beschreven door het
populatiegemiddelde ( en de variabiliteit beschreven door de standaarddeviatie van de steekproefverdeling,
*
die gelijk staat aan de populatie standaarddeviatie delen door de wortel van de steekproefgrootte:
&
,Ook als de populatieverdeling niet belvormig is, kan de steekproefverdeling van het steekproefgemiddelde wel
belvormig zijn.
× Het gemiddelde van een steekproefverdeling van het steekproefgemiddelde is hetzelfde als het
populatiegemiddelde ( en de standaarddeviatie van de steekproefverdeling voor het steekproefgemiddelde
*
is
&
× Het belvormige resultaat is een consequentie van de Central Limit Theorem (CLT). Deze theorie zegt dat
het steekproefverdeling van het steekproefgemiddelde vaak een bij benadering normale verdeling heeft.
o Dit geldt ook als de populatieverdeling geen belvormige verdeling heeft.
Formules
Gemiddelde en standaarddeviatie van de steekproefverdeling van het steekproefgemiddelde ':
Voor een willekeurige steekproef van de grootte n van een populatie met gemiddelde ( en standaarddeviatie
), heeft de steekproefverdeling van het steekproefgemiddelde ' z’n center hetzelfde als het
populatiegemiddelde ( en is de variatie te beschrijven door de standaarddeviatie van de steekproefverdeling
*
door:
&
De Central Limit Theorem (CLT): beschrijft de verwachte vorm van de steekproefverdeling voor het
steekproefgemiddelde '
7.3 De binominale verdeling is een steekproefverdeling
De binominale kansverdeling is een voorbeeld van een steekproefverdeling. Het is de steekproefverdeling van
het aantal successen of tellingen in n onafhankelijke gebeurtenissen.
Formules
Gemiddelde en standaarddeviatie van de steekproefverdeling van een proportie:
Voor een binominale willekeurige variabele met n gebeurtenissen en p kans op succes voor elke gebeurtenis,
heeft de steekproefverdeling van de proportie van successen:
Mean: p
Standaarddeviatie: +(1 − +)//
Om deze waarden met behulp van de binominale verdeling te verkrijgen, neem het binominale gemiddelde np
en de binominale standaarddeviatie /+(1 − +) van het aantal successen en deel door n.
, College 1: steekproevenverdeling
Populatie: de groep waarover informatie verzameld worden
Steekproef: een greep uit de groep
We trekken steekproeven omdat er sprake is van tijdgebrek of geldgebrek.
à Uiteindelijk willen we iets over populatieparameters (bijvoorbeeld: gemiddelde, variantie en correlatie)
zeggen met behulp van ‘statistics’ berekend in steekproeven.
De stap om iets vanuit je steekproef te zeggen over de populatie noem je inferentiële of toetsende statistiek.
Statistic: een getal dat een eigenschap van een steekproef weergeeft
à een numerieke samenvatting van steekproefgegevens zoals een steekproefproportie
of steekproefgemiddelde
Parameter: getal dat een eigenschap van een populatie weergeeft
à een numerieke samenvatting van een populatiekenmerk zoals een populatieproportie
of populatiegemiddelde.
Steekproevenverdeling (sampling distribution)
× Steekproevenverdeling à hoe dicht bij de
populatiewaarde zal de steekproefschatting naar
verwachting vallen?
× Hoe gedragen ‘statistics’ zich bij een bepaalde
populatiewaarde en bepaalde steekproefgrootte?
o Voorbeeld: hoe gedraagt een
steekproefproportie zich als de
populatieproportie 0.30 is en er een steekproef
van n=100 getrokken wordt?
× De steekproevenverdeling van een statistic is de kansverdeling die aangeeft welke kansen horen bij de
mogelijke waarden van een statistic.
× De steekproevenverdeling beschrijft de variatie in de statistic die optreedt over alle mogelijke steekproeven
waarbij die statistic wordt gebruikt om de populatieparameter te schatten.
× Kennis over de steekproevenverdeling geeft informatie om in te schatten hoe dicht de ‘statistic’ bij de
parameter ligt.
× Elke statistic heeft een steekproevenverdeling
Populatieverdeling
De kansverdeling waaruit we een steekproef trekken, de gehele groep (bijv. alle Nederlanders)
× De waarden van de parameters zijn normaalgesproken onbekend. Het vaststellen van deze parameters is
het doel van het onderzoek, ze worden geschat met behulp van steekproefgegevens.
× Populatieverdeling van een dichotome variabele:
Dataverdeling
× Dit is de verdeling van de steekproefdata, meestal zie je alleen deze.
× Bij een aselecte steekproeftrekking geldt: hoe groter de steekproefomvang (n), hoe beter de verdeling van
de data de verdeling in de populatie weerspiegelt.
× Dataverdeling van een dichotome variabele:
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller melaniebakker. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.48. You're not tied to anything after your purchase.