100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting Statistiek Premaster Bestuurskunde VU Week 3 & 4 €5,09   In winkelwagen

College aantekeningen

Samenvatting Statistiek Premaster Bestuurskunde VU Week 3 & 4

 13 keer bekeken  1 keer verkocht

Samenvatting/uitleg/colleges van het vak PM Beschrijvende en inferentiële statistiek. Vak behaald met eindcijfer: 8,5

Voorbeeld 4 van de 55  pagina's

  • 3 oktober 2021
  • 55
  • 2020/2021
  • College aantekeningen
  • J.c. muis
  • Week 3 & 4
Alle documenten voor dit vak (3)
avatar-seller
tessavandelogt35
Week 3
6: Betrouwbaarheidsintervallen
6.1: Inferenties
In inferentiële statistiek gebruiken we informatie uit de steekproef om uitspraken te doen over de
bredere populatie, waarvan we de parameters niet kennen. Door steekproefvariatie is er altijd
onzekerheid in de schattingen. Dit is een goede reden om een bandbreedte te schatten waarbinnen
de populatieparameter waarschijnlijk valt, in plaats van een precieze puntsschatting.
Voor de interpretatie van betrouwbaarheid, zie ook de tekst “Long run versus subjective probability
interpretation of confidence” in paragraaf 8.2 van Agresti et al. (pp. 376-377 in de 4th edition).
1. Punt- en intervalschattingen van populatieparameters





andere ouders ook?




Twee type statistische inferentie onderscheiden:



1

, - We kunnen populatieparameters schatten;
- En we kunnen hypothesen over deze parameters testen.

2 manieren waarop we de waarde van een PP kunnen schatten:
1. Puntschatter (point estimate): Het is één getal dat onze beste schatting is van de
populatieparameter;
2. Intervalschatting: Het is een reeks waarden waarbinnen we veravhten dat de parameter zal
vallen.

Babyvoorbeeld
1. Puntschatter
Laten we aannemen dat het gemiddelde aantal uren dat de 60 respondenten in
de steekproef minder slapen nadat zij een baby hebben gekregen 2,6 is. Dat
betekent dat een goede puntschatting voor het gemiddeld aantal verloren
slaapuren in de populatie 2.6 is. → De statistiek x-streepje, wat in ons geval 2,6
uur is, is een goede puntschatting van de parameter U.

Echter, een individuele puntschatting vertelt ons niet of de schatting dicht bij
de populatieparameter ligt waarin we geïnteresseerd zijn. Daarom willen
onderzoekers, naast de puntschatting zelf, vaak ook de waarschijnlijke precisie
van de puntschatting weten. → laten ze zien door een intervalschatting te
berekenen.

2. Intervalschatting
Een intervalschatting is een reeks getallen die, waarschijnlijk, de echte
populatiewaarde omvat. Op basis van ons steekproefgemiddelde van 2,6 uur,
kunnen we wellicht voorspellen dat het gemiddelde aantal verloren slaapuren
van nieuwe ouders in Amsterdam bijvoorbeeld tussen 2,3 en 2,9 ligt.

De waarschijnlijkheid dat dat interval de populatiewaarde bevat is wat we
noemen het betrouwbaarheidsniveau. Het betrouwbaarheidsniveau heeft
altijd een waarde die dicht bij de 1 ligt, meestal 0,95. In dat geval praten we over
het 95% betrouwbaarheidsinterval.

6.2: Betrouwbaarheidsintervallen
Deze drie kennisclips bespreken betrouwbaarheidsintervallen voor proporties
en voor gemiddelden.

NB: In de eerste video wordt het symbool π gebruikt voor populatieproporties. Het boek (Agresti et
al.) gebruikt dit symbool niet, zoals ze uitleggen naast de tekst op pagina 368 van editie 4. In plaats
daarvan gebruiken ze p voor populatieproporties en p-hat voor steekproefproporties. In het
formuleblad volgen we het boek.

In de derde video wordt de t-verdeling geïntroduceerd. Vorige week zeiden we al dat de
standaarddeviatie van de populatie meestal onbekend is. Daarom gebruiken we de
standaarddeviatie van de steekproef om de standaardfout te berekenen. Hiermee introduceren we
een extra foutmarge. Hier moeten we rekening mee houden als we hypothesen toetsen of
betrouwbaarheidsintervallen berekenen. Dit doen we door de t-verdeling te gebruiken in plaats van
de z-verdeling. Hoe de t-verdeling er precies uitziet hangt af van het aantal betrouwbaarheidsgraden
(steekproefomvang minus 1, ofwel n-1). Hoe groter de steekproef, hoe meer de t-verdeling lijkt op
de normaalverdeling. Zoals Agresti et al. (p. 387) schrijven: “When df is above about 30, the t-score



2

,is similar to this z-score. For instance, they both round to 2.0. The t-score gets closer and closer to
the z-score as df keeps increasing. You can think of the standard normal distribution as a t-
distribution with df = infinity.).” Vanaf nu houden we rekening met deze extra foutmarge door de t-
verdeling te gebruiken als we hypothesen toetsen of betrouwbaarheidsintervallen uitrekenen voor
gemiddelden.

1. Betrouwbaarheidsintervallen voor properties

Houd je baby ervan om te poepen tijdens het verschonen van de
luier?
Hoe kunnen we op basis van zo’n studie, een
betrouwbaarheidsinterval construeren om een populatieproportie
te berekenen.
17% van 100 respondenten geeft aan JA → proportie = 0.17
83% van 100 respondenten geeft aan NEE

Wanneer we een betrouwbaarheidsinterval maken voor een
proportie, dan gebruiken we de steekproevenverdeling van de
steekproefproportie. We weten dat, zolang de steekproef groot genoeg is, de steekproevenverdeling
normaal verdeeld is met een gemiddelde dat gelijk is aan de proportie in de populatie, P. En een
standaarddeviatie die gelijk is aan de wortel van P, vermenigvuldigd met 1 min P gedeeld door n.
We weten ook dat de kans op het vinden van een steekproefproportie van minder van ongeveer
twee SD van het gemiddelde, wat de populatieproportie is, 0.95 is. Meer precies, wanneer we de z-
score die bij deze kans hoort, opzoeken, dan vinden we een waarde van 1.96. Dit betekent dat we
een 95% kans hebben dat onze steekproefproportie tussen 1.96 standaarddeviaties van onze
populatieproportie zal liggen. Dit is wat we de foutmarge noemen.

De formule waarmee we het 95%
betrouwbaarheidsinterval kunnen
berekenen ziet er zo uit:
P plus en min 1.96 keer de
standaarddeviatie van de
steekproevenverdeling van de
steekproefproportie. 1.96 is de z-
score die hoort bij het 95%
betrouwbaarheidsinterval. Dus
we kunnen ook noteren: p plus en
min de z-score van het 95%
betrouwbaarheidsinterval keer de
standaardeviatie van de
steekproevenverdeling van de
steekproefproportie.
We hebben het hier over een 95%
betrouwbaarheidsinterval, dat
betekent dat we kunnen zeggen
dat wanneer we een oneindig
aantal steekproeven zouden trekken, in 95% van de gevallen het betrouwbaarheidsinterval de
populatieproportie P zou omvatten. Echter, zoals je wellicht gemerkt hebt, weten we de waarde van
de populatieproportie P niet. Dus het is onmogelijk om een SD van de steekproevenverdeling van de
steekproevenproportie te berekenen. → We moeten daarom de populatieparameter P vervangen




3

, door een schatting, en deze schatting is onze steekproefstatistiek, P dakje. Dit




leidt tot de volgende formule:
P plus en min de z-score voor het 95% betrouwbaarheidsinterval keer de
geschatte SD van de steekproefverdeling van de steekproefproportie.

In tegenstelling tot het betrouwbaarheidsinterval voor een gemiddelde
maken we geen gebruik van de t-verdeling bij het maken van een
betrouwbaarheidsinterval rond een proportie. We maken gewoon gebruik
van de standaard normaalverdeling. Echter, je data moet aan een aantal
assumpties voldoen. Je moet minimaal 15 successen en 15 fouten hebben.
Als dit niet het geval is dan kun je het betrouwbaarheidsinterval niet
berekenen op basis van de besproken formule.

VB baby poepen:

Se= 0.038
De foutmarge is dan 1,96*0.038=0.07
Betrouwbaarheidsinterval = 0,17 – 0,07 = 0,10 &
0,17 + 0,07 = 0,24.
Dus ons betrouwbaarheidsinterval loopt van 0,10 tot 0,24

→ Betekent dat we met 95% betrouwbaarheid kunnen
zeggen dat de populatieproportie tussen de 0,10 en de 0,24
ligt.
Of met andere woorden, als we een oneindige hoeveelheid
steekproeven met n is 100 uit een populatie zouden trekken,
en voor elke steekrpeof een BI met deze foutmarge zouden berekenen, dan zou de
populatiewaarde in 95% van de gevallen in dit BI vallen.

We kunnen met 95% betrouwbaarheid zeggen dat tussen de 10% en de 24% van de baby’s wel
poept tijdens het verschonen.

2. Betrouwbaarheidsintervallen voor gemiddelden waarvan de standaarddeviatie in de populatie
bekend is.
Weer hetzelfde voorbeeld als eerder:
→ in de praktijk is het heel onwaarschijnlijk dat je de waarde van deze
parameter (SD van populatie vlgm) weet, maar voor nu neem aan dat je
hem weet.

Vandaag:
Betrouwbaarheidsinterval berekenen met deze gegevens hiernaast & hoe je
die moet interpreteren.

Om een betrouwbaarheidsinterval te maken, gebruiken we de
steekproefverdeling van het gemiddelde. We hebben namelijk, te maken
met een steekproef van de populatie. We weten dat zolang onze steekproef
voldoende groot is, de steekproevenverdeling normaal verdeeld is met een




4

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper tessavandelogt35. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €5,09. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 79976 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€5,09  1x  verkocht
  • (0)
  Kopen