100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Statistiek Premaster Bestuurskunde VU Week 3 & 4 $5.76   Add to cart

Class notes

Samenvatting Statistiek Premaster Bestuurskunde VU Week 3 & 4

 13 views  1 purchase
  • Course
  • Institution

Samenvatting/uitleg/colleges van het vak PM Beschrijvende en inferentiële statistiek. Vak behaald met eindcijfer: 8,5

Preview 4 out of 55  pages

  • October 3, 2021
  • 55
  • 2020/2021
  • Class notes
  • J.c. muis
  • Week 3 & 4
avatar-seller
Week 3
6: Betrouwbaarheidsintervallen
6.1: Inferenties
In inferentiële statistiek gebruiken we informatie uit de steekproef om uitspraken te doen over de
bredere populatie, waarvan we de parameters niet kennen. Door steekproefvariatie is er altijd
onzekerheid in de schattingen. Dit is een goede reden om een bandbreedte te schatten waarbinnen
de populatieparameter waarschijnlijk valt, in plaats van een precieze puntsschatting.
Voor de interpretatie van betrouwbaarheid, zie ook de tekst “Long run versus subjective probability
interpretation of confidence” in paragraaf 8.2 van Agresti et al. (pp. 376-377 in de 4th edition).
1. Punt- en intervalschattingen van populatieparameters





andere ouders ook?




Twee type statistische inferentie onderscheiden:



1

, - We kunnen populatieparameters schatten;
- En we kunnen hypothesen over deze parameters testen.

2 manieren waarop we de waarde van een PP kunnen schatten:
1. Puntschatter (point estimate): Het is één getal dat onze beste schatting is van de
populatieparameter;
2. Intervalschatting: Het is een reeks waarden waarbinnen we veravhten dat de parameter zal
vallen.

Babyvoorbeeld
1. Puntschatter
Laten we aannemen dat het gemiddelde aantal uren dat de 60 respondenten in
de steekproef minder slapen nadat zij een baby hebben gekregen 2,6 is. Dat
betekent dat een goede puntschatting voor het gemiddeld aantal verloren
slaapuren in de populatie 2.6 is. → De statistiek x-streepje, wat in ons geval 2,6
uur is, is een goede puntschatting van de parameter U.

Echter, een individuele puntschatting vertelt ons niet of de schatting dicht bij
de populatieparameter ligt waarin we geïnteresseerd zijn. Daarom willen
onderzoekers, naast de puntschatting zelf, vaak ook de waarschijnlijke precisie
van de puntschatting weten. → laten ze zien door een intervalschatting te
berekenen.

2. Intervalschatting
Een intervalschatting is een reeks getallen die, waarschijnlijk, de echte
populatiewaarde omvat. Op basis van ons steekproefgemiddelde van 2,6 uur,
kunnen we wellicht voorspellen dat het gemiddelde aantal verloren slaapuren
van nieuwe ouders in Amsterdam bijvoorbeeld tussen 2,3 en 2,9 ligt.

De waarschijnlijkheid dat dat interval de populatiewaarde bevat is wat we
noemen het betrouwbaarheidsniveau. Het betrouwbaarheidsniveau heeft
altijd een waarde die dicht bij de 1 ligt, meestal 0,95. In dat geval praten we over
het 95% betrouwbaarheidsinterval.

6.2: Betrouwbaarheidsintervallen
Deze drie kennisclips bespreken betrouwbaarheidsintervallen voor proporties
en voor gemiddelden.

NB: In de eerste video wordt het symbool π gebruikt voor populatieproporties. Het boek (Agresti et
al.) gebruikt dit symbool niet, zoals ze uitleggen naast de tekst op pagina 368 van editie 4. In plaats
daarvan gebruiken ze p voor populatieproporties en p-hat voor steekproefproporties. In het
formuleblad volgen we het boek.

In de derde video wordt de t-verdeling geïntroduceerd. Vorige week zeiden we al dat de
standaarddeviatie van de populatie meestal onbekend is. Daarom gebruiken we de
standaarddeviatie van de steekproef om de standaardfout te berekenen. Hiermee introduceren we
een extra foutmarge. Hier moeten we rekening mee houden als we hypothesen toetsen of
betrouwbaarheidsintervallen berekenen. Dit doen we door de t-verdeling te gebruiken in plaats van
de z-verdeling. Hoe de t-verdeling er precies uitziet hangt af van het aantal betrouwbaarheidsgraden
(steekproefomvang minus 1, ofwel n-1). Hoe groter de steekproef, hoe meer de t-verdeling lijkt op
de normaalverdeling. Zoals Agresti et al. (p. 387) schrijven: “When df is above about 30, the t-score



2

,is similar to this z-score. For instance, they both round to 2.0. The t-score gets closer and closer to
the z-score as df keeps increasing. You can think of the standard normal distribution as a t-
distribution with df = infinity.).” Vanaf nu houden we rekening met deze extra foutmarge door de t-
verdeling te gebruiken als we hypothesen toetsen of betrouwbaarheidsintervallen uitrekenen voor
gemiddelden.

1. Betrouwbaarheidsintervallen voor properties

Houd je baby ervan om te poepen tijdens het verschonen van de
luier?
Hoe kunnen we op basis van zo’n studie, een
betrouwbaarheidsinterval construeren om een populatieproportie
te berekenen.
17% van 100 respondenten geeft aan JA → proportie = 0.17
83% van 100 respondenten geeft aan NEE

Wanneer we een betrouwbaarheidsinterval maken voor een
proportie, dan gebruiken we de steekproevenverdeling van de
steekproefproportie. We weten dat, zolang de steekproef groot genoeg is, de steekproevenverdeling
normaal verdeeld is met een gemiddelde dat gelijk is aan de proportie in de populatie, P. En een
standaarddeviatie die gelijk is aan de wortel van P, vermenigvuldigd met 1 min P gedeeld door n.
We weten ook dat de kans op het vinden van een steekproefproportie van minder van ongeveer
twee SD van het gemiddelde, wat de populatieproportie is, 0.95 is. Meer precies, wanneer we de z-
score die bij deze kans hoort, opzoeken, dan vinden we een waarde van 1.96. Dit betekent dat we
een 95% kans hebben dat onze steekproefproportie tussen 1.96 standaarddeviaties van onze
populatieproportie zal liggen. Dit is wat we de foutmarge noemen.

De formule waarmee we het 95%
betrouwbaarheidsinterval kunnen
berekenen ziet er zo uit:
P plus en min 1.96 keer de
standaarddeviatie van de
steekproevenverdeling van de
steekproefproportie. 1.96 is de z-
score die hoort bij het 95%
betrouwbaarheidsinterval. Dus
we kunnen ook noteren: p plus en
min de z-score van het 95%
betrouwbaarheidsinterval keer de
standaardeviatie van de
steekproevenverdeling van de
steekproefproportie.
We hebben het hier over een 95%
betrouwbaarheidsinterval, dat
betekent dat we kunnen zeggen
dat wanneer we een oneindig
aantal steekproeven zouden trekken, in 95% van de gevallen het betrouwbaarheidsinterval de
populatieproportie P zou omvatten. Echter, zoals je wellicht gemerkt hebt, weten we de waarde van
de populatieproportie P niet. Dus het is onmogelijk om een SD van de steekproevenverdeling van de
steekproevenproportie te berekenen. → We moeten daarom de populatieparameter P vervangen




3

, door een schatting, en deze schatting is onze steekproefstatistiek, P dakje. Dit




leidt tot de volgende formule:
P plus en min de z-score voor het 95% betrouwbaarheidsinterval keer de
geschatte SD van de steekproefverdeling van de steekproefproportie.

In tegenstelling tot het betrouwbaarheidsinterval voor een gemiddelde
maken we geen gebruik van de t-verdeling bij het maken van een
betrouwbaarheidsinterval rond een proportie. We maken gewoon gebruik
van de standaard normaalverdeling. Echter, je data moet aan een aantal
assumpties voldoen. Je moet minimaal 15 successen en 15 fouten hebben.
Als dit niet het geval is dan kun je het betrouwbaarheidsinterval niet
berekenen op basis van de besproken formule.

VB baby poepen:

Se= 0.038
De foutmarge is dan 1,96*0.038=0.07
Betrouwbaarheidsinterval = 0,17 – 0,07 = 0,10 &
0,17 + 0,07 = 0,24.
Dus ons betrouwbaarheidsinterval loopt van 0,10 tot 0,24

→ Betekent dat we met 95% betrouwbaarheid kunnen
zeggen dat de populatieproportie tussen de 0,10 en de 0,24
ligt.
Of met andere woorden, als we een oneindige hoeveelheid
steekproeven met n is 100 uit een populatie zouden trekken,
en voor elke steekrpeof een BI met deze foutmarge zouden berekenen, dan zou de
populatiewaarde in 95% van de gevallen in dit BI vallen.

We kunnen met 95% betrouwbaarheid zeggen dat tussen de 10% en de 24% van de baby’s wel
poept tijdens het verschonen.

2. Betrouwbaarheidsintervallen voor gemiddelden waarvan de standaarddeviatie in de populatie
bekend is.
Weer hetzelfde voorbeeld als eerder:
→ in de praktijk is het heel onwaarschijnlijk dat je de waarde van deze
parameter (SD van populatie vlgm) weet, maar voor nu neem aan dat je
hem weet.

Vandaag:
Betrouwbaarheidsinterval berekenen met deze gegevens hiernaast & hoe je
die moet interpreteren.

Om een betrouwbaarheidsinterval te maken, gebruiken we de
steekproefverdeling van het gemiddelde. We hebben namelijk, te maken
met een steekproef van de populatie. We weten dat zolang onze steekproef
voldoende groot is, de steekproevenverdeling normaal verdeeld is met een




4

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller tessavandelogt35. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $5.76. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

77764 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$5.76  1x  sold
  • (0)
  Add to cart