College aantekeningen

Samenvatting Statistiek Premaster Bestuurskunde VU Week 3 & 4

1 keer verkocht

Instelling
Vrije Universiteit Amsterdam (VU)

Samenvatting/uitleg/colleges van het vak PM Beschrijvende en inferentiële statistiek. Vak behaald met eindcijfer: 8,5

[Meer zien]

Voorbeeld 4 van de 55 pagina's

Bekijk voorbeeld

Geupload op 3 oktober 2021
Aantal pagina's 55
Geschreven in 2020/2021
Type College aantekeningen
Docent(en) J.c. muis
Bevat Week 3 & 4

Volgen

tessavandelogt35 Lid sinds 4 jaar 215 documenten verkocht

€5,09

Ook beschikbaar in voordeelbundel v.a. €12,49

In winkelwagen

Opslaan

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Ook beschikbaar in voordeelbundel (1)

Samenvatting Statistiek Premaster Bestuurskunde VU Week 1 tm 5 (Volledig)

€ 15,27 € 12,49

5x verkocht

3 items

1. College aantekeningen - Samenvatting statistiek premaster bestuurskunde vu week 1 & 2
2. College aantekeningen - Samenvatting statistiek premaster bestuurskunde vu week 3 & 4
3. College aantekeningen - Samenvatting statistiek premaster bestuurskunde vu week 5 & 6
Meer zien

Week 3
6: Betrouwbaarheidsintervallen
6.1: Inferenties
In inferentiële statistiek gebruiken we informatie uit de steekproef om uitspraken te doen over de
bredere populatie, waarvan we de parameters niet kennen. Door steekproefvariatie is er altijd
onzekerheid in de schattingen. Dit is een goede reden om een bandbreedte te schatten waarbinnen
de populatieparameter waarschijnlijk valt, in plaats van een precieze puntsschatting.
Voor de interpretatie van betrouwbaarheid, zie ook de tekst “Long run versus subjective probability
interpretation of confidence” in paragraaf 8.2 van Agresti et al. (pp. 376-377 in de 4th edition).
1. Punt- en intervalschattingen van populatieparameters

→
andere ouders ook?

Twee type statistische inferentie onderscheiden:

1

, - We kunnen populatieparameters schatten;
- En we kunnen hypothesen over deze parameters testen.

2 manieren waarop we de waarde van een PP kunnen schatten:
1. Puntschatter (point estimate): Het is één getal dat onze beste schatting is van de
populatieparameter;
2. Intervalschatting: Het is een reeks waarden waarbinnen we veravhten dat de parameter zal
vallen.

Babyvoorbeeld
1. Puntschatter
Laten we aannemen dat het gemiddelde aantal uren dat de 60 respondenten in
de steekproef minder slapen nadat zij een baby hebben gekregen 2,6 is. Dat
betekent dat een goede puntschatting voor het gemiddeld aantal verloren
slaapuren in de populatie 2.6 is. → De statistiek x-streepje, wat in ons geval 2,6
uur is, is een goede puntschatting van de parameter U.

Echter, een individuele puntschatting vertelt ons niet of de schatting dicht bij
de populatieparameter ligt waarin we geïnteresseerd zijn. Daarom willen
onderzoekers, naast de puntschatting zelf, vaak ook de waarschijnlijke precisie
van de puntschatting weten. → laten ze zien door een intervalschatting te
berekenen.

2. Intervalschatting
Een intervalschatting is een reeks getallen die, waarschijnlijk, de echte
populatiewaarde omvat. Op basis van ons steekproefgemiddelde van 2,6 uur,
kunnen we wellicht voorspellen dat het gemiddelde aantal verloren slaapuren
van nieuwe ouders in Amsterdam bijvoorbeeld tussen 2,3 en 2,9 ligt.

De waarschijnlijkheid dat dat interval de populatiewaarde bevat is wat we
noemen het betrouwbaarheidsniveau. Het betrouwbaarheidsniveau heeft
altijd een waarde die dicht bij de 1 ligt, meestal 0,95. In dat geval praten we over
het 95% betrouwbaarheidsinterval.

6.2: Betrouwbaarheidsintervallen
Deze drie kennisclips bespreken betrouwbaarheidsintervallen voor proporties
en voor gemiddelden.

NB: In de eerste video wordt het symbool π gebruikt voor populatieproporties. Het boek (Agresti et
al.) gebruikt dit symbool niet, zoals ze uitleggen naast de tekst op pagina 368 van editie 4. In plaats
daarvan gebruiken ze p voor populatieproporties en p-hat voor steekproefproporties. In het
formuleblad volgen we het boek.

In de derde video wordt de t-verdeling geïntroduceerd. Vorige week zeiden we al dat de
standaarddeviatie van de populatie meestal onbekend is. Daarom gebruiken we de
standaarddeviatie van de steekproef om de standaardfout te berekenen. Hiermee introduceren we
een extra foutmarge. Hier moeten we rekening mee houden als we hypothesen toetsen of
betrouwbaarheidsintervallen berekenen. Dit doen we door de t-verdeling te gebruiken in plaats van
de z-verdeling. Hoe de t-verdeling er precies uitziet hangt af van het aantal betrouwbaarheidsgraden
(steekproefomvang minus 1, ofwel n-1). Hoe groter de steekproef, hoe meer de t-verdeling lijkt op
de normaalverdeling. Zoals Agresti et al. (p. 387) schrijven: “When df is above about 30, the t-score

2

,is similar to this z-score. For instance, they both round to 2.0. The t-score gets closer and closer to
the z-score as df keeps increasing. You can think of the standard normal distribution as a t-
distribution with df = infinity.).” Vanaf nu houden we rekening met deze extra foutmarge door de t-
verdeling te gebruiken als we hypothesen toetsen of betrouwbaarheidsintervallen uitrekenen voor
gemiddelden.

1. Betrouwbaarheidsintervallen voor properties

Houd je baby ervan om te poepen tijdens het verschonen van de
luier?
Hoe kunnen we op basis van zo’n studie, een
betrouwbaarheidsinterval construeren om een populatieproportie
te berekenen.
17% van 100 respondenten geeft aan JA → proportie = 0.17
83% van 100 respondenten geeft aan NEE

Wanneer we een betrouwbaarheidsinterval maken voor een
proportie, dan gebruiken we de steekproevenverdeling van de
steekproefproportie. We weten dat, zolang de steekproef groot genoeg is, de steekproevenverdeling
normaal verdeeld is met een gemiddelde dat gelijk is aan de proportie in de populatie, P. En een
standaarddeviatie die gelijk is aan de wortel van P, vermenigvuldigd met 1 min P gedeeld door n.
We weten ook dat de kans op het vinden van een steekproefproportie van minder van ongeveer
twee SD van het gemiddelde, wat de populatieproportie is, 0.95 is. Meer precies, wanneer we de z-
score die bij deze kans hoort, opzoeken, dan vinden we een waarde van 1.96. Dit betekent dat we
een 95% kans hebben dat onze steekproefproportie tussen 1.96 standaarddeviaties van onze
populatieproportie zal liggen. Dit is wat we de foutmarge noemen.

De formule waarmee we het 95%
betrouwbaarheidsinterval kunnen
berekenen ziet er zo uit:
P plus en min 1.96 keer de
standaarddeviatie van de
steekproevenverdeling van de
steekproefproportie. 1.96 is de z-
score die hoort bij het 95%
betrouwbaarheidsinterval. Dus
we kunnen ook noteren: p plus en
min de z-score van het 95%
betrouwbaarheidsinterval keer de
standaardeviatie van de
steekproevenverdeling van de
steekproefproportie.
We hebben het hier over een 95%
betrouwbaarheidsinterval, dat
betekent dat we kunnen zeggen
dat wanneer we een oneindig
aantal steekproeven zouden trekken, in 95% van de gevallen het betrouwbaarheidsinterval de
populatieproportie P zou omvatten. Echter, zoals je wellicht gemerkt hebt, weten we de waarde van
de populatieproportie P niet. Dus het is onmogelijk om een SD van de steekproevenverdeling van de
steekproevenproportie te berekenen. → We moeten daarom de populatieparameter P vervangen

3

, door een schatting, en deze schatting is onze steekproefstatistiek, P dakje. Dit

leidt tot de volgende formule:
P plus en min de z-score voor het 95% betrouwbaarheidsinterval keer de
geschatte SD van de steekproefverdeling van de steekproefproportie.

In tegenstelling tot het betrouwbaarheidsinterval voor een gemiddelde
maken we geen gebruik van de t-verdeling bij het maken van een
betrouwbaarheidsinterval rond een proportie. We maken gewoon gebruik
van de standaard normaalverdeling. Echter, je data moet aan een aantal
assumpties voldoen. Je moet minimaal 15 successen en 15 fouten hebben.
Als dit niet het geval is dan kun je het betrouwbaarheidsinterval niet
berekenen op basis van de besproken formule.

VB baby poepen:

Se= 0.038
De foutmarge is dan 1,96*0.038=0.07
Betrouwbaarheidsinterval = 0,17 – 0,07 = 0,10 &
0,17 + 0,07 = 0,24.
Dus ons betrouwbaarheidsinterval loopt van 0,10 tot 0,24

→ Betekent dat we met 95% betrouwbaarheid kunnen
zeggen dat de populatieproportie tussen de 0,10 en de 0,24
ligt.
Of met andere woorden, als we een oneindige hoeveelheid
steekproeven met n is 100 uit een populatie zouden trekken,
en voor elke steekrpeof een BI met deze foutmarge zouden berekenen, dan zou de
populatiewaarde in 95% van de gevallen in dit BI vallen.

We kunnen met 95% betrouwbaarheid zeggen dat tussen de 10% en de 24% van de baby’s wel
poept tijdens het verschonen.

2. Betrouwbaarheidsintervallen voor gemiddelden waarvan de standaarddeviatie in de populatie
bekend is.
Weer hetzelfde voorbeeld als eerder:
→ in de praktijk is het heel onwaarschijnlijk dat je de waarde van deze
parameter (SD van populatie vlgm) weet, maar voor nu neem aan dat je
hem weet.

Vandaag:
Betrouwbaarheidsinterval berekenen met deze gegevens hiernaast & hoe je
die moet interpreteren.

Om een betrouwbaarheidsinterval te maken, gebruiken we de
steekproefverdeling van het gemiddelde. We hebben namelijk, te maken
met een steekproef van de populatie. We weten dat zolang onze steekproef
voldoende groot is, de steekproevenverdeling normaal verdeeld is met een

4

Dit zijn jouw voordelen als je samenvattingen koopt bij Stuvia:

Bewezen kwaliteit door reviews

Studenten hebben al meer dan 850.000 samenvattingen beoordeeld. Zo weet jij zeker dat je de beste keuze maakt!

In een paar klikken geregeld

Geen gedoe — betaal gewoon eenmalig met iDeal, creditcard of je Stuvia-tegoed en je bent klaar. Geen abonnement nodig.

Direct to-the-point

Studenten maken samenvattingen voor studenten. Dat betekent: actuele inhoud waar jij écht wat aan hebt. Geen overbodige details!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.