100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
P4: Beschrijvende en Inferentiele Statistiek (BIS deeltentamen 2) €6,99
In winkelwagen

College aantekeningen

P4: Beschrijvende en Inferentiele Statistiek (BIS deeltentamen 2)

5 beoordelingen
 166 keer bekeken  22 keer verkocht

Alle aantekeningen die ik heb gemaakt tijdens colleges van week 3 en 4 het vak Beschrijvende en Inferentiele Statistiek (BIS), dat wordt gegeven tijdens de premaster Beleid, Communicatie en Organisatie (BCO) aan de VU. De aantekeningen zijn aangevuld met informatie uit het boek van Van de Bunt (Des...

[Meer zien]
Laatste update van het document: 4 jaar geleden

Voorbeeld 3 van de 17  pagina's

  • 1 maart 2020
  • 20 maart 2020
  • 17
  • 2019/2020
  • College aantekeningen
  • Onbekend
  • Alle colleges
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
Alle documenten voor dit vak (3)

5  beoordelingen

review-writer-avatar

Door: julia235 • 2 jaar geleden

review-writer-avatar

Door: maartjevansnippenberg • 4 jaar geleden

review-writer-avatar

Door: koenscheepers • 4 jaar geleden

review-writer-avatar

Door: kishabadu • 4 jaar geleden

review-writer-avatar

Door: manonbrabander1 • 4 jaar geleden

avatar-seller
sop_hie_
Beschrijvende en Inferentiële Statistiek (BIS) – Deeltentamen 2

College 7 – Betrouwbaarheidsintervallen (H8)

Een ‘statistic’ beschrijft een steekproef. Hierbij hoort het steekproefgemiddelde (x-bar) en de standaarddeviatie s. Een
‘parameter’ beschrijft de populatie. Hierbij hoort het gemiddelde (m) en de standaarddeviatie s. Op basis van de steekproef
worden beslissingen gemaakt en voorspellingen gedaan over de populatie. Dit wordt ook wel inferentiële statistiek genoemd.

Puntenschatting en intervalschatting
Populatie paramaters hebben twee manieren om te schatten: puntschatting en intervalschatting. Een schatter (estimator) is een
steekproefwaarde (sample statistic) die wordt gebruikt om de populatieparameter mee te schatten
• Puntschatting (point estimate)
Schattig van een specifiek percentage of een specifiek gemiddelde. Deze schatting wordt gedaan op basis van een
steekproefproportie of een steekproefgemiddelde
Voorbeeld: X krijgt 56,5% van de stemmen/het gemiddelde cijfer is een 8,2
• Intervalschatting (interval estimate)
Schatting van een range. Hierbij wordt een bepaalde foutmarge (margin of error) gegeven, waardoor het mogelijk is
de nauwkeurigheid van de puntschatting te bepalen
Voorbeeld: X krijgt tussen de 54,5% en 58,5% van de stemmen

Bij categorische variabelen wordt een proportie geschat, welke zowel een puntschatting als een intervalschatting kan zijn. Bij
kwantitatieve variabelen wordt een specifiek gemiddelde geschat en wordt dus alleen een puntschatting gedaan.

Kenmerken van een goede puntschatting
Een goede puntschatting heeft twee kenmerken:
• Zuiver (unbiased)
Het gemiddelde van de steekproevenverdeling is gelijk aan het gemiddelde van de populatie. Een onzuivere
schatter (biased estimator) overschat of onderschat daarentegen de populatieparameter en is dus geen goede schatter
• Kleine standaard error (efficient estimate)
Een goede schatter heeft een kleine standaardfout in vergelijking met andere schatters. Dit wordt dan ook wel een
efficiënte schatting genoemd. Hoe kleiner de standaardfout, hoe efficiënter de schatting

Betrouwbaarheid van een intervalschatting
Hoe betrouwbaar een intervalschattig is wordt bepaald aan de hand van twee factoren:
• Het betrouwbaarheidsinterval (confidence interval)
Dit is een interval van waarden, waarvan we met een bepaald vertrouwen aannemen dat de ‘ware’ waarde van de
populatieparameter daarin ligt. Deze wordt bepaald door de puntschatting en de foutmarge (margin of error). De
foutmarge wordt bepaald door de z-score op basis van het betrouwbaarheidsniveau en de standaardfout
Voorbeeld: we kunnen met 95% vertrouwen zeggen dat de werkelijke waarde van de voorkeur voor X tussen de
54,5% en de 58,5% ligt
• Het betrouwbaarheidsniveau (confidence level)
Dit is de kans dat de populatieparameter daadwerkelijk in het interval ligt
Voorbeeld: we kunnen met 95% vertrouwen zeggen dat de werkelijke waarde van de voorkeur voor X tussen de
54,5% en de 58,5% ligt
Het meest gebruikte betrouwbaarheidsniveau is 0,95. In dat geval weet je met 95%
zekerheid dat de populatieparameter in een bepaald betrouwbaarheidsinterval ligt. De
foutmarge (a) is hierbij 5%. Er is dus 0,05 kans dat we het fout hebben. Deze fout kan
in beide ‘staarten’ van de verdeling liggen. Om de benodigde z-score bij 95%
betrouwbaarheidsniveau te vinden wordt a daarom gedeeld door 2 (p = 0,025).

Betrouwbaarheidsinterval berekenen
Om een betrouwbaarheidsinterval te berekenen worden verschillende stappen genomen:
1) Neem de puntschattig
2) Bepaal het betrouwbaarheidsniveau
3) Bereken de foutmarge op basis van de standaardfout en z-score: foutmarge = standaardfout ∗ z − score
4) Bereken het betrouwbaarheidsinterval op basis van de formule: B.I. = puntschatting ± foutmarge
5) Trek de conclusie

Betrouwbaarheidsinterval berekenen met proportie
Voorbeeld: we willen een 95% betrouwbaarheidsinterval maken voor de proportie Amerikanen die in reïncarnatie gelooft. In
2003 werd middels een survey aan 2201 Amerikanen gevraagd of ze in reïncarnatie geloofden. Van deze 2201 Amerikanen
geloofde 594 in reïncarnatie
1) Puntschatting
Aangezien het hier om een categorische variabele gaat wordt gekeken naar de proportie: 594 van de 2201 geloven
!"#
in reïncarnatie, dus: p-hat = = 0,2699
$$%&

, 2) Betrouwbaarheidsniveau
Het betrouwbaarheidsniveau wordt door de onderzoeker zelf bepaald. Dit reken je dus niet uit! In dit geval wordt
gekozen voor een betrouwbaarheidsniveau van 95%

3) Foutmarge op basis van de standaardfout en de z-score
'%,$)(&+%,$))
Standaardfout (se) = = 0,0095
$$%&

Z-score: het betrouwbaarheidsniveau is 95%. Dit betekent dat er een foutmarge is van 5%. Omdat deze kans is
%,%!
beide staarten van de verdeling kan liggen, wordt de kans gedeeld door twee: p = $ = 0,0250, Kijk in tabel A bij
p = 0,0250, Deze hoort bij een z-score van –1,96,




Foutmarge = 1,96 ∗ 0,0095 = 0,01862

4) Betrouwbaarheidsinterval
Bovengrens betrouwbaarheidsinterval = 0,27 + 0,01862 = 0,28862
Ondergrens betrouwbaarheidsinterval = 0,27 − 0,01862 = 0,25138

5) Conclusie
We kunnen met 95% zekerheid zeggen dat het percentage van alle Amerikanen dat in reïncarnatie gelooft tussen de
25,1% en 28,9% ligt

Betrouwbaarheidsinterval berekenen met gemiddelde en z-score
Voorbeeld: we willen een 95% betrouwbaarheidsinterval maken van het aantal sekspartners per jaar van Amerikanen. In
2006 werd aan 2400 Amerikanen gevraagd hoeveel sekspartners ze het afgelopen jaar hadden gehad. Het gemiddelde was
1,04 en de standaarddeviatie 1,09.

1) Puntschatting
Aangezien het hier om een kwantitatieve variabele gaat wordt gekeken naar het gemiddelde. Deze wordt gegeven:
1,04 sekspartners per jaar

2) Betrouwbaarheidsniveau
Het betrouwbaarheidsniveau wordt door de onderzoeker zelf bepaald aan de hand van de hoeveelheid zekerheid de
hij wil. Dit reken je dus niet uit! In dit geval wordt gekozen voor een betrouwbaarheidsniveau van 95%

3) Foutmarge op basis van de standaardfout en de z-score
&%"
Standaardfout (se) = = 0,022
√$#%%

Z-score: het betrouwbaarheidsniveau is 95%. Zoals in het vorige voorbeeld is laten zien hoort hier een z-score van
1,96 bij

Foutmarge = 1,96 ∗ 0,022 = 0,0436

4) Betrouwbaarheidsinterval
Bovengrens betrouwbaarheidsinterval = 1,04 + 0,0436 = 1,0836
Ondergrens betrouwbaarheidsinterval = 1,04 − 0,0436 = 0,9964

5) Conclusie
We kunnen met 95% zekerheid zeggen dat het gemiddeld aantal sekspartners van alle Amerikanen tussen de 1,00
en 1,08 ligt

Invloeden op het betrouwbaarheidsinterval
Als het betrouwbaarheidsniveau wordt vergroot (bijvoorbeeld van 95% naar 99%), is dit van invloed op de z-score. In plaats
van p = 0,025 (betrouwbaarheidsinterval 95%) wordt er bijvoorbeeld naar p = 0,005 (betrouwbaarheidsinterval 99%) gezocht
in tabel A. Waar bij een betrouwbaarheidsniveau van 95% een z-score van – 1,96 hoorde, hoort bij een betrouwbaarheids-
niveau van 99% een z-score van – 2,58, zoals is af te lezen uit tabel A. Als gevolg hiervan neemt de foutmarge toe en wordt
het betrouwbaarheidsinterval breder. De schatting wordt hiermee dus minder precies.

, In onderstaande tabel zijn de meest voorkomende betrouwbaarheidsniveaus met hun bijbehorende foutmarge en z-score
weergegeven.

Betrouwbaarheidsniveau Foutmarge (a) Z-score Betrouwbaarheidsinterval
0,90 0,10 1,645 p ± 1,645(se)
0,95 0,05 1,96 p ± 1,96(se)
0,99 0,01 2,58 p ± 2,58(se)

Als de steekproefgrootte toeneemt (bijvoorbeeld van n = 240 naar n = 2400), is dit van invloed op de standaardfout. De
standaardfout bij een grote steekproef is kleiner dan de standaardfout bij een kleine steekproef. De standaarddeviatie wordt
immers door een groter getal gedeeld, waardoor deze kleiner wordt. Als gevolg hiervan neemt de foutmarge af en wordt het
betrouwbaarheidsinterval smaller. De schatting wordt hiermee dus preciezer.

De t-score gebruiken in plaats van de z-score
Om de standaardfout bij een gemiddelde te berekenen wordt in plaats van de s (standaarddeviatie van de populatie) gebruik
gemaakt van de s (standaarddeviatie van de steekproef), omdat de s vaak onbekend is. Hierdoor is er sprake van een extra
onzekerheid. In plaats van een z-score wordt daarom gebruik gemaakt van een t-score. Om gebruik te kunnen maken van een
t-score moet aan de volgende eisen worden voldaan:
• De data moet worden vergaard door middel van een random sample of een gerandomiseerd experiment
• De data moet ongeveer normaal verdeeld zijn en dus moet n groter zijn dan 30 (Centrale Limiet Theorie)

De t-score wordt gebruikt bij gemiddelden wanneer de n kleiner is dan 100, Wanneer de n bij gemiddelden groter is dan 100,
wordt gewoon gebruik gemaakt van de z-score. Bij proporties wordt altijd gebruik gemaakt van z-scores. Wanneer de n groot
genoeg is neigt de t-verdeling naar de standaard normaalverdeling (op basis van z-scores).

De t-verdeling is afhankelijk van het betrouwbaarheidsniveau en de vrijheidsgraden (degrees of freedom, df). De
vrijheidsgraden kunnen worden berekend door: df = n – 1, Het betrouwbaarheidsniveau wordt door de onderzoeker bepaald.

Betrouwbaarheidsinterval berekenen met gemiddelde en t-score
Voorbeeld: we willen een 95% betrouwbaarheidsinterval maken over de sportprestaties van de studenten van een universiteit.
Aan 7 studenten wordt gevraagd hoe vaak zij per week sporten. Hieruit is naar voren gekomen dat studenten gemiddeld 2,45
keer per week sporten, met een standaardafwijking van 0,54
1) Puntschatting
Aangezien het om een kwantitatieve variabele gaat wordt naar het gemiddelde gekeken. Deze is gegeven: 2,45 keer
per week sporten

2) Betrouwbaarheidsniveau
Het betrouwbaarheidsniveau wordt door de onderzoeker zelf bepaald aan de hand van de hoeveelheid zekerheid de
hij wil. Dit reken je dus niet uit! In dit geval wordt gekozen voor 95%

3) Foutmarge op basis van de standaardfout en de t-score
%,!#
Standaardfout (se) = = 0,204
√)
T-score: het betrouwbaarheidsniveau is 95%. Dit wordt in tabel B ook wel ‘confidence level’ genoemd. Kies
bovenaan in de tabel het juiste betrouwbaarheidsniveau. Aan de linkerkant van de tabel staan de vrijheidsgraden
(df). In dit geval zijn de degrees of freedom 6 (7-1). Bij dit betrouwbaarheidsniveau en degrees of freedom hoort
een t-score van 2,447




Foutmarge = 2,447 ∗ 0,204 = 0,499

4) Betrouwbaarheidsinterval
Bovengrens betrouwbaarheidsinterval = 2,45 + 0,499 = 2,949
Ondergrens betrouwbaarheidsinterval = 2,45 − 0,499 = 1,951

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper sop_hie_. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 52928 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€6,99  22x  verkocht
  • (5)
In winkelwagen
Toegevoegd