- Doel: Conclusies trekken, beslissingen nemen, voorspellingen maken over een populatie op basis
van steekproefresultaten
- Gedachte: Wat zou er gebeuren op de lange duur, bij heel veel herhalingen?
Twee inferentiële methodes:
1) Betrouwbaarheidsintervallen
Het schatten van de waarde van een parameter
Doel: Schatten van een onbekende parameter met een indicatie van de nauwkeurigheid van de schatter en
hoe zeker we zijn van een correct resultaat
2) Significantietoetsen
Het verkrijgen van bewijs tegen een bepaalde claim. We stellen hierbij 2 hypotheses op.
Doel: Beoordelen van het bewijs geleverd door de data tegen een nulhypothese ten gunste van een
alternatieve hypothese.
Significantietoets= Een formele procedure die een vergelijking maakt tussen wat we waargenomen hebben
(geobserveerde data) en een bepaalde hypothese die we willen toetsen.
Resultaat van deze toets: een kans die aangeeft hoe goed de data en hypothese overeenkomen.
Beide methodes zijn gebaseerd op sampling distributions van statistics.
Er is niet één beste inferentiële methode, want je hebt verschillende aanpakken. Welke je gebruikt hangt af
van wat je wil onderzoeken:
1) Frequentistische aanpak
- Verzekert ons dat we correcte conclusies trekken voor een vast percentage van onderzoeken, in
‘the long run’. In dit blok gebruik je vooral deze aanpak.
- We willen bewijs verzamelen tegen de hypothese.
2) Bayesiaanse aanpak
- Kwantificeert bewijs in een bepaalde dataset voor een bepaalde hypothese.
- We willen bewijs verzamelen voor de hypothese.
Sampling distributions
Centrale limietstelling
, Collegeslides Statistiek 1B
- Als 𝑛 groot is, dan is de sampling distribution van het steekproefgemiddelde ongeveer normaal
verdeeld.
- is ongeveer
Dit geldt altijd, ongeacht de vorm van de populatieverdeling. Maar, er zitten wel voorwaarden aan:
Simple Random Sample
Eindige 𝜎
Voldoende grote 𝑛
Als 𝑋~𝑁(𝜇, 𝜎) dan is ook exact normaal verdeeld, ook bij kleine 𝑛
In hoofdstuk 6 worden bepaalde aannames gedaan, waar we later in hoofdstuk 7 vanaf stappen. Deze
setting is namelijk te makkelijk om waar te zijn, en onrealistisch. De aannames zijn als volgt:
Er moet een SRS getrokken worden uit de populatie waarin we geïnteresseerd zijn. We hebben hier
geen non-response of een andere praktisch problemen.
De variabele die we meten heeft een exacte normale populatieverdeling 𝑁(𝜇, 𝜎).
Het populatiegemiddelde (𝜇) is onbekend, maar de populatiestandaarddeviatie (𝜎) is wel bekend.
Schatten met betrouwbaarheid
Betrouwbaarheidsinterval
Een interval dat de meest geloofwaardige waarden van een parameter bevat
68-95-99.7 regel: standaarddeviatie is 𝜎/√n.
Stel standaarddeviatie is 0.2 -> Als we heel vaak een steekproef trekken en elke keer een interval
± 0.4 opstellen, dan zullen 95% van deze intervallen 𝜇 bevatten.
95% betrouwbaarheid betekent: We hebben dit interval verkregen met een methode die ons een
correct resultaat geeft in 95% van de gevallen. We weten niet of onze steekproef een van de
intervallen is die populatiegemiddelde (𝜇) bevat of niet.
Betrouwbaarheidsniveau/Confidence level
De kans dat deze methode een interval produceert dat de parameter bevat
De 68-95-99.7 regel is een vuistregel en geeft geen exact resultaat. Daarom gebruiken we vanaf nu de
normale verdeling om exactere grenzen te gebruiken. Je gebruikt hierbij tabel A & z-scores.
Betrouwbaarheidsinterval voor een populatiegemiddelde (𝜇)
Algemene vorm Confidence Betrouwbaarheidsinterval: schatter ± margin of error
schatter ± kritieke waarde x standaardfout
Schatter
- Beste gok voor populatiegemiddelde
- Populatiegemiddelde is ongeveer
Margin of error
- Indicatie nauwkeurigheid van de schatter
-
Het opzoeken van z*:
- Stel 80% BHI
- Zie hieronder: (1-C/2)
, Collegeslides Statistiek 1B
- (1-0.80/2)=0.10
- Zoek bij 𝑃 = 0.90 in Tabel A
- 𝑧∗= 1.28
Elke normale verdeling heeft kans C tussen 𝑧∗ standaarddeviaties onder en boven gemiddelde.
Als de populatieverdeling normaal is: het betrouwbaarheidsniveau van het interval is exact 𝐶.
Als de populatieverdeling anders is: het betrouwbaarheidsniveau van het interval is ongeveer C.
Eigenschappen van Betrouwbaarheidsintervallen:
- We streven naar een hoge betrouwbaarheid
Betekenis: Onze methode levert bijna altijd correcte antwoorden, dus populatie gemiddelde
bevat. Dit is een keuze van de onderzoeker (bv 95%)
- We streven naar een kleine margin of error
Betekenis: Dan hebben we een hele accurate schatting van de parameter
- Hoe smaller het BHI, hoe nauwkeuriger de schatting van de parameter
Welke factoren bepalen de breedte van het BHI?
- Kritieke waarde (𝑧∗)
Geeft de grens van BHI aan. Deze waarde wordt bepaalt door de keuze van het
betrouwbaarheidsniveau (C). Hoe kleiner C, hoe kleiner z*, hoe smaller het BHI. Dit is niet wat
we willen, we willen betrouwbaarheidsniveau liever niet verlagen.
- Populatiestandaarddeviatie (𝜎)
Hoe kleiner 𝜎, hoe smaller het BHI. Maar, 𝜎 is een kenmerk van de populatie en hier kun je
(meestal) niets aan veranderen.
- Steekproefgrootte (n)
Hoe groter 𝑛, hoe kleiner de variabiliteit 𝜎/√𝑛, hoe smaller het BHI
College 2
Significantietoets= Een formele procedure die een vergelijking maakt tussen wat we waargenomen hebben
(geobserveerde data) en een bepaalde hypothese die we willen toetsen.
Het resultaat van deze toets: een kans die aangeeft hoe goed de data en de hypothese overeenkomen.
Significantietoets doet een uitspraak over de sterkte van het bewijs tegen 𝐻0.
Wat betekent het als deze (staart)kans heel klein is?
Dat kan komen door 2 dingen:
1. We hebben iets heel uitzonderlijks waargenomen.
2. De aanname die je gedaan hebt (hypothese) is onjuist. Naar dit gaat de voorkeur uit, omdat de
kans op iets heel uitzonderlijks is klein.
Wat doe je als de (staart)kans heel klein is?
Je neemt afstand van de hypothese, H0 verwerpen.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper lindevegmond. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,99. Je zit daarna nergens aan vast.