- Doel: Conclusies trekken, beslissingen nemen, voorspellingen maken over een populatie op basis
van steekproefresultaten
- Gedachte: Wat zou er gebeuren op de lange duur, bij heel veel herhalingen?
Twee inferentiële methodes:
1) Betrouwbaarheidsintervallen
Het schatten van de waarde van een parameter
Doel: Schatten van een onbekende parameter met een indicatie van de nauwkeurigheid van de schatter en
hoe zeker we zijn van een correct resultaat
2) Significantietoetsen
Het verkrijgen van bewijs tegen een bepaalde claim. We stellen hierbij 2 hypotheses op.
Doel: Beoordelen van het bewijs geleverd door de data tegen een nulhypothese ten gunste van een
alternatieve hypothese.
Significantietoets= Een formele procedure die een vergelijking maakt tussen wat we waargenomen hebben
(geobserveerde data) en een bepaalde hypothese die we willen toetsen.
Resultaat van deze toets: een kans die aangeeft hoe goed de data en hypothese overeenkomen.
Beide methodes zijn gebaseerd op sampling distributions van statistics.
Er is niet één beste inferentiële methode, want je hebt verschillende aanpakken. Welke je gebruikt hangt af
van wat je wil onderzoeken:
1) Frequentistische aanpak
- Verzekert ons dat we correcte conclusies trekken voor een vast percentage van onderzoeken, in
‘the long run’. In dit blok gebruik je vooral deze aanpak.
- We willen bewijs verzamelen tegen de hypothese.
2) Bayesiaanse aanpak
- Kwantificeert bewijs in een bepaalde dataset voor een bepaalde hypothese.
- We willen bewijs verzamelen voor de hypothese.
Sampling distributions
Centrale limietstelling
, Collegeslides Statistiek 1B
- Als 𝑛 groot is, dan is de sampling distribution van het steekproefgemiddelde ongeveer normaal
verdeeld.
- is ongeveer
Dit geldt altijd, ongeacht de vorm van de populatieverdeling. Maar, er zitten wel voorwaarden aan:
Simple Random Sample
Eindige 𝜎
Voldoende grote 𝑛
Als 𝑋~𝑁(𝜇, 𝜎) dan is ook exact normaal verdeeld, ook bij kleine 𝑛
In hoofdstuk 6 worden bepaalde aannames gedaan, waar we later in hoofdstuk 7 vanaf stappen. Deze
setting is namelijk te makkelijk om waar te zijn, en onrealistisch. De aannames zijn als volgt:
Er moet een SRS getrokken worden uit de populatie waarin we geïnteresseerd zijn. We hebben hier
geen non-response of een andere praktisch problemen.
De variabele die we meten heeft een exacte normale populatieverdeling 𝑁(𝜇, 𝜎).
Het populatiegemiddelde (𝜇) is onbekend, maar de populatiestandaarddeviatie (𝜎) is wel bekend.
Schatten met betrouwbaarheid
Betrouwbaarheidsinterval
Een interval dat de meest geloofwaardige waarden van een parameter bevat
68-95-99.7 regel: standaarddeviatie is 𝜎/√n.
Stel standaarddeviatie is 0.2 -> Als we heel vaak een steekproef trekken en elke keer een interval
± 0.4 opstellen, dan zullen 95% van deze intervallen 𝜇 bevatten.
95% betrouwbaarheid betekent: We hebben dit interval verkregen met een methode die ons een
correct resultaat geeft in 95% van de gevallen. We weten niet of onze steekproef een van de
intervallen is die populatiegemiddelde (𝜇) bevat of niet.
Betrouwbaarheidsniveau/Confidence level
De kans dat deze methode een interval produceert dat de parameter bevat
De 68-95-99.7 regel is een vuistregel en geeft geen exact resultaat. Daarom gebruiken we vanaf nu de
normale verdeling om exactere grenzen te gebruiken. Je gebruikt hierbij tabel A & z-scores.
Betrouwbaarheidsinterval voor een populatiegemiddelde (𝜇)
Algemene vorm Confidence Betrouwbaarheidsinterval: schatter ± margin of error
schatter ± kritieke waarde x standaardfout
Schatter
- Beste gok voor populatiegemiddelde
- Populatiegemiddelde is ongeveer
Margin of error
- Indicatie nauwkeurigheid van de schatter
-
Het opzoeken van z*:
- Stel 80% BHI
- Zie hieronder: (1-C/2)
, Collegeslides Statistiek 1B
- (1-0.80/2)=0.10
- Zoek bij 𝑃 = 0.90 in Tabel A
- 𝑧∗= 1.28
Elke normale verdeling heeft kans C tussen 𝑧∗ standaarddeviaties onder en boven gemiddelde.
Als de populatieverdeling normaal is: het betrouwbaarheidsniveau van het interval is exact 𝐶.
Als de populatieverdeling anders is: het betrouwbaarheidsniveau van het interval is ongeveer C.
Eigenschappen van Betrouwbaarheidsintervallen:
- We streven naar een hoge betrouwbaarheid
Betekenis: Onze methode levert bijna altijd correcte antwoorden, dus populatie gemiddelde
bevat. Dit is een keuze van de onderzoeker (bv 95%)
- We streven naar een kleine margin of error
Betekenis: Dan hebben we een hele accurate schatting van de parameter
- Hoe smaller het BHI, hoe nauwkeuriger de schatting van de parameter
Welke factoren bepalen de breedte van het BHI?
- Kritieke waarde (𝑧∗)
Geeft de grens van BHI aan. Deze waarde wordt bepaalt door de keuze van het
betrouwbaarheidsniveau (C). Hoe kleiner C, hoe kleiner z*, hoe smaller het BHI. Dit is niet wat
we willen, we willen betrouwbaarheidsniveau liever niet verlagen.
- Populatiestandaarddeviatie (𝜎)
Hoe kleiner 𝜎, hoe smaller het BHI. Maar, 𝜎 is een kenmerk van de populatie en hier kun je
(meestal) niets aan veranderen.
- Steekproefgrootte (n)
Hoe groter 𝑛, hoe kleiner de variabiliteit 𝜎/√𝑛, hoe smaller het BHI
College 2
Significantietoets= Een formele procedure die een vergelijking maakt tussen wat we waargenomen hebben
(geobserveerde data) en een bepaalde hypothese die we willen toetsen.
Het resultaat van deze toets: een kans die aangeeft hoe goed de data en de hypothese overeenkomen.
Significantietoets doet een uitspraak over de sterkte van het bewijs tegen 𝐻0.
Wat betekent het als deze (staart)kans heel klein is?
Dat kan komen door 2 dingen:
1. We hebben iets heel uitzonderlijks waargenomen.
2. De aanname die je gedaan hebt (hypothese) is onjuist. Naar dit gaat de voorkeur uit, omdat de
kans op iets heel uitzonderlijks is klein.
Wat doe je als de (staart)kans heel klein is?
Je neemt afstand van de hypothese, H0 verwerpen.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller lindevegmond. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.36. You're not tied to anything after your purchase.