Statistische modellen 2
Hoofddoelen statistiek (het samenvatten van grote hoeveelheden data)
Samenvatting van gegevens
▪ Beschrijvende statistiek (Inleiding onderzoek)
- M.n. maken plaatjes, berekenen samenvattingsmaten
Aangeven van onzekerheid
▪ Inferentiële statistiek (Statistische Modellen 1 en 2)
- Wat zegt steekproefuitkomst over de populatie?
Terminologie
Populatie: Groep waarvan onderzoeker eigenschappen wil weten (NL, ♀ , ♂)
Parameter: Numerieke samenvatting van eigenschap in populatie
Proportie: Welk deel van het geheel heeft een bepaalde eigenschap
Steekproef: Subgroep uit populatie die onderzocht wordt
Statistic: (ook wel schatter): numerieke samenvatting van eigenschap in steekproef
Doel in Onderzoek:
Steekproef → Populatie
Statistic → Parameterschatting
› We vinden iets in een steekproef. Wat betekent dit in populatie?
Hoe?
Beschikbaar: Theorie (stel: we zouden populatie kennen. Wat kan er allemaal uit
steekproef komen?)
Populatie → Steekproef
Parameter → Statistic (schatting van de parameter)
Nodig in Praktijk: omgekeerde stap
Parameterschatting ← Statistic
Inferentiële statistiek
Voorbeeld: het gemiddelde in de steekproef kun je gebruiken om:
• het gemiddelde in populatie te schatten (^)
• kansuitspraken te doen over het gemiddelde (𝑥̅ of 𝑦̅ )in de populatie
Nodig om kansuitspraken te doen:
• steekproevenverdeling: Wat gebeurt er wanneer we hetzelfde onderzoek
opnieuw zouden doen?
Steekproevenverdeling
Waar heb je een steekproevenverdelingen voor nodig?
1) Betrouwbaarheidsintervallen: foutenmarge (M)
2) Toetsen: p-waarde (uitkomsten van significantie toetsen)
Twee methoden voor inferentie
1. Betrouwbaarheidsintervallen (bhi)
Indicatie van de parameter (bij herhaald steekproeftrekken)
2. Hypothesetoetsen (significantietoetsen)
“de kans op deze steekproefuitkomst is zo klein als de nulhypothese waar zou
zijn, dat het onwaarschijnlijk is dat de populatiegrootheid die waarde (H0) heeft”
→ populatie en steekproef
1
,1. Betrouwbaarheidsintervallen
Bhi gebaseerd op steekproevenverdeling rond
parameter (bv. µ, π)
• Middelste C% van de verdeling
• Afstand tot midden = margin of error
• Margin of error (M)= kritieke waarde *
standaardfout (SE)
• Altijd rond steekproefuitkomst →
• Iedere keer ander interval
• Doel: schatten parameter (^)
• Algemeen: informatiever dan significantietoets
µ
Interpretatie Betrouwbaarheidsinterval
Als we heel vaak een betrouwbaarheidsinterval op deze manier zouden opstellen, zou
dit in C% van de gevallen de parameter omvatten
of..
Als ons betrouwbaarheidsinterval de parameter omvat (en dat is het geval in C% van de
steekproeven), dan ligt de parameter tussen de [ondergrens] en [bovengrens]
en dus niet..
We zijn nu 95% zeker dat de parameter ligt tussen de [ondergrens] en [bovengrens].
Deze conclusie mag je niet trekken.
Vaste opbouw betrouwbaarheidsinterval (bhi)
Statistic +/- margin of error ofwel Statistic +/- kritieke waarde * standaardfout
2. Toetsen (bewijs verzamelen tegen een bepaalde stelling)
• Nulhypothese (H0): een populatiegrootheid heeft een bepaalde waarde
• Alternatieve hypothese (Ha): de populatie-grootheid heeft die waarde niet
(groter, kleiner, ongelijk)
→ probeer de nulhypothese te verwerpen (het heeft wel effect)
• voorbeeld: H0: = 0 versus Ha: ≠ 0
• Gebaseerd op een toetsingsgrootheid (t-waarde
of z-waarde) hoeveel standaardfouten zit er
tussen de gevonden waarde en H0 (test
statistic). Dan kun je vervolgens berekenen hoe
bijzonder is datgeen wat we gevonden hebben
(uitgedrukt in een kans → p-waarde).
2
, p-waarde (kans)
“The probability of getting an outcome as extreme or more extreme than the actually
observed outcome, given H0. “
• Hoe kleiner p des te sterker is het bewijs tegen de nulhypothese, d.w.z. hoe
onwaarschijnlijker de nulhypothese is.
• Hoe klein is p?
→ vergelijk met significantieniveau (vaak 5%)
Interpretatie uitkomst significantietoets
p < α : significant : “er lijkt bewijs tegen de nulhypothese” (maar dit hoeft niet per
se sterk bewijs te zijn)
p > α : niet significant : “geen idee of er een populatie-effect is” (en dus niet: “er is
waarschijnlijk geen populatie-effect”)
Wees voorzichtig! Rigide interpretaties zijn zelden wenselijk, vooral rondom een
grenswaarde ().
Vaste opbouw significantie toets
• Test statistic: “hoeveel standaardfouten ligt gevonden uitkomst van de waarde
onder de H0 af”?
• p-waarde: wat is de kans op minstens de gevonden test statistic?
Problemen met significantietoetsing
1. Complexe redenatie:
Heel vaak fouten bij interpretatie van resultaten (te stellige uitspraken doen)
2. Slechts twee mogelijke uitkomsten (significant/niet significant):
Onnodige en schadelijke reductie van informatie! Kans dat het artikel
gepubliceerd wordt is groter als de uitkomst significant is, dit kan leiden tot
manipulatie van data.
3. Kan leiden tot gebruik questionable research practices
Analogie voor significantietoetsing aan de hand van de rechtspraak:
Voorbeeld: Sesamstraat
y = POSTLET, kennis van letters (verschilt nauwelijks tussen jongens en meisjes)
2 populaties: jongens (n1 = 115) en meisjes (n2 = 125)
3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper MaroeskaV. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.