Samenvatting Experimentele onderzoeksmethoden
Hoorcollege 1
Beschrijvende statistiek
= het samenvatten van data, dit kan op twee manieren:
• Het maken van een verdeling van scores, door bijv. een frequentieverdeling of
histogram.
• Steekproefgrootheden.
Steekproefgrootheden
Data samenvatten d.m.v.
kenmerkende eigenschappen
van de verdeling van de data.
Wat zijn deze kenmerkende
eigenschappen?
1. Meest kenmerkende score van de verdeling = centrale tendentie.
• Gemiddelde, mediaan en modus.
2. Hoeveel de scores afwijken van de meest kenmerkende score = spreiding.
• Range, variantie en standaarddeviatie.
• Variantie s2 = de som van alle gekwadrateerde deviatiescores gedeeld door het
aantal scores – 1. Dus SS / (N – 1).
• Standaarddeviatie is de wortel van de variantie.
Inferentiële statistiek
Beschrijvende statistiek volstaat als we data hebben van de gehele populatie, maar meestal
hebben we dat niet. M.b.v. inferentiële statistiek kunnen we op basis van een steekproef een
uitspraak proberen te doen over de populatie. 3 procedures:
1. Hypothese toetsen
• Hypothesen moeten uitsluitend en uitputtend zijn.
• ≠ is tweezijdig, > of < is eenzijdig.
• H0 bevat =, gaat altijd op. H1 bevat
verwachtingen van de onderzoeker, gaat
bijna altijd op.
• Stappenplan:
i. Stap 1: Formuleren van hypothesen.
ii. Stap 2: Beslissingsregel bepalen
wanneer een resultaat statistisch
significant is.
iii. Stap 3: P-waarde bepalen uit de
SPSS-output
iv. Stap 4: Beslissing over significantie
en inhoudelijke conclusie.
• Let op: De output van SPSS is altijd
tweezijdig.
2. Puntschatten
• Beantwoorden van de vraag: Wat is de beste gok voor de parameter? Dus:
Welke waarde ligt het dichtst bij de waarde van de populatie?
, • In het geval van het gemiddelde μ is de beste gok X met een streepje erboven.
• In het geval van de variantie σ2 is de beste gok s2.
2. Intervalschatten: betrouwbaarheidsinterval
• Beantwoorden van de vraag: Wat is het interval waarbinnen de waarde van de
parameter zich met …% zekerheid bevindt?
• Een 95% betrouwbaarheidsinterval voor μ: In 95% van de keren dat ik een
steekproef trek van N = 50 zal het betrouwbaarheidsinterval μ bevatten.
• De grenzen van het betrouwbaarheidsinterval worden berekend door
de formule hiernaast.
o Gemiddelde, kritische t-waarde, standaarddeviatie en de
wortel van de steekproefgrootte.
o tcv is af te lezen in de tabel van de t-verdeling m.b.v. de vrijheidsgraden
en ons betrouwbaarheidsinterval dat we willen.
o SPSS rekent het anders uit, om het op het steekproef data te betrekken,
neem je dus het gemiddelde mee.
• Als μ van H0 in het betrouwbaarheidsinterval ligt, mag je H0 niet verwerpen. Als
μ van H0 wel in het interval ligt, mag je H0 wel verwerpen.
Overzicht toetsen gemiddelden
Eén populatie:
1. H0: μ = μ0, bekend (z-toets)
2. H0: μ = μ0, onbekend (t-toets)
Twee populaties:
3. H0: μ1 = μ2, σ1 = σ2 en onbekend, onafhankelijke steekproeven.
4. H0: μ1 = μ2, σ1 ≠ σ2 en onbekend, onafhankelijke steekproeven.
5. H0: ỏ = μ1 - μ2 = 0, σD onbekend, afhankelijke steekproeven.
De 5 toetsen lijken op elkaar, want altijd geldt:
• Toetsgrootheid = (steekproef grootheid – parameter) / standaardfout.
, Hoorcollege 2
Vermogen / power
Het onderscheidend vermogen / power is de kans op het terecht verwerpen van de
nulhypothese. Een groot onderscheidend vermogen is dus wenselijk, want het impliceert een
hoge kans op het terecht verwerpen van de nulhypothese.
Stappenplan power bepalen
1. Bepaal de kritische Z-waarde (ZCV) onder H0 met Tabel B.2.
• Is de toets tweezijdig? Kijk onder Proportion in Two Tails Combined.
o Is μH1 > μH0? Laat de ZCV positief.
o Is μH1 < μH0? Zet een – voor de ZCV.
• Is de toets eenzijdig? Kijk onder Proportion in One Tail.
o Is de toets links eenzijdig (<)? Zet een – voor de ZCV.
o Is de toets rechts eenzijdig (>)? Laat de ZCV positief.
2. Bereken de standaardfout (σX) m.b.v. de formule hiernaast.
3. Bereken grens van het verwerpingsgebied onder H0 m.b.v. de formule
hiernaast (XCV).
4. Bereken de kritische Z-waarde van de grens onder H1 m.b.v. de formule
hiernaast (Z1 – β / ZH1).
5. Zoek de bijbehorende oppervlakte in Tabel B.1.
• Is de toets tweezijdig?
o Is μH1 > μH0? Dan ligt het verwerpingsgebied (stap 3) in de rechterstaart.
▪ Is Z1-β positief? Kijk in Proportion in Tail.
▪ Is Z1-β negatief? Kijk in Proportion in Body.
o Is μH1 < μH0? Dan ligt het verwerpingsgebied in de linkerstaart.
▪ Is Z1-β positief? Kijk in Proportion in Body.
▪ Is Z1-β negatief? Kijk in Proportion in Tail.
• Is de toets eenzijdig?
o Is de toets rechtszijdig?
▪ Is ZCV positief? Kijk in Proportion in Tail.
▪ Is ZCV negatief? Kijk in Proportion in Body.
o Is de toets linkszijdig?
▪ Is ZCV positief? Kijk in Proportion in Body.
▪ Is ZCV negatief? Kijk in Proportion in Tail.
Tool om mee te oefenen: https://r.uvt.nl/power_shiny/dutch/
Tip: Maak een tekening van een normaalverdeling met waar μH0, μH1 en Z1 – β liggen.
Effectgrootte
• Wanneer op basis van een hypothesetoets H0 verworpen wordt, dan krijgen
wetenschappelijke claims het predicaat ‘significant.’
• Maar significant betekent niet…
o …dat het onomstotelijk bewezen is dat er een systematisch effect is.
o …dat het effect praktisch relevant is. Zelfs heel kleine verschillen zijn significant
als je heel grote steekproeven gebruikt.
▪ Als N laag is, dan is het vermogen van de toets laag, wat
hoogstwaarschijnlijk statistisch niet significant is, ook als effect groot is.
▪ Als N hoog is, dan is het vermogen van de toets hoog, en heb je een
statistisch wel significant resultaat, ook als effect laag is.
• Twee belangrijke maten voor effectgrootte bij het vergelijken van gemiddelden:
o Cohens d – Hoe groot is het relatieve verschil in groepen.
, o (Partiële) verklaarde variantie η2 – Hoeveel variantie wordt verklaard door
groepslidmaatschap?
Levene’s Test
Levene’s test beantwoordt de vraag: Zijn de populatievarianties van beide groepen gelijk aan
elkaar?
• Levene’s toets is altijd tweezijdig.
• Is de p-waarde groter / kleiner dan α?
o Groter? Kijk naar de rij Equal variances assumed.
o Kleiner? Kijk naar de rij Equal variances not assumed.
• We willen hier het liefst een niet-significant resultaat vinden, wat het is makkelijker
om later in de t-toets een significant resultaat te vinden als de varianties gelijk aan
elkaar zijn.
Hypothesen opstellen
• H0 bevat altijd ‘=’
o Tweezijdige toets: =
o Eenzijdige toets: ≤ of ≥
• H1 bevat altijd ‘>’ of ‘<’ of ‘≠’ en is vaak de verwachting van de onderzoeker.
o Tweezijdige toets: ≠
o Eenzijdige toets: < of >
▪ Rechtszijdige toets: >
▪ Linkszijdige toets: <
Betrouwbaarheidsinterval
• CI = Steekproefgrootheid ± (kritieke waarde) * (standaardfout)
o Steekproefgrootheid = In SPSS-output: Mean Difference.
o Kritieke waarde = Opzoeken in Tabel B.2 gegeven de vrijheidsgraden en alfa.
o Standaardfout = In SPSS-output: Std. Error Difference.