Experimentele Onderzoeksmethoden TiU
MechteldC
Experimentele Onderzoeksvaardigheden
Opmerking vooraf
- Voor deze cursus is het belangrijk om de stof van Inleiding Statistiek en Methodenleer
te kennen. Hoorcollege 1 is een soort samenvatting, maar niet alle begrippen staan
hier meer uitgelegd. Zorg dus dat je deze kent.
- Voor het halen van het tentamen is het doorlezen van een samenvatting niet genoeg.
Zorg dus dat je ook opgaven maakt en oefent met de stof.
- Alle afbeeldingen komen uit de slides van de hoorcolleges van Experimentele
Onderzoeksmethoden 2020-2021, tenzij anders vermeld.
-Hoorcollege 1 - Introductie-
Beschrijvende statistiek
Beschrijvende statistiek gaat over het samenvatten van data. Data zijn numerieke gegevens
van populatie of steekproef. Het verschil tussen populatie en steekproef:
Stel je voor je hebt de volgende gegevens uit een steekproef:
1144323121344334431444434423134134442424331143413
Dan is het moeilijk om obv de reeks getallen iets te zeggen over bijvoorbeeld de frequentie van
een getal. Beschrijvende statistiek helpt om de data samen te vatten, waardoor de lijst
overzichtelijk wordt. Er zijn twee manieren om dit te doen:
1. Het maken van een verdeling van scores
2. Steekproefgrootheden
Verdeling
Je kunt data samenvatten door groeperen van data met dezelfde score. Dit kan onder andere
door middel van een frequentieverdeling (links) of histogram (rechts).
, Experimentele Onderzoeksmethoden TiU
MechteldC
Je gebruikt SPSS syntax om een frequentieverdeling en histogram te genereren (syntax is
belangrijk in deze cursus!). Een voorbeeld van syntax is:
FREQUENCIES
VARIABLES=x
/HISTOGRAM
/ORDER= ANALYSIS .
Steekproefgrootheden
Bij steekproefgrootheden kunnen we data samenvatten door kenmerkende eigenschappen van
de verdeling van de data.
We kunnen op twee manieren kijken naar wat deze kenmerkende eigenschappen zijn:
1. Meest kenmerkende score van de verdeling = centrale tendentie
2. Hoeveel wijken scores af van de meest kenmerkende score = spreiding
Centrale tendentie
Maten voor centrale tendentie zijn gemiddelde, mediaan en modus. Het gemiddelde van data is
de som van alle scores gedeeld door het totaal aantal scores.
Met de hand: Met SPSS:
Oftewel: de score van X1 + de score van X2 + de score van X3 etc en die delen door het totaal
van alle scores.
Spreiding
Maten voor spreiding zijn range, variantie, en standaarddeviatie. Variantie van data is de som
van alle gekwadrateerde deviatiescores gedeeld door aantal scores min één:
Met de hand: Met SPSS:
2
Standaarddeviatie is de wortel van de variantie: 𝑠 = 𝑠 = 1.147
Inferentiële statistiek
Beschrijvende statistiek volstaat als we data hebben van de gehele populatie, maar bijna altijd
hebben we alleen data van een steekproef en niet de van de hele populatie, omdat:
1. Te duur
2. Kost veel tijd om te verzamelen
3. Soms onmogelijk
, Experimentele Onderzoeksmethoden TiU
MechteldC
Met behulp van inferentiële statistiek kunnen we op basis van een steekproef een uitspraak
proberen te doen over de populatie.
Er zijn drie “procedures” in de inferentiële statistiek:
1. Hypothese toetsen
2. Puntschatten
3. Intervalschatten → betrouwbaarheidsinterval
Hypothese toetsen
Vraag: Wat is het gemiddelde van de populatie waaruit de steekproef van 50 cases is
getrokken?
Bij hypothese toetsen ga je na of het gemiddelde in de populatie gelijk is aan een bepaalde
waarde of niet → hypothesen zijn uitsluitend en uitputtend
Voorbeeld: H0: = 2.5 en H1: ≠ 2.5
We spreken hier van een tweezijdige toets (H1 staat ≠), later bespreken we ook eenzijdige toets
(H1 staat > of <). Je toetst H0, die je kunt verwerpen of niet. Als je H 0 verwerpt concludeer je H1,
oftewel, is niet gelijk aan 2.5.
Vuistregels opstellen hypothesen:
1. H0 bevat “=“ → gaat altijd op
2. H1 bevat verwachtingen van de onderzoeker → gaat bijna altijd op
Stappen bij hypothese toetsen:
1. Formuleren van hypothesen: H0: = 2.5 en H1: ≠ 2.5
2. Beslissingsregel bepalen wanneer een resultaat statistisch significant is → p≤ α
3. P-waarde bepalen uit output van SPSS
4. Beslissing over significantie en inhoudelijke conclusie
Toepassen op ons voorbeeld: SPSS Syntax
T-TEST
/TESTVAL=2.5 (we specificeren dat de waarde gelijk is aan 2.5 (zie hypothese)
/MISSING=ANALYSIS
/VARIABLES=x
/CRITERIA=CIN (.95) .
Output:
Sig. = 0,017 , dus p = 0,017 < 0,05 , dus het is significant.
De testval (testvalue) verwijst dus naar de waarde die we toetsen in de hypothese.
De logica van hypothesetoetsen
, Experimentele Onderzoeksmethoden TiU
MechteldC
- Je maakt een aanname over de waarde van een parameter (hier µ) – de nulhypothese
(Stap 1)
- Gegeven dat de waarde juist is, bepaal je de verdeling van de mogelijke waarden die de
steekproefgrootheid (hier 𝑋) kan aannemen (de steekproevenverdeling van 𝑋) bij een
enkelvoudige toevallige steekproef (“simple random sample”) van N cases
2
- Het gemiddelde van de steekproevenverdeling is µ, de variantie σ : 𝑁
- Met die steekproevenverdeling bepaal je de kans, de zogenaamde p-waarde, dat de
waarde van optreedt 𝑋 of nog extremer
- In Stap 3 bepaal je de positie van 𝑋 in de steekproevenverdeling, en bepaal je dus ook
impliciet de p-waarde.
Als de kans kleiner is dan α, dan zeg je:
“Als mijn H0 waar is, dan is de kans dat ik deze waarde voor 𝑋 vind of nog extremer, kleiner
dan α. Deze kans is zo klein, dat ik geen vertrouwen meer heb in mijn nulhypothese. Ik
verwerp H0.”
Als de kans groter is dan α, dan zeg je:
“Als mijn H0 waar is, dan is de kans dat ik deze waarde voor 𝑋 vind of nog extremer best
groot. Ik heb dus niet genoeg redenen om te twijfelen aan de juistheid van H0. Ik verwerp H0
dus niet.”
Dus… In stap 2 bepaal je α en de beslissingsregel, in stap 4 neem je de beslissing.
Opmerking: Eén van de aannames is dus wel dat de steekproef een ‘simple random sample’
is. Dat wil zeggen:
- Alle cases hebben gelijke kans om in de steekproef te komen
- Cases worden onafhankelijk van elkaar geselecteerd
Als niet aan de aanname voldaan is, dan mag de toets strikt genomen niet gebruikt worden.
Eénzijdig vs. tweezijdig toetsen
De logica van éénzijdig en tweezijdig toetsen is hetzelfde. Echter, de output van SPSS is altijd
tweezijdig, dus je moet de tweezijdige “Sig.” in SPSS output naar de juiste (éénzijdige)
p-waarde omzetten. We kunnen hiervoor de superslide gebruiken (belangrijk!)
In ons voorbeeld:
In alle gevallen geldt volgende
beslissingsregel:
“Als p-waarde < a, dan verwerp H0”