Experimentele Onderzoeksmethoden
Hoorcollege 1
Beschrijvende Statistiek = samenvatting van data
Data = numerieke gegevens van populatie of steekproef
Populatie = Alle leden van een gedefinieerde groep met parameters (maten voor
eigenschappen van de scores in de populatie) in Griekse letters: µ voor gemiddelde en σ voor
standaarddeviatie.
Steekproef = Deelverzameling van gedefinieerde groep met steekproefgrootheden
(parameters voor steekproeven) in Latijnse letters: X voor gemiddelde en s voor
standaarddeviatie.
Je kunt beschrijvende data opvragen in bijvoorbeeld een frequentieverdeling of histogram.
FREQUENCIES
VARIABLES = x
/HISTOGRAM
/ORDER = ANALYSIS
Je kunt het ook doen aan de hand van steekproefgrootheden, dus door kenmerkende
eigenschappen van de verdeling van de data op te vragen.
De meest kenmerkende score van de verdeling is de centrale tendentie (gemiddelde,
mediaan en modus), met de spreiding (range, variantie, SD) zie je hoeveel scores afwijken
van deze centrale tendentie.
Het gemiddelde is de som van alle scores gedeeld door het totaal aantal
scores zoals je ziet hier rechts. De sigma betekent de som van alle waarden
van Xi, beginnend bij i = 1 en eindigend bij N (alle scores), hierna deel je dit
door N.
Variantie is de som van alle gekwadrateerde deviatiescores gedeeld
door het aantal scores min één. Xi - X is de deviatiescore, deze
kwadrateer je dus en tel je dan allemaal bij elkaar op. De som van deze
gekwadrateerde scores wordt de Sum of Squares (SS) genoemd.
Voor de standaarddeviatie trek je de wortel van de variantie.
Beschrijvende statistiek volstaat als we data hebben van de gehele populatie, dit heb je bijna
nooit, want dat is erg duur, duurt te lang en is soms simpelweg onmogelijk. Door inferentiële
statistiek kun je een uitspraak proberen te doen over de populatie, aan de hand van de
steekproef. Dit kan via:
1. Hypothese toetsen
2. Puntschatten
3. (Betrouwbaarheids-)Intervalschatten
1. Hypothese Toetsen
,Je vraagt jezelf af wat het gemiddelde van de populatie is waaruit de steekproef is
getrokken. Bij hypothese toetsen ga je na of het gemiddelde in de populatie gelijk is aan een
bepaalde waarde of niet. De hypothesen zijn uitsluitend en uitputtend.
Bijvoorbeeld:
H0 (nulhypothese): µ = 2.5
H1 (alternatieve hypothese): µ ≠ 2.5
In dit voorbeeld spreek je van een tweezijdige toets, als H0 verworpen wordt is het
gemiddelde dus niet gelijk aan 2.5, maar je weet niet of dit gemiddelde hoger of lager ligt.
De H0 bevat altijd een =-teken (of ≤ , ≥) en de H1 gaat meestal over de verwachtingen van de
onderzoeker.
Stap 1: Formuleren van de hypothesen H0 en H1. Je doet een aanname over de parameters
(H0) en gaat er voor de analyse van uit dat deze waar is.
Stap 2: Beslissingsregel bepalen, wanneer is een resultaat statistisch significant? P ≤ α .
Meestal is dit .05, dat betekent dat als de p-waarde lager is dan .05, de kans kleiner is dan
5% dat de resultaten per toeval naar boven zijn gekomen.
Stap 3: p-waarde bepalen uit de output van SPSS. Dit wordt meestal aangegeven als ‘sig.’ in
de outputtabellen.
Stap 4: Beslissing over significante en inhoudelijke conclusie.
De p-waarde is dus de kans om jouw waarde te vinden (of extremer), gegeven dat de
nulhypothese waar is. Dus: als de nulhypothese waar is, dan verwacht je in het voorbeeld
hierboven dat het gemiddelde van de steekproef 2.5 is. Als het gemiddelde van 2.5 waar is
voor de populatie, kun je nog steeds een gemiddelde in de steekproef hebben van 2.6 of 2.4,
afhankelijk van je steekproef zelf. De vraag is dus, als je een steekproefgemiddelde hebt van
2.9, hoe groot is de kans dat het werkelijke gemiddelde (populatiegemiddelde /
nulhypothese) nog steeds waar is. Als de kans daarop .05 of kleiner is, dan ga je ervan uit dat
de kans zo klein is dat de nulhypothese waar is, dat je deze kunt verwerpen.
Technisch gezien mag je een hypothese toets alleen uitvoeren als er sprake is van een simple
random sample. In de praktijk wordt hier echter maar zelden aan voldaan.
Simple random sample = Alle cases van de populatie hebben een gelijke kans om in de
steekproef te komen en alle cases worden onafhankelijk van elkaar geselecteerd.
Wanneer je een duidelijke verwachting hebt in je onderzoek
(beter dan / minder dan / sterker dan ) heb je geen tweezijdige
toets maar een éénzijdige toets. Je gaat er dus vanuit dat H1
maar naar één zijde van de H0 kan uitvallen.
Als een toets eenzijdig is kun je dat zien in de H1, deze wordt
dan aangegeven met een < of een >.
Als hierna blijkt dat je resultaat in overeenstemming is met H1
( X > H0, 2.9 > 2.5, dus klopt) dan kun je de sig. uit SPSS gewoon
door twee delen. Dit komt omdat de p-waarde een tweezijdige
kans is, dus deze is verdeeld over beide kanten van de
spreiding.
,2. Puntschatten
Bij puntschatten wordt er antwoord gegeven op de vraag wat de beste gok is voor de
parameter. Dus welke waarde het dichtste bij de waarde in de populatie ligt. In het geval van
het gemiddelde µ is je beste gok X . In het geval van de variantie σ2 is dat s2.
3. Intervalschatten
Bij betrouwbaarheidsintervallen beantwoordt men de vraag: wat is het interval waarbinnen
de waarde van de parameter met …% zekerheid zich bevindt. Een 95%
betrouwbaarheidsinterval voor µ betekent dat in 95% van de keren dat je een steekproef
trekt van N = 50, het interval µ bevat. De tcv in deze formule is af te lezen in een tabel in het
tabellen boekje dat op canvas staat en je er bij het tentamen bij mag houden, hiervoor heb
je alleen de vrijheidsgraden (df) en de alfa (.05, meestal) nodig, deze zijn af te lezen in de
SPSS tabel.
LET OP: het betrouwbaarheidsinterval dat gegeven wordt in de SPSS tabel is het
betrouwbaarheidsinterval van het verschil. Wat je uitrekent is het
betrouwbaarheidsinterval van het gemiddelde. Als je hierbij de µ (2,5) optelt krijg je
weer het interval van het gemiddelde.
Uit het voorbeeld zou hier dan 2,574 als ondergrens uit komen en 3,226 als bovengrens. Je
ziet dat 2,5 hier niet tussen valt, wat betekent dat je de H0 kunt verwerpen.
Het is belangrijk om hierbij te noteren ALS H0 waar is, dat 95% van de keren deze ook binnen
het interval vallen. Er komt dus ook bij 5% van de steekproeven een CI (confidence interval)
waar hij onterecht niet invalt (Type I fout).
Toetsen
Wanneer je één populatie hebt kun je gebruik maken van een z-toets of een t-toets. Een z-
toets gebruik je als de σ (SD van populatie) bekend is, de t-toets als deze niet bekend is. Bij
twee populaties, bijvoorbeeld een testgroep en een controlegroep, kun je drie verschillende
t-toetsen doen.
De vijf toetsen lijken erg op elkaar omdat voor
elke toets dezelfde regel geldt:
Voor EOM hebben we het voornamelijk over toetsen met twee populaties.
Voorbeeld:
Toets met twee onafhankelijke steekproeven met als onderzoeksvraag of mannelijke en
vrouwelijke studenten gemiddeld verschillen in hun zelfverzekerdheid.
Stap 1: Formuleren van hypothesen H0: µm = µv, H1: µm ≠ µv.
Stap 2: Beslissingsregel vaststellend Significant bij p < α = .05.
Stap 3: p-waarde bepalen uit output van SPSS.
In de SPSS output krijg je naast de t-test eerst Levene’s Test voor Gelijke Varianties. Hier
moet je naar kijken omdat dit bepaald of je naar de bovenste regel in de significantietest
kijkt of naar de onderste regel. Als Levene’s Test niet significant is kijk je naar de bovenste
regel. In dit geval: Levene’s Sig.= .062, dit is groter dan .05, dus je kijkt naar de bovenste
regel, ‘equal variances assumed’. Uit de t-test komt dan een p-waarde van .105, hieruit blijkt
dus dat je de H0 niet kunt verwerpen en dat er geen significant verschil is in de gemiddelden
tussen mannen en vrouwen.
, Oefening
Onderzoeksvraag: Verschillen mannelijke en vrouwelijke studenten gemiddeld in de mate
waarin ze introvert zijn?
Stap 1: Formuleren van de Hypothesen H0: µm ≥ µv, H1: µm < µv.
Stap 2: Wanneer is het resultaat significant p ≤ α = .05.
Stap 3: p-waarde halen uit de output van SPSS.
Antwoord:
Als eerste valt je op dat de hypothese links-eenzijdig is. Je verwacht dus dat mannen lager
scoren op introversie dan vrouwen.
Levene’s test is echter altijd tweezijdig, dus bij de eerste significantie deel je hem niet door
twee. Dit betekent dat bij Levene’s de H0 nog aangehouden wordt en in de bovenste regel
wordt gekeken.
Belangrijk om te benoemen is dat de toets eenzijdig is naar links, en mannen dus een lager
gemiddelden zou hebben dan vrouwen. Echter zie je in het tabel ‘group statistics’ dat
mannen juist hoger scoren dan vrouwen, dit gaat in tegen je H1. Dit heeft consequenties
voor het berekenen van je sig. (Kijk naar het schema bij nulhypothese toetsen op blz. 2).
Je berekent nu de p-waarde met de formule 1-sig/2.
1 - .494/2 = 1 - .247 = .853
En dus wordt de nulhypothese niet verworpen.