Experimentele Onderzoeksmethoden
Hoorcollege Samenvatting
Studie Psychologie
Jaar 2 Blok 3
Studiejaar 2021-2022
Tilburg University
Inhoudsopgave
Hoorcollege 1 – Samenvatting Stof Eerdere Cursussen ............................................................. 2
Hoorcollege 2 – Onderscheidend Vermogen, Effectgrootte en Eén-weg ANOVA Deel 1 ....... 10
Hoorcollege 3 – Eén-weg ANOVA Deel 2 ................................................................................. 19
Hoorcollege 4 – Contrasten Deel 1 .......................................................................................... 27
Hoorcollege 5 – Contrasten Deel 2 .......................................................................................... 35
Hoorcollege 6 – Twee-weg ANOVA Deel 1............................................................................... 44
Hoorcollege 7 – Twee-weg ANOVA Deel 2............................................................................... 51
Hoorcollege 8 – ANCOVA Deel 1 .............................................................................................. 60
Hoorcollege 9 – ANCOVA Deel 2 .............................................................................................. 68
Hoorcollege 10 – Repeated Measures ANOVA ........................................................................ 77
Hoorcollege 11 – Design........................................................................................................... 85
Hoorcollege 12 – Responsie ..................................................................................................... 89
1
,Hoorcollege 1 – Samenvatting Stof Eerdere Cursussen
Collegedoelen HC1
• Een frequentieverdeling interpreteren
• Centrummaten (bijv. gemiddelde) en spreidingsmaten (bijv. variantie) interpreteren
en berekenen
• De logica van hypothesetoetsen uitleggen
• De SPSS output van een one-sample t-toets en independent samples t-toets
interpreteren
1.1 De beschrijvende statistiek
De beschrijvende statistiek is het samenvatten van data. Met data bedoelen we de numerieke
gegevens van de populatie of een steekproef. De populatie zijn alle leden van de gedefinieerde
groep. Maar in de steekproef hebben we een deelverzameling van leden van de gedefinieerde
groep.
Parameters zijn maten voor eigenschappen van de scores in de populatie. Deze parameters
worden bijna altijd weergegeven met Griekse letters (zoals µ of σ). In de steekproef hebben
we geen parameters, maar spreken we van steekproefgrootheden (statistics). Dit zijn maten
voor eigenschappen van de scores in de steekproef. Deze worden aangetoond met Latijnse
letters, zoals de X en s. (gemiddelde, en standaard deviatie).
Gegevens uit een steekproef zijn bijvoorbeeld:
1144323121344334431444434423134134442424331143413
De beschrijvende statistiek helpt om de data samen te vatten, deze lijst is onoverzichtelijk. Dit
kunnen we op twee manieren doen:
1. Het maken van een verdeling van scores.
2. Via steekproefgrootheden.
1. Verdeling
In een verdeling vatten we data samen door het groeperen van de data met dezelfde score.
Dit kan onder andere door een frequentieverdeling of histogram.
Zo kunnen we bij het cumulatieve percentage aflezen dat 60% van de mensen een score heeft
van 3 of lager. De SPSS syntax om frequentieverdeling en histogram te genereren:
FREQUENCIES
VARIABLES=x
/HISTOGRAM
/ORDER= ANALYSIS .
2
,2. Steekproefgrootheden
Bij de steekproefgrootheden wordt de data samengevat door kenmerkende eigenschappen
van de verdeling van de data. We kijken dan niet naar de verdeling, maar de eigenschappen.
Deze kenmerkende eigenschappen zijn:
1. De meest kenmerkende score van de verdeling = centrale tendentie.
2. Hoeveel wijken de scores af van de meest kenmerkende score = spreiding.
Centrale tendentie
De maten voor centrale tendentie zijn het gemiddelde, de mediaan en de modus. Het
gemiddelde van de data is de som van alle scores gedeeld door het totaal aantal scores. Dit
kan met de hand en met SPSS. Als we drie scores hebben van 2 4 6, dan berekenen we het
gemiddelde met (2+4+6)/3=4. In SPSS lezen we het gemiddelde af bij mean.
De mediaan is het middelste getal wanneer alle waarnemingen op volgorde gezet worden. De
modus is de waarneming met de hoogste frequentie, die het vaakst voorkomt.
Spreiding
De maten voor spreiding zijn range, variantie en standaarddeviatie. De variantie van data is
de som van alle gekwadrateerde deviatiescores gedeeld door het aantal scores min één.
Met de hand berekenen we dit als het gedeelte boven de
deelstreep wordt ook wel de sums of squares genoemd.
Wanneer we de standaarddeviatie willen weten, dan wordt de wortel gepakt van de variantie.
. Een groter getal betekent dat er meer spreiding voorkomt. Het kan ook in
SPSS worden afgelezen bij std. deviation.
Het staat dus in dezelfde tabel als het gemiddelde.
1.2 De inferentiële statistiek
Het samenvatten met de beschrijvende statistiek is voldoende als we gegevens of data hebben
van de gehele populatie. Vaak is dit niet mogelijk. Bijna altijd hebben we alleen data van een
steekproef en niet van de hele populatie, omdat het te duur is, het te veel tijd kost om te
verzamelen en het soms onmogelijk is.
Met behulp van de inferentiële statistiek kunnen we op basis van een steekproef een
uitspraak proberen te doen over de populatie. Er zijn drie verschillende procedures om deze
inferentiële statistiek toe te passen.
1. Hypothese toetsen.
2. Puntschatten.
3. Intervalschatten → betrouwbaarheidsinterval.
3
,1. Hypothese toetsen
Bij hypothese toetsen gaan we na of het gemiddelde in de populatie gelijk is aan een bepaalde
waarde of niet. De hypothese moeten uitsluitend (maar 1 enkele hypothese kan waar zijn) en
uitputtend (alle verschillende mogelijkheden zijn opgenomen) zijn.
We spreken hier van een tweezijdige toets, want er staat een ≠ teken bij H1. Bij een éénzijdige
toets staat dan een groter of kleiner dan teken bij H1.
Je toetst H0, die je kunt verwerpen of niet. Als je H0 verwerpt concludeer je dat H1 waar is,
dat wil zeggen dat µ niet gelijk is aan 2.5. De vuistregels voor het opstellen van hypothesen:
1. H0 bevat ‘=’ → dit gaat altijd op.
2. H1 bevat de verwachtingen van de onderzoeker → dit gaat bijna altijd op.
Stappen bij hypothese toetsen:
Stap 1: Het formuleren van de hypothesen: . Hier wordt een uitspraak
gemaakt over de waarde van het parameter (de µ).
Stap 2: De beslissingsregel bepalen wanneer een resultaat statistisch significant is. We spreken
van een statistisch significant resultaat wanneer de p-waarde kleiner is dan het α-niveau. Vaak
wordt er een alpha van 0.5 gekozen.
Stap 3: De p-waarde bepalen uit de output van SPSS.
Stap 4: De beslissing over significantie maken en de inhoudelijke conclusie geven.
We zien in deze syntax dat 2.5 de waarde uit de nulhypothese is. Er wordt getoetst of de
populatiegemiddelde gelijk is aan deze 2.5.
In de output zien we dat de p-waarde gelijk is aan 0.017. Dit staat onder Sig in de tabel. We
zien hierbij dat deze p-waarde kleiner is dan de alfa van 0.5. De conclusie is dat er een
statistisch significant resultaat is. Het gemiddelde wat we vinden in de steekproef ligt zo ver
af van het populatiegemiddelde, dat we concluderen dat het populatiegemiddelde nooit gelijk
kan zijn aan 2.5.
Logica toetsen:
• In stap 1 wordt een uitspraak gemaakt over de waarde van het parameter (de µ) – de
nulhypothese.
• Gegeven dat de waarde juist is, bepaal je de verdeling van de mogelijke waarden die
de steekproefgrootheid (hier X ) kan aannemen. Dat wordt gedaan middels de
steekproevenverdeling bij een enkelvoudige toevallige steekproef van N cases.
4
, • Het gemiddelde van de steekproevenverdeling is dan de µ, en de variantie is σ²/N.
• Met die steekproevenverdeling bepaal je de kans, de zogenaamde p-waarde.
• In stap 3 bepaal je de positie van het gemiddelde in de steekproevenverdeling, en
bepaal je dus ook impliciet de p-waarde.
• Als de p-waarde kleiner is dan α, dan zeg je:
“Als mijn H0 waar is, dan is de kans dat ik deze waarde voor 𝑋 vind of nog extremer,
kleiner dan . Deze kans is zo klein, dat ik geen vertrouwen meer heb in mijn
nulhypothese. Ik verwerp H0 .”
• Als de p-waarde groter is dan α, dan zeg je:
“Als mijn H0 waar is, dan is de kans dat ik deze waarde voor 𝑋vind of nog extremer
best groot. Ik heb dus niet genoeg redenen om te twijfelen aan de juistheid van H0. Ik
verwerp H0 dus niet.”
• Dus in stap 2 bepaal je de alfa en de beslissingsregel, maar in stap 4 neem je echt de
inhoudelijke beslissing.
Opmerking: Eén van de aannames is dus wel dat de steekproef een simple random sample is.
Dat wil zeggen dat alle cases een gelijke kans hebben om in de steekproef te komen en dat de
cases onafhankelijk van elkaar geselecteerd worden. Als niet aan deze aanname voldaan
wordt, dan mag de toets strikt genomen niet gebruikt worden. In de praktijk wordt dit toch
vaak gedaan, bijvoorbeeld bij onderzoek in de psychologie waarbij vaak studenten gebruikt
worden.
Eénzijdig versus tweezijdig toetsen
Het probleem is dat SPSS in de output altijd de resultaten laat zien van een tweezijdige toets.
Maar eigenlijk is de logica hetzelfde van beide toetsen. Als we een éénzijdige toets willen
uitvoeren, dan moet gekeken worden naar de sig waarde die de output rapporteert, en deze
omzetten. Hiervoor kan de onderstaande tabel gebruikt worden.
5
,In het eerder gebruikte voorbeeld was er sprake van een tweezijdige toets. Het resultaat van
de steekproef was een gemiddelde van 2.9. De H1 stelde dat er een µ zou voorkomen van niet
2.5. We zien dus dat het resultaat van de steekproef in overeenstemming staat met H1. Dus
de sig wordt gedeeld door twee.
2. Puntschatten
Bij puntschatten wordt de vraag ‘Wat is de beste gok voor de parameter?’ beantwoord. Dus:
welke waarde ligt het dichtste bij de waarde van de populatie. In het geval van het gemiddelde
µ is de beste gok de X , het steekproefgemiddelde. Als we de spreiding van de scores zouden
willen weten dan kijken we naar de variantie σ², en de beste gok hiervoor is de variantie s² in
de steekproef.
3. Intervalschatten
Bij betrouwbaarheidsintervallen beantwoord men de vraag: “Wat is het interval waarbinnen
de waarde van de parameter met …% zekerheid zich bevindt?”. Bij een 95%
betrouwbaarheidsinterval zouden we dus concluderen dat in 95% van de keren dat een
steekproef getrokken wordt van N=50, het betrouwbaarheidsinterval de µ zal bevatten.
Het betrouwbaarheidsinterval kan berekend worden door:
Toegepast op het voorbeeld:
Het gemiddelde X = 2.9.
De s = 1.147
N = 50
De kritische t-waarde is de waarde die bepaalt of dat de hypothese toets significant is. Als de
t-waarde groter is dan de kritische t-waarde, dan betekent dit dat de nul hypothese verworpen
moet worden. De kritische t-waarde kan gevonden worden in het tabellen boekje. In ons
voorbeeld is deze 2.0.
Als we de formule invullen krijgen we:
2.9 – 2 x 1.147/√50 = 2.574 en 2.9 + 2 x 1.147/√50 = 3.226
Het 95% betrouwbaarheidsinterval is dus [2.574;3.226]. Dit is anders dan we in de output zien,
want dat is het interval over het verschil. Wat we net berekend is het interval voor het
steekproefgemiddelde. We kunnen ook het interval van het steekproefgemiddelde berekenen
via de SPSS output. We tellen dan de getallen op bij de µ, 2.5. In dit voorbeeld dus 2.5 + 0.0739
en 2.5 + 0.73.
Het betrouwbaarheidsinterval kan ook gebruikt worden om een tweezijdige hypothese toets
uit te voeren. Dit wordt bepaald met de volgende beslissingsregel:
We zien dat µ = 2.5 buiten het interval ligt, en ook de nul hypothese moeten verwerpen. We
komen dus op dezelfde conclusie bij de p-waarde en bij het interval.
6
,Waarom werkt deze beslissingsregel?
• Stel dat H0 waar is: we zeggen dan dat 95% van alle mogelijke steekproeven een
interval oplevert waar µH0 in ligt. Hierbij houden we terecht H0 aan. Maar 5% van de
mogelijke steekproeven leveren dan een interval waar µH0 niet in ligt. Hierbij
verwerpen we H0 ten onrechte = Type 1 fout.
• De alternatieve interpretatie van het interval in relatie tot hypothese toetsen: Het 95%
interval geeft alle mogelijke hypothetische waarden voor µ die niet worden verworpen
door de steekproefgegevens.
We zien bij test values dat de µ 28 is. We stellen daarbij de hypotheses op als:
H0: µ = 28
H1: µ ≠ 28
De mean difference is 2. Het steekproefgemiddelde X is dan 28 + 2 = 30. We kunnen dit
toetsen door te kijken of 0 in het interval valt. Als 0 in het interval zit dan betekent dit dat het
verschil tussen het steekproefgemiddelde en het populatiegemiddelde van 28 niet groot
genoeg is om de nul hypothese te verwerpen. We zien in SPSS dat 0 in het interval valt, en de
nul hypothese niet hoeven verwerpen.
1.3 Overzicht toetsen gemiddelde
In de eerdere statistiek cursussen hebben we al vijf toetsen gezien voor gemiddelden:
Bij wat we in deze cursus bespreken zijn toetsen 3-5 het belangrijkst.
1.4 Voorbeeld toets twee onafhankelijke steekproeven
Onderzoeksvraag: Verschillen mannelijke en vrouwelijke studenten gemiddeld in hun
zelfverzekerdheid?
Stap 1: Het formuleren van de hypothesen
Stap 2: Wanneer is een resultaat significant? → p ≤ α = 0.05
Stap 3: De p-waarde bepalen uit de output van SPSS
7
, We zien twee soorten toetsen. Bij een Levene’s Test wordt getoetst of de populatievariantie
van de mannen gelijk is aan de populatievariantie van de vrouwen. De alternatieve hypothese
stelt dan dat deze populatievarianties ongelijk zijn aan elkaar.
Dit bepaalt in welke rij van de tabel we moeten kijken, de equal variances assumed of de equal
variances not assumed. Als we de nul hypothese niet kunnen verwerpen (de
populatievarianties zijn gelijk) dan kijken we bij equal variances assumed. Als we de nul
hypothese wel kunnen verwerpen dan kijken we bij equal variances not assumed.
In de SPSS output zien we een sig van 0.062, deze is groter dan de alfa van 0.05. Dus we gaan
de nul hypothese niet verwerpen. We kijken naar de equal variances assumed.
Stap 4: Een beslissing maken over de significantie en inhoudelijke conclusie.
In de tabel gaan we kijken bij de equal variances assumed op de bovenste rij. De sig waarde
die we hier zien, is 0.105. Dit is groter dan ons alfa niveau, waardoor we de nulhypothese
moeten behouden. Onze conclusie is dat de gemiddelde zelfverzekerdheid niet verschilt
tussen mannen en vrouwen.
1.5 Oefening
Onderzoeksvraag: Verschillen mannelijke en vrouwelijke studenten gemiddeld in de mate
waarin ze introvert zijn?
Stap 1: Het formuleren van de hypothesen: De alternatieve hypothese
is een links éénzijdige hypothese. De onderzoek verwacht dat de populatiegemiddelde van de
mannen kleiner is dan die van de vrouwen.
Stap 2: Wanneer is een resultaat significant? → p ≤ α = 0.05
Stap 3: De p-waarde bepalen uit de output van SPSS
De Levene’s Test stelt dat we de nul hypothese niet gaan verwerpen, dus we gaan kijken bij
de equal variances assumed. Onze tweezijdige p-waarde is dan 0.494. Maar we hebben hier
een éénzijdige toets. We zien bij de mean dat mannen hoger scoren dan de vrouwen.
8