The role of statistics in behavioral research
Sander Los
, Contents
Chapter 1. Why Statistics?..........................................................................................................3
Chapter 2. Testing the null hypothesis.....................................................................................14
Chapter 4. Introduction to the t-test........................................................................................34
Hoofdstuk 5. De t-test voor gekoppelde waarnemingen; De statistische
besluitvormingsprocedure.......................................................................................................46
2
, Chapter 1. Why Statistics?
1.1 Introduction
Op het gebied van psychologie en pedagogiek verzamelen onderzoekers
gegevens om hypothesen over relaties tussen variabelen en over oorzaken van gedrag te
toetsen. De rol van statistieken zijn hierbij cruciaal, en in deze syllabus zal ik proberen uit te
leggen waarom. Om dit te doen, zal ik me richten op algemene principes en wiskundige
details overslaan. Deze details zijn belangrijk voor een diepgaand begrip van statistieken, en
zullen worden behandeld in de Statistics I cursus, die in november van start gaat. In deze
inleiding houden we ons aan het motto "bos voor bomen".
Een algemeen begrip van de rol van de statistiek is belangrijk omdat het je in staat
stelt om de beweringen van onderzoekers in onderzoeksartikelen te begrijpen. Een
onderzoeksartikel bestaat uit vaste rubrieken, het Abstract, Inleiding, Methode, Resultaten
en Discussie. De meeste secties zijn goed toegankelijk voor u (als u bereid bent om een
beetje moeite te doen), maar de sectie Resultaten kan echt uitdagend zijn. Hier worden de
resultaten van statistische tests gerapporteerd met schijnbaar ontmoedigende codes, zoals
"F (3, 26) = 32,73, p <.001". Om deze code in detail te begrijpen, is een grondige kennis van
statistiek vereist, maar veel minder is nodig om u op het juiste spoor te zetten. Het doel van
deze syllabus is om u voldoende inzicht te geven in de statistieken om de codes in de sectie
Resultaten transparant te maken, zodat u zich meer op uw gemak voelt bij het
onderzoeksartikel dat u leest.
1.2 The problem
Tess, een eerstejaarsstudent pedagogiek, wil weten of er een verschil is in gemiddelde
reactietijd tussen Nederlanders en Belgen. Omdat ze nooit zelf onderzoek heeft gedaan, stelt
ze haar idee eerst voor aan haar kritische klasgenoot Manuel, die psychologie studeert.
3
, Dit leidt tot een levendige discussie waarin verschillende scenario's worden besproken. Voor
elk scenario stellen Tess en Manuel eerst een hypothetische uitkomst voor, en bespreken
vervolgens of die uitkomst hun onderzoeksvraag zou beantwoorden.
Scenario 1. Over sommige aspecten van het probleem zijn Tess en Manuel het snel
eens. Ze moeten een steekproef nemen van de Nederlanders en de Belgische bevolking,
omdat het onmogelijk is om de responstijden van de hele bevolking te meten. Ze zijn het er
ook over eens dat de steekproef willekeurig moet zijn. Dit betekent dat elke Nederlander
een gelijke kans heeft om in de Nederlandse steekproef te worden opgenomen, en elke Belg
een gelijke kans heeft om in de Belgische steekproef te worden opgenomen. Zo niet, dan is
het niet gerechtvaardigd om de bevindingen later te veralgemenen naar de bevolking toe.
Tess en Manuel zijn het ook eens over het meten van de reactietijd: ze laten elke deelnemer
op een knop drukken zodra er een wit vierkant op een zwart computerscherm verschijnt.
Maar dan hebben Tess en Manuel een probleem: hoe groot moet het monster zijn?
Tess stelt het volgende voor: "Als we willekeurig twee Nederlanders en twee Belgen
selecteren, zijn we snel klaar. Als we bijvoorbeeld een gemiddelde responstijd vinden van
280 ms (= 0,28 s) voor de Nederlanders en 300 ms voor de Belgen, dan kunnen we
concluderen dat de Nederlanders sneller reageren dan de Belgen". Heeft Tess gelijk?
Manuel vindt dat Tess ongelijk heeft. Hij zegt: "Deze uitkomst zegt ons alleen maar
dat deze twee Nederlanders sneller zijn dan de Belgen in de steekproef. Maar de kritische
vraag is of er een algemeen verschil in gemiddelde reactietijd is tussen Nederlanders en
Belgen. Niet alleen in de steekproef, maar ook in de bevolking! Niemand is geïnteresseerd in
de steekproef als deze niets zegt over de bevolking. De vraag is dus: kunnen we de
bevindingen in onze steekproef veralgemenen naar de bevolking toe? Kunnen we
concluderen dat de gemiddelde reactietijd bij de Nederlandse bevolking korter is dan bij de
Belgische bevolking?".
Na verder nadenken beantwoordt Manuel zijn eigen vraag: "Nee," zegt hij, "op basis
van de steekproefgegevens kunnen we niet concluderen dat Nederlanders sneller reageren
dan Belgen. Als we dat doen, maken we gebruik van een inductief argument: We hebben
een specifieke observatie en we willen een algemene uitspraak doen. We willen
steekproefsgewijs een uitspraak doen over de hele bevolking. Hebben we niet geleerd dat
we nooit zeker kunnen zijn van de geldigheid van een inductief argument? Onze
steekproefgegevens vertellen ons dus niets over de bevolking.
4