Hoofdstuk 1: Psychometrics and the
importance of psychological measurement –
Furr (2022)
Gedragswetenschappers gebruiken testen om observeerbaar gedrag te meten en niet-observeerbare
eigenschappen zoals geheugen of intelligentie af te leiden. Deze eigenschappen, genaamd
hypothetische constructen of latente variabelen, worden gemeten door middel van specifiek
gedrag: operationele definities.
Volgens Cronbach vergelijkt een psychologische test systematisch gedrag tussen mensen of binnen
dezelfde persoon gedurende een bepaalde tijd of situatie. Er worden voorbeelden van gedrag
gebruikt die op een duidelijke, gestandaardiseerde manier zijn verzameld om verschillen op te
sporen.
Manieren waarop psychologische tests kunnen verschillen:
Inhoud: aanleg, prestatie, intelligentie, persoonlijkheid, etc.
Vereiste respons: open vragen vs. gesloten vragen
Manier van afname: individueel vs. groep
Gebruik: criterium gerelateerd (cut-off score) vs. norm gerelateerd (vergelijking met
referentiegroep). In werkelijkheid is het onderscheid meestal vaag.
Timing: versneld (tijdgebonden, score gebaseerd op beantwoorde items, even gemakkelijke
vragen) vs. power (niet getimed, score gebaseerd op juiste antwoorden, variërende
moeilijkheidsgraad)
De betekenis van “indicatoren”: reflectief/effect (antwoorden weerspiegelen het construct,
bijv. intelligentie) vs. formatief/causaal (indicatoren definiëren het construct, bijv. SES-
status).
Psychometrie is de wetenschap van het evalueren van psychologische tests, waarbij de nadruk ligt
op de informatie die ze verschaffen, hun betrouwbaarheid en hun validiteit. Het gaat om het
schatten van deze niet-waarneembare eigenschappen met behulp van specifieke procedures.
Uitdagingen in psychologische metingen
Complexiteit van concepten: Fenomenen als intelligentie en angst hebben veel verschillende
aspecten
Reactiviteit van deelnemers: Individuen die hun gedrag veranderen omdat ze zich ervan
bewust zijn dat ze gemeten worden (bijv. vraagkarakteristieken, sociale wenselijkheid, expres
verergerde symptomen laten zien), wat de validiteit van de meting in gevaar kan brengen.
Verwachtingen/vooroordelen van observeerders: Vooroordelen/verwachtingen van
gegevensverzamelaars die metingen verstoren.
Composite (samengestelde) scores: Het combineren van antwoorden van meerdere items
om één psychologische eigenschap te meten.
Scoregevoeligheid: Het vermogen om betekenisvolle verschillen te detecteren.
(Gebrek aan) bewustzijn van psychometrie: Psychologische metingen worden vaak gebruikt
zonder rekening te houden met hun kwaliteit, wat hun nauwkeurigheid en bruikbaarheid
beïnvloedt.
, Psychologische metingen identificeren individuele verschillen (differentiële psychologie) en zorgen
voor validiteit door scoreverschillen af te stemmen op echte verschillen. Psychometrie gaat verder
dan dat en richt zich op het begrijpen van de problemen die gepaard gaan met het meten van gedrag
en psychologische eigenschappen.
Hoofdstuk 2: Scaling - Furr (2022)
Schalen is de manier waarop numerieke waarden worden toegekend aan psychologische
eigenschappen. Eigenschappen van getallen:
1. Identiteit: hetzelfde vs. verschillend Categorieën moeten verschillend zijn (bijv. “1” voor
gedragsproblemen, “2” voor geen), elkaar uitsluiten (een persoon kan niet tot beide
behoren), en uitputtend zijn (alle mogelijkheden moeten gedekt zijn).
2. Volgorde: relatieve hoeveelheid van kenmerk Rangschikt individuen op basis van de
hoeveelheid van een kenmerk (bijv. 1e, 2e), zoals kinderen rangschikken op interesse in
leren, maar specificeert niet het exacte verschil tussen de rangen.
3. Hoeveelheid: exacte hoeveelheid van kenmerk Gebruikt echte getallen om verschillen te
meten, bijv. 4 graden op een thermometer.
4. Nul kan twee betekenissen hebben:
Absolute nul: Geen aanwezigheid van een eigenschap (bijv. 0 cm betekent geen lengte).
Arbitrair nulpunt: Een willekeurig punt op een schaal, dat geen afwezigheid
vertegenwoordigt (bijv. 0°C markeert het smeltpunt van ijs, niet de afwezigheid van
temperatuur).
Meeteenheden worden gebruikt om eigenschappen te kwantificeren. Bij fysische metingen betekent
willekeur dat hun grootte vrij gekozen kan worden, dat ze op meerdere objecten van toepassing
kunnen zijn en dat ze verschillende attributen kunnen meten (een stopwatch kan bijvoorbeeld zowel
de reactietijd als de tijd om naar de winkel te lopen meten). In de psychologie kunnen eenheden een
willekeurige grootte hebben, maar zijn ze gebonden aan specifieke eigenschappen die gemeten
worden (bijvoorbeeld IQ).
Additiviteit in metingen veronderstelt consistente eenheden. In psychologische metingen is het
mogelijk dat als testonderdelen variëren in moeilijkheidsgraad, de scores de werkelijke kennis niet
accuraat weergeven, wat leidt tot een kloof tussen gemeten en werkelijke vaardigheid.
Soorten schalen:
Nominaal: Labelt categorieën (bijv. biologisch geslacht).
Ordinaal: Rangschikt individuen op basis van de hoeveelheid kenmerken (bijv. atletisch
vermogen).
Interval: Heeft een willekeurige nul en constante, additieve eenheden (bijv. 40°C + 2°C =
42°C), maar geen zinvolle vermenigvuldiging/verdeling (bijv. 80°C is niet twee keer zo heet
als 40°C). Veel psychologische tests worden behandeld als intervalschalen, maar er zijn er
maar weinig die echt scores op intervalniveau geven. Dichotome variabelen kunnen alleen
gegevens op intervalniveau weergeven als ze gebaseerd zijn op een kwantitatief kenmerk.
Ratio: Heeft een absoluut nulpunt, waardoor zowel additieve (bijv. 40 km + 10 km = 50 km)
als multiplicatieve interpretaties mogelijk zijn (bijv. 80 km is twee keer zo ver als 40 km).