Samenvatting Testtheorie
Furr, R.M. & Bacharach, V.R. (2018). Psychometrics: An Introduction (3th edition). London: SAGE
Publications
‘’Hoofdstuk 1: Het belang van psychologische metingen
Het belang van psychologische
testen………………………………………………………………………………………………….
Bijna iedereen in de samenleving wordt op een bepaald moment in zijn leven betrokken bij een
psychologische meting. Doordat psychologische testen een belangrijke rol spelen in het leven en de
maatschappij, is het van belang dat psychologische testen van erg hoge kwaliteit zijn. De
testgebruikers (diegene die beslissingen nemen over mensen) zijn verantwoordelijk voor het
onderzoeken en het interpreteren van de belangrijke informatie over de betekenis en de kwaliteit
van de testen die ze gebruiken.
Waarneembaar gedrag en niet-waarneembare psychologische
eigenschappen………………………………….
De waarneembare gebeurtenissen in de gedragswetenschappen zijn meestal een gedrag en een
gedragsmeting heeft twee doelen, namelijk het meten van het gedrag, omdat de psycholoog
geïnteresseerd is in het specifieke gedrag (1) en het observeren van het menselijk gedrag om de niet-
waarneembare constructen, zoals bijvoorbeeld depressie en intelligentie te beoordelen (2). Er wordt
vanuit het waarneembare gedrag een gevolgtrekking gemaakt om uitspraken te kunnen doen over
het niet-waarneembare psychologische construct. Op het moment dat deze conclusie redelijk lijkt,
heeft de interpretatie van gedrag een mate van geldigheid.
Wanneer de scores van de test het mentale proces lijkt te meten wat we willen meten, dan wordt er
gesproken over validiteit. De metingen in de psychologie omvatten meestal een theorie die
psychologische kenmerken, toestanden of processen koppelt aan waarneembaar gedrag. Er wordt
hiervan verwacht dat het verschillen in een bepaald psychologisch construct weergeeft. De niet-
waarneembare psychologische constructen, zoals het werkgeheugen is een theoretisch concept.
Deze worden gebruikt om de verschillen in het gedrag te verklaren. Dit worden ook wel de
hypothetische constructen of de latente variabelen genoemd. Om de hypothetische constructen
toch te kunnen meten wordt er gebruik gemaakt van operationele definities (operaties of
procedures).
Psychologische testen: definities en
types……………………………………………………………………………………………
Een psychologische test is een systematische procedure voor het vergelijken van twee of meer
personen. Er zijn een aantal componenten die van belang zijn bij een psychologische test, namelijk
dat de testen gedragsmonsters van een soort omvatten (observeerbaar) en dat de gedragsmonsters
op een systematische manier verzameld moeten zijn (objectief). Daarnaast heeft de test als doel om
het gedrag van twee of meer personen te vergelijken, maar het kan ook het vergelijken zijn van
personen over tijd.
Een psychologische test kan veel verschillende vormen hebben, zoals bijvoorbeeld een test op
papier, een laboratoriumstudie, een meerkeuze vaardigheidstest, een systematische
gedragsobservatie of een Rorschach inktvlekkentest. De informatie die een test oplevert kan ook
,sterk verschillen. Zo geven sommige testen getallen weer over de hoeveelheid die iemand heeft van
een psychologisch construct en andere testen geven informatie weer over categorische gegevens en
plaatsen personen in groepen.
De inter- en intra-individuele verschillen bij een testprestatie zorgen voor een testscorevariabiliteit.
Dit is een belangrijk onderdeel in het meten van een psychologisch construct.
Wat hoort er bij een psychologische
test?................................................................................................
Er zijn verschillende zaken die bij een psychologische test behoren:
Testmateriaal.
Testformulieren voor het registreren van de datapunten. Er kan vervolgens gekeken worden
wat de uitkomsten zijn.
Testhandleiding. Er zijn een aantal elementen van de testhandleiding, namelijk de exacte
testinstructie, de verwerkingsprocedure, de normtabellen en de bespreking van
wetenschappelijke kwaliteiten.
Soorten testen……………………………………………………………………………………………………………………………………..
Er wordt een onderscheid gemaakt tussen verschillende soorten testen:
Open-ended testen versus closed-ended testen.
Testen die ontworpen zijn om bij een individu af te nemen versus testen die ontworpen zijn
om bij groepen mensen af te nemen.
Prestatieniveau testen (maximum) versus gedragswijze testen (typical performance). Bij een
prestatieniveau test krijgt iedereen een test en laat hij de maximale prestatie zien die hij kan
leveren. Een voorbeeld hiervan is een tentamen. De prestatieniveau testen meten dus
iemands vaardigheden. Bij een gedragswijze test wordt er geprobeerd om een plaatje van
iemand als persoon te schetsen. Er is hier dus geen sprake van een goed of fout antwoord,
maar sprake van of iets wel of niet bij iemand past. De gedragswijze testen meten dus
bijvoorbeeld iemands persoonlijkheidseigenschappen en attitudes.
Criteriumgerichte testen versus normgerichte testen. Bij een criteriumgerichte test wordt er
een criterium vastgesteld om mensen in te delen in twee groepen, namelijk boven of onder
het criterium. Een voorbeeld van een criteriumgerichte test is het tentamen Testtheorie,
want iemand die voldoende de stof beheerst zou ook een voldoende moeten krijgen. Bij een
normgerichte test wordt de test gebruikt om te begrijpen hoe iemand scoort in vergelijking
tot anderen. De testscore van een individu wordt dus vergeleken met de testscore van een
normatieve steekproef. Hierbij zijn goede normgegevens over de populatie van cruciaal
belang.
Speed testen versus power testen. Een speed test meet de prestaties van iemand onder
tijdsdruk. Hierbij wordt er dus gekeken hoeveel vragen iemand beantwoord in een bepaalde
tijd. Een voorbeeld van een speed test is de Bourdon dot concentration (zo snel mogelijk sets
afwerken en de sets omcirkelen waar vier bolletjes staan). Een power test meet het aantal
goede antwoorden zonder dat er sprake is van tijdsdruk. De meer vaardige personen zullen
dus meer vragen goed beantwoorden. Een voorbeeld van een power test is een tentamen.
Itemscores
De itemscores worden zo bepaald dat deze indicatief zijn voor het te meten construct, dus een
hogere itemscore correspondeert met een hoger niveau op een bepaalde eigenschap. Een itemscore
,is contra indicatief wanneer een hogere itemscore correspondeert met een lager niveau op een
bepaalde eigenschappen.
Eigenschappen van testscore……………………………………………………………………………………………………………….
Een testscore is de optelsom van alle itemscores. De testscore is de belangrijkste uitkomst van een
test. Bij de interpretatie van een score wordt er gekeken naar de testscore en niet naar de itemscore.
De testhandleiding geeft instructies over het interpreteren van de testscores. Bij een normgerichte
test moeten de normgegevens geraadpleegd worden. Het is belangrijk dat een testscore de
verschillen in mensen blootlegt. Hierbij is een hoge mate van variantie in de testscores wenselijk.
Doordat de testscore bestaat uit de itemscores, is een hoge variantie op de itemscores wenselijk en
is een hoge covariantie tussen de itemscores ook wenselijk. De testscore variantie neemt toe
wanneer de itemscore-variantie ook toeneemt. Een goede samenhang tussen de verschillende items
is dan ook belangrijk.
Wat is
psychometrie?................................................................................................................................
De psychometrie is de wetenschap die zich richt op het evalueren van de kenmerken van
psychologische testen. Hierbij zijn drie zaken erg belangrijk:
Het type informatie dat wordt verkregen door het gebruik van psychologische testen.
De betrouwbaarheid van de gegevens van de psychologische testen.
De validiteit van de data dat wordt verkregen door de psychologische testen.
Uitdagingen tot meten in de
psychologie…………………………………………………………………………………………….
Alle metingen worden beïnvloed door uitdagingen die de meetnauwkeurigheid kunnen verminderen.
Er zijn zes verschillende uitdagingen:
De poging om alle belangrijke aspecten van een psychologisch construct in één getal uit te
drukken en vast te leggen.
Deelnemersreactiviteit is een fenomeen dat de reacties en/of gedragingen van de
deelnemers beïnvloed kunnen worden door het bewustzijn van het deel uitmaken van een
onderzoek. Dit kan drie verschillende vormen aannemen:
1. Bij demand characteristics probeert de deelnemer te handelen naar datgene
waarvan hij denkt dat de onderzoeker dat wil bereiken met zijn onderzoek.
2. Bij sociaal wenselijkheid probeert de deelnemer indruk te maken door sociale
wenselijke antwoorden in te vullen.
3. Bij malingering gaan de deelnemers opzettelijk slechter presteren.
Er is sprake van verwachting en bias effect wanneer de onderzoekers onbewust de
onderzoeksresultaten laten beïnvloeden door hun verwachtingen. Een voorbeeld hierbij is
dat de onderzoekers onbewust signalen doorgeven, waardoor de deelnemers gaan presteren
naar de verwachtingen van de onderzoekers.
Een psycholoog lijkt te vertrouwen op een composietscore. Een composietscore is een
gemiddelde score. Het gebruik van een composietscore heeft echter ook verschillende
nadelen.
De scoregevoeligheid is het vermogen van een test om een onderscheid te maken tussen
betekenisvolle eenheden binnen de dimensie die gemeten wordt.
, Er is een tekort aan bewustzijn over de belangrijke psychometrische informatie. De meeste
testen in het dagelijks leven hebben dan ook weinig psychometrische kwaliteit. Deze testen
zijn dus niet valide.
De gedragswetenschappers hebben een goed weten van deze uitdagingen en hebben verschillende
methoden ontwikkeld om de bovenstaande problemen te verkleinen, op te spoten en te verklaren.
Het belang van individuele
verschillen…………………………………………………………………………………………………
Het doel van psychologische metingen is het identificeren en het kwantificeren van de
psychologische verschillen die bijdragen aan de verschillen in testscores en die de basis vormen van
de psychometrische informatie. De nuttige psychometrische informatie kan alleen verkregen worden
wanneer mensen verschillen met betrekking tot het gedrag dat onderzocht wordt.
Hoofdstuk 2: Schalen
Bij een test wordt een nummer toegewezen aan de kwantiteit van een psychologisch construct.
Hierbij spelen verschillende schalen een belangrijke rol. De schalen zijn de verschillende manieren
waarop numerieke gegevens gekoppeld kunnen worden aan psychologische constructen.
Fundamentele problemen met nummers
……………………………………………………………………………………………
Bij psychologische metingen worden nummers gebruikt om individuele levels op een psychologisch
construct te presenteren. Er zijn drie belangrijke eigenschappen en één getal die invloed hebben op
de manier waarop de psychologische constructen weergegeven worden.
Eigenschap van identiteit…………………………..………………………………………………………………………………………..
De meest basale vorm van een meting heeft te maken met de eigenschap van identiteit, waarbij er
wordt gekeken naar ‘hetzelfde’ en ‘anders’. Wanneer een meting nuttig dient te zien, moeten
mensen minimaal in twee verschillende categorieën opgedeeld kunnen worden. Zo zijn de mensen in
groep 1 hetzelfde als de anderen in groep 1, maar verschillen zij van mensen in groep 2. Er zijn een
aantal regels voordat een persoon gecategoriseerd kan worden:
De mensen in dezelfde groep moeten gelijk zijn aan elkaar. De mensen binnen een bepaalde
categorie moeten identiek zijn wat betreft de eigenschap van die categorie.
De categorieën moeten exclusief (mutually exclusive) zijn. Dit houdt in dat mensen maar tot
één categorie tegelijkertijd kunnen behoren en niet in meerdere categorieën tegelijkertijd
kunnen vallen.
De categorieën moeten uitputtend (exhaustive) zijn. Dit betekent dat mensen duidelijk tot
één categorie moeten behoren. Wanneer ze niet duidelijk in één van de twee categorieën
kunnen vallen, dienen er nieuwe categorieën worden toegevoegd.
Aan de verschillende categorieën wordt een nummer gekoppeld, maar deze heeft meestal geen
numerieke waarde, omdat het als symbool staat voor de variabele, zoals 1 = gedragsprobleem, 2 =
geen gedragsprobleem.
Eigenschap van
orde…………………………………………………………………………………………………………………………….
De eigenschap van orde geeft informatie weer over de mate waarin mensen verschillen en de mate
waarin mensen voldoen aan een bepaald psychologisch construct. Op het moment dat nummers de
eigenschap van orde hebben, geven ze de rangorde van mensen ten opzichte van elkaar aan in een