Testtheorie
Inleiding in de theorie van de psychologische test en zijn
toepassingen
1
,2
,2 Definitie, kenmerken en toepassingen van de test
2.1 Wat is een test?
2.1.1 Onderdelen van een test
In het algemeen komt men in een verantwoorde test de volgende onderdelen tegen:
- Testmateriaal (pen, papier, bouwstenen, foto’s etc.) Dit verschilt sterk per test.
- Testformulieren; hierop worden antwoorden, reacties en gedragsgegevens
verzameld, die het materiaal vormen waaruit de psychologische interpretatie of
conclusies worden afgeleid.
- Testhandleiding; varieert van een uitvoerig boekwerk tot beknopte richtlijnen.
o Exacte testinstructie; instructie met alles wat betrekking heeft op het
testonderzoek.
o Verwerkingsprocedure; bestaat voornamelijk uit richtlijnen voor de
toekenning van numerieke scores aan de antwoorden of reacties op de
opgaven.
o Normtabellen. Testprestatie wordt bijna altijd uitgedrukt in een numerieke
testscore. Scores kunnen vergeleken worden met normgroepen.
o De handleiding dient een bespreking te bevatten van de wetenschappelijke
kwaliteiten van de test; indicatie van betrouwbaarheid, testbetekenis, voor
welke voorspellingen de test gebruikt kan worden.
2.1.2 Eerste omschrijving
Het doel van een test is het doen van een uitspraak die een voorspelling, classificatie of
beschrijving met betrekking tot het onderzochte individu behelst. Het gaat vaak om een
vergelijking met andere mensen.
Psychologische test: ‘Een systematisch onderzoek van gedrag met behulp van speciaal
geselecteerde vragen of opgaven, met de bedoeling inzicht te krijgen in een psychologisch
kenmerk van de onderzochte in vergelijking met anderen.’
2.1.3 Kenmerken van een test
Bij de beschikbaarheid van voldoende juiste informatie is het niet altijd nodig een test te
gebruiken bij de oordeelsvorming over menselijk gedrag. Indien de psychologische test wel
een juister beeld oplevert dan het voorwetenschappelijk oordeel, of een verbetering en
aanvulling hierop kan betekenen en de kosten of ethische bezwaren niet onoverkomelijk
zijn, is het gebruik ervan gerechtvaardigd. Met de volgende zes kenmerken is een goede test
in de meeste gevallen in het voordeel ten opzichte van het voorwetenschappelijk oordeel:
- Efficiëntie. Er zijn talrijke situaties die aanwijzingen verschaffen voor het schatten
van intelligentie, maar die situaties moeten zich wel voordoen. De intelligentietest is
niet afhankelijk van toevallige situaties.
- Standaardisatie. Dit is één van de noodzakelijke voorwaarden voor de
vergelijkbaarheid van testprestaties met anderen. Condities en invloeden worden zo
veel mogelijk gestandaardiseerd. Door standaardisatie van de afnamen van de test
worden min of meer de condities en invloeden op de testresultaten (bij verschillende
personen en verschillende tijdstippen van afname) gelijkgeschaard waardoor
onderlinge vergelijkbaarheid van de testprestaties wordt verwezenlijkt.
3
, - Normering. Het vaststellen van een rangorde is de eenvoudigste vorm van
normering. De beschikbaarheid van normen is een noodzakelijke voorwaarde voor
het gebruik van een test. De testscore van de onderzochte persoon kan met de
rangorde worden vergeleken en de hoogte van een bepaalde testscore kan worden
geevalueerd. De benadering met een normaalverdeling doet men doorgaans als de
steekproef uit een normaal verdeelde populatie afkomstig is, en men de
steekproeffouten wil ‘gladstrijken’. Het kiezen van nieuwe verdelingskenmerken
(gemiddelde, spreiding), doet men om een ‘handige’ schaal te krijgen. Men kan
volstaan met een ongenormeerde test bijvoorbeeld in experimenteel onderzoek.
- Objectiviteit. De objectiviteit van de testinterpretatie houdt in dat de interpreatie
onafhankelijk is van de persoon die de test afneemt. Deze opvatting heeft twee
gevolgen:
Bij objectief testonderzoek moet het niet uitmaken wie de beoordelaar is
Objectiviteit impliceert openheid en reproduceerbaarheid van de test- en
evaluatieprocedure.
Objectiviteit wordt omschreven in termen van het intersubjectiviteitsprincipe.
Hiermee is de mate van objectiviteit te bepalen.
Onafhankelijkheid van de beoordelaars betekent dat zij niet overleggen of zelfs maar
weet hebben van elkaars oordelen. De mate van overeenstemming van de resultaten
is uit te drukken in de interbeoordelaarsbetrouwbaarheid. Indien twee
onafhankelijke beoordelaars beiden een rangorde produceren kan de
interbeoordelaarsbetrouwbaarheid worden uitgedrukt in een rangcorrelatie
(Spearman of Kendall).
Indien de beoordelingen niet alleen een rangorde vormen, maar de afstanden tussen
de plaatsen in die rangorde betekenis hebben, kan de product-momentcorrelatie de
mate van overeenstemming uitdrukken.
De mate van overeenstemming tussen twee beoordelaars: Po: mate van
overeenstemming; Pt: toevalskans.
& (&
𝑘𝑎𝑝𝑝𝑎 = ' )
*(&)
- Betrouwbaarheid; als twee verschillende testmetingen bij dezelfde persoon
bijzonder weinig verschillen, dan wordt de test als betrouwbaar betiteld. Door de
rangordes met elkaar te vergelijken en bijvoorbeeld uit te drukken in een
rangcorrelatie, beschikken we tevens over een kwantitatieve maat voor deze
betrouwbaarheid.
- Validiteit; meet de test wat hij moet meten? Zijn de indicaties die je meet, ook de
juiste om je einddoel te meten? Van een goede test is de psychologische betekenis
bekend. Er is geen verschil van mening mogelijk over de interpretatie en de betekenis
van de testprestatie.
2.2 Meten van eigenschappen door middel van tests
2.2.1 Meetniveaus en toegestane operaties
Er zijn vier meetniveaus:
- Nominale schaal; als we personen of objecten volgens een bepaald principe verdelen
in groepen en we kennen aan die groepen een getal toe(categorisering en
naamgeving). Vb. toekennen van rugnummers aan voetballers.
4
, - Ordinale schaal; het ordenen van categorieën of objecten. Vb. meer of minder
intelligent
- Interval schaal; de verschillende posities zijn geordend van minder naar meer, maar
de afstanden tussen de verschillende posities hebben betekenis. Arbitrair nulpunt.
Vb. Celsius.
- Verhoudingsschaal; ‘ratio scale’, schaal die eenheden heeft waarmee afstanden
kunnen worden aangegeven, maar bovendien is het nulpunt absoluut. Vb. lengte,
gewicht.
2.2.2 Opvattingen over meten
De psychologie heeft lang geworsteld met het begrip ‘meten’ en het meetbaar maken van
eigenschappen. Het meetbaar maken van psychologische eigenschapen via tests en
vragenlijsten, en het onderzoek naar de betekenis van testscores leveren een
wetenschappelijke bijdrage aan de ontwikkeling van de psychologie. Tests en vragenlijsten
spelen ook een onmisbare rol in het werk van veel in de praktijk werkzame psychologen.
2.2.3 De gangbare procedure voor het meten van psychologische eigenschappen.
De stappen die we kunnen onderscheiden om te komen tot een meting, zijn de volgende.
- Identificatie van de te meten eigenschap; vaststellen wat de theorie is met
betrekking tot de te meten eigenschap, ook rivaliserende theorieën. Enig probleem is
dat sommige eigenschappen beperkte theorievorming hebben.
- Operationalisering van de eigenschap; de specificatie van de operaties (via items) die
nodig zijn om de eigenschap te meten. Vb van items: uitspraken, taken en vragen.
Een test bestaat uit een representatieve steekproef van items uit het itemdomein.
- Onderzoek en kwantificering van reacties; de reacties van personen op de items
geven informatie over de eigenschap waarover de test wordt geacht uitsluitsel te
geven. Deze reacties zijn kwalitatief, hierna volgt kwantificering.
- Terugkoppeling naar de theorie; als de uitkomst aangeeft dat de test de bedoelde
eigenschap meet en dat aan een aantal technische eisen voor een geslaagde meting
is voldaan, dan heeft men een goed meetinstrument en is er evidentie gevonden
voor theorievorming.
Representational measurement = er kan alleen sprake zijn van meting, indien de formele
relaties tussen meetwaarden overeenkomen met de relaties die er in de empirie bestaan
tussen de ‘objecten’ waarover die meetwaarden iets zeggen.
Als Jan een hogere testscore heeft dan Piet op een test die pretendeert ruimtelijk inzicht te
meten, dat er dan in de empirie een aantoonbare relatie moet bestaan tussen het ruimtelijk
inzicht van Jan en Piet, zodanig dat we kunnen concluderen dat Jan hierop een hoger niveau
heeft dan Piet.
2.3 Definitie van een test
‘Een test is een systematische classificatie- of meetprocedure, waarbij het mogelijk is een
uitspraak te doen over één of meer empirisch-theoretisch gefundeerde eigenschappen van
de onderzochte of over specifiek niet-testgedrag, door uit te gaan van een objectieve
verwerking van reacties van hem/haar, in vergelijking tot die van anderen, op een aantal
gestandaardiseerde, zorgvuldig gekozen stimuli.’
5