Samenvatting Testen en Meten
College 1
Hoofdstuk 1: Psychometrics and the importance of psychological
measurement
Binnen de pedagogische en onderwijswetenschappen worden verschillende tests
gebruikt om het functioneren van individuen te meten. Enkele voorbeelden van
dergelijke tests zijn de IQ-test, CBCL en WISC. Deze tests bieden inzicht in
verschillende aspecten van cognitieve en emotionele ontwikkeling.
Latente variabelen zijn verborgen eigenschappen of kenmerken die we niet direct
kunnen zien, maar die we aannemen op basis van het bekijken van verschillende
meetbare dingen die ermee te maken hebben. Denk aan latente variabelen als
onzichtbare eigenschappen die we afleiden uit dingen die we wel kunnen meten.
Laten we het voorbeeld van werkgeheugen als latente variabele en het aantal cijfers
dat iemand kan onthouden als niet-latente variabele gebruiken. Het werkgeheugen is
niet direct observeerbaar. Je kunt niet van de buitenkant zien of iemand een goed of
slecht werkgeheugen heeft. In plaats daarvan kunnen onderzoekers proberen het
werkgeheugen af te leiden uit verschillende meetbare variabelen, zoals een taak
over het aantal cijfers dat iemand kan onthouden. In tegenstelling tot werkgeheugen
is het aantal cijfers dat iemand kan onthouden direct observeerbaar. Je kunt een
persoon eenvoudig vragen om een reeks cijfers te onthouden en vervolgens tellen
hoeveel cijfers ze correct kunnen reproduceren. Dit is een test die gebruikt kan
worden om een latente variabele te meten, zoals in dit geval het werkgeheugen. Nog
een aantal voorbeelden van latente variabelen zijn bijvoorbeeld agressie en
zelfredzaamheid. Er moet eerst een test worden uitgevoerd, voordat je over deze
eigenschappen kan oordelen.
Een term die vaak wordt gebruikt om de relaties tussen de latente en observeerbare
constructen te beschrijven, is het nomologisch netwerk. Dit verwijst naar een
theoretisch kader dat uitlegt hoe specifieke latente constructen verbonden zijn met
observeerbare gedragingen. In essentie is het nomologisch netwerk een theorie die
aangeeft hoe hypothetische concepten, zoals werkgeheugen, dienen als verklaringen
voor observeerbaar gedrag, zoals het aantal cijfers dat iemand kan onthouden of het
aantal woorden dat iemand kan reproduceren.
Er zijn drie fundamentele aannames over waarneembare psychologische kenmerken
die kunnen worden geïdentificeerd:
1. Menselijk gedrag laat zien wat er in ons hoofd gebeurt, ook al kunnen we dat
innerlijke gevoel niet rechtstreeks zien. Met andere woorden, wat we doen of
hoe we reageren, geeft aan wat er vanbinnen met onze gedachten en
gevoelens gebeurt.
2. De taken die we uitvoeren, zoals tests of opdrachten, zijn eigenlijk verbonden
met wat er in ons hoofd gebeurt. Als we bijvoorbeeld een test doen, meet die
eigenlijk iets wat we misschien niet rechtstreeks kunnen zien, maar wat wel in
ons innerlijke zit.
3. Wat er in ons hoofd gebeurt, is niet zo makkelijk te meten of te veranderen.
Het is als iets dat weerstand biedt, het laat zich niet zomaar observeren of
beïnvloeden. We moeten speciale methoden gebruiken om het nauwkeurig te
begrijpen.
Een psychologische test is een systematische procedure voor het vergelijken van het
gedrag van twee of meer mensen. De definitie omvat drie belangrijke componenten:
, 1. Tests omvatten gedragsmonsters van enig soort gedrag. Bij het afnemen van
een test is er dus altijd sprake van verschillende gedragingen die worden
geobserveerd. Bijvoorbeeld, in een geheugentest kan het gedrag zijn om
zoveel mogelijk cijfers te onthouden uit een reeks, wat het werkgeheugen test.
Deze gedragingen worden systematisch verzameld om een objectieve
beoordeling mogelijk te maken.
2. De gedragsmonsters moeten op een systematische manier worden verzameld.
Bij gestandaardiseerde tests, zoals bijvoorbeeld bij een centraal examen op
een middelbare school, wordt ervoor gezorgd dat alle deelnemers zich in
dezelfde omstandigheden bevinden. Ze maken de toets allemaal in dezelfde
zaal en onder vergelijkbare omstandigheden. Dit wordt gedaan om de
resultaten van de testen goed met elkaar te kunnen vergelijken, wat belangrijk
is voor een eerlijke beoordeling.
3. Het doel van de tests is om het gedrag van twee of meer mensen te
vergelijken. De scores die voortkomen uit deze gedragingen worden gebruikt
om mensen onderling te vergelijken. Bijvoorbeeld, bij een tentamen kunnen de
behaalde cijfers worden vergeleken met het aantal correct beantwoorde
vragen, en op basis daarvan worden sommige studenten als geslaagd
beschouwd, terwijl anderen dat niet zijn.
Interindividuele verschillen en intra-individuele verschillen zijn twee concepten
binnen de psychologie die verwijzen naar verschillende niveaus van variabiliteit in
gedrag en eigenschappen:
o Interindividuele verschillen (tussen individuen): Dit verwijst naar de verschillen
die optreden tussen verschillende individuen in een groep of populatie. Stel je
voor dat je een groep mensen hebt en je meet hun intelligentie,
interindividuele verschillen zullen laten zien hoe sommige mensen in de groep
hogere intelligentiescores hebben dan anderen.
o Intra-individuele verschillen (binnen individuen): Dit verwijst naar de
verschillen die optreden binnen hetzelfde individu over de tijd of in
verschillende situaties. Als je bijvoorbeeld de emoties van een persoon meet
in verschillende situaties gedurende de dag, zou je intra-individuele verschillen
kunnen identificeren door te zien hoe die persoon variërende emotionele
reacties vertoont in verschillende contexten.
In de gedragswetenschappen richten pedagogen en leraren zich vooral op individuele
personen, en is het cruciaal om ervoor te zorgen dat meetinstrumenten en
vragenlijsten betrouwbare resultaten opleveren. Een fundamentele hypothese in de
gedragswetenschappen stelt dat als een test of vragenlijst een specifiek construct
meet, verschillen in testscores duiden op daadwerkelijke verschillen in dat construct
tussen individuen. Deze hypothese vormt de basis voor het gebruik van
meetinstrumenten om inzicht te krijgen in psychologische kenmerken,
gedragspatronen en vaardigheden. Echter, de geldigheid van deze hypothese moet
grondig worden onderzocht. Het is essentieel om te bepalen of de test of vragenlijst
daadwerkelijk meet wat het beoogt te meten, en of de waarnemers die de resultaten
interpreteren niet bevooroordeeld zijn.
Psychologische tests zijn vaak gecategoriseerd in criteriumgerichte tests en
normgerichte tests. Een criteriumgerichte test is ontworpen om te meten hoe goed
een persoon bepaalde vaardigheden of kennis beheerst ten opzichte van een vooraf
bepaald criterium of standaard. Het doel is om te beoordelen of een individu
specifieke doelstellingen heeft bereikt. Hierbij wordt gekeken naar hoe goed een
persoon dus presteert in relatie tot een vooraf bepaalde standaard of set van criteria.
Stel je voor dat je een taaltoets hebt waarbij het criterium is dat de leerling 90% van
de spellingregels correct moet toepassen. De test beoordeelt of de leerling voldoet
aan deze specifieke norm. Een normgerichte test beoordeelt de prestaties van een
, persoon in vergelijking met de prestaties van een groep mensen, de normgroep
genoemd. Het doel is om te classificeren en te rangschikken hoe goed een individu
presteert ten opzichte van anderen in de groep. Er zijn geen vaste criteria voor het
beoordelen van de prestaties, het gaat erom hoe goed de persoon het doet in
vergelijking met anderen. Als je een normgerichte intelligentietest hebt, wordt het
individu beoordeeld op basis van hoe zijn intelligentieniveau zich verhoudt tot de
normgroep. Bijvoorbeeld, als iemand in de top 10% van de normgroep valt, wordt
deze persoon als bovengemiddeld beschouwd.
Bij een versnelde test (speeded test) wordt van de deelnemer verwacht dat deze zo
veel mogelijk vragen binnen een vooraf bepaalde tijdslimiet beantwoordt. De nadruk
ligt hierbij op snelheid en efficiëntie, waarbij de testmaker zijn of haar vaardigheden
moet tonen onder tijdsdruk. In tegenstelling hiermee staat de vermogentest (power
test), waarbij de deelnemer alle benodigde tijd mag nemen om de test te voltooien.
Hierbij wordt niet beperkt door een vastgestelde tijdslimiet, waardoor de nadruk
meer ligt op de grondigheid en zorgvuldigheid bij het beantwoorden van vragen. De
testmaker heeft de vrijheid om op een meer bedachtzame manier te reageren,
zonder de druk van tijdsbeperkingen.
Psychometrie is de wetenschap die zich bezighoudt met het evalueren van de
eigenschappen van psychologische tests. Drie van deze eigenschappen zullen
bijzondere interesse wekken: 1) het type informatie dat wordt gegenereerd door het
gebruik van psychologische tests, 2) de betrouwbaarheid van gegevens uit
psychologische tests, en 3) kwesties met betrekking tot de geldigheid van gegevens
verkregen uit psychologische tests.
Psychometrie en testtheorie worden soms als synoniemen gebruikt, maar ze kunnen
ook verschillende betekenissen hebben. Psychometrie verwijst naar de wetenschap
die zich bezighoudt met het evalueren van de eigenschappen van psychologische
tests. En testtheorie omvat een verzameling technieken die de ontwikkeling en het
gebruik van psychologische tests begeleiden.
Er zijn een aantal uitdagingen bij metingen in de psychologie:
1. Deelnemersreactiviteit (participant reactivity): Dit verwijst naar het fenomeen
waarbij deelnemers aan een onderzoek hun gedrag veranderen vanwege het
bewustzijn dat ze worden geobserveerd. Het kan de nauwkeurigheid van de
metingen beïnvloeden omdat deelnemers mogelijk niet hun natuurlijke gedrag
vertonen.
2. Verwachtings- en bias-effecten: Dit duidt op de invloed van vooraf bestaande
verwachtingen en vooroordelen van de onderzoeker op de resultaten. Als de
onderzoeker bepaalde verwachtingen heeft, kan dit onbedoeld het verzamelen
en interpreteren van gegevens beïnvloeden.
3. Samengestelde scores (composite scores): Dit betreft het gebruik van
gecombineerde metingen of scores om een algemene prestatie of eigenschap
te vertegenwoordigen. Het kan uitdagend zijn omdat het vereist dat
individuele metingen op een zinvolle manier worden samengevoegd, wat
interpretatie moeilijkheden met zich mee kan brengen.
4. Scoresensitiviteit betekent eigenlijk hoe goed een test reageert op
veranderingen in wat het probeert te meten. Als een test niet zo gevoelig is,
kan het lastig zijn om kleine veranderingen of verschillen in het gedrag of de
eigenschap die je onderzoekt op te merken.
5. Gebrek aan bewustzijn van belangrijke psychometrische informatie: Dit wijst
op het risico dat onderzoekers of gebruikers van tests mogelijk niet volledig op
de hoogte zijn van essentiële informatie met betrekking tot de