PB1502 Test- en toetstheorie H1, 2, 3 en 4
H1 Historische ontwikkeling van testen (pp. 15-37)......................................................................................................4
1.1 Periode tot het verschijnen van de Binet-Simon-test..........................................................................................4
Psychiatrie......................................................................................................................................................4
Experimentele psychologie............................................................................................................................4
Genetica.........................................................................................................................................................5
1.2 Periode tussen het verschijnen van de Binet-Simon-test en de Eerste Wereldoorlog.........................................5
1.3 Van het begin van de Eerste Wereldoorlog tot de Tweede Wereldoorlog............................................................6
Europa............................................................................................................................................................6
Amerika..........................................................................................................................................................6
Engeland.........................................................................................................................................................6
1.4 Van het begin van de Tweede Wereldoorlog tot heden........................................................................................7
1.4.1 Ontwikkelingen in de Verenigde Staten.....................................................................................................7
1.4.2 Ontwikkelingen in Europa, vooral in Nederland........................................................................................8
H2 Definitie, kenmerken en toepassingen van de test (pp. 38-75).................................................................................9
2.1 Wat is een test?....................................................................................................................................................9
2.1.1 Onderdelen van een test..............................................................................................................................9
Testmateriaal..................................................................................................................................................9
Testformulieren..............................................................................................................................................9
Testhandleiding..............................................................................................................................................9
2.1.2 Eerste omschrijving....................................................................................................................................9
2.1.3 Kenmerken van een test..............................................................................................................................9
Efficiëntie.....................................................................................................................................................10
Standaardisatie.............................................................................................................................................10
Normering....................................................................................................................................................10
Objectiviteit..................................................................................................................................................10
Betrouwbaarheid..........................................................................................................................................11
Validiteit.......................................................................................................................................................11
2.2 Meten van eigenschappen door middel van tests..............................................................................................11
2.2.1 Meetniveaus en toegestane operaties........................................................................................................11
Nominale schaal...........................................................................................................................................12
Ordinale schaal.............................................................................................................................................12
Intervalschaal...............................................................................................................................................12
Verhoudingsschaal (‘ratio scale’).................................................................................................................12
2.2.2 Opvattingen over meten............................................................................................................................12
Operationalisme...........................................................................................................................................13
2.2.3 De gangbare procedure voor het meten van psychologische eigenschappen...........................................13
Identificatie van de te meten eigenschap.....................................................................................................13
Operationalisering van de eigenschap..........................................................................................................14
Onderzoek en kwantificering van reacties...................................................................................................14
Terugkoppeling naar de theorie....................................................................................................................14
2.3 Definitie van een test.........................................................................................................................................15
2.4 Toepassingsmogelijkheden................................................................................................................................15
2.4.1 Beoordeling van individuen......................................................................................................................15
2.4.2 Beoordeling van groepen..........................................................................................................................15
2.4.3 Beoordeling van invloed van situaties en methoden................................................................................16
H3 Indelingen, onderscheidingen en begrippen (pp. 76-115).......................................................................................17
3.1 Indeling naar testgedrag....................................................................................................................................17
3.1.1 Tests voor prestatieniveau (figuur 3.1 p. 78)............................................................................................17
, Enkelvoudige algemene niveautests............................................................................................................17
Veelvoudige algemene niveautests...............................................................................................................18
Speciale niveautests.....................................................................................................................................19
Vorderingentests...........................................................................................................................................19
3.1.2 Tests voor gedragswijze (figuur 3.2 p. 87)...............................................................................................19
Observatietests.............................................................................................................................................20
Somato-fysiologische methoden..................................................................................................................20
Zelfbeoordelingen........................................................................................................................................21
Kwalitatieve prestatietests............................................................................................................................22
3.1.3 Drie voorbeelden van tests........................................................................................................................22
RAKIT – algemene intelligentie (revisie Amsterdamse KinderIntelligentieTest).......................................22
Test voor transitief redeneren – specifieke test (computertest Bouwmeester).............................................23
NEO – meting van de Big-Five persoonlijkheidsstructuur..........................................................................23
3.2 Indeling naar instructie en afneming.................................................................................................................24
3.2.1 Individuele test en groepstest....................................................................................................................24
Individuele test.............................................................................................................................................24
Groepstest.....................................................................................................................................................24
3.2.2 Snelheidstest en niveautest (speed test vs. power test).............................................................................25
Snelheidstest.................................................................................................................................................25
Niveautest.....................................................................................................................................................25
Meten ze dezelfde eigenschap?....................................................................................................................25
3.3 Onderscheid op basis van testvragen.................................................................................................................26
3.3.1 Cultuurvrije en niet-cultuurvrije tests.......................................................................................................26
Gradueel onderscheid...................................................................................................................................26
3.3.2 Directe tests en indirecte tests...................................................................................................................26
Directe test...................................................................................................................................................26
Indirecte test.................................................................................................................................................26
3.3.3 Vrije-antwoordtests en keuze-antwoordtests............................................................................................26
Vrije-antwoordtests......................................................................................................................................26
Keuze-antwoordtests....................................................................................................................................26
H4 Constructie van items en kwantificering van reacties (pp. 116-145)......................................................................27
4.1 Van de respondent gevraagde activiteit.............................................................................................................27
Theoretische opdrachten..............................................................................................................................27
Stellingen.....................................................................................................................................................27
Vragen..........................................................................................................................................................27
Praktijkproeven............................................................................................................................................27
4.2 Vorm waarin het antwoord wordt gegeven........................................................................................................28
Open vraagvorm...........................................................................................................................................28
Gesloten vraagvorm.....................................................................................................................................28
4.3 Itemvormen: het speciale geval van geprecodeerde items................................................................................29
4.3.1 Items voor prestatieniveautests.................................................................................................................29
1. Kiezen......................................................................................................................................................29
2. Rangschikken...........................................................................................................................................29
3. Toeschrijving (matching).........................................................................................................................29
4.3.2 Items voor tests voor gedragswijze...........................................................................................................29
4.4 Kwantificering van antwoorden........................................................................................................................29
4.4.1 Kwantificering, diverse informatiebronnen..............................................................................................29
4.4.2 Itemscores.................................................................................................................................................30
4.5 Beoordeling van kwaliteit van items in vooronderzoek....................................................................................30
Vooronderzoek.............................................................................................................................................30
, Hoofdonderzoek...........................................................................................................................................30
4.5.1 Dichotome items.......................................................................................................................................31
4.5.2 Polytome items.........................................................................................................................................31
Drenth, P. J. D., & Sijtsma, K. (2006). Testtheorie: Inleiding in de theorie van de psychologische test en zijn
toepassingen (4e ed.). Houten, Nederland: Bohn Stafleu van Loghum.
,H1 Historische ontwikkeling van testen (pp. 15-37)
Testdiagnostiek kwam tot bloei in de 20e eeuw. Maar ook voor die tijd werden er vormen van testonderzoek gedaan (bv.
Chinese keizer (oudheid), Gideon (Bijbel), middeleeuwen en nieuwere tijd). De meeste school/academische examens
waren mondeling, maar sommigen (orde der jezuïeten) schriftelijk.
In de 20e eeuw meer wetenschappelijke aandacht voor de test: systematische bestudering en empirische fundering van
het instrument dat voor oordeelsvorming wordt gebruikt.
Er zijn 4 perioden te onderscheiden, waarbij elke periode begint met een belangrijke gebeurtenis:
1. Voorafgaande periode.
2. Verschijnen van de Binet-Simon-test.
3. Eerste Wereldoorlog.
4. Tweede Wereldoorlog.
1.1 Periode tot het verschijnen van de Binet-Simon-test
Diverse ontwikkelingen gingen vooraf aan het verschijnen van de eerste waardevolle intelligentietest (1905):
Psychiatrie
Binnen de psychiatrie, m.n. in Frankrijk en Duitsland, ontstond de behoefte aan tests om verschillen in geestelijke
afwijkingen te kunnen diagnosticeren.
Pinel (1794): krankzinnigen zijn niet misdadig, maar ziek.
Esquirol (1838): schreef over het onderscheid tussen krankzinnigheid en zwakzinnigheid → idiotie is geen ziekte, maar
een gebrek aan intellectuele vaardigheden.
Séquin (1848): trainde zwakzinnige kinderen op motorische en sensorische functies (Séquin Form Board performance test).
Charcot, Janet, Ribot en Binet: aandacht voor geestelijke onvolwaardigheid in Frankrijk.
Rieger (1885): deed een voorstel voor een algemeen toepasbare methode voor het intelligentieonderzoek.
Kreaplin: poging tot het diagnosticeren van krankzinnigheid.
Ebbinghaus (1897): psychische vermoeidheid meten met een test waarin onvolledige zinnen moesten worden aangevuld
(functioneerde als intelligentietest).
Ziehen (1897): evaluatie van de antwoorden niet vooraf verrichten, maar laten afhangen van de prestaties van de geteste
personen.
Experimentele psychologie
De experimentele psychologie in Duitsland oefende invloed uit door haar methodiek van onderzoek; onder andere door
controle en exacte beschrijving. Het had naast een stimulerende ook een remmende werking:
◦ Stimulans: door de waarde die werd gehecht aan:
exacte beschrijving van experimenteercondities;
rigoureuze controle van variabelen;
de nauwkeurige verwerking van uitkomsten.
◦ Remming: ook door de nauwkeurige verwerking van uitkomsten → de experimentator vond de verschillen tussen
proefpersonen niet interessant: zag ze als experimenteerfouten i.p.v. als werkelijke verschillen.
Wundt (Leipzig, 1879): experimenteel laboratorium voor grootschalig systematisch experimenteel onderzoek naar de
talloze functies van de mens. Maar er bleven twee obstakels bestaan:
1. Het doel was de generaliseerbaarheid van wetten en verbanden, terwijl afwijkingen en verschillen werden
gezien als experimenteerfouten.
2. Het onderzoek bleef beperkt tot primaire sensorische en motorische functies en geen hogere complexe
cognitieve en intellectuele processen.
Cattell (1890): promoveerde op individuele verschillen in reactietijd en gebruikte voor het eerst het woord ‘test’. Stichtte
in de VS een laboratorium voor experimentele psychologie en testpsychologie.
Jastrow (1893): liet bezoekers op een tentoonstelling zich onderwerpen aan een serie tests → zo konden ze hun
resultaten vergelijken met algemene normen.
APA (1893): stelde een commissie in voor het registreren van tests en het formuleren van de gebruiksmogelijkheden.
, Genetica
Het onderzoek naar de erfelijke verklaring van individuele verschillen (genetica) had m.n. een grote invloed op de
statistische kant van testonderzoek. Ook de belangstelling van Cattell in individuele verschillen droeg hier aan bij. Hij
was geïnspireerd door Galtons werk om resultaten te presenteren als afwijkingen van het gemiddelde.
Darwin (1859): ‘The origin of species’, over het probleem van de erfelijkheid van lichamelijke eigenschappen.
Galton (1882): verrichtte antropometrische onderzoekingen naar lichamelijke, sensorische en geestelijke functies.
Probeerde aan te tonen dat de erfelijkheid van psychische eigenschappen dezelfde wetten volgt als van lichamelijke
eigenschappen. Drie elementen die een pijler van wetenschappelijk testonderzoek werden:
1. De wenselijkheid van het onderzoek naar individuele verschillen.
2. De noodzaak van systematisering van onderzoekstechnieken; om resultaten te kunnen vergelijken en conclusies
te generaliseren.
3. Resultaten van onderzoeken uitdrukken in afwijkingen van het gemiddelde; normatief denken;
onderzoeksresultaten in statistische termen, gebaseerd op principes van waarschijnlijkheid.
Pearson: geïnspireerd door deze verwerkingsmogelijkheden, heeft veel betekend voor de statistiek en testpsychologie
→ correlatiecoëfficiënt, rangcorrelatie, multiple correlatie, factoranalyse etc.
Deze eerste periode werd dus gekenmerkt door de behoefte van de psychiatrie aan diagnosemogelijkheden, de traditie
van de experimentele psychologie m.b.t. gestandaardiseerde onderzoeksprocedures en de interesse van de genetica in de
verschillen tussen mensen.
Maar er was nog geen psychologisch testen op grote schaal, het was theoretisch gericht en onderzoeksresultaten werden
weinig toegepast. Is grotendeels te verklaren door de keuze voornamelijk de psychofysische functies te meten
(sensorisch, motorisch en evt. geheugenprocessen), maar geen onderzoek te doen naar complexe intelligentiefuncties.
1.2 Periode tussen het verschijnen van de Binet-Simon-test en de Eerste
Wereldoorlog
Binet moest in 1904 een onderzoek doen naar de mogelijkheid om luie en incapabele kinderen te differentiëren op
Parijse scholen → onderscheid tussen kinderen die niet konden en kinderen die niet wilden. Samen met medewerker
Simon maakte hij 30 opgaven die een steekproef vormden van de verschillende opgaven die kinderen op school en in
het dagelijks leven tegenkwamen. De opgaven waren m.n. verbaal, een variëteit van problemen, getest op 50 normale
en enkele zwakzinnige kinderen en in volgorde van moeilijkheid.
De Binet-Simon-test was om drie redenen vernieuwend:
1. Accent lag op complexe processen i.p.v. op mentale processen (begrip, geheugen, probleemoplossend vermogen,
verbeeldingskracht).
2. Had een empirisch uitgangspunt; ideeën, omgezet in testopgaven, werden getoetst aan de empirie (niet
functionele opgaven werden gewijzigd of verwijderd).
3. Gebruikte een totaalscore om het intelligentieniveau weer te geven.
Tweede versie in 1908 en derde in 1911: aantal opgaven werd vergroot, minder goede werden vervangen en de schaal
doorgetrokken naar hogere leeftijden. Het begrip ‘mentale leeftijd’, een indicatie van de geestelijke groei, bleek een
praktisch nuttig begrip.
Mensen die verder gingen met dit idee:
Claparède (1924): zijn Jean-Jacques Rousseau Instituut was toegewijd aan ontwikkeling en toepassing van tests.
Bobertag (1911): vertaalde Binet-Simon-test in het Duits.
Stern (1911): stelde voor mentale leeftijd kind te vergelijken met zijn werkelijke leeftijd.
Goddard (1911) en Burt (1921): vertaalden de test in het Engels.
Terman (1916): maakte een Amerikaanse versie van de test: ‘Stanford-Binet’, waarbij aan 2 belangrijke testtechnische
eisen werd voldaan:
◦ Standaardinstructies formuleren: zodat vergelijkbaarheid van testscores mogelijk werd.
◦ Normen construeren: gebaseerd op een representatieve steekproef.
Ook werd de mentale leeftijd gedeeld door de chronologische leeftijd en vermenigvuldigd
met 100 → praktische indicatie voor het intelligentieniveau.
Binet’s test was praktisch, maar minder theoretisch nuttig. Wel samenhang tussen schoolprestaties en beoordeling van
intelligentie, maar geen antwoord op de theoretische vraag naar de samenstellende elementen van intelligentie.
Spearman (1904): concludeerde dat in alle tests twee intelligentiefactoren een rol speelden: twee-factorentheorie: