Test- en toetstheorie
PB 1502
,Hoofdstuk 1: Historische ontwikkeling van het testen
1.1 Periode tot het verschijnen van de Binet-Simon-test
De eerste stimulans kwam vanuit de psychiatrie in Frankrijk en Duitsland. In Frankrijk focusten mensen als Charcot, Janet,
Ribot en uiteindelijk Binet zich op zwakzinnigheid. Er ontstond een behoefte om verschillen tussen geesteszieken en
verschillende gradaties in zwakzinnigheid te bepalen.
Een tweede ontwikkeling kwam via de experimentele psychologie in Duitsland, deze lag voornamelijk in de methodiek van
onderzoek. Hier werd veel waarde gehecht aan het exact beschrijven van condities, rigoureuze controle van variabelen en
nauwkeurig verwerken van de uitkomsten. Echter werden verschillen tussen proefpersonen eerder als vervelend ervaren dan
als boeiend, de experimentele psychologie was in tegenstelling tot de testontwikkelaars vooral geïnteresseerd in
generaliseerbaarheid van de wetten, dit had dus een remmende en stimulerende invloed. In 1879 richtte Wundt zijn
laboratorium op wat de start van het systematische experimentele onderzoek was. Dit bleef beperkt tot de primaire
sensorische en motorische functies. Een leerling van Wundt, Cattell, promoveerde echter op individuele verschillen in
reactietijd en gebruikt in 1890 voor het eerst het woord test. Hij was geïnspireerd door het werk van Galton om resultaten te
presenteren als afwijkingen van het gemiddelde.
Ten derde is genetica van invloed geweest op testen, hieruit ontstond de aandacht voor verschillen in prestaties tussen
personen. Galton deed veel onderzoek waar drie belangrijke elementen in naar voren kwam; individuele verschillen zijn
interessant, de noodzaak van systematisering van onderzoekstechnieken en een poging om de resultaten uit te drukken ten
opzichte van het gemiddelde. Dit laatste punt werd vervolgens doorontwikkeld door Pearson, aan hem danken wij de
rangordecorrelatie, multipele correlaties, factoranalyse en de correlatiecoë ciënt.
1.2 Periode tussen het verschijnen van de Binet-Simon-test en de Eerste Wereldoorlog
Meer wetenschappelijke aandacht voor de test ontstaat aan het begin van de twintigste eeuw. In 1904 kreeg Binet de
opdracht om een test te ontwikkelen waardoor hij luie kinderen kon onderscheiden van niet capabele kinderen. Voor de
periode Binet werden hoofdzakelijk psychofysische tests gebruikt in de laboratoriumsituatie. De Binet-Simon-test bestaat uit
een steekproef van complexe opgaven waarvoor het kind zich in het dagelijks leven en de schoolpraktijk gesteld ziet. De
opgaven bestrijken een groot scala van problemen, maar zijn sterk verbaal van aard. Zijn test was vernieuwend omdat het
complexe mentale processen testen, hij testte de resultaten emperisch en stelde een totaal score voor intelligentie voor. In de
tweede versie introduceerde hij het begrip mentale leeftijd.
Terman ontwikkelde de test verder tot de Stanford-Binet test. De twee zeer belangrijke testtechnische eisen waaraan werd
voldaan, waren: standaardinstructies en de constructie van normen op grond van een representatieve steekproef.
Terman nam van Stern het idee over om de mentale leeftijd te delen door de chronologische leeftijd en dit getal werd dan
vermenigvuldigd met honderd.
Theoretisch was het werk van Binet niet van grote betekenis. Spearman ontwikkelde zijn twee-factorentheorie die stelde dat
er sprake was van een algemene G factor (getest door Binet) en een speci eke S factor.
Burt en Thorndike probeerden als eersten de schoolprestaties met behulp van ‘educational achievement tests' te
objectiveren waarmee achtergebleven leerlingen konden worden herkent en verschillende scholen vergeleken.
Validatieonderzoek, waarbij de samenhang van testuitslagen en latere prestaties wordt onderzoek was voor de eerste wereld
oorlog nog geen sprake. Daarnaast konden de tests niet groepsgewijs worden afgenomen.
1.3 Van het begin van de Eerste tot de Tweede Wereldoorlog
Door de eerste wereld oorlog raakte de ontwikkeling van testen in een stroomversnelling. De twee veranderingen in de
psychologie door de Eerste Wereldoorlog zijn: het routinematig toepassen van de testpsychologie in beslissingssituaties en
het toepassen van de psychologie buiten laboratoriumsituaties. In het begin van de Eerste Wereldoorlog werden tests vooral
met succes toegepas bij selectie van personeel.
Er was behoefte om snel en e ciënt te testen, zo ontstond de schriftelijk af te nemen Army Alpha, een test met verschillende
opdrachten, zoals rekenopgaven en het aangeven van woordbetekenis die klassikaal kan worden afgenomen.
Na de WOI bleef in Europa de individuele diagnostiek populair en daarmee een meer fenomenologische / intuïtieve methode.
In Amerika bleef echter het accent liggen op kwantitatief verwerkbare groepstesten, een reden hiervoor waren de grote
groepen immigranten die een plaats in de samenleving moesten verwerven. Daardoor ontstond ook behoefte naar tests die
minder taal en cultuur afhankelijk waren. Non-verbale tests werden ook toegepast op het speci eke terrein van
intelligentieonderzoek van gehandicapten, zoals motorisch en perceptueel gestoorden. Terman Merrill (Stanford-Binet) en the
Wechsler-series (WAIS, WISC) zijn voorbeelden van belangrijke tests die individueel kunnen worden afgenomen in de US.
Engeland nam een tussen positie in. Zowel in Engeland als in Amerika wordt grote aandacht besteed aan de objectieve
evaluatie van schoolprestaties. Net als in de VS werden schoolexamens vaker multiple choice en werd de beoordeling niet
meer door de leraar gedaan maar door een specialist.
ffi fiffi fi
, Het gebruik van test ging vaak vooraf aan de theorie. Onderzoek van Kelly, Thurstone, Guilford, Thomson en Holzinger leidde
tot een uitbreiding van Spearman’s theorie met zogenaamde groepsfactoren.
De volgende zeven groepsfactoren werden door Thurstone geïdenti ceerd: verbal comprehension, word uency, number
facility, spacial visualization, associative memory, perceptual speed, reasoning. Thurstone heeft verder in de theorievorming
een sterk stimulerend e ect gehad, hij stelde dat de relatie tussen test en criterium van tevoren moet zijn aangetoond, de
resultaten van een test betrouwbare scores moeten opleveren en dat de aandacht gericht dient te zijn op een kritische
evaluatie van de test.
Er zijn drie methoden voor het testen van persoonlijkheid;
1. Observatie - populair in West-Europa
2. Persoonlijkheidsvragenlijsten
3. Projectietests - zoals de Rorschachtest en de Thematic Apperception Test
1.4 Van het begin van de Tweede Wereldoorlog tot heden
1.4.1 Ontwikkelingen in de verenigde staten
Veel psychologen werden ingezet voor het testen van nieuwe soldaten. 9 miljoen mensen werden getest met de Army
General Classi cation Test (AGCT). De gegevens van deze personen vormden een goede bron voor genuanceerde normering
en validering van deze Army Classi cation Test.
Met behulp van schoolvorderingentests kunnen vergelijkingen worden gemaakt tussen de resultaten van vooropleidingen.
Opleidings- en kennistests worden gebruikt om zowel de toekomstige prestaties van een kandidaat te voorspellen als de
opleidingsprogramma’s te evalueren. Persoonlijkheidsvragenlijsten en biogra sche anamnestische vragenlijsten werden
gebruikt bij identi catie van potentiële psychiatrische patiënten en bij selectie voor bepaalde functies.
De di erentiële testbatterijen werden ontwikkeld om inzicht te krijgen in de structuur van vaardigheden.
In 1947 werd de Educational Testing Service (ETS) opgericht.
Vanaf het begin van de Tweede Wereldoorlog is er sprake van een sterke toename van het aantal beschikbare tests en een
kritische bezinning op de methodische grondslagen van het testgebruik.
De versnelde ontwikkeling werd mede gevoed door de computer, ‘educational Measurement’, het door de testcommissie van
de American Psychological Association gepubliceerde ‘technical recommendations for Psychological tests and
Diagnostics’(1954) en de schaaltheorie.
1.4.2 Ontwikkeling in Europa, voornamelijk in Nederland
In de jaren 40 en 50 werd het testen in Nederland geremd door de nadruk op het intuïtie van de psycholoog.
In 1959 werd een Test Research Comissie opgericht, tegenwoordig COTAN, met als belangrijkste taak een overzicht van de
in Nederland bestaande en in gebruik zijnde tests en het onderzoek wat hiermee wordt verricht. Vanaf de jaren zestig heeft
de psychologische test de nitief een wetenschappelijk verantwoorde plaats veroverd in Nederland.
Pas in de jaren 70 deed de testtheorie haar intrede bij schoolbeoordelingen. Kouwer en De Groot hadden volgens het
algemene model voor psychologische wetenschapsbeoefening in de jaren vijftig grote invloed op het testgebruik in
Nederland.
Dankzij de Groot werd het Centraal Instituut voor Toetsontwikkeling (CITO) opgericht. Daarnaast was er een toename van
communicatie met betrekking tot tests en testonderzoek (tijdschriften en andere periodieken) en verschijnen er talrijke
handboeken over testgebruik.
Hoofdstuk 2: De nitie, kenmerken en toepassingen van de test
2.1 Wat is een test?
2.1.1 Onderdelen van een test
1. Testmateriaal
2. Testformulier
3. Testhandleiding, hierin moeten vier onderwerpen aan de orde komen; testinstructie, verwerkingsprocedure, normtabellen
en bespreking van de wetenschappelijke kwaliteiten van de test.
2.1.2 Eerste omschrijving
De bedoeling van testonderzoek is het doen van een voorspelling, classi catie of beschrijving met betrekking tot het
onderzochte individu in vergelijking met een bepaalde populatie. Impliciet in testonderzoek is dat het vrijwel altijd om een
vergelijking gaat tussen de geteste persoon en andere mensen (bijvoorbeeld de normgroep).
ff fi fi ff fifi fi fi fi fi fl