Hoofdstuk 1: historische ontwikkeling van het testen
Vanaf 20e eeuw tot bloei gekomen door meer wetenschappelijke aandacht voor de test. Voor die tijd
al sinds de oudheid voorbeelden van testonderzoek. In de bijbel al in het verhaal van Gideon in het
oude testament. Er zijn vier perioden te onderscheiden in de historische ontwikkeling van het testen.
1.1 periode tot het verschijnen van de Binet-Simon-test (ongeveer 1794-
1905)
Vanuit de psychiatrie eerste stimulans met een driedelig werk over geestesziektes met de nadruk
op het onderscheid tussen krankzinnigheid en zwakzinnigheid. Behoefte aan
diagnosemogelijkheden met betrekking tot de aard en niveau van de geestelijke afwijking. De
Franse Séguin ontwierp een methode die een voorloper is van de performance test met
betrekking op motorische en sensorische functies (Séguin Form Board). Ook in Duitsland
aandacht voor het onderzoek van diverse geestelijke vermogens. Ook ontstonden eerste
intelligentietesten.
Tweede ontwikkelingslijn loopt via de experimentele psychologie met het ontstaan van
gestandaardiseerde onderzoeksprocedures. Stimulerende werking op testpsychologie door de
waarde die werd gehecht aan exacte beschrijvingen van experimenteercondities, controle van
variabelen en de nauwkeurige verwerking van de uitkomsten. Dit laatste had ook een remmende
werking omdat de experimentator de verschillen tussen proefpersonen niet boeiend vond en ze
toeschreef aan fouten in plaats van werkelijke verschillen in vaardigheid tussen proefpersonen
terwijl het daar nu net bij testen om gaat.
Er kwam een experimenteel laboratorium in Leipzig wat de start was van het systematische
experimentele onderzoek. Talloze functies van de mens werden onderzocht, maar twee
obstakels voor de ontwikkeling van het testen. Ten eerste werden afwijkingen en verschillen
beschouwd als experimenteerfouten. Ten tweede werden hogere en complexe cognitieve en
intellectuele processen buiten beschouwing gelaten. De individuele verschillen kregen kort
hierna meer aandacht en werden niet langer gezien als fouten (Cattell).
De derde ontwikkelingslijn is die van de genetica in verschillen tussen mensen. Sinds 1882
antropometrische onderzoekingen. Darwin en neef Galton uit deze tijd. Stellen erfelijkheid van
lichamelijke en psychische eigenschappen aan de orde. Hierin kwamen drie elementen voor, die
alle een pijler van het wetenschappelijk testonderzoek zouden gaan vormen: de wenselijkheid
van het onderzoek van individuele verschillen, de noodzaak van systematisering van de
onderzoekstechnieken en resultaten uitdrukken in termen van afwijkingen van het gemiddelde.
Pearson uit deze periode.
Tests waren nog niet op grote schaal, onderzoeksresultaten werden nog weinig toegepast en hier
kwam verandering in door de Binet-Simon-test. Een intelligentietest.
1
,2
periode tussen het verschijnen van de Binet-Simon-test en de Eerste
Wereldoorlog
Franse overheid wilde onderscheid kunnen maken tussen luie en incapabele kinderen en zo
ontstond de Binet-Simon-test. Binets benadering nieuw omdat het accent lag op complexe (ipv
eenvoudige) processen. Daarnaast was het empirisch uitgangspunt nieuw en stelde Binet voor
een totaalscore te gebruiken om het intelligentieniveau weer te geven. Hij introduceerde de
mentale leeftijd en later bedacht Claparède om de mentale leeftijd te vergelijken met de
werkelijke leeftijd van het kind. De test kreeg meerdere versies en werd vertaald. Terman werkte
aan een amerikaanse versie vanuit Stanford University en kwam met standaardinstructies en
normen op basis van een representatieve steekproef. Er kwam een uiteindelijke score wat de
mentale leeftijd/chronologische leeftijd x100 was.
Binets werk was praktisch gezien belangrijk, maar theoretisch niet. Spearman kwam tot de
conclusie dat in alle tests twee intelligentiefactoren een rol speelden: een algemene g-factor en
een specifieke s-factor. Dit werd later met de multi-factorentheorie bestreden.
van het begin van de eerste tot de tweede wereldoorlog.
Door het uitbreken van WOI kwam de ontwikkeling van het testen in een stroomversnelling. De
reden was de noodzaak om grote groepen te selecteren voor functies en opleidingen van sterk
uiteenlopende inhoud en zeer verschillend niveau. De psychologische test werd erkend als
instrument dat een positieve bijdrage kan leveren in velerlei beslissingssituaties. Er was geen tijd
om individueel te testen dus er ontwikkelden zich groepsgewijs schriftelijk af te nemen tests
(Army Alpha).
Na WOI liepen de testontwikkelingen in Amerika en die in Europa sterk uiteen. Europa bleef de
individuele diagnostiek populair door het heersende filosofische klimaat. De houding tegenover
de eigen prestatie werd minstens even belangrijk gevonden als de prestatie zelf. Er ontwikkelden
meer tests gericht op de kwalitatieve aspecten. Deze methode is fenomenologischer of
intuïtiever dan die in Amerika.
In Amerika kwam het accent te liggen op kwantitatief verwerkbare groepstests door de
filosofische achtergrond en vooral praktische behoefte. Het gaat erom de kansen van de
onderzochte te bepalen op een positief resultaat in de te voorspellen situatie. Door veel
immigranten speelt de vraag op naar een test die minder afhankelijk is van taal en cultuur.
Speelden grote rol bij algemeen vergelijkend onderzoek tussen bevolkingsgroepen. Er
verschenen ook veel individuele testbatterijen (meer dan in Europa), die waren alleen minder
populair in Amerika.
Engeland nam een tussenpositie in er was veel aandacht voor de objectieve evaluatie van
schoolprestaties. Dit leefde nog sterker in Amerika.
Vaak werd eerst de test gedaan en daarna pas de theorie toegepast in plaats van andersom.
Kritische evaluatie van de test zelf werd aangemoedigd. Voorkomt criterium gedrag, wanneer je
met een test gedrag buiten de testsituatie probeert te voorspellen. Statistiek ging daarom een
grotere rol spelen. Kwantificeerbaarheid van de testprestatie werd een voorwaarde voor nuttig
testgebruik. Ook kwam het nieuwe inzicht van Thurstone dat intelligentie een complex geheel is
van groepsfactoren.
2
,3
Tot slot in deze periode het ontstaan en de ontwikkeling van de persoonlijkheidstest. Drie
afzonderlijke methoden kunnen worden onderscheiden:
- methode van de observatie: populair in west-europa, bedoeld om inzicht te geven in de
kwalitatieve aspecten van de prestatie. Hierbij was weinig sprake van betrouwbaren en
objectieve of gestandaardiseerde metingen.
- Persoonlijkheidsvragenlijsten: systematischere vorm van verzameling van gegevens.
- Persoonlijkheidsdiagnostiek, projectietests. Er wordt een stimulus aangeboden waarop de
persoon vrij mag reageren al naargelang de betekenis die deze stimulus voor hem of haar
heeft of de associaties die hij oproept. Verondersteld wordt dat de onderzochte in de
reacties iets van zichzelf openbaart.
van het begin van de Tweede Wereldoorlog tot heden.
Ontwikkelingen in de VS
In WOII nam het aantal beschikbare tests snel toe en er vond een sterke kritische bezinning
plaats op de methodologische grondslagen van het testgebruik. In Amerika werden heel veel
testen gebruikt en ontwikkeld. Na de oorlog zette zich dit met nauwelijks verminderd tempo
voort. In 1947 oprichting Educational Testing Service om tegemoet te komen aan de bhoeften
van het amerikaanse onderwijs- en opvoedingsveld wat betreft de toelating tor en de evaluatie
van het onderwijs. Hierin is veel ruimte voor fundamenteel psychometrisch onderzoek.
Communicatie over tests en testonderzoek en de psychometrie loopt via tijdschriften. Er is een
toename van uitgeverijen die zich bezighouden met het uitgeven van tests. Ook komen er
handboeken over test die testtheorie behandelen. Volgende belangrijke invloed is de
schaaltheorie. Boeken over schaal- en beoordelingsmodellen. Oorzaak voor de versnelde
testontwikkeling is de ontwikkeling en uitbouw van de verweking van testgegevens per
computer.
Ontwikkelingen in Europa, vooral in NL
In Europa nauwelijks ontwikkeling tov VS. Vanaf jaren 70 kwam daar verandering in en de
bloeiende testtheorie- en praktijk is nog steeds bezig. De boeken van Rasch en Fischer zijn hierin
van belang geweest. Tot de jaren 70 lag de nadruk op de oriëntatie, het ‘verstehen’, van de
psycholoog. Er was nauwelijks ruimte voor objectieve, kwantitatieve benaderingen. Er werden
vrijwel alleen observatietests of projectieve tests ontworpen. Van Der Giessen gaf een
belangrijke impuls aan in de richting van wetenschappelijk verantwoord testgebruik door een
dissertie te schrijven over voorspellingen in de psychologie. Er werd afgerekend met de vele
vooroordelen en schijnargumenten die op het terrein van de persoonlijkheidsdiagnostiek de
ronde deden. Er werd een Test Research commissie ingesteld om testonderzoek te bevorderen in
Nederland. Beschrijven tests in het COTAN.
Verder ontwikkeling in NL van de schoolvorderingentests. Werd vroeger overgelaten aan
onderwijzend personeel. Toelatingsexamens en eindexamens hadden niet het karakter van
goede schoolvorderingentests. Er werd geen kwantitatieve en kwalitatieve analyse van de
bruikbaarheid van de opgaven gemaakt. Het CITO werd opgericht als landelijk centraal instituut
toetsontwikkeling.
3
, 4
Hoofdstuk 2: definitie, kenmerken en toepassingen van
de test.
2.1 wat is een test?
Onderdelen van een test:
- testmateriaal: varieert sterk met de soort van de test. Er kan gedacht worden aan
opdrachtboekjes, bouwstenen of legpuzzels.
- Testformulieren: hierop worden de antwoorden, reacties of gedragsgegevens verzameld. Dit
vormt het materiaal waaruit de psychologische interpretatie of conclusies worden afgeleid.
- Testhandleiding: varieert van een uitvoerig boekwerk tot beknopte richtlijnen. De volgende
vier onderwerpen in een goede handleiding:
Een exacte testinstructie: bespreking testprocedure, condities voor een goede
testsituatie, de woordelijke aanwijzingen, responstijden en de uitleg etc.
Verwerkingsprocedure: richtlijnen voor de toekenning van numerieke scores aan de
antwoorden of de reacties op de opgaven. Ook hoe niet-beantwoorde vragen
moeten worden beoordeeld.
Normtabellen: de testscore wordt vaak gewaardeerd en geïnterpreteerd tegen de
achtergrond van de prestaties van anderen. Normtabellen maken het mogelijk scores
te vergelijken met die van een normgroep.
Bespreking van wetenschappelijke kwaliteiten: gegevens die een indicatie geven
van de betrouwbaarheid van de test, een bespreking van de testbetekenis en de
vraag voor welke voorspellingen de test gebruikt kan worden.
De psychologische test is een systematisch onderzoek van gedrag met behulp van speciaal
geselecteerde vragen of opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk
van de onderzochte in vergelijking met anderen.
Kenmerken van een test:
- Efficiëntie: er word zoveel mogelijk direct gemeten wat je wilt meten. Er wordt een
testsituatie gecreëerd waarin bijkomstigheden en storende invloeden zo veel mogelijk
worden geweerd.
- Standaardisatie: noodzakelijke voorwaarde voor vergelijkbaarheid van testprestaties. De
condities en invloeden die op de testprestatie kunnen inwerken worden zoveel mogelijk
gestandaardiseerd. Dit maakt een uitvoerbare handleiding wenselijk. De standaardisatie-eis
is een norm waaraan een test meer of minder kan beantwoorden. Het gaat vooral om een
streven, want het is moeilijk volledig te realiseren.
- Normering: als je de scores wilt vergelijken dan moet je in ieder geval de afstand tussen twee
scores zo exact mogelijk kunnen schatten. Om goed te kunnen vergelijken is een gevoelig
instrument nodig. Het vaststellen van rangorde is de eenvoudigste vorm van normering.
Rangscores 1 en 2 zijn het laagst en bijvoorbeeld rangscores 50 en 51 het hoogst. Hierbij
hoort een testscore van bijvoorbeeld 1 of 9. Dit kan weer benaderd worden met een
normaalverdeling. Normaal verdeling wordt vooral toegepast in steekproeven uit een
normaal verdeelde populatie om steekproeffouten glad te strijken. Een studietoets is
wanneer men het aantal goede antwoorden zou omzetten naar een schaal tussen 0 en 10.
Meestal zijn normen noodzakelijk voor de interpretatie en beoordeling van de testprestatie.
- Objectiviteit: de onafhankelijkheid van storende invloeden vanuit de persoon van de
waarnemer, beoordelaar of interpretator. Dit heeft twee gevolgen: (1)het moet niet
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper elinemonteban. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,49. Je zit daarna nergens aan vast.