HOOFDSTUK 1: Historische ontwikkeling van het testen
Historische ontwikkeling
- testdiagnostiek is als wetenschappelijke discipline in de twintigste eeuw tot bloei
gekomen
- voor 1900 werd ook al op testen gelijkend onderzoek gedaan, maar pas aan het begin
van de twintigste eeuw begint een meer wetenschappelijke aandacht voor de test te
ontstaan, met een systematische bestudering en empirische fundering van instrumenten
die voor oordeelsvorming worden gebruikt
- in de ontwikkeling vanaf de eerste pogingen tot heden zijn vier perioden te
onderscheiden, waarbij een nieuwe periode telkens wordt ingeluid door een belangrijke
gebeurtenis
1. Periode tot het verschijnen van de Binet-Simon-test
Aan de eerste waardevolle intelligentietest, de Binet-Simon-test (eerste versie: 1905) gingen diverse
ontwikkelingen vooraf
Eerste stimulans: de psychiatrie in Frankrijk en Duitsland
- in de Franse medische wereld ontstond een sterke interesse in geestelijke abnormaliteit
en zwakzinnigheid
- ook in Duitsland hielden zich in de tweede helft van de negentiende eeuw psychiaters
bezig met het onderzoek van geestelijke vermogens
- zo ontstond in de psychiatrie een behoefte aan methoden om de verschillen tussen
geesteszieken en de verschillende gradaties in zwakzinnigheid te bepalen
Tweede ontwikkelingslijn: de experimentele psychologie, vooral beoefend in Duitsland
- die had naast een stimulerende, ook een remmende werking op de testpsychologie
- de stimulans lag in de waarde die werd gehecht aan het nauwkeurig omgaan met
experimenteercondities, variabelen en uitkomsten. In dat laatste ligt tevens de
remmende invloed
- de experimentator vond de verschillen tussen proefpersonen namelijk eerder vervelend
dan boeiend
- hij schreef ze toe aan fouten in plaats van aan werkelijke verschillen
- in 1879 stichtte Wundt zijn experimentele laboratorium
- ondanks de grondigheid waarmee talloze functies van de mens werden onderzocht,
bleven twee obstakels voor de ontwikkeling van het testen bestaan
ten eerste was het doel van het onderzoek de generaliseerbaarheid van wetten
en samenhangen, terwijl afwijkingen werden beschouwd als fouten
ten tweede bleef het onderzoek beperkt tot de primaire sensorische en
motorische functies
McKeen Cattell
- met de komst van McKeen Cattell ging men anders aankijken tegen individuele
verschillen
- die bleken een vruchtbaar onderwerp voor verder onderzoek te vormen
- Cattell stichtte in de Verenigde Staten een laboratorium voor experimentele psychologie
en testpsychologie
1
, - in 1893 werd binnen de APA een commissie ingesteld, met als taak het registreren van
tests en het formuleren van gebruiksmogelijkheden
- de samenhang met praktische criteria bleek laag, maar de eerste stappen op de weg van
het systematisch onderzoek waren gezet
- de belangstelling van Cattell voor individuele verschillen kan worden teruggevoerd op de
derde lijn, die van de genetica
- al vanaf 1882 verrichtte Galton antropometrische onderzoekingen
- als neef van Darwin was hij geïnteresseerd in de erfelijkheid van psychische
eigenschappen
- in zijn wijze van onderzoeken kwamen drie elementen voor, die een pijler van het
wetenschappelijk testonderzoek zouden gaan vormen
het eerste was de wenselijkheid van het onderzoek van individuele verschillen
het tweede bestond uit de noodzaak van systematisering van de
onderzoekstechnieken
als derde element geldt de poging van Galton om de resultaten van zijn
onderzoeken uit te drukken in termen van afwijkingen van het gemiddelde
- dit normatieve denken en het weergeven van resultaten in statistische termen, opende
nieuwe dimensies voor zowel de theoretische ontwikkeling als de praktische toepassing
van de test
- Galtons jongere collega Pearson werd hierdoor geïnspireerd en heeft veel betekend voor
de statistiek en de testpsychologie
- ondanks deze drie ontwikkelingen was van psychologisch testen op grote schaal nog
geen sprake
- de interesse was incidenteel en voornamelijk theoretisch gericht
- onderzoeksresultaten werden nog weinig toegepast, en pogingen hiertoe leidden tot
teleurstellende resultaten
- dit is grotendeels te verklaren uit de keuze van de vermogens en functies die men
trachtte te meten, die hoofdzakelijk van psychofysische aard waren
- de publicatie van de Binet-Simon-test luidde een nieuwe periode in
2. Periode tussen het verschijnen van de Binet-Simon-test en de Eerste Wereldoorlog
Periode tussen het verschijnen van de Binet-Simon-test en de Eerste Wereldoorlog
- Binet ontwikkelde samen met Simon een test om onderscheid te kunnen maken tussen
luie en incapabele kinderen
- de opgaven waren sterk verbaal, maar bestreken een grote variëteit aan problemen
- Binets benadering was nieuw door de accentuering van complexe, ipv eenvoudige
mentale processen, door zijn bereidheid testopgaven te toetsen aan de empirie, en door
het gebruik van een totaalscore voor intelligentie
- na de eerste versie van 1905 volgden herzieningen in 1908 en 1911
- bij de tweede versie werd het begrip mentale leeftijd geïntroduceerd
- de test werd in diverse landen overgenomen
- Terman werkte aan de Amerikaanse versie van de test, die sindsdien bekend is onder de
naam Stanford-Binet
- al bij de eerste versie van 1916 werd aan twee belangrijke testtechnische eisen voldaan:
er werden standaardinstructies geformuleerd
er werden normen geconstrueerd
- ook nam Terman het idee van Stern over om de mentale leeftijd te delen door de
chronologische leeftijd, en dit getal te vermenigvuldigen met honderd
2
, - het werk van Binet was in praktisch opzicht van grote betekenis, maar theoretisch was
dit minder het geval
- op basis van zijn theoretische onderzoek kwam Spearman tot de conclusie dat in alle
tests twee intelligentiefactoren een rol speelden:
een algemene g-factor
een specifieke s-factor
- hiermee had hij de tweefactorentheorie geformuleerd
- op het gebied van de meting van opleidingsvorderingen van leerlingen werden in deze
periode de eerste stappen gezet
- de intelligentiemeting boekte grote vooruitgang door uit te gaan van of voort te bouwen
op de ideeën van Binet en Simon
- testen op grote schaal vond nog niet plaats, en van valideringsonderzoek was voor de
Eerste Wereldoorlog nog geen sprake
3. Van het begin van de Eerste tot de Tweede Wereldoorlog
Begin van de Eerste Wereldoorlog
- door het uitbreken van de Eerste Wereldoorlog kwam de ontwikkeling van het testen in
een stroomversnelling, door de noodzaak om grote groepen mensen te selecteren voor
uiteenlopende functies en opleidingen
- voor het eerst werd de psychologie regelmatig toegepast buiten het laboratorium
- de echte doorbraak kwam toen in 1917 ook de Verenigde Staten in de oorlog werden
betrokken, en het werk van de eerste bedrijfspsycholoog Münsterberg met collectieve
tests zijn waarde ging bewijzen
- uit de noodzaak om snel en efficiënt te testen kwam een groepsgewijs af te nemen test
voort, de Army Alpha
- deze test groeide uit tot een veel toegepast en gewaardeerd hulpmiddel bij vele soorten
beslissingen
Na de Eerste Wereldoorlog
- na Eerste Wereldoorlog liepen testontwikkeling in Amerika en die in Europa sterk uiteen
- in Europa bleef de individuele diagnostiek populair, als gevolg van het vooral door de
Gestaltpsychologie gedomineerde filosofische klimaat
- de wijze waarop een proefpersoon een taak verrichtte, werd minstens even belangrijk
gevonden als de prestatie zelf
- in Amerika kwam, tegen een behavioristisch-positivistische achtergrond, maar vooral
vanuit een praktische behoefte, het accent steeds sterker te liggen op kwantitatief
verwerkbare groepstests
- centraal stond het bepalen van de kansen van de onderzochte op een positief resultaat
in de te voorspellen situatie
- in dit verband wordt gesproken van de actuarische methode
- behalve de noodzaak van selectie- en plaatsingsbeslissingen, speelde daarbij een aantal
andere factoren mee
een toenemend aantal immigranten uit vele landen
de gedachte van gelijke kansen voor iedereen
de toenemende specialisatie, differentiatie en vertechnisering van het
productieproces
- de vele immigranten deden ook de behoefte ontstaan aan tests die minder afhankelijk
waren van taal en cultuur
3
, - in 1918 werd naast Army Alpha een tweede schriftelijke groepstest samengesteld, de
Army Bèta, die geen beroep deed op enige taalkennis of verbale vaardigheid
- dergelijke niet-verbale tests speelden een grote rol bij algemeen vergelijkend onderzoek
tussen bevolkingsgroepen, al was hun betrouwbaarheid vaak geringer dan die van
verbale tests
- de individuele test nam in de Verenigde Staten relatief een minder belangrijke positie in
dan in Europa, maar het aantal individuele testbatterijen dat in deze periode verscheen,
is indrukwekkend
- de belangrijkste waren de Terman Merrill en de WAIS en WISC
Situatie in Engeland
- Engeland nam in de tegenstelling Verenigde Staten versus Europa een tussenpositie in
- in 1938 verscheen de veelgebruikte Progressive Matrices van Raven, maar een grote
bloei onderging dit soort tests niet wel was er, in tegenstelling tot andere landen in
Europa, veel aandacht voor objectieve evaluatie van schoolprestaties
- het vrije-antwoordenexamen maakte plaats voor meerkeuzevragen
- de constructie en ijking van schoolvorderingentests ging over van de docent naar de
specialist
- het gebruik van de test ging vaak vooraf aan de theorie, in plaats van andersom
- wel stimuleerde Thurstone de aandacht voor kritische evaluatie van de test zelf
- hij was van mening dat de resultaten van een test betrouwbare scores dienen op te
leveren, en als men met een test gedrag buiten de testsituatie probeert te voorspellen –
criteriumgedrag genoemd – dient de relatie tussen test en criterium van tevoren te zijn
aangetoond
- hierdoor ging de statistiek een belangrijke rol spelen in de testpsychologie en werd
kwantificeerbaarheid van de testprestatie een voorwaarde voor nuttig testgebruik
- ook aan het onderzoek naar de intelligentiestructuur werd een nieuwe dimensie
toegevoegd
- naast de algemene en specifieke factoren van Spearman werden de groepsfactoren
geïntroduceerd, waarbij intelligentie wordt opgevat als een complex geheel van
groepsfactoren
- deze structurele opvatting van de intelligentie opende nieuwe perspectieven voor
selectie, diagnose, beroepskeuze en counseling
- de door Thurstone vastgestelde factoren verbal comprehension, word fluency, number
facility, spacial visualization, associative memory, perceptual speed en reasoning zijn nog
steeds belangrijke onderscheidingen in de intelligentietheorie
Persoonlijkheidstest: er kunnen drie afzonderlijke methoden worden onderscheiden
- ten eerste de vooral in West-Europa populaire methode van de observatie, bedoeld om
inzicht te geven in de kwalitatieve aspecten van de prestatie
van observatietests was het een kleine stap naar tests voor observatie van het
voor de proefpersoon typerende gedrag zelf
de persoonlijkheidsbeelden ontstonden voornamelijk langs intuïtieve weg
- ten tweede werden in deze periode de eerste persoonlijkheidsvragenlijsten
samengesteld
de eerste waren niet anders dan gestandaardiseerde, op schrift gestelde
psychiatrische interviews
deze vragenlijsten waren de voorlopers van latere veelgebruikte
persoonlijkheidsvragenlijsten
4
, - de derde methode ligt in de toepassing van projectietests, waarbij een stimulus wordt
aangeboden waarop de persoon vrij mag reageren
bekende projectietests zijn Rorschachtest en Thematic Apperception Test (TAT)
4. Van het begin van de Tweede Wereldoorlog tot heden
4.1 Ontwikkelingen in de Verenigde Staten
Ontwikkelingen in de Verenigde Staten
- de Tweede Wereldoorlog luidde in Engeland en vooral de Verenigde Staten een periode
in waarin een expansie plaatsvond op alle terreinen van het testen
- samenwerking tussen psychologen en keurings- en selectiediensten leidde in de
Verenigde Staten tot
een enorme toename van het aantal tests
tot een sterke professionalisering van het selectie- en plaatsingsbeleid
tot een constructieve en kritische bezinning op de psychologische principes van
testonderzoek
- miljoenen werden onderzocht met de Army General Classification Test (AGCT)
- na de oorlog zetten de ontwikkelingen zich in een nauwelijks verminderd tempo voort
- in 1947 werd de Educational Testing Service (ETS) opgericht, met de bedoeling tegemoet
te komen aan de behoeften van het Amerikaanse onderwijs- en opleidingsveld wat
betreft de toelating tot en de evaluatie van het onderwijs
- naast ETS is in de Verenigde Staten een groot aantal test agencies werkzaam
- sommige bestrijken een breed toepassingsveld, terwijl andere zich hebben
gespecialiseerd
- over tests en testonderzoek en ook de psychometrie loopt de communicatie via vele
tijdschriften
- handboeken brengen niet alleen veel inhoudelijke informatie over tests bijeen, maar
bieden tevens een behandeling van de wetenschappelijke testtheorie
- ook op het meer toegepaste terrein van de selectiepsychologie staat de testtheorie
centraal
- vanuit educational measurement werd een belangrijke invloed uitgeoefend op de
testtheorie en de acceptatie van de principes daarvan
- theoretische onderbouwingen van de psychometrie en het onderwijskundig meten zijn
steeds meer hand in hand gegaan
- dit heeft vooral plaatsgevonden in de vorm van ontwikkelingen op het terrein van de
moderne testtheorie of de item-responstheorie
- dit neemt niet weg dat sommige toepassingen van theorie en testpraktijk typisch
psychologisch of typisch onderwijskundig kunnen worden genoemd
- een andere belangrijke invloed op de testtheorie is afkomstig uit de schaaltheorie
- een andere oorzaak van de versnelde testontwikkeling en testresearch is de ontwikkeling
en uitbouw van de verwerking van testgegevens per computer
- computers worden niet alleen gebruikt voor de tests zelf, maar ook voor de constructie
en het onderhoud van itembanken en adaptief testen
5
,4.2 Ontwikkelingen in Europa, vooral in Nederland
Ontwikkelingen in Europa, vooral in Nederland
- de ontwikkelingen in Europa hebben lange tijd in de schaduw gestaan van die in de
Verenigde Staten
- nog steeds is de testtheorie alsmede het gebruik van tests in grote delen van Europa
nauwelijks tot ontwikkeling gekomen
- vooral sinds de jaren zestig is daarin in een aantal landen, waaronder Nederland,
verandering gekomen
- in West-Europa is zelfs sprake van een bloeiende testtheorie en –praktijk
- de ontwikkeling in Nederland werd in de jaren veertig en vijftig nog in sterke mate
gekenmerkt – geremd – door de oriëntatie van de psychologie op de intuïtie van de
psycholoog, het ‘Verstehen’ en de ontmoeting met de cliënt
- binnen deze oriëntatie was nauwelijks ruimte voor een objectieve, kwantitatieve
benadering
- in de jaren vijftig en zestig werd een steeds krachtiger pleidooi gevoerd voor een
systematisch-wetenschappelijk testgebruik
- ten behoeve van een betere communicatie en ter bevordering van het testonderzoek
stelde het Nederlands Instituut van Psychologen (NIP) in 1959 een Test Research
Commissie (tegenwoordig Commissie Testaangelegenheden Nederland, COTAN) in
- schoolvorderingentests werden tot in de jaren zestig in Nederlands nauwelijks gebruikt,
in tegenstelling tot de Verenigde Staten
- de beoordeling van schoolprestaties werd overgelaten aan onderwijzend personeel. In
de jaren zeventig deed de testtheorie haar intrede bij de beoordeling van school- en
opleidingsprestaties
- op voorstel van De Groot, met zijn vaak prikkelende opinies, werd het Centraal Instituut
voor Toetsontwikkeling (CITO) opgericht, naar model van de ETS
- allerlei handboeken hebben algemeen ingang gevonden
- aanvankelijk werden de meeste wetenschappelijke bevindingen gepubliceerd in de
Nederlandse vaktijdschriften, maar heden ten dage vrijwel alleen nog in internationale
journals, vooral de Amerikaanse
- mede hierdoor neemt de Nederlandse psychometrie internationaal een prominente
plaats in
- hierbij speelde een rol dat de versnipperde universitaire onderzoeksactiviteiten sedert
1987 zijn gebundeld in het Interuniversitair Onderzoeksinstituut voor Psychometrie en
Sociometrie (IOPS)
6
,HOOFDSTUK 2: Definitie, kenmerken en toepassingen van de test
1. Wat is een test?
1.1 Onderdelen van een test
In het algemeen komt men in een verantwoorde en gepubliceerde test de volgende
onderdelen tegen:
- testmateriaal: dit materiaal varieert sterk met de soort test. In een enkel geval is er geen
materiaal in strikte zin
- testformulieren: hierop worden antwoorden, reacties of gedragsgegevens verzameld, die
het materiaal vormen waaruit psychologische interpretaties of conclusies worden
afgeleid
- testhandleiding: van een goede handleiding mag men verwachten dat vier onderwerpen
aan de orde komen
een exacte testinstructie: alles wat betrekking heeft op de gang van zaken tijdens
de test
de verwerkingsprocedure: richtlijnen voor de toekenning van scores aan
antwoorden
de normtabellen, waarin scores worden vergeleken met de prestaties van
normgroepen
een bespreking van de wetenschappelijke kwaliteiten van de test
1.2 Eerste omschrijving
Eerste omschrijving
- de bedoeling van het testonderzoek is het doen van een uitspraak die een voorspelling,
classificatie of beschrijving met betrekking tot het onderzochte individu behelst
- impliciet gaat het daarbij vrijwel altijd om een vergelijking met andere mensen
- de aard en de grootte van de vergelijkingsgroep hebben belangrijke gevolgen voor de
draagwijdte van de conclusie over de geteste persoon
- lang niet alle middelen waarmee we een uitspraak over iemand kunnen doen, kunnen
tests worden genoemd
- bij een test gaat het om een systematisch onderzoek van apart voor het testdoel
geselecteerde gedragingen
Psychologische test
- een psychologische test is een systematisch onderzoek van gedrag met behulp van
speciaal geselecteerde vragen of opgaven, met de bedoeling inzicht te krijgen in een
psychologisch kenmerk van de onderzochte in vergelijking met anderen
1.3 Kenmerken van een test
Kenmerken van een test
- bij de beschikbaarheid van voldoende juiste informatie is het niet altijd nodig een test te
gebruiken
- indien een psychologische test een juister beeld oplevert dan het voorwetenschappelijk
oordeel, of een verbetering en aanvulling hierop kan betekenen, en de kosten of
ethische bezwaren niet onoverkomelijk zijn, is het gebruik ervan gerechtvaardigd
- dat de psychologische test hiertoe vaak in staat is, blijkt uit zes kenmerken
7
, Efficiëntie
- in het dagelijks leven doen zich talrijke situaties voor die aanwijzingen verschaffen voor
het schatten van bijvoorbeeld intelligentie
- het probleem is echter dat men moet wachten tot deze situaties zich voordoen
- daar komt nog bij dat deze situaties typerend zijn voor het alledaagse contact waarin
meestal niet de schatting van intelligentie vooropstaat
- hiertegenover staat de intelligentietest, die speciaal is samengesteld om een schatting
van de intelligentie te verkrijgen
Standaardisatie
- standaardisatie is een van de noodzakelijke voorwaarden voor de vergelijkbaarheid van
testprestaties
- ook het voorwetenschappelijk oordeel draagt deze notie van vergelijken expliciet of
impliciet in zich
- wil men de onderzochte ter vergelijking naast anderen plaatsen, dat moet de situatie
waarin we deze persoon bezig zien vergelijkbaar zijn met de situatie waarin de
referentiegroep heeft verkeerd. Het beste bereikt men dit door de situatie te
standaardiseren
Normering
- de eis van vergelijkbaarheid van testprestaties houdt nog een tweede consequentie in
- wil men de intelligentie van persoon A vergelijken met die van persoon B, dan moet men
in elk geval de afstand tussen A en B zo exact mogelijk schatten
- natuurlijk bestaat in de voorwetenschappelijke beoordeling een notie van ‘meer of
minder’, maar van een exacte vergelijking is geen sprake
- voor het vaststellen van kleinere verschillen is een gevoelig instrument nodig
- een genormeerde psychologische test is veel beter in staat aan deze eis te
beantwoorden dan een praktijkbeoordeling
- in het normeringsonderzoek is op zijn minst een rangorde vastgesteld, zodat iemands
prestatie door middel van een plaatsbepaling in deze rangorde kan worden beoordeeld
- hierbij is men gebonden aan de groep proefpersonen waarop deze normen worden
vastgesteld
- het vaststellen van een rangorde is de eenvoudigste vorm van normering. Vaak kunnen
de afstanden tussen testscores in de normering worden opgenomen
- in de afbeelding hieronder is een voorbeeld te zien van een discrete verdeling van
testscores
- de twee respondenten met de rangscores 1 en 2 hebben hierin bijvoorbeeld de twee
laagste testscores van 1 en 3
- de discrete verdeling kan ook benaderd worden met een normaalverdeling
- daartoe moet eerst worden vastgesteld of dit redelijk is, met een statistische toets als de
Kolmogorov-Smirnov
- vervolgens kunnen een geschikt gemiddelde en een geschikte standaarddeviatie gekozen
worden, en kan de schaal van de testscores omgezet worden naar die onder de
normaalverdeling met dat gemiddelde en die spreiding
- daarmee verandert wel de schaal, maar blijven de personen dezelfde rangorde houden
- de beschikbaarheid van normen is meestal een noodzakelijke voorwaarde voor het
gebruik van een test in een enkel uitzonderlijk geval kan men volstaan met een
ongenormeerde test
- normen zijn ook nodig bij het gebruik van observatietests en projectieve technieken
8
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Michaela12. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.04. You're not tied to anything after your purchase.