Hoofdstuk 1: Introduction to psychological assessment: why we do it and what it is
1.1 Korte geschiedenis van testen
Anastasi en Urbina (1997) verklaarden dat de werkelijke 'wortels van testen verloren zijn gegaan in
de oudheid'. Sommige schrijvers suggereren dat de eerste test eigenlijk de beroemde 'Apple Test'
was die Eva in de Hof van Eden gaf. Als men Bijbelse referenties echter uitsluit, is het testen meestal
terug te voeren tot de vroege Chinezen. In het volgende gedeelte worden enkele van de mijlpalen in
de testgeschiedenis beschreven.
1.1.1 Vroegste testen: circa 2200 v. Chr
Het vroegst gedocumenteerde gebruik van tests wordt meestal toegeschreven aan de Chinezen die
openbare functionarissen testten om hun bekwaamheid te verzekeren.
1.1.2 Achttiende- en negentiende-eeuwse tests
Carl Frederich Gauss
Gauss was een bekende Duitse wiskundige die ook belangrijke bijdragen leverde in de astronomie en
de studie van magnetisme. Tijdens het volgen van sterrenbewegingen ontdekte hij dat zijn collega's
vaak op iets andere locaties kwamen. Hij zette de frequentie van de waargenomen locaties
systematisch uit en vond de observaties in de vorm van een curve (de normale curve of normale
verdeling). Hij stelde vast dat de beste schatting van de precieze locaties van de ster het gemiddelde
van de waarnemingen was en dat elke onafhankelijke waarneming een zekere mate van fouten
bevatte. Hoewel Gauss doorgaans niet wordt erkend als een pionier in testen, geloven we dat zijn
formele kennis van meetfouten en zijn distributiekenmerken hem deze erkenning oplevert.
Ambtenarenonderzoek
Het testen van civiele diensten, vergelijkbaar met die in China, werden gebruikt om
overheidsmedewerkers te selecteren en werd in de late 18 e en vroeger 19e eeuw geïntroduceerd in
Europese landen. In 1883 begon de Amerikaanse Civil Service Commission soortgelijke prestatietests
te gebruiken om de selectie van overheidsmedewerkers te vergemakkelijken.
Artsen en psychiaters
In de 19e eeuw ontwikkelden artsen en psychiaters in Engeland en de Verenigde Staten
classificatiesystemen om individuen met mentale retardatie en andere mentale problemen te
classificeren. In de jaren 1830 was de Franse arts Jean Esquirol een van de eersten die
krankzinnigheid onderscheidde van geestelijke gebreken. In de jaren 1890 bevorderden Emil
Kraepelin en anderen het gebruik van vrije associatietesten bij de beoordeling van psychiatrische
patiënten. Vrije-associatietesten omvatten de presentatie van stimuluswoorden waarop de
respondent reageert 'met het eerste woord dat in je opkomt'. Later exposeerde Sigmund Freud over
de techniek om patiënten aan te moedigen vrijelijk alle gedachten te onthullen die in ze opkwamen
om onderliggende gedachten en emoties te identificeren.
Het tijdperk van blaasinstrumenten
Vroege experimentele psychologen zoals Wilhelm Wundt, Sir Francis Galton, James McKeen Cattell
en Clark Wissler leverden een belangrijke bijdrage aan de ontwikkeling van cognitieve
vaardigheidstests. Een van de belangrijkste ontwikkelingen in deze periode was de stap naar het
meten van menselijke vermogens met behulp van objectieve procedures die gemakkelijk kunnen
worden gerepliceerd. Deze vroege pioniers gebruikten verschillende instrumenten, vaak gemaakt van
messing, om eenvoudige sensorische en motorische processen te meten op basis van de aanname
dat het metingen waren van algemene intelligentie.
1
,Galton wordt beschouwd als de grondlegger van mentale testen en metingen en was
verantwoordelijk voor de eerste grootschalige systematische verzameling van gegevens over
individuele verschillen.
Cattell deelde Galton's overtuiging dat relatief eenvoudige sensorische en motorische tests kunnen
worden gebruikt om intellectuele vermogens te meten. Galton en Cattell hebben ook bijgedragen
aan de ontwikkeling van testprocedures, zoals gestandaardiseerde vragenlijsten en
beoordelingsschalen die later populaire technieken voor persoonlijkheidsbeoordeling werden.
Wissler was een van de studenten van Cattell wiens onderzoek het werk van zijn beroemde leraren
grotendeels in diskrediet bracht. Wissler ontdekte dat de metingen van de sensorische motoriek die
gewoonlijk worden gebruikt om intelligentie te beoordelen, in essentie geen correlatie hadden met
academische prestaties. Hij vond ook dat de sensorisch-motorische test slechts zwakke correlaties
met elkaar had. Deze ontmoedigende bevindingen beëindigden in wezen het gebruik van de
eenvoudige sensorisch-motorische metingen van intelligentie en zetten de weg voor een nieuwe
benadering van intellectuele beoordeling die het meer geavanceerde mentale proces van hogere
orde benadrukte. Ironisch genoeg waren er significante methodologische tekortkomingen in het
onderzoek van Wissler. Desalniettemin zou het tientallen jaren duren voordat onderzoekers zouden
ontdekken dat ze het belang van psychofysische metingen bij het onderzoek van intelligentie
mogelijk hadden afgewezen, en dat het de vrije loop was gegaan voor Alfred Binet's benadering van
intelligentietests met nadruk op hogere geestelijke vermogens.
1.1.3 Twintigste-eeuwse tests
Alfred Binet - Doe intelligentietesten!
Binet experimenteerde aanvankelijk met sensorisch-motorische metingen zoals reactietijd en
sensorische scherpte, maar hij raakte ontevreden met hen en pionierde het gebruik van metingen
van hogere orde cognitieve processen om intelligentie te beoordelen. De eerste Binet-Simon Scale
werd uitgebracht in 1905 en was de eerste intelligentietest die een goede voorspeller was van
academisch succes. De schaal bevatte enkele sensorisch-perceptuele tests, maar de nadruk lag op
verbale items die begrip, redenering, beoordelingsvermogen en kortetermijngeheugen
beoordeelden.
Leger-alfa- en bètatests
Intelligentietesten kregen een nieuwe impuls in de Verenigde Staten tijdens de Eerste Wereldoorlog.
Het Amerikaanse leger had een manier nodig om rekruten te beoordelen en te classificeren als
geschikt voor het leger en om ze te classificeren voor banen in het leger. De APA en een van zijn
vroegere presidenten, Robert M. Yerkes, ontwikkelden een task force die een reeks proeve van
bekwaamheid bedacht die bekend werd als de Alpha- en Beta-leger, verbaal en non-verbaal. Door
hun inspanningen en die van het leger bij het screenen van rekruten, waren letterlijk miljoenen
Amerikanen bekend met het concept van intelligentietests.
Robert Woodworth - Doe persoonlijkheidstests!
In 1918 ontwikkelde Robert Doodworth het Woodworth Personal Data Sheet, dat algemeen wordt
beschouwd als de eerste formele persoonlijkheidstest. Het Woodworth Personal Data Sheet is
ontworpen om persoonlijke informatie over militaire rekruten te verzamelen. Net zoals de
ontwikkeling van de Binet-schaal werd ingeluid voor intelligentietests, luidde de introductie van het
Woodworth Personal Data Sheet het tijdperk van persoonlijkheidsbeoordeling in.
Rorschach Inkblot Test
2
,Hermann Rorschach ontwikkelde de Inkblot Test van Rorschach in de jaren 1920. Er is veel discussie
geweest over de psychometrische eigenschappen van de Rorschach, maar het blijft een van de meer
populaire persoonlijkheidsbeoordelingen die in het begin van de 21e eeuw worden gebruikt.
College toelatingstests
De college-toelatingsexamencommissie (CEEB) werd oorspronkelijk opgericht om hogescholen en
universiteiten een objectieve en geldige maatstaf te bieden voor de academische capaciteiten van
studenten en om zich terug te trekken nalatenschap in opnames tot academische verdiensten. Zijn
inspanningen resulteerden in de ontwikkeling van de eerste Scholastic Aptitude Test (SAT) in 1926.
Het American College Testing Program (ACT) werd geïnitieerd in 1959 en is de belangrijkste
concurrent van de SAT. Voorafgaand aan de komst van deze tests waren beslissingen over
universiteitsacceptaties zeer subjectief en sterk beïnvloed door de achtergrond en status van de
familie.
Wechsler intelligentieschalen
Intelligence-testen kregen een nieuwe impuls in de jaren dertig, toen David Wechsler een
intelligentietest ontwikkelde met metingen van verbale vaardigheid en non-verbaal op dezelfde test.
Voorafgaand aan Wechsler beoordeelden intelligentietests meestal verbale of non-verbale
intelligentie, niet beide. De Wechsler-weegschalen zijn de meest populaire intelligentietests
geworden die tegenwoordig worden gebruikt.
Minnesota multiphasic personality inventory (MMPI)
De MMPI werd begin jaren veertig gepubliceerd om te helpen bij de diagnose van psychiatrische
stoornissen. Het is een objectieve persoonlijkheidstest en het onderwerp geweest van een grote
hoeveelheid onderzoek. De tweede editie is nog steeds een van de meest populaire (zo niet de meest
populaire) persoonlijkheidsbeoordelingen die vandaag worden gebruikt.
1.1.4 Testen van de eenentwintigste eeuw
De laatste 60 jaar is er een explosie geweest in termen van testontwikkeling en gebruik van
psychologische en educatieve tests.
1.2 De taal van beoordeling
1.2.1 Testen, meten en beoordelen
Een test is een apparaat of procedure waarbij een steekproef van het gedrag van een individu wordt
verkregen, geëvalueerd en beoordeeld met behulp van gestandaardiseerde procedures. Een test is
een voorbeeld van gedrag. Omdat een test slechts een voorbeeld van gedrag is, is het belangrijk dat
tests een representatief voorbeeld van het gedrag weerspiegelen waarin je bent geïnteresseerd.
Een gestandaardiseerde test is een test die op een standaard manier wordt toegediend,
gescoord en geïnterpreteerd. Het doel van standaardisatie is ervoor te zorgen dat de testcondities zo
ongeveer hetzelfde zijn als mogelijk is voor alle personen die de test afleggen. Als dit wordt bereikt,
zal geen enkele geëxamineerde een voordeel hebben ten opzichte van een andere vanwege variantie
in toedieningsprocedures, en zijn de beoordelingsresultaten vergelijkbaar.
Meting wordt gedefinieerd als een reeks regels voor het toewijzen van getallen om objecten,
eigenschappen, attributen of gedrag weer te geven.
Beoordeling wordt gedefinieerd als elke systematische procedure voor het verzamelen van
informatie die kan worden gebruikt om conclusies te trekken over de kenmerken van mensen of
objecten.
In contrasterende psychologische tests en psychologische beoordelingen merkte Meyer (2001) op
dat testen een relatief eenvoudig proces is waarbij een specifieke test wordt beheerd om een
specifieke score te verkrijgen. Integendeel, psychologische beoordeling integreert meerdere scores,
3
, meestal verkregen met behulp van meerdere tests, met informatie verzameld door het controleren
van records, het uitvoeren van interviews en het uitvoeren van observaties. Het doel is om een beter
begrip van de cliënt te ontwikkelen, doorverwijzingsvragen te beantwoorden.
McFall en Trent (1999) gaan nog een stapje verder en herinneren ons eraan dat het 'doel van
klinische beoordeling is om gegevens te verzamelen die ons in staat stellen de onzekerheid met
betrekking tot de waarschijnlijkheid van gebeurtenissen te verminderen'.
Evaluatie is een term die vaak wordt gebruikt bij het bespreken van problemen met beoordelingen,
testen en metingen. Evaluatie is een activiteit waarbij de waarde wordt beoordeeld.
Betrouwbaarheid verwijst naar de stabiliteit, consistentie en relatieve nauwkeurigheid van de
testscores. Validiteit verwijst naar de nauwkeurigheid van de interpretatie van testscores.
1.2.2 Typen testen
Cronbach (1990) merkte op dat testen over het algemeen kunnen worden geclassificeerd als
maatregelen voor maximale prestaties of typische respons.
Maximale prestatietests zijn ontworpen om de bovengrenzen van de kennis en vaardigheden van de
examinandus te beoordelen. Binnen de brede categorie van maximale prestatietests zijn er een
aantal subcategorieën. Ten eerste worden maximale prestatietests vaak geclassificeerd als
prestatietests of proeve van bekwaamheid. Tweede, maximale prestatietests kunnen worden
geclassificeerd als objectief of subjectief. Ten slotte worden maximale prestatietests vaak beschreven
als snelheids- of vermogenstests.
Prestatietests meten kennis en vaardigheden op een gebied waar instructie is gegeven. Aptitude-
tests meten cognitieve vaardigheden en vaardigheden die worden geacclimatiseerd als het resultaat
van algemene levenservaringen. Prestatietests worden meestal gebruikt om te meten wat op een
bepaald moment is geleerd of 'behaald'. Aptitude-tests daarentegen worden meestal gebruikt om
toekomstige prestaties te voorspellen of om het potentieel van een individu in termen van
academische of werkprestaties te weerspiegelen.
Objectiviteit betekent meestal onpartijdigheid of de afwezigheid van persoonlijke vooroordelen.
Objectiviteit verwijst naar de mate waarin getrainde examinatoren die een toets hebben gehaald het
eens zijn en op dezelfde manier antwoorden scoren. Subjectieve tests zijn tests die afhankelijk zijn
van het persoonlijke oordeel van de personen die de test beoordelen.
Maximale prestatietests worden vaak ingedeeld als snelheidstests of vermogenstests. Bij een pure
snelheidstest weerspiegelt de prestatie verschillen in de snelheid van prestaties. Bij een pure
vermogenstest is de snelheid van de uitvoering geen probleem. Bij vermogenstests weerspiegelt de
prestatie de moeilijkheid van de items die de examinandus correct kan beantwoorden.
Goed ontwikkelde snelheids- en vermogenstests zijn ontworpen zodat niemand een perfecte score
kan behalen. Ze zijn op deze manier ontworpen omdat perfecte scores 'onbepaald' zijn. Dat wil
zeggen, als iemand een perfecte score behaalt bij een test, kan de test de uiterste grenzen van dat
vermogen niet beoordelen. Om toegang te krijgen tot de hoogste limieten van bekwaamheid,
moeten tests door testexperts worden aangeduid als 'voldoende plafond'. Dat wil zeggen, de
moeilijkheidsgraad van de tests is zo ingesteld dat geen van de examinandi een perfecte score kan
behalen.
Typische reactietests zijn ontworpen om het typische gedrag en de typische kenmerken van
examinandi te meten. Net als bij maximale prestatietests, impliceert in de context van typische
objectiviteit van de responsbeoordeling ook onpartijdigheid of de afwezigheid van persoonlijke
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller barbaraenmyrthe. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $11.42. You're not tied to anything after your purchase.