SAMENVATTING
PSYCHOLOGISCHE DIAGNOSTIEK
EN TESTTHEORIE
CHAPTER 1 INTRODUCTION TO PSYCHOLOGICAL ASSESSMENT
SPECIAL INTEREST TOPIC 1.1 HOW DO CLINICAL, COUNSELING,
AND SCHOOL PSYCHOLOGISTS DIFFER?
Er bestaat een onderscheid tussen programma’s die een PhD (Doctor of Philosophy)
diploma toekennen en programma’s die een PsyD (Doctor of Psychology) diploma
toekennen. PhD programma’s bieden een brede training in zowel klinische als
onderzoek toepassingen, terwijl PsyD programma’s over het algemeen de focus leggen
op klinische training en minder op onderzoek.
Klinische psychologie programma’s komen meer in overvloed voor en
produceren meer afgestudeerden.
Klinische psychologen zijn geneigd om meer projectieve persoonlijke oordelen te
gebruiken, terwijl counseling psychologen vaak meer carrière en beroepsmatige
oordelen gebruiken.
Het merendeel van zowel klinische als counseling psychologen hebben een
voorkeur voor een integratieve of cognitieve gedragsmatige benadering.
Klinische psychologen werken over het algemeen vaker in privé praktijken,
ziekenhuizen, of medische scholen, terwijl counseling psychologen vaker werken
in universiteitscentra en community centrum settings.
Meer masterstudenten komen counseling programma’s binnen in plaats van
klinische programma’s.
BRIEF HISTORY OF TESTING
Het gebruik van psychologische testen is niet gelimiteerd aan enkel klinische of
gezondheid settings. Industriële en organisatorische psychologen besteden een groot
deel van hun tijd aan het ontwikkelen, toepassen, en interpreteren van testen.
Onderzoekspsychologen moeten daarnaast ook bekwaam zijn in metingen en
beoordelingen. Het merendeel van psychologisch onderzoek heeft betrekking op deze
metingen of oordelen, ongeacht de focus van het onderzoek. Onderwijspsychologen zijn
vaak intrinsiek betrokken bij het testen, metingen, en oordeelkwesties.
Het meest vroege gebruik van testen is toegewezen aan de Chinezen die openbare
functionarissen testten om competentie te verzekeren. Dit testprogramma is veranderd
in de loop der tijd en heeft verschillende vormen aangenomen.
18e en 19e eeuw
Carl Frederich Gauss heeft belangrijke bijdragen geleverd in astronomie en de
bestudering van magnetisme. Hij tekende de frequentie van de geobserveerde locaties
van sterren op een systematische wijze en ontdekte dat deze observaties de vorm van
Page 1 of 105
,een curve aannemen, welke tegenwoordig bekend staat als de normale curve of de
normale distributie.
Civiele service testen, vergelijkbaar met die van China, werden toegepast om
regeringswerknemers te selecteren in Europese landen in het einde van de 18 e en het
begin van de 19e eeuw. In 1883 begon de U. S. Civil Service Commission met het
gebruiken van vergelijkbare prestatietesten op de selectie van regeringswerknemers te
verbeteren.
In de 19e eeuw ontwikkelden artsen en psychiaters in Engeland en de VS
classificatiesystemen om te helpen bij het classificeren van individuen met mentale
achterstanden en andere mentale problemen. Jean Esquirol was een van de eersten die
krankzinnigheid onderscheidde van mentale tekortkomingen; hij geloofde dat mentale
achterstanden bestonden op een continuüm van mild tot extreem en hij observeerde dat
verbale vaardigheden de meest betrouwbare manier was van het identificeren van de
mate van een mentale achterstand.
In de tijd van de bronzen instrumenten was een van de meest belangrijke
ontwikkelingen de beweging richting de meting van menselijke vaardigheden door het
gebruik van objectieve procedures die makkelijk gerepliceerd konden worden. Sir
Francis Galton wordt gezien als de ontwikkelaar van mentale testen en metingen. Een
van zijn belangrijkste prestaties was de oprichting van een antropometrisch
laboratorium in Londen. In dit laboratorium werden de eerste systematische
verzamelingen van data van individuele verschillen op grote schaal gedaan. James
McKeen Cattell was instrumenteel in het openen van psychologische laboratoria en het
verspreiden van de testbewegingen in de VS. Hij wordt gezien als de eerste die de term
mentale test gebruikte in een artikel. Galton en Cattell hebben ook bijgedragen aan de
ontwikkeling van test procedures zoals gestandaardiseerde vragenlijsten en
beoordelingsschalen die later populair werden in de beoordeling van persoonlijkheid.
Clark Wissler vond dat de sensorische-motor metingen die vaak werden gebruikt om
intelligentie te beoordelen in essentie geen correlatie hadden met academische
prestaties. Hij vond daarnaast ook dat de sensorische-motor testen slechts zwakke
correlaties met elkaar hadden.
20ste eeuw
Alfred Binet experimenteerde initieel met sensorische-motor metingen, maar pionierde
uiteindelijk het gebruik van metingen van hogere cognitieve processen om intelligentie
te beoordelen. Binet en zijn collega Theodore Simon ontwikkelde een test om
academische prestaties te voorspellen, genaamd de Binet-Simon Schaal, welke
wijdverspreid in Frankrijk werden geaccepteerd en al snel werden vertaald en
gestandaardiseerd in de VS. Een andere boost voor het testen van intelligentie kwam
gedurende WOI in de VS. Het Amerikaanse leger had een manier nodig om nieuwe
rekruten te classificeren als geschikt voor het leger en voor specifieke taken in het
leger. De APA en Robert M. Yerkes ontwikkelde een serie van begaafdheid testen, Army
Alpha en Army Beta, welke werden door verbale of non-verbale testen. Robert
Woodworth ontwikkelde in 1918 de Woodworth Personal Data Sheet, welke wordt
gezien als de eerste formele persoonlijkheidstest. Hermann Rorschach ontwikkelde de
Rorschach inktvlekken in de jaren 20. Het College Entrance Examination Board (CEEB)
werd aanvankelijk gevormd om colleges en universiteiten te verschaffen met een
objectieve en valide meting voor de academische vermogens van de studenten en om te
vertrekken van nepotisme. Deze pogingen resulteerden in de ontwikkeling van de eerste
Scholastic Aptitude Test (SAT). In de jaren 30 kreeg het testen van intelligentie een
Page 2 of 105
,nieuwe boost toen David Wechsler een intelligentie test ontwikkelde die bestond uit
metingen van verbale vermogens en non-verbale vermogens op dezelfde test. De
Minnesota Multiphasic personality Inventory (MMPI) werd in het begin van de jaren 40
gepubliceerd om te helpen bij de diagnose van psychiatrische stoornissen.
21ste eeuw
De laatste 60 jaar was een explosie in termen van test ontwikkeling en gebruik van
psychologische en educationele testen.
THE LANGUAGE OF ASSESSMENT
Een test is een middel of procedure waarin een sample van het gedrag van een individu
wordt verkregen, geëvalueerd, en gescoord door middel van gestandaardiseerde
procedures. Omdat een test slechts een sample van het gedrag is, is het belangrijk dat
testen een representatief sample van het gedrag waarin men geïnteresseerd is ook
daadwerkelijk reflecteert. Een gestandaardiseerde test is een test die wordt
toegediend en geïnterpreteerd op een standaard manier. Het doel van standaardisatie is
om te verzekeren dat test condities zoveel mogelijk op elkaar lijken voor alle individuen
die de test doen. Een measurement kan worden gedefinieerd als een set van regels
voor het toewijzen van getallen aan vertegenwoordigde objecten, eigenschappen,
attributen, of gedragingen. Deze getallen worden vervolgens geïnterpreteerd als het
reflecteren van karakteristieken van degene die de test doet. Assessment wordt
gedefinieerd als een systematische procedure voor het verzamelen van informatie die
kan worden gebruikt om inferenties te maken over de karakteristieken van mensen of
objecten. Deze evaluatie zou moeten leiden tot een toename van begrip van deze
karakteristieken. Deze term verwijst over het algemeen naar een proces dat bestaat uit
de integratie van informatie verkregen uit meerdere bronnen door meerdere methodes
te gebruiken. De testscores staan onderzoekers toe om gebeurtenissen te voorspellen of
te controleren met grotere nauwkeurigheid of minder fouten dan dat kon worden
gedaan zonder deze scores. Het doel is om deze fouten af te laten nemen in aantal en in
magnitude. Evaluation is een activiteit die bestaat uit het oordelen of inschatten van de
waarde van iets. Reliability verwijst naar de stabiliteit, consistentie, en relatieve
nauwkeurigheid van de testscores. Op een meer theoretisch niveau verwijst
betrouwbaarheid naar de mate waarmee testscores vrij zijn van meetfouten. Validity
verwijst naar de geschiktheid of nauwkeurigheid van de interpretaties van de
testscores.
Cronbach heeft opgemerkt dat testen over het algemeen geclassificeerd kunnen worden
als metingen van ofwel maximum prestatie dan wel als metingen van typische response.
Maximum performance tests zijn ontworpen om de bovenste grenzen van de kennis
en vaardigheden van een individu te meten. Binnen deze brede categorie zijn er een
aantal subcategorieën:
Maximum prestatie testen worden vaak geclassificeerd als prestatie testen of als
vaardigheid test.
o Achievement tests zijn ontworpen om de kennis of vaardigheden van
een individu te meten in een content domein waarin hij of zij instructies
heeft gekregen. Deze testen worden vaak gebruikt als een meting van wat
er is geleerd of bereikt op een specifiek punt in tijd.
o Aptitude tests zijn breder in hun reikwijdte en zijn ontworpen om de
cognitieve vaardigheiden, vaardigheden, en kennis te meten die een
Page 3 of 105
, individu heeft verzameld als het resultaat van algemene levenservaringen.
Deze testen worden over het algemeen gebruikt om toekomstige
prestaties te voorspellen of de potentie van een individu te reflecteren in
termen van academische of professionele prestaties.
Maximum prestatie testen kunnen geclassificeerd worden als objectief of
subjectief.
o Objectiviteit impliceert over het algemeen de afwezigheid van
persoonlijke vooroordelen. Cronbach stelde dat hoe minder de testscores
worden beïnvloed door het subjectieve oordeel van de persoon die de test
scoort, des te objectiever is de test. Subjectieve testen zijn afhankelijk van
het persoonlijke oordeel van het individu die de test scoort, zoals het
cijfer van een essay.
Maximum prestatie testen worden vaak beschreven als snelheid of power testen.
o Speed tests reflecteren enkel verschillen in de snelheid van de prestatie.
Dit soort testen bevatten over het algemeen items die relatief makkelijk
zijn met een strikte tijdslimiet die voorkomt dat testmakers succesvol alle
items kunnen voltooien.
o Power tests zijn testen waar de snelheid van de prestatie niet de kwestie
is; iedereen krijgt genoeg tijd om een poging te doen alle items te
voltooien, maar de items zijn geordend volgens moeilijkheid en sommige
items zijn dusdanig moeilijk dat men verwacht dat niemand deze correct
kan beantwoorden.
o Als iemand een perfecte score zou krijgen op deze testen, dan heeft de
test gefaald in het beoordelen van de bovenste grens van het vermogen
van die persoon.
Typical response tests zijn ontworpen om het typische gedrag of de typische
karakteristieken van individuen te meten. Bij het beschrijven van
persoonlijkheidstesten, maken de meeste experts een onderscheid tussen objectieve en
projectieve technieken. Een objective personality test is een test die geselecteerde
respons items gebruikt, zoals “waar” of “niet waar”, en welke worden gescoord op een
objectieve manier. Projective personality tests bestaan over het algemeen uit de
presentatie van niet gestructureerde of dubbelzinnige materialen die een bijna
oneindige reeks van responses kunnen opwekken. Wat uniek is aan projectieve tests is
de “projectieve” hypothese, welke stelt dat wanneer een individu reageert op een
dubbelzinnige stimulus, deze zal reageren op een manier die de algemene onbewuste
verlangens, motieven, en driften van dit persoon reflecteert zonder interferentie van het
ego of de bewuste mind. Het komt ook voor dat er een onderscheid wordt gemaakt
tussen individuele testen en groepstesten. Dit is een belangrijk onderscheid die van
toepassing is op de toediening van de test in plaats van het type test.
Bijna alle testen produceren scores die de prestatie van het individu reflecteren of
representeren. Er zijn 2 fundamentele benaderingen voor het begrijpen van scores,
namelijk:
De norm-referenced score interpretaties zijn vergelijkingen van de score van
een getest individu met de prestaties van andere individuen.
o Deze interpretaties zijn relatief.
De criterion-referenced score interpretaties zijn vergelijkingen van de score
van een getest individu met een gespecificeerd prestatieniveau.
o Een gerelateerd type is mastery testing waarbij er wordt bepaald of een
individu een bepaald niveau heeft bereikt door een cut score waarbij de
persoon kan falen of succesvol kan zijn.
Page 4 of 105