samenvatting assessmentpsychologie. Boek: psychodiagnostiek en
assessment.
Hoofdstuk 2.
De psychodiagnostiek onderscheidt zich echter van een leek in een manier waarop hij dat doet,
namelijk met gebruikmaking van wetenschappelijk onderbouwde methoden en instrumenten. Deze
instrumenten We zijn onder te verdelen in 3 categorieën:
1. Interviewtechnieken.
2. Psychologische testen.
3. Observatie methode.
In de praktijk maken we bij voorkeur gebruik van een combinatie van de genoemde 3 diagnostische
instrumenten: het interview, de psychologische test en/ of gedragsobservaties.
Soms wordt ook de dossieranalyse in deze lijst opgenomen, maar strikt genomen bestaat een
dergelijke analyse uit niet meer dan een historische gegevens die zijn gebaseerd op een of meerdere
van de 3 hiervoor genoemde diagnostische instrumenten. Deze diagnostische instrumenten, die ook
wel de gouden 3 worden genoemd, komen we in allerlei vormen tegen. Er zijn verschillende
interviewvormen bijvoorbeeld; gestructureerd en gedetailleerd. Ook gedragsobservaties komen in
verschillende vormen voor, van sterk gestructureerde tot volledig on gestructureerde methode. Het
kan daarbij gaan om observaties die door de toegepast psycholoog zal worden uitgevoerd, of om
voor me waarbij de toegepast psycholoog Alleen het format ontwerpt of aanlevert en de feitelijke
observaties en scoring worden uitgevoerd door de ouders van een kind of de schooljuf. Maar het kan
ook zo zijn dat de cliënt zelf scoort hoe vaak bepaalde gevoelens of gedragingen zich voordoen.
Psychologie is geen natuurkunde of een exacte wetenschap. De meetinstrumenten die toegepast
psychologen gebruiken zijn minder precies en nauwkeurig. nog met het interview, nog met de
psychologische test, nog met observatie methoden zullen we in alle gevallen perfecte voorspellingen
kunnen doen. Deze onvermijdelijke foutmarge is voor sommige reden om dan maar helemaal geen
gebruik te maken van psychomotorisch verantwoorde ontwikkeld instrumenten. Dit is niet goed,
omdat er in de praktijk immers Beslissingen over Mensen genomen worden.
2.2 wat maakt een test een goede test?
Wat is nu het verschil tussen een gedegen professionele test en testjes die Alleen bedoeld zijn om de
lezer te amuseren? Er bestaan goede én professionele tests die bijvoorbeeld maar uit 5 of 10 vragen
bestaan n in enkele minuten zijn ingevuld. Ook de wijze van score hoeft niet echt te verschillen. De
invullen leest een vraag en beantwoord op een vijfpuntsschaal in hoeverre deze stelling op hem/
haar van toepassing is, daarna de verschillende antwoorden bij elkaar worden opgeteld en een
eindscore volgt. Zowel bij Libelle-testen als bij COTAN-gecertificeerden testen volgt men deze
werkwijze (COTAN is een kwaliteitskeurmerk voor psychologische testen Dat is afgegeven door het
NIP, de beroeps organisatie van psychologen). Welke zijn dat? We noemen de belangrijkste:
1. En professionele test wordt geconstrueerd vanuit een wetenschappelijke achtergrond. Dit
kan een wetenschappelijke persoonlijkheids theorie of een statische methode zijn,
bijvoorbeeld factor analyse. In de handleiding wordt omschreven volgens welke methoden
items zijn samengesteld én gekozen.
, 2. Schalen zijn homogeen en zuiver.
3. Er is onderzoek gedaan naar de betrouwbaarheid en validiteit van de test.
4. De wijze waarop de test moet worden afgenomen is precies omschreven en doorgaans in
hoge mate gestandaardiseerd.
5. Testscores van een kandidaat kunnen worden vergeleken met voldoende grote en
representatieve normgroepen.
6. Er is onderzoek gedaan naar de meetpretenties van de test en de mate waarin de test die
kan waarmaken.
Een toegepast psycholoog of hrm’er Is een testgebruiker en geen testconstructeur. Dit laatste is een
taak voor de academische psycholoog.
Wetenschappelijke en niet wetenschappelijke ideeën hoeven helemaal niet zoveel van elkaar te
verschillen, Maar dat de manier waarop die ideeën tot stand gekomen zijn en hoe ze verder
evolueren vaak wel scherp te onderscheiden zijn.
De psycholoog voelt zich lid van een wetenschappelijke gemeenschap. Zijn opvattingen beschouwt
hij als tijdelijke hypotheses die voortdurend onderwerp zijn van empirisch onderzoek en
academische en praktische discussie. Wetenschappelijke psychologen vinden niet zomaar iets kom
maar hij wil niet zomaar een mening, maar hangen een theorie aan die gebaseerd is op de
uitkomsten van experimenten en wetenschappelijke onderzoeken en onderworpen is aan kritische
discussies in een wetenschappelijke fora. Dit kan betekenen dat opvattingen die enige tijd terug nog
voor waar worden gehouden, inmiddels achterhaald zijn.
Factoranalyse is een datareductietechniek, een methode om via een statische benadering patronen
en samenhang in grootte en complexe hoeveelheden informatie te ontdekken. Lichaamslengte en
lichaamsgewicht hebben we een samenhang. Uit lichaamslengte kunnen we met een bepaalde mate
van zekerheid iemands gewicht afleiden. In de factoranalyse zouden we zeggen dat beide fenomenen
teruggaan op één gemeenschappelijke factor. In dit geval zouden we dat lichaamsomvang kunnen
noemen, de kleinste gemeenschappelijke noemer.
Schalen van vragenlijsten zijn bij voorkeur terug te voeren tot één zo'n gemeenschappelijke factor.
Dan noemen we zon schaal zuiver of homogeen.
Wat een factor analist ís computerprogramma eigenlijk Alleen maar doet, is alle door een groot
aantal mensen ingevulde items onderling met elkaar correleren. En dit geval levert dit een 4 keer 4
matrix op. De computer ontdekt dan:
- 1 en 3 correleren hoog, maar correleren bij de laag met 2 en 4.
- 2 en 4 correleren hoog, maar correleren laag met 1 en 3.
Het computerprogramma zal dan aangeven dat het twee factoren ontdekt heeft: 1 die bestaat uit de
items 1 en 3, en 1 die bestaat uit de items 2 en 4. Op de vraag wat de naam van deze factoren moet
zijn, geef de computer geen antwoord. Het is dan aan ons om een term te bedenken die het beste
lading dekt. De beperkingen van de menselijke geest worden in hoog tempo voorbij gestreefd door
geavanceerde computers die zeer grote factoranalyses aankunnen, we spreken hier over big data.
Met wil van factoranalyse vinden we dus factoren. Een factor bestaat uit items die onderling allemaal
hoog met elkaar correleren, dus eigenlijk allemaal hetzelfde meten.
Betrouwbaarheid en validiteit zijn twee kernbegrippen In de psychometrie. Je zou kunnen zeggen dat
betrouwbaarheid een intern kenmerk is van een test of methode, terwijl validiteit steeds betrekking
heeft op buiten de methodes zelf gelegen, externe zaken Frans betrouwbaarheid is een
, noodzakelijke, maar niet voldoende verantwoordde voor validiteit. Betrouwbaarheid heeft
betrekking op de afwezigheid van storende factoren die het meetproces kunnen vertroebelen.
Een zeer groot aantal fysieke eigenschappen zijn normaal verdeeld, bijvoorbeeld lengte, gewicht,
levensduur, atletische vermogens, spierkracht en longinhoud. Hetzelfde geldt voor psychische
eigenschappen als intelligentie, persoonlijkheidstrekken, psychopathologie, waar de komma normen,
overtuigingen, en psychofysische kenmerken als geheugen, reactietijd en snelheid waarmee we
informatie kunnen verwerken twee belangrijke kenmerken van een normaalverdeling zijn het
gemiddelde en de standaard deviatie.
In handleidingen van psychologische testen is aangegeven hoe een bepaalde concrete score van een
kandidaat gelezen moet worden, welke foutmarges we dus steeds in 8 moeten nemen. We gaan
daarbij uit van de aannemen dat de score van de cliënt eenzelfde spreiding heeft als die van andere
cliënten die we eerder onderzocht hebben en waarvan we de spreiding hebben berekend.
4 manieren om het betrouwbaarheid te meten. Ingeval een schaal 5 items bevalt, zou je dat 5 keer 5
is 25 items, minus 5 en dat weer gedeeld door twee. Het aantal correlaties is dus steeds N(N-1) : 2=,
in dit geval 10. Het gemiddelde van deze 10 correlaties is de betrouwbaarheid van deze schaal.
Bovendien geldt dat geen van deze correlaties te laag mag zijn.
Een andere, veelgebruikte manier is de splitsingsmethode, waarbij de items in twee willekeurige
groepen worden verdeeld en de correlatie tussen deze twee groepen wordt berekend.
1/3 manier om de betrouwbaarheid van de diagnostisch instrument te bepalen is de test-
hertestmethode Hierbij wordt eenzelfde s met een tussenperiode van enkele weken of enkele malen
bij deze groep kandidaten afgenomen. Wanneer de test een stabiele persoonlijkheids eigenschap
beoogt te meten, dan moeten de scores van deze 2 meetmomenten sterk overeenkomen kom maar
ofwel: Er is een hoge correlatie tussen de twee meetmomenten.
1/4 aanpak is het bepalen van de Interraterbetrouwbaarheid. Onder een meetmethode, zoals een
schriftelijke vragenlijst, of een lijst met vragen die in een interview wordt afgenomen, vallen alle
aspecten die mogelijk invloed op de uitkomst kunnen hebben. Dus niet Alleen de vragen en de
schriftelijke instructies voor de afnemers, maar ook een onbedoelde en vaak onverwachte effecten,
zoals huidskleur van de interviewers. Wanneer geïnterviewden daardoor niet hun ware mening
prijsgeven over bijvoorbeeld integratie of racisme, dan is die vragenlijst om die reden minder
betrouwbaar en moet er dus iets verzonnen worden om de betrouwbaarheid op te krikken.
Wat de ene docent als agressief ervaart, is voor een andere docent niet meer dan een plagerijtje.
Hetzelfde gedrag van een leerling zal door deze twee beoordelaars dus anders worden gescoord, wat
de interraterbetrouwbaarheid niet ten goede komt. Dit probleem fragment doorgaans te
ondervangen door een begrip goed te definiëren en ze operationaliseren, voorbeelden te geven van
wat wel en wat niet om het begrip valt enzelfs de verschillende schappen van definities, voorbeelden
en uitsluitende voorbeelden te voorzien. Deze laatste methode noemen we BARS: Behavior
Anchored Rating Scales. Maar dan nog zullen er verschillen tussen beoordelaars blijven bestaan. In
fact Emmen wordt de Inter ater betrouwbaarheid uitgedrukt In de Cohens Kappa, een
correlatiecoëfficiënt tussen oordelen van verschillende beoordelaars op eenzelfde dimensie.
Een gedegen validiteit is het meest belangrijke kenmerk van de deugdelijke test. Je zou kunnen
zeggen dat de validiteit het finale keurmerk is. Validiteit kunnen we dan ook het beste omschrijven
Als de maten waarin een test aan Zijn doel beantwoordt. En test wordt nooit zomaar gemaakt, maar