Furr & Bacharach college en boek
Ch. 1: Psychometrie en het belang van psychologische metingen
Observeerbaar gedrag en niet observeerbare psychologische attributen
Psychologische testen worden gebruikt als instrumenten om observeerbare/waarneembare
gebeurtenissen in de fysieke wereld te meten. Dit is meestal een bepaald soort gedrag en wordt
gedaan voor twee doeleinden. Ten eerste vanwege de interesse in specifiek gedrag op zich (zoals de
manier waarop gelaatsuitdrukking de perceptie van emoties beïnvloedt). Ten tweede, en algemener,
observeren gedragswetenschappers het gedrag van mensen als een manier om niet-waarneembare
psychologische eigenschappen, zoals intelligentie, depressie, kennis enz. te kunnen beoordelen.
Testscore (theorie en praktijk): je wilt iets meten met de testscores.
Theorie: psychometrie an sich.
Praktijk:
True score: als er geen meetfout in de test zit, maar dit bestaat NIET. Er zit namelijk altijd een
meetfout in de test.
Betrouwbaarheid: hoe goed je een true score kan benaderen.
Validiteit: meten wat je wilt meten. Zijn de factoren echt wat je wilt meten?
Response bias: door bijvoorbeeld zenuwen bij een tentamen.
Test bias: hebben geen andere zaken invloed, bijvoorbeeld integratie test.
Voorbeeld college: Strange situation assesment
Is het kind (1) veilig gehecht, (2) niet veilig gehecht of is het (3) ambivalent?
Hechting meten: aan de hand van bv. emotie, zelfbeeld, afwijzing, zelfvertrouwen ouders enz.
Dit zijn constructen die hechting meten.
= Hypothetisch construct, latente variabelen, psychologische attributen
Een hypothetisch construct zijn dus de theoretische psychologische kenmerken, eigenschappen,
processen of staten die niet direct observeerbaar zijn. Hierbij kan men denken aan: leren,
intelligentie, zelfvertrouwen, dromen, houdingen en gevoelens. Bv. werkgeheugen.
Vervolgens maak je gebruik van operational definitions: de procedures die worden gebruikt om deze
hypothetische constructen te meten. Bv. het aantal digits die je onthoudt.
Bij het testen van het werkgeheugen moeten drie dingen worden opgemerkt:
1. Je maakt een gevolgtrekking van waarneembaar gedrag aan een niet-waarneembaar psychologisch
attribuut. We nemen aan dat het specifieke gedrag dat we waarnamen in feite een meting was van
het werkgeheugen.
2. Om onze interpretatie van de digit recall scores als geldig te beschouwen, moest de recall-taak
theoretisch worden gekoppeld aan het werkgeheugen.
3. Bij het meten van het werkgeheugen gaan we er van uit dat het werkgeheugen meer is dan een
verzinsel van onze verbeelding.
Hoe wordt een psychologische test gedefinieerd?
‘A psychological test is a systematic procedure for comparing behavior of two or more people’
(Cronbach).
Er zijn drie belangrijke componenten:
1. De test bevat gedragssamples (allerlei soorten gedragingen)
2. Deze gedragssamples zijn op systematische wijze verkregen (gestandaardiseerde condities)
3. Het doel van de test is het vergelijken van gedrag van twee of meer mensen (intra- or inter-
individuele verschillen, dus ook de vergelijking van de prestaties door dezelfde personen op
verschillende tijdstippen kan in deze definitie worden opgenomen)
,We proberen testen zo gelijk mogelijk te maken zodat we het gedrag wat vertoond word ook echt
kunnen toeschrijven aan dat wat we willen meten.
Verschillende soorten testen
Je hebt natuurlijk soorten zoals open-einde of gesloten-einde:
Open-einde tests: tests waarop de individuen kunnen antwoorden hoe ze maar willen.
Gesloten-einde tests: test waarop de individuen kunnen antwoorden door te kiezen tussen een
aantal gegeven mogelijkheden.
Verder wordt er onderscheid gemaakt tussen:
1. Performance vs. Behavior
2. Criterion referenced vs. Norm referenced een onderscheid op het gebied van wat het doel is
van de test scores.
Criterion: tests waarbij er van te voren een bepaalde criteriumscore is vastgesteld. Dit zorgt er voor
dat de deelnemers kunnen worden verdeeld in twee groepen. Zij die een score hebben behaald
boven het criterium, en zij die een score hebben behaald onder het criterium. De strange situation
test is bijvoorbeeld criterium.
Norm: tests waarbij er geen criterium is, maar waarbij de scores van de deelnemers worden
vergeleken met een referentie sample. Deze sample wordt geacht de gehele populatie te
vertegenwoordigen. De score van de deelnemer wordt vergeleken met het gemiddelde van de
referentiesample (de norm)
Onderscheid tussen criterion referenced tests en norm referenced tests is vaak moeilijk te
maken, omdat de criteriumscore ook gezien kan worden als een bepaalde norm.
3. Speeded vs. Power iets zo snel mogelijk doen (bv. schaatsen op de olympische spelen) of iets zo
goed mogelijk doen (bv. snowboarden op de olympische spelen waarbij je de mooiste truckjes moet
doen).
Speeded: tests met een tijdslimiet. Er wordt gekeken hoeveel vragen de deelnemer kan
beantwoorden in een bepaald tijdsbestek. Je score is het aantal beantwoorde vragen en iedere vraag
is van een vergelijkbare moeilijkheidsgraad.
Power: kijkt naar de hoeveelheid vragen dat correct is beantwoord, zonder dat dit in een bepaald
tijdsbestek moet gebeuren. Je score is het aantal correct beantwoorde vragen en de vragen
verschillen in moeilijkheidsgraad.
Wat is psychometrie
Psychometrie houd zich bezig met de attributen van psychologische testen. Het houdt zich bezig met
het evalueren van de eigenschappen van deze psychologische tests. Drie eigenschappen die in het
bijzonder van belang zijn:
-Het soort informatie dat de psychologische tests opleveren (scores)
-De betrouwbaarheid van de data uit de psychologische tests
-De validiteit van de data uit de psychologische tests
Psychometrie is niet beperkt tot differentiële psychologie, maar het betreft ook experimentele
psychologie (differentiële psychologie stond in contrast met de experimentele psychologie dat zich
vooral richtte op de mens in het algemeen, maar toch is psychometrie niet beperkt tot differentieel).
Psychometrie is betrokken bij alle gedragsmetingen.
Wie is Francis Galton?
Galton leek geobsedeerd door meten. De belangrijkste bijdrage was zijn interesse in wat hij
'anthropometrics' noemde; het meten van menselijke kenmerken, zoals hoofdomvang, armlengte
enz. Metingen van mentale kenmerken noemde hij 'psychometrie'. Galton concentreerde zich op de
variabiliteit van menselijke kenmerken (verschillen tussen mensen). Hij was vooral geïnteresseerd in
de manieren waarop mensen van elkaar verschillen. Deze benadering werd bekend als differentiële
psychologie, de studie van individuele verschillen. Hij is ook wel bekend van:
-De normaal verdeling
,-Correlatie coëfficiënt
-Sampling (steekproeven trekken)
Uitdagingen bij meten
Gedragswetenschappen hebben uitdagingen waar natuurwetenschappen geen last van hebben. Een
van deze uitdagingen is om te proberen de belangrijke aspecten van typen menselijke psychologische
kenmerken in één getal te identificeren en vast te leggen (intelligentie, gevoel van eigenwaarde enz.)
-Identificeren en omvatten van menselijke/psychologische attributen/kenmerken in een getal.
Kunnen we onze psychologische constructen wel samenvatten in een getal?
Verder weet je nooit 100% zeker dat de meting juist is doordat:
-Participant reactivity: bij psychologie is het moeilijk omdat er vaak veel factoren zijn die de
resultaten beïnvloeden. Bijvoorbeeld zenuwen bij een toets. Het feit dat iemand zich bewust is dat
hij getest wordt, kan de psychologische staat beïnvloeden en ook de antwoorden.
Hier bestaan verschillende vormen van:
-Demand characteristics er achter proberen te komen wat het doel van de studie is en je
gedrag aanpassen.
-Social desirability je gedrag aanpassen op een sociaal wenselijke manier.
-Malingering je gedrag op een negatieve manier aanpassen om een slechte indruk achter
te laten voor degene die de test afneemt.
-Objectiviteit: er kan sprake zijn van biases en verwachtingen bij degene die de test afneemt.
-Samengestelde score: psychologen gaan uit van composite scores bij het meten van psychologische
eigenschappen. Je telt dus scores op en wilt daar dan iets mee zeggen, maar kunnen we wel zo maar
de scores op tellen? Is iedere vraag evenveel waard?
-Sensitiviteit van score: het vermogen van een test om onderscheid te kunnen maken tussen
betekenisvolle hoeveelheden of units van de dimensie die gemeten is. Het kan hierbij voorkomen dat
de data die je nodig hebt als het ware wordt gefilterd door de ongevoeligheid van de schaal. Bv. Op
een schaal waarbij je kan kiezen tussen goed en slecht zal je minder snel vooruitgang zien dan op een
schaal waarbij je kan kiezen uit heel goed, redelijk goed, neutraal, een beetje slecht, heel slecht.
Kunnen we met een test verschillen op een attribuut goed weergeven?
-Gebrek aan awareness of psychometrische info: gebrek aan besef van het belang van
psychometrische informatie. Er zijn zo veel testen (denk ook aan in een magazine), zijn deze allemaal
betrouwbaar? Hier denken mensen vaak niet over na. In de sociale wetenschappen willen we wel
gebruik maken van testen die betrouwbaar zijn.
Ch. 2: Scaling
De standaard definitie van measurment is: de toeschrijving van numerieke waardes aan objecten of
gebeurtenissen volgens bepaalde regels.
Numerieke waardes vertegenwoordigen een individu’s level van een bepaalde psychologische
eigenschap. Bv. je IQ vertegenwoordigt je intelligentie.
College:
‘Metingen zijn het toekennen van nummers aan objecten of gebeurtenissen (gedrag) volgens regels
(scales of measurements)’ (Stevens).
‘Als iets bestaat, dan moet het bestaan in bepaalde mate’ (Thorndike).
Scaling: de manier waarop numerieke waardes worden toegekend aan de psychologische attributen.
Fundamentele problemen met nummers
-Eigenschappen van nummers:
The property of identity: de numerieke waarde zorgt ervoor dat mensen kunnen worden
onderverdeeld in minstens twee categorieën. Mensen die voldoen aan een zelfde
psychologische eigenschap kunnen in een categorie komen omdat zij deze eigenschap
gemeen hebben met elkaar. De mensen in de andere groep voldoen allemaal aan een andere
, psychologische eigenschap die zij gemeen hebben en waarin zij dus verschillen van de andere
groep. Voor het plaatsen van mensen in categorieën bestaan er een aantal regels:
-Iedereen binnen die categorie moet voldoen aan dat kenmerk dat de categorie
vertegenwoordigt.
-De categorieën moeten mutually exclusive zijn, dit houdt in dat iemand die geclassificeerd
wordt in de ene groep, niet ook geclassificeerd kan worden in de andere groep.
-De categorieën moeten exhaustive zijn, dit houdt in dat iedere persoon in 1 en ook enkel in
1 categorie valt. Als er binnen deze groep mensen iemand is die in geen van beide
categorieën valt moet er dus een derde categorie komen.
The property of order: in dit geval geeft de numerieke waarde een rank order aan van
mensen ten opzichte van anderen uit een bepaalde groep. Dit vertelt ons iets over de
verschillen tussen mensen maar zegt niets over de grote van die verschillen. Nummers zijn
labels, maar ranks hebben een betekenis omdat ze de property of order hebben.
The property of quantity: in dit geval geeft de numerieke waarde de grote van de verschillen
tussen mensen weer. De numerieke waardes vertegenwoordigen hier echt cijfers in
tegenstelling tot de twee eerder genoemde properties waarin de numerieke waardes labels
vertegenwoordigden. Deze waarden worden vaak scalar, metric, cardinal of quantative
values genoemd.
-Het nummer 0: een raar nummer. Het kan twee betekenissen hebben;
Absolute betekenis: 0 staat voor een staat waarin een eigenschap of een object of
gebeurtenis niet bestaat. Het is er niet. In dit geval vertegenwoordigt de 0 het ‘niks’. Dit
wordt ook wel het absolute nulpunt genoemd (lengte, gewicht, reactietijd).
Arbitraire betekenis: 0 staat voor een willekeurige hoeveelheid. Dit wordt ook wel het
arbitraire nulpunt genoemd. De waarde 0 betekent in dit geval niet dat er ’niks’ is. Bij een
temperatuur van 0 graden, is er nog steeds een temperatuur (temperatuur, kalender).
-Meeteenheden: er zijn 3 manieren waarop een meting arbitrair kan zijn;
Willekeur in formaat van de unit, je kunt van alles gebruiken om dingen mee te meten.
Willekeur in type van object dat gemeten wordt. Sommige units van metingen zijn niet
gebonden aan een specifiek object.
Willekeur in het kenmerk dat wordt gemeten. Een meetlat kun je gebruiken om lengte mee
te meten, maar als je het op een weegschaal legt meet je er gewicht mee. Sommige units van
metingen kunnen dus, wanneer zij een fysieke vorm aannemen, meerdere kenmerken van
een object meten.
Additiviteit: vereist dat de unit size constant blijft. Het unit formaat van metingen veranderd niet,
alle units die geteld worden zijn identiek. Dit is vaak problematisch bij psychologische metingen;
meeteenheid is niet altijd gelijk aan de psychologische unit.
Tellen: alles wat we meten bestaat uit tellingen, maar niet alles wat geteld wordt betekent meten.
Bv. De stoelen in de collegezaal tellen is gewoon tellen en niet perse meten. Maar voor alles wat je
wilt meten moet je wel tellen. Tellen telt alleen als meting wanneer het gebruikt wordt om de
hoeveelheid van een bepaalde eigenschap of kenmerk van een object te meten
Paradox bij tellen: we willen getallen toekennen aan psychologisch construct, maar eigenlijk weten
we helemaal niet de mate waarin een psychologisch construct bestaat. We weten niet in hoeverre en
in welke mate intelligentie bv bestaat. Kunnen we dit wel in een getal uitdrukken?
Vier schalen van meten
-Nominaal: betreft categorieën
-Ordinaal: geeft een bepaalde rangorde aan tussen individuen
-Interval: geeft de grote van de verschillen tussen individuen weer. Heeft een arbitrair nulpunt.
Iemand met een IQ van 140 is niet twee keer zo intelligent als iemand met een IQ van 70.
-Ratio: geeft de grote van de verschillen tussen individuen weer. Heeft een absoluut nulpunt. Iets
met een waarde van 20 is twee keer zo groot als iets met een waarde van 10.