Samenvatting Psychometrics: An
Introduction Third Edition – Fur &
Bacharach
Hoofdstuk 1 | Observeerbaar gedrag en onobserveerbare
psychologische attributen
Gedragswetenschappers meten het menselijk gedrag om onobserveerbare psychologische
attributen te meten. We identificeren dan een bepaald observeerbaar gedrag en nemen aan
dat dit een bepaald onobserveerbaar psychologisch proces, attribuut of attitude
representeert. Je moet er wel voor zorgen dat wat je gaat meten ook datgene is wat je
beoogt te meten. In de sociale wetenschap wordt vaak gebruik gemaakt van theoretische
concepten, zoals kortetermijngeheugen. Dit wordt ook wel de latente variabele genoemd.
Psychologische testen: definitie en typen
Volgens Cronbach is een psychologische test een systematische procedure voor het
vergelijken van het gedrag van twee of meer mensen. Deze test moet aan drie voorwaarden
voldoen:
- de test moet gedragssamples hebben,
- de gedragssamples moeten verzameld worden op een systematische manier
- het doel van de test moet zijn om het gedrag van twee of meer mensen te meten
(interindividuele verschillen).
soorten tests
Open-ended tests: tests waarop de individuen kunnen antwoorden hoe ze maar willen
Closed-endend tests: test waarop de individuen kunnen antwoorden door te kiezen tussen
een aantal gegeven mogelijkheden.
Criterion referenced tests: tests waarbij er van te voren een bepaalde criteriumscore is
vastgesteld. Dit zorgt er voor dat de deelnemers kunnen worden verdeeld in twee groepen.
Zij die een score hebben behaald boven het criterium, en zij die een score hebben behaald
onder het criterium. Deze wordt gebruikt om een bepaadl vaardigheidsniveau van een
persoon vast te stellen.
Norm referenced tests: tests waarbij er geen criterium is, maar waarbij de scores van de
deelnemers worden vergeleken met een referentie sample. Deze sample wordt geacht de
gehele populatie te vertegenwoordigen. De score van de deelnemer wordt vergeleken met
het gemiddelde van de referentiesample (de norm)
Onderscheid tussen criterion referenced tests en norm referenced tests is vaak moeilijk te
maken, omdat de criteriumscore ook gezien kan worden als een bepaalde norm.
Speeded tests: tests met een tijdslimiet. Er wordt gekeken hoeveel vragen de deelnemer
kan beantwoorden in een bepaald tijdsbestek. Je score is het aantal beantwoorde vragen en
iedere vraag is van een vergelijkbare moeilijkheidsgraad.
,Power tests: kijkt naar de hoeveelheid vragen dat correct is beantwoord, zonder dat dit in
een bepaald tijdsbestek moet gebeuren. Je score is het aantal correct beantwoorde vragen
en de vragen verschillen in moeilijkheidsgraad.
Wat is psychometrie?
Bij de psychometrie ligt de focus op de attributen van testen. Zoals psychologische testen
ontworpen zijn om psychologische attributen van mensen te meten, zo is psychometrie de
wetenschap waar men zich bezig houdt met de attributen van de psychologische testen. Er
zijn drie attributen die van belang zijn:
- het type data (voornamelijk scores)
- de betrouwbaarheid van de psychologische testen
- validiteit van de psychologische testen.
Psychometrie gaat over de procedures waarmee attributen van testen geschat en
geëvalueerd worden.
pioniers psychometrie: Galton, Spearman, Pearson
Francis Galton:
De founding father van de moderne psychometrie, bekend van:
● De normaal verdeling
● Correlatie coëfficiënt
● Sampling (steekproeven trekken)
Hij focuste zich op de verschillen in de menselijke kenmerken. Met andere woorden, hij
hield zich bezig met de verschillen tussen mensen. (Dit wordt ook wel de differential
psychology genoemd, en stond in contrast met de experimental psychology dat zich vooral
richtte op de mens in het algemeen)
Moeilijkheden bij metingen in de psychologie:
❏ Participant reactivity: het feit dat iemand zich bewust is dat hij getest wordt, kan de
psychologische staat beïnvloeden. Hier bestaan verschillende vormen van:
- Demand characteristics → er achter proberen te komen wat het doel
van de studie is en je gedrag aanpassen
- Social desirability → je gedrag aanpassen op een sociaal wenselijke
manier.
- Malingering → je gedrag op een negatieve manier aanpassen om een
slechte indruk achter te laten voor degene die de test afneemt.
❏ Biases en verwachtingen vanuit de onderzoeker/ testafnemer
❏ Psychologen gaan uit van compositiescores bij het meten van psychologische
eigenschappen. Dit houdt in dat scores die iets gemeen hebben met elkaar,
samengevoegd worden. Bijvoorbeeld dat in een vragenlijst waar tien vragen staan
over extraversie, de scores op deze vragen worden samengevoegd.
❏ Score sensitivity: het vermogen van een test om onderscheid te kunnen maken
tussen betekenisvolle hoeveelheden of units van de dimensie die gemeten is. Als
een psycholoog bijvoorbeeld een test gebruikt om veranderingen te meten, maar die
test is niet sensitief genoeg om kleine veranderingen op te merken, dan werkt het
niet. (voorbeeld: pp een schaal waarbij je kan kiezen tussen goed en slecht zal je
minder snel vooruitgang zien dan op een schaal waarbij je kan kiezen uit heel goed,
redelijk goed, neutraal, een beetje slecht, heel slecht.)
❏ Gebrek aan besef van het belang van psychometrische informatie
,Hoofdstuk 2 | Scaling
psychological measurement: de toeschrijving van numerieke waardes aan objecten of
gebeurtenissen volgens bepaalde regels.
Schaling is de manier waarop cijfers worden toegewezen aan psychologische
eigenschappen.
Problemen met cijfers
In psychologische metingen worden cijfers gebruikt om het niveau van een psychologische
eigenschap te laten zien. Hiertoe zijn er vier eigenschappen:
Identiteit
Het belangrijkste bij het meten van de eigenschap is het kijken naar de verschillen en de
overeenkomsten tussen personen. Met de verschillen kan men de proefpersonen/objecten
in categorieën indelen. De categorieën moeten aan een aantal punten voldoen:
- Alle proefpersonen binnen een categorie moeten dezelfde eigenschap vertonen als
de anderen in deze categorie. (maar niet gelijk aan personen buiten deze categorie)
- De categorieën wederkerig uitsluitend (mutually exclusive) zijn. Dat betekent dat
elke proefpersoon maar in één categorie ingedeeld kan worden.
- De categorieën moeten exhaustive zijn: er mogen geen personen buiten de
categorieën vallen. (Cijfers worden hier alleen gebruikt als label voor de categorieën.
Ze hebben geen wiskundige waarde: er kan dus niet gekeken worden naar de
kwantitatieve significantie.)
Rangorde
De rangorde van de cijfers bevat informatie over de relatieve omvang van een eigenschap
die mensen bezitten. Dus of je in meer of mindere mate een eigenschap bezit in vergelijking
met de andere mensen in de categorie. De labels geven alleen een betekenis aan de
rangorde binnen de categorie, maar hebben geen wiskundige betekenis.
Kwantiteit
Bij de kwantiteit zijn de echte cijfers (continu) per persoon gegeven en kan dus gekeken
worden naar de grootte van het verschil tussen twee personen. Op dit niveau hebben de
cijfers ook een wiskundige betekenis, met deze cijfers kunnen berekeningen worden
gemaakt. Wanneer er psychologische metingen worden gedaan wordt er vaak aangenomen
dat de scores de eigenschap van kwantiteit bevatten, maar dit is zeker niet altijd waar.
Het getal 0
Er zijn twee potentiële betekenissen van nul:
- het object of de persoon bestaat niet (absolute nul), bijvoorbeeld bij de reactietijd.
- Nul kan ook een arbitraire hoeveelheid zijn van een eigenschap (relatieve of
arbitraire nul). In dit geval kan men denken aan een klok of thermometer. (een
willekeurig punt in een meetschaal: 0 graden laat geen afwezigheid van warmte of
kou zien)
Het is belangrijk om te kijken of de nul in een psychologische test relatief of absoluut is. Het
kan voorkomen dat de test nul aangeeft terwijl de persoon die eigenschap wel heeft. Dan
kan je het opvatten als een relatieve nul terwijl het eerst als absolute nul bedoeld was.
3 manieren waarop een meting arbitrair kan zijn:
- Het formaat van de unit kan arbitrair zijn (bij het kiezen van de xrod kon je elke maat
kiezen want je verzint deze maat zelf)
- Sommige units van metingen zijn niet gebonden aan een specifiek object (met
, pounds kun je allerlei objecten wegen)
- Sommige units van metingen kunnen, wanneer zij een fysieke vorm aannemen,
meerdere kenmerken van een object meten. (een tas met boodschappen kan 4xrod
wegen, maar ook 2.5 kg, of 5 pounds)
Additivity
Elk stukje eenheid is gelijk. Bij toevoeging van een eenheid komt er elke keer één bij. Dit is
constant. Ook als de condities van de meting veranderen, blijft de grootte van de eenheid
hetzelfde (conjoint measurement). Bij een vragenlijst zijn er vragen die makkelijk zijn en
vragen die moeilijk zijn. Daardoor kan er bij de meeste vragenlijsten niet bij elke vraag één
punt worden toegekend. Er kunnen meer punten worden toegekend bij vragen die moeilijker
zijn. Maar hoeveel punten kent men aan een vraag toe? Dit geeft een paradox: We willen
een psychologische eigenschap vertalen in een lijst cijfers om naar de hoeveelheid te
kijken, maar dit kan niet precies omdat we niet weten hoeveel precieze eenheid er bij een
psychologische eigenschap kan zijn.
Counts
Een strijdpunt over de relatie tussen tellen en meten komt naar boven wanneer we dingen
gaan tellen in plaats van eigenschappen. Tellen is alleen gelijk aan meten wanneer de
hoeveelheid van een kenmerk of eigenschap bedoeld is om de hoeveelheid van een
kenmerk van een object weer te geven.
Meetschalen (NOIR):
categorisch/kwalitatief (categorical/qualitative)
- nominaal (nominal) : ongeordende categorieën (kleur ogen)
- ordinaal (ordinal) : geordende categorieën (opl. niveau)
kwantitatief/numeriek (quantitative/numerical)
- interval (interval) : gelijke afstand tussen opeenvolgende waarden (°C)
- ratio (ratio): gelijke afstand én absoluut nulpunt (K)