Samenvatting Psychometrie
Week 1: Meten, schaling en normen
Wat is psychometrie tak van psychologie die zich bezig houdt met de ontwikkeling en het
gebruik van psychologische tests, toepassen van statistische technieken op het gebied van
psychologische testen. Gaat ook over normen, betrouwbaarheid en validiteit.
Meten van psychologische eigenschappen observeerbaar gedrag dat gevoelig is voor
varianties in het psychologisch construct. Psychologische test Systematische verzameling
(antwoorden op vragen van test), met als doel om vergelijkingen te maken (tussen of binnen
personen). Van de afgeleide gevolgen, leiden we iets af over de persoon. Latente variabele = niet-
direct observeerbaar construct.
Schaling definitie (toekennen van numerieke waarde aan psychologische eigenschappen) in
praktijk (hoe wordt testscore of categorie bepaald aan hand van observaties). Eigenschappen van
getallen meetniveau (nominaal, ordinaal, interval, ratio). Meestal is schaling het aantal “goed”
geantwoorde items.
Interpretatie van testscores test (systematische verzameling gedrag), schaling (toekennen van
kwantitatieve testscore), normen (interpretatie van testscore). Alleen het getal betekent niets.
Standaardscore Zx aantal standaarddeviaties van gemiddelde, zowel positieve als negatieve
X− X
waarden, gemiddelde = 0, sd = 1. Z x = . Bij psychopathologische verdelingen heb je meestal
SD X
een positief scheve verdeling. Betekenis van standaarddeviaties ± 1 = 68,2%; ± 2 = 94,4%; ±3
= 99,7%.
Getransformeerde standaardscore Tx makkelijker te begrijpen, alleen positieve waarden.
T x =10 ∙ Z X +50 . Gemiddelde = 50, SD = 10 (maar je kan ze elk gemiddelde geven). Om wat minder
vervelende score te maken, camoufleert, want een negatieve waarde is vervelend te krijgen.
Percentielscores/percentile ranks (Px) percentage scores lager of gelijk aan een specifieke
testscore.
Relatieve normen gebaseerd op testscores van representatieve normgroep, gemiddelde en
standaarddeviatie in target populatie, vergeleken met anderen. Absolute normen vaste
standaard/grens. Vergeleken met een vaste waarde.
COTAN controleert op normen actueel, groot genoeg en representatief zijn, maar ook de kwaliteit
van testmateriaal en handleiding, betrouwbaarheid, begripsvaliditeit en criteriumvaliditeit.
1
, Week 2: Betrouwbaarheid en klassieke testtheorie
Betrouwbaarheid in hoeverre geven mijn metingen altijd dezelfde uitkomst? In hoeverre zijn
individuele verschillen in testscore een functie van werkelijke individuele verschillen (ware scores)?
In welke mate is de test vrij van random meetfouten? Als mijn test meet dat mensen anders zijn, in
hoeverre zijn ze dan daadwerkelijk anders?
Validiteit in hoeverre meet een test wat hij beoogt te meten? In welke mate is de test vrij van
systematische meetfouten.
Klassieke testtheorie (KTT) voor elke persoon is de geobserveerde score gelijk aan de som
van de ware score en random error. X o=X t + X e . Ware score (hoe ik daadwerkelijk ben, latente
variabele). Error (verschil tussen geobserveerde score en ware score).
Assumpties: formule heeft geen praktisch nut, daarom aanvullende assumpties.
1) μe =0 gemiddelde error in populatie is nul. Geen systematische over- of onderschatting van
ware scores voor populatie als geheel.
2) r et =0 errors zijn voledig ongecorreleerd met ware scores. Geen systematische over- of
onderschatting van ware scores in deelpopulaties.
3) r e e =0 errors zijn volledig ongecorreleerd met elkaar. Error van persoon 1 zegt niets over
i j
error van persoon 2.
2 2 2
Variantie van Xo als samengestelde variabele: so =s t + s e .
Betrouwbaarheidscoëfficiënt (Rxx) proportie variantie van geobserveerde scores die verklaard
2 2 2 2 2
wordt door ware score. so =s t + s e of R xx =r ot =1−2 oe.
Betrouwbaarheid schatten met twee metingen. Parallelle metingen = alternate forms
(paralleltesten = twee verschillende testen voor hetzelfde construct) Test-hertest (zelfde test op twee
verschillende tijdstippen). Split-half (test opgesplitst in twee parallelle testhelften).
Twee paralleltesten algemene eis = twee metingen (X en Y), zijn parallel als ze exact dezelfde
2 2
ware score meten (Xt = Yt) (=tau equivalentie), identieke errorvarianties hebben ( S x =S y ). Gevolgen
e e
parallelliteit (identieke geobserveerde varianties en identieke correlaties met ware score). Alles wat X o
en Yo gemeen hebben, komt van gemeenschappelijke ware score (X t). Daarom moet partiële correlatie
0 zijn: R xy −r xt r yt =0.
Twee problemen:
1) Zijn testen werkelijk parallel? Nooit helemaal zeker. Gedeeltelijke oplossingen:
Domain sampling: selecteer k items van twee paralleltesten random uit populatie van
mogelijke item.
Gevolgen: als testen parallel zijn, moeten ze gelijke gemiddelden en
standaarddeviaties hebben.
2) Carry-over effecten: Doen van test 1 kan resultaten test beïnvloeden, kan leiden tot te hoge
correlatie tussen testen.
Test-hertest: betrouwbaarheid onderzoeken door dezelfde test nog een keer af te nemen, maar:
Mensen veranderen: met name op sommige kenmerken, in sommige perioden en bij meer
tijd tussen afnames.
2