OMT I: PSYCHOMETRIE’24 - hoorcolleges
HOC 1 - psychometrie
belang van psychologische testen voor psychologen en in het dagelijkse leven
begrijpen
definiëren wat een psychologische test is
de gevolgen van deze definitie van psychologische testen begrijpen
inzicht hebben in de geschiedenis van psychologische testen
HOC 2 - meetschalen
verschillende categorieën van psychologische testen kunnen onderscheiden
operationaliseren van constructen adhv psychologische testen begrijpen
begrijpen hoe we van antwoorden op testen tot getallen in testscores komen
eigenschappen van getallen begrijpen en kunnen toepassen op testscores
meetniveaus van psychologische testen begrijpen
begrijpen hoe meetniveaus in de praktijk gebruikt worden
HOC 3 - individuele verschillen
verdeling van scores kunnen beschrijven adhv karakteristieke waarden van positie,
spreiding, en de vorm van de verdeling
scatterplot kunnen interpreteren
verband tussen 2 continue variabelen schatten adhv covariantie en correlatie
verband tussen 2 dichotome variabelen schatten adhv lambda en chi-kwadraat
normaalverdeling interpreteren adhv gemiddelde en standaarddeviatie
HOC 4 - transformatie meetwaarden
normaalverdeling kunnen toepassen om te berekenen hoeveel % van observaties in
bepaald gebied liggen
verschillende (groepen) transformatie meetwaarden van elkaar kunnen
onderscheiden
ruwe scores omvormen tot transformatie meetwaarden
kunnen uitleggen wat voor- en nadelen zijn van verschillende transformatie
meetwaarden
begrijpen hoe normen samengesteld worden en wat voorwaarden van goede normen
zijn
HOC 5 - betrouwbaarheid
basisassumpties van klassieke test theorie begrijpen
begrijpen hoe klassieke test theorie betrouwbaarheid definieert
betrouwbaarheid op 4 verschillende manieren kunnen berekenen, gebruik makend
van geobserveerde scores, true scores, en meetfouten
standaardmeetfout kunnen berekenen en interpreteren
begrijpen welke assumpties parallelle testen maken, en hoe deze kunnen helpen om
betrouwbaarheid te schatten in de praktijk
1
,HOC 6 - betrouwbaarheid schatten
verschillen tussen parallelle testen, test-hertest, en interne consistentie benadering
om betrouwbaarheid te schatten begrijpen
betrouwbaarheid kunnen schatten adhv paralleltestbetrouwbaarheid,
test-hertestbetrouwbaarheid, split - half betrouwbaarheid, ruwe en
gestandaardiseerde Cronbach Alfa, KR20, en omega
assumpties bij elke methode om betrouwbaarheid te schatten/begrijpen
begrijpen hoe de samenstelling van de steekproef en de lengte van de test een
invloed hebben op geschatte betrouwbaarheid
HOC 7 - constructvaliditeit
begrijpen wat constructvaliditeit is en wat het belang ervan is
constructvaliditeit op verschillende manieren kunnen beoordelen (inhoudsvaliditeit,
interne structuur, antwoord processen, relaties met andere variabelen, gevolgen van
de test)
verband tussen betrouwbaarheid en constructvaliditeit begrijpen
HOC 8 - constructvaliditeit schatten a.d.h.v verbanden
je kan constructvaliditeit beoordelen a.d.h.v. nomologisch netwerk
je kan verschillende soorten validiteit coëfficiënten in een nomologisch netwerk van
elkaar onderscheiden
je kan een MTMM-matrix beoordelen
je begrijpt hoe true score correlaties, meetfouten, range restriction, en
methodevariantie validiteits coëfficiënten beïnvloeden
je kan een correlatiecoëfficiënt en validiteit coëfficiënten corrigeren voor meetfouten
HOC 9 - response bias
verschillende soorten respons biasen identificeren en van elkaar kunne
onderscheiden
begrijpen hoe response biases de betrouwbaarheid en constructvaliditeit van testen
kan bedreigen
methoden om response bias te voorkomen, minimaliseren, of detecteren kennen.
begrijpen wanneer je welke methode kan gebruiken
HOC 10 - itemanalyse EN itemresponstheorie
je kan item-moeilijkheidsindex, item-betrouwbaarheidsindex, item - validiteit index, en
item-discriminatieindex berekenen en interpreteren
je begrijpt basisprincipes van IRT modellen (1PL, 2PL, 3PL, graded response model)
en kan ze toepassen
je kan item-moeilijkheid en trait-level bij een 1PL model schatten
je kan item- en test-informatiewaarde berekenen en interpreteren
je begrijpt hoe differential item functioning kan worden gebruikt om construct validiteit
te beoordelen
2
,HOC 11 - test accuraatheid
- je kan observaties indelen in true positives, true negatives, false positives en false
negatives
- je kan test accuraatheid schatten adhv sensitiviteit, specificiteit, false positive rate,
false negative rate, predictive value, en likelihood ratio
- je kan Bayes theorem toepassen op diagnostische data
- je begrijpt de afwegingen die gemaakt moeten worden bij de keuze van een cut-off
- je kan een ROC curve en area under the curve interpreteren
3
,HOC 1:PSYCHOMETRIE
wooclap - ‘Is dit een psychologische test?’
- inktvlekkentest/Rorschach test: psychologische test, veel gebruikt,
wel discussie over kwaliteit, bestaat uit een aantal afbeeldingen, cliënt
moet zeggen wat hij ziet, obv zijn/haar antwoord gaat de therapeut na
of er al dan niet sprake is van een persoonlijkheidsstoornis
- ishihara test/kleurenblindheid: psychologische
test, focus op zintuiglijke waarneming, kan
relevant zijn om diagnose te stellen
- enquête in de Flair: psychologische test
- stellingen: psychologische test, voldoet aan alle
kenmerken van psychologische test, meet de
attitudes tov autoriteit, goede voorspeller
stemmingen Donald Trump
⇒ kwaliteit van een test beslist niet of het wel/niet een psychologische test is
Wat zijn psychologische testen?
= systematische procedure om het gedrag van twee of meer personen te vergelijken (intEr
individuele verschillen), of om het gedrag van een persoon op verschillende momenten te
vergelijken (intrA individuele verschillen) (Cortenbach)
- inter individuele verschillen → verschil IQ tussen 2 personen
- intra individuele verschillen → test afnemen bij 1 persoon en kijken hoe bv IQ evolueert
1. systematische procedures (gestandaardiseerd)
= alle deelnemers krijgen dezelfde vragen te zien en dezelfde antwoordopties, voor
elke persoon wordt op dezelfde manier een totaalscore berekend
1. testontwikkeling
= psychologische test wordt ontwikkeld obv wetenschappelijk
onderzoek, testontwikkelaar stelt een item pool (specifieke stelling,
vragen, ….) op, uit de item pool worden de beste items geselecteerd
(items die goed scoren op of bijdragen aan psychometrische
kenmerken zoals betrouwbaarheid predictieve validiteit, test
accuraatheid, …)
→ psycholoog gebruikt procedure om tot bepaalde vragen te komen
→ belangrijk dat het item meet wat het beoogt te meten, procedure
moet duidelijk zijn, anders kunnen we nadien de deelnemers niet
vergelijken
2. testafname
= gestandaardiseerde manier om test af te nemen
→ bv Digit span test: reeks cijfers, persoon moet de cijfers herhalen
→ doel: afname van de test op dezelfde manier afnemen bij alle
deelnemers
3. test scoring en interpretatie
= Hoe worden de antwoorden op de verschillende items omgezet in
een score en hoe moeten we deze interpreteren?
4
, - objectieve scoren = heel duidelijk
○ vooraf duidelijk bepalen van de antwoorden, scores,
respons wordt vergeleken met een lijst waarin alle
mogelijke responsen opgesomd werden en waarbij
vervolgens de bijbehorende score kan worden
opgezocht
○ gevolg: 2 deelnemers met dezelfde responsen komen
automatisch tot dezelfde conclusie (Big Five)
bv: Bij een examen weet de prof welke antwoordopties de studenten krijgen en hij weet ook
welke getallen hij met welke antwoordopties verbindt. ALs er 5 antwoordopties zijn, dan is er
slechts 1 juist en dan wordt daar het getal 1 aangebonden en er zijn vier die fout zijn en daar
wordt het getal 4 aan gebonden. Dit werd allemaal op voorhand bepaald. De totaalscore
wordt gebruikt om een uitspraak te doen van het concept dat men wil meten. Op een
examen is dat meestal kennis over een bepaald vak.
- ⇔ subjectieve scoren
○ antwoordmogelijkheden niet op voorhand gekend
○ (bv: Rorschach)
○ werken met richtlijnen/principes
○ nadeel: 2 verschillende personen kunnen richtlijnen
anders toepassen en zo tot andere conclusies komen
○ subjectiviteit van de testleider:
2. leveren staal van gedrag op
= inzicht in een bepaald fenomeen obv beperkt aantal vragen/items te bevragen
- test bestaat uit een eindig aantal items (vragen/stellingen/opdrachten)
- selectie van deze items is cruciaal, ze moeten een representatief ‘staal’ van
gedrag meten, deze items moeten niet noodzakelijk een rechtstreekse
afspiegeling zijn van het gedrag dat we wensen te meten
- bepaalde vraag moet gedrag kunnen voorspellen
- bv: stel dat ‘veel water drinken’ gelinkt is aan depressie, dan kan ‘Hoeveel
glazen water drinkt u per dag?’ een voorspelling zijn van depressie
3. leveren test score/totaalscore/schaalscore op
= door alle scores per dimensie/vragen op te tellen doe je als onderzoeker uitspraken
→ bv: mensen met elkaar vergelijken door ze op een continuüm te plaatsen (IQ-test)
- ‘whatever exists at all exists in some amount’ - Thorndike
- ‘anything that exists in amount can be measured’ - McCall
- met een test willen we een bepaald psychologisch kenmerk (construct meten)
- we gaan er van uit dat elke persoon dit kenmerk in zekere mate bezit
- een testscore is een schatting van de ‘mate/hoeveelheid’ waarin dit kenmerk
bij een persoon aanwezig is
- elke test scoren bevat echter een zekere meetfout: X = T+E (E= meetfout)
○ geen enkele test is beperkt, met een test probeert men de X
(geobserveerde score) te bekomen en uitspraken te doen over een
bepaald fenomeen dat men wil bestuderen
○ het concept of fenomeen dat men probeert te omschrijven T (true
score/werkelijke score/ fenomeen waarover uitspraken gedaan
worden)
5
, ○ de score die je als onderzoeker observeert is niet noodzakelijk gelijk
aan de werkelijke score: een test hangt af van een beperkte staal van
het gedrag om obv daarvan een niet direct observeerbare (afgeleide
eigenschap) in te schatten
○ goede test = X zo dicht mogelijk bij de werkelijke score (T) ligt
en de error (e) zo klein mogelijk
○ Hoe groter de meetfouten, hoe slechter de test
○ opmerking: meetfout zal nooit 0 zijn en voor elke onderzochte
deelnemer zal “E” een andere waarde hebben
○ psychologische testen meten geen “ding” dat echt fysisch
bestaat, wel een abstractie (abstract begrip/construct), dat
bruikbaar is om niet-testgedrag te voorspellen
4. maken gebruik van normen en standaarden
- Stel dat je een score 130 op een IQ test uitkomt, hoe moet je dit
interpreteren?
- norm = samenvatting van testresultaten voor een grote steekproef die
representatief is voor een populatie
- NIET ELKE TEST HEEFT NORMEN
- norm-referenced = normen gebruiken om een score te kunnen interpreteren
⇔ criterion-referenced testen = criterium gebruiken (bv:geslaagd=50% halen)
5. voorspellen gedrag buiten de test
- uiteindelijk doel is niet om te voorspellen hoe iemand scoort op de test zelf,
maar hoe iemand zich zal gedragen buiten de testomstandigheden
- bv: Balloon Analogue Risk Task (BART): computertest, inschatten in welke
mate je risico's neemt: ballon opblazen door op knop te drukken, bedrag stijgt
→ niet geïnteresseerd in hoe men ballonnen opblaast, wel in welke mate men
risico neemt
➢ 1ste test die iedereen aflegt bij geboorte(België)(afgenomen door verpleegkundige)
- Virginia Apgar/APGAR score voor pasgeborenen(psychologische
scoringstest)
1. Activiteit(spiertonus)
2. Pols(hartslag)
3. Grimas (reflex, responsiviteit)
4. Aanblik (huidskleur)
5. Respiratie (ademhaling)
⇒ op elk van de 5 kenmerken geven ze een score (0 slecht -2 goed),
totaalscore berekenen per dimensie, gezondheid van de baby beoordelen
(7-10 = gezond) (4,5,6,7 = ingrijpen) (lager dan 4 = reanimeren)
⇒ op latere leeftijd zou de peuter die vroeger een lage APGAR score had
mogelijks in aanmerking komen met ontwikkelingsstoornissen
- laat zien hoe belangrijk psychologische tests zijn in het dagelijks leven
6