Testtheorie | Marleen de Jong
Hoorcolleges Testtheorie
Hoorcollege 1 – Inleiding en basiskennis statistiek
Introductie
- Voor het meten bij individuen gebruik je meestal een test met veel items
- Items als indicatoren voor een construct (perfectionisme)
1. Aan antwoorden worden scores toegekend (itemscores)
2. Itemscores worden verwerkt tot testscores (meestal optellen)
3. Testscores worden geïnterpreteerd
Wat kun je zeggen over iemands perfectionisme op basis van de testscores?
- Zijn de testscores zinvol te interpreteren?
- Meet de test wel perfectionisme? Hoe kom je daarachter?
- Zijn de vragen/opdrachten wel van goede kwaliteit?
- Zijn er wel genoeg vragen in de test?
- Iemand heeft een score 14 en een ander heeft een score 15. Is dit verschil groot genoeg om te
concluderen dat ze verschillen in perfectionisme?
Positie-driehoek over psychologische testen
1
, Testtheorie | Marleen de Jong
- Tests worden veel gebruikt om te meten in de psychologie, meestal de handigste manier om
aan gegevens te komen
- Als je goed en nauwkeurig wilt meten, heb je een goede test nodig. Anders sloppy science!
- Voor het maken van een goede test zijn helaas geen kant-en-klare regels. Het vereist
voortdurend goed nadenken, goede kennis van de te meten eigenschap, goed gebruik van
statistische methoden
- Er zijn wel handvaten: Die worden behandeld in testtheorie
Statistische basiskennis
Scores van 5 respondenten op 3 tests
̅ ): het gemiddelde van de testscores (𝑋)
Gemiddelde (𝑿
∑𝑁
𝑖=1 𝑋𝑖
𝑋̅ =
𝑁
(6+9+7+10+8)
Vb. 𝑋̅ = =8
5
Gemiddelde (𝒙
̅): het gemiddelde van de afwijkingsscores (𝑥)
- 𝑥̅ is altijd 0
∑𝑁
𝑖=1 𝑥𝑖
𝑥̅ =
𝑁
(−2+1+−1+2+0)
Vb. 𝑥̅ = =0
5
2
, Testtheorie | Marleen de Jong
Gemiddelde (𝒛̅𝑿 ): het gemiddelde van de standaardscores (𝑧𝑋 )
- 𝑧̅𝑋 is altijd 0
∑𝑁
𝑖=1 𝑧𝑋𝑖
𝑧̅𝑋 =
𝑁
(−1.41+0.71+−0.71+1.41+0)
Vb. 𝑧̅𝑋 = =0
5
Deviatiescore (x): het verschil tussen de score X en het gemiddelde 𝑋̅
𝑥 = 𝑋 − 𝑋̅
Variantie (𝑺𝟐𝑿 𝒐𝒇 𝑺𝟐 (𝑿)): de variantie van testscores (𝑋)
- Spreidingsmaat, moeilijk te interpreteren
∑𝑁 ̅ 2 ∑𝑁
𝑖=1(𝑋 − 𝑋 )
2
𝑖=1 𝑥𝑖
𝑆𝑋2 = =
𝑁 𝑁
((−2)2 +12 +(−1)2 +22 +02 )
Vb. 𝑆𝑋2 = =2
5
Variantie binair item (𝑺𝟐𝑿 𝒐𝒇 𝑺𝟐 (𝑿)):
𝑆𝑋2 = 𝑝𝑞
Vb. 𝑆𝑋2 = 0.60 ∗ 0.40 = 0.24
3
, Testtheorie | Marleen de Jong
Variantie (𝑺𝟐𝒙 𝒐𝒇 𝑺𝟐 (𝒙)): de variantie van afwijkingsscores (𝑥)
- 𝑆 2 (𝑥) is altijd gelijk aan 𝑆 2 (𝑋) → variantie is gelijk, dus SD is gelijk → zelfde spreiding, alleen
bij 𝑥 heb je 𝑋 − 𝑋̅ gedaan
∑𝑁
𝑖=1(𝑥 − 𝑥̅ )
2
𝑆𝑥2 =
𝑁
((−2−0)2 +(1−0)2 +(−1−0)2 +(2−0)2 +(0−0)2 )
Vb. 𝑆𝑥2 = =2
5
Variantie (𝑺𝟐𝒛𝑿 𝒐𝒇 𝑺𝟐 (𝒛𝑿 )): de variantie van de standaardscores (𝑧𝑋 )
- 𝑆 2 (𝑧𝑋 )is altijd 1
∑𝑁
𝑖=1(𝑧𝑋 − 𝑧̅𝑋 )
2
𝑆 2 (𝑧𝑋 ) =
𝑁
((−1.41−0)2 +(0.71−0)2 +(−0.71−0)2 +(1.41−0)2 +(0−0)2 )
Vb. 𝑆 2 (𝑧𝑋 ) = =1
5
Standaarddeviatie (𝑺𝑿 𝒐𝒇 𝑺(𝑿)): de standaarddeviatie van de testscores (X)
𝑆𝑋 = √𝑆𝑋2
Vb. 𝑆𝑋 = √2 = 1.41
Standaarddeviatie (𝑺𝒙 𝒐𝒇 𝑺(𝒙)): de standaarddeviatie van de afwijkingsscores (𝑥)
𝑆𝑥 = √𝑆𝑥2
Vb. 𝑆𝑥 = √2 = 1.41
4
, Testtheorie | Marleen de Jong
Standaarddeviatie (𝑺𝒛𝑿 𝒐𝒇 𝑺(𝒛𝑿)): de standaarddeviatie van de standaardscores (𝑧𝑋 )
- Gemiddelde afstand tot het gemiddelde → hier liggen de meeste scores in
- 𝑆𝑧𝑋 is altijd 1
𝑆𝑧𝑋 = √𝑆𝑧2𝑋
Vb. 𝑆𝑧𝑋 = √1 = 1
Standaardscores (of z-scores):
𝑥
𝑧𝑥 =
𝑆𝑋
−2
Vb. 𝑧𝑥 = = −1.41
1.41
Covariantie (𝑺𝑿𝒀 ):
- Aan de hand van de covariantie kun je enkel iets
zeggen over de richting van de samenhang
- Positieve covariantie = positief scoren op het ene
item betekent hoog scoren op het andere item;
hoog scoren op meerdere items is een indicatie dat
er een onderliggende trek is
∑𝑁
𝑖=1 𝑥𝑖 𝑦𝑖
𝑆𝑋𝑌 = 𝑐𝑋𝑌 =
𝑁
((−2×−0.2)+(1×−0.2)+(−1×−0.2)+(2×0.8)+(0×−0.2))
Vb. 𝑆𝑋𝑌 = = 0.4
5
Covariantie (𝑺𝒛𝑿𝒛𝒀 ):
- 𝑆𝑧𝑋𝑧𝑌 is gelijk aan 𝑟𝑋𝑌
∑𝑁
𝑖=1 𝑧𝑥𝑖 𝑧𝑦𝑖
𝑆𝑧𝑋𝑧𝑌 =
𝑁
((−1.41×−0.5)+(0.71×−0.5)+(−0.71×−0.5)+(1.41×2)+(0×−0.5))
Vb. 𝑆𝑧𝑋 𝑧𝑌 = = 0.71
5
5
, Testtheorie | Marleen de Jong
Correlatie (𝒓𝑿𝒀 ):
- Aan de hand van de correlatie kun je iets zeggen over de richting en de sterkte van het
verband, omdat de correlatie gestandaardiseerd is
𝑆𝑋𝑌
𝑟𝑋𝑌 =
𝑆𝑋 × 𝑆𝑌
0.4
Vb. 𝑟𝑋𝑌 = = 0.71
1.41 × 0.4
Covariantie en correlatie
Variantie-covariantiematrix
- Varianties op de diagonale elementen
- Covarianties op de buitendiagonale elementen
Correlatiematrix
- Enen op de diagonale elementen
- Correlaties op de buitendiagonale elementen
Hoorcollege 2 – Eigenschappen van tests en items
Wat is een psychologische test?
- Cronbach (1960): ‘a systematic procedure for comparing the behavior of two or more people’
→ een systematische procedure voor het vergelijken van gedrag van 2 of meer mensen →
met opzet zo vaag, omdat het veel verschillende vormen aan kan nemen
- Zo’n ‘procedure’ kan vele vormen aannemen:
o Multiple choice vaardigheidstest
o Open-ended persoonlijkheidsvragenlijst → geen antwoordopties, zelf beschrijven
o Systematische gedragsobservatie → bijv. op kleuterschool sociaal gedrag beoordelen, je
moet zelf observeren of leraar laten observeren
o Rorschach inktvlekkentest
6
, Testtheorie | Marleen de Jong
- 3 cruciale eigenschappen:
o Gericht op gedragsmeting (observeerbaar) → gaan over dingen die we kunnen observeren
→ we zijn empirische wetenschap, dus we praten over dingen die we kunnen zien → als het
ware gedrag uitlokken, waarmee we alsnog iets zinnigs kunnen zeggen over direct
observeerbare eigenschap
o Systematisch (objectief) → iedereen weet van tevoren hoe het eruit gaat zien en hoe men
beoordeeld gaat worden
o Vergelijken van verschillende personen* → we hebben het idee dat we in psychologie op
zoek zijn naar persoonseigenschappen. We willen zicht krijgen op verschillen tussen mensen.
Je wilt mensen kunnen vergelijken. Je wilt individuele verschillen naar de voorgrond halen:
voordat je een test afneemt, ga je er eigenlijk vanuit dát mensen verschillen, maar je weet nog
niet hoe. Je wilt die verschillen waarvan je aanneemt dat ze er zijn naar de voorgrond brengen
en daarmee dus in beeld krijgen zodat je er iets zinnigs over kan zeggen
* of van personen over tijd! → bijv. bij behandeling van klinische populatie: voor en na →
zelfde persoon op tijdstip 1 en 2
→ Dus test beoordelen op mate waarin ze die verschillen kunnen blootleggen
Type tests (1)
- Tests voor prestatieniveau vs. gedragswijze:
o Maximum versus typical performance
▪ Maximum performance tests → voor meten van vaardigheden: degene die de test
krijgt doet zijn best om zo goed mogelijk te presteren. Antwoorden zijn in meer of
mindere mate goed. Bijv. tentamen, intelligentietest. Er zijn al
antwoordmogelijkheden vastgesteld
▪ Typical performance tests → persoonseigenschappen die niet per se vaardigheden
zijn, maar zeggen wel iets relevants over personen, bijv.
persoonlijkheidseigenschappen, depressieniveau. We zijn niet zo zeer op zoek naar de
hoogst mogelijke prestatie, maar dat je zo’n typisch en eerlijk mogelijk beeld van
jezelf weergeeft op die test. het is dus belangrijker dat je eerlijke antwoorden geeft,
dan dat je de hoogst mogelijke prestatie haalt. Iedere psychologische test die geen
maximum performance test is, is een typical performance test. Moet brede range van
antwoordmogelijkheden bieden, er is geen goed antwoord → vaak met Likert schalen
waarin je met stellingen werkt waarbij mensen moeten aangeven of ze het in
meerdere of mindere mate mee eens zijn
o Prestatieniveautests voor meten vaardigheden
o Gedragswijzetests voor meten o.a. persoonlijkheidseigenschappen & attitudes
o Grote verschillen voor de aanpak bij de testontwikkeling
o Nauwelijks verschillen voor statistische analyse van testscores
7
, Testtheorie | Marleen de Jong
Type tests (2)
- 2 type tests voor prestatieniveau:
o ‘Power’ tests → denk je bijna standaard aan als je het hebt over maximum performance test
▪ Meten vaardigheid zonder tijdsdruk → waarschijnlijk wel praktische tijdslimiet,
maar er wordt vanuit gegaan dat het niet voor een beperking zorgt
▪ Meer vaardige personen maken meer vragen goed
o ‘Speed’ tests
▪ Meten prestaties onder zware tijdsdruk → hoeveel antwoorden heb je
gegeven binnen een bepaalde tijd, of hoe lang deed je erover om een aantal
vragen te maken? Hoe snel ben je in staat om iets te doen?
▪ Vragen zijn van triviale moeilijkheid → eigenlijk simpele vragen, iedereen
kan de goede antwoorden vinden
▪ Meer vaardige personen beantwoorden meer vragen
▪ Vb speed test: Bourdon dot concentration test → zo snel mogelijk en alleen de
sets van 4 puntjes doorkruisen en ook allen die van 4 puntjes door te kruisen → je
moet snelle visuele analyse van omgeving geven
Type tests (3)
- Normgericht of criteriumgericht → 2 manieren waarop je een testscore kan interpreteren
o Normgerichte tests vergelijken personen met de rest van de populatie → hoe verhoudt
iemand zich tot de rest van de mensen uit de populatie? Kijken naar verdeling van scores in
een bepaalde populatie → bijv. percentielscores
▪ Goede normgegevens over deze populatie zijn van groot belang
o Criteriumgericht tests vergelijken personen met een absolute standaard → richten op
objectief criterium, los van de populatie waar iemand toe behoort
▪ Testoordeel staat los van prestatieniveau in de populatie
▪ Vb: tentamen testtheorie is criteriumgericht → lat wordt aan de hand van
objectief criterium vastgesteld. Men wordt vergeleken met dat absolute criterium
Wat hoort er bij een psychologische test? → Heb je best wat bij nodig om het in te kunnen zetten
- Testmateriaal
o Voorbeeld testmateriaal:
Kinderen worden gevraagd om incomplete plaatjes te benoemen. Je noteert het antwoord van
het kindje en na afloop kijk je hoe je dit moet scoren
8