Testtheorie Aantekeningen
College 1
Hoofdstuk 2
Testtheorie:
- Testconstructie Hoe zet je een test in elkaar?
- Testgebruik Hoe neem je een test af?
- Test evaluatie Hoe evalueer/analyseer je een test?
Test = systematisch onderzoek van gedrag met behulp van speciaal geselecteerde vragen/opgaven
met als doel inzicht in (psychologische) kenmerken van een individu in vergelijking met anderen.
Doel: voorspellen, classificeren, beschrijven -> in vergelijking met anderen.
Psychologische test
Meten psychologische eigenschappen (intelligentie, persoonlijkheid) -> psychologische
eigenschappen zijn niet direct waarneembaar of meetbaar -> daarom indicatoren (items) opstellen
die gedrag oproepen dat iets zegt over het te meten construct.
Psychologische tests worden alleen afgenomen wanneer je geen goed beeld hebt van een persoon.
Een test is een hulpmiddel, dus pas op voor het absoluut maken van testscores (test is nooit 100% de
uitslag). Er kan alleen een oordeel tot stand komen op basis van een combinatie van verschillende
waarnemingen (test, schoolresultaten, observatie, enz.). Dus vertrouw niet blind op een enkele
testuitslag.
Kenmerken van een goede test (bosven TENTAMEN)
- Betrouwbaarheid
Bij herhaalde metingen (ongeveer) dezelfde score.
- Objectiviteit
Het niet uitmaakt wie de beoordelaar is.
- Standaardisatie
Testprocedure voor alle respondenten gelijk / gelijke omstandigheden (zelfde instructie, zelfde
tijdslimiet, zelfde condities)
Beperk storende omgevingsinvloeden (lawaai, pratende mensen, lichtval, temperatuur,
ventilatie, afkijken, mensen die ruimte binnenkomen of verlaten).
Condities van proefpersonen gelijk (lichamelijke en geestelijke conditie, emotionele opwinding,
motivatie, angst voor slechte prestatie)
- Validiteit
Aan zijn doel beantwoorden / doet waar die bestemd voor is
- Predicatieve validiteit mate om criterium te voorspellen
- Concurrent validiteit gelijktijdig andere metingen doen
- Content validiteit mate waarin test construct meet
- Construct validiteit te meten begrip voldoende uitgewerkt in de verschillende aspecten?
- Efficiëntie
Gericht op het meten van het hypothetische construct (kenmerk) en verder niets.
- Normering
Testscores van verschillende respondenten zijn vergelijkbaar door middel van normen (= ruwe
data vertalen naar score). Score zegt iets over de populatie.
Een norm is een referentiekader voor de evaluatie van de ruwe score. Deze is gebaseerd op de
kenmerken van de verdeling van ruwe scores in de populatie. Deze kenmerken worden geschat
op basis van een representatieve steekproef.
Normering noodzakelijk bij interpretatie en beoordeling van testprestatie.
1
,Objectiviteit
Valkuilen (gedrag) proefleider
- Vooroordelen
- Sympathieën en antipathieën = medegevoel en afkeer
- Eerste indruk
- Vermoedens bevestigd willen zien
- Ideaaltypen willen vinden
- Eigen theorieën bevestigd willen zien
Onderzoeken in hoeverre beoordelaars op eenzelfde manier scores toekennen
Correlatie tussen de scores
- Kendalls Tau correlatie tussen rangscores
- Spearmans Rho correlatie tussen rangscores
- Cohen’s Kappa
Po = geobserveerde proportie Wel Niet
Wel 20 10 30
overeenstemming
Niet 20 50 70
Diagonaal optellen / totaal 40 60 100
(20+50)/100 = 0,70
Wel Niet
Pt = verwachte proportie Wel 12 (30*40/100) 18 (30*60/100) 30
overeenstemming Niet 28 (70*40/100) 42 (70*60/100) 70
Diagonaal optellen / totaal 40 60 100
(12+42)/100 = 0,54
p o− pt
Kappa =
1−p t
0,70−0,54
= 0,348
1−0,54
0.00 – 0.20 gering
0.20 – 0.40 matig
0.40 – 0.60 redelijk
0.60 – 0.80 voldoende tot goed
0.80 – 1.00 bijna perfect
Mogelijke test-toepassingen
- Voorspelling doen succeskans VWO
- Keuze maken beroepkeuzetest
- Sterkte/zwakte analyse effect cursus
- Interne vergelijking onderzoek bij één iemand
- Beschrijving persoonlijkheid
- Startpunt probleemanalyse t.b.v. counseling (= hulpverlening)
2
,Hoofdstuk 3
Indeling volgens testgedrag (TENTAMEN lijsten kennen)
Beide totaal andere insteek van testen
- Prestatieniveau (tentamens, IQ-test)
- Maximale prestatie
- Totaalscore
- Intelligentie, cognitieve capaciteiten, kennis
- Gedragswijze
- Hoe iemand doet, hoe iemand reageert
- Persoonlijkheidstrek, voorkeuren, attitudes
3
, Problemen met test voor gedragswijze
- Overeenkomst testgedrag en gedrag dagelijks leven
- Geen objectief criterium/beoordeling
- Persoonlijkheidstrekken zijn minder stabiel, minder generaliseerbaar, minder gelijkmatig van
invloed op gedrag
Andere testindelingen
- Structuur (instructie en afneming)
- Individuele versus groepstests
- Snelheid en niveau
- Testvragen
- Cultuurvrij versus niet cultuurvrij
- Direct versus indirect (betekenis wel/niet duidelijk voor onderzochte)
- Vrije-antwoord versus keuze-antwoord
4