SPO 2018-2019 Samenvatting
Testtheorie
Boek + Aantekeningen
,Formuleblad
1
, Hoofdstuk 1:
Alleen deel uit college
Historische voorlopers:
- Oude voorlopers (voorwetenschappelijke oordeelsvorming)
o 2000 BC China – vorderingen
o Oude Testament – Gideon persoonlijkheid
o ME en NT intelligentie –karaktereigenschappen (fysische kenmerken; astrologie)
- Wetenschappelijke benadering:
o 20e eeuw -systematisch bestuderen en empirisch funderen van test
Binet (belangrijke naam):
- Verbale complexe opgaven
- Via empirisch onderzoek → moeilijkheidsgraad
- Werken met een totaalscore
- Begrip mentale leeftijd
Terman – Stanford-Binet
- Formuleren van standaardinstructies
- Normen gebaseerd op representatieve streekproef
Stern:
- IQ = mentale leeftijd/kalender leeftijd x 100
Verdere ontwikkelingen:
Door nood aan selectie van personeel legen → de test in de stroomversnelling
- Europa
o Individuele diagnostiek, later ook collectief (CITO en COTAN)
- VS
o Collectief testen, migrantenproblemen → niet-verbale testen
- Engeland
o Tussenpositie, aandacht voor objectief evalueren van schoolprestaties (MC test)
Vanaf de jaren 50 is er stimulering van testgebruik gekomen en ontwikkeling van psychologie tot een
wetenschap.
Omschrijving van een test
Systematisch onderzoek van gedrag met behulp van speciaal geselecteerde vragen/opgaven (items)
met als doel inzicht in (psychologische) kenmerken van een individu in vergelijking met anderen.
Doel van testen: voorspellen, classificeren, beschrijven – in vergelijking met anderen!
2
, Hoofdstuk 2:
Definitie, kenmerken en toepassingen van de test
2.1 Wat is een test?
De Psychologische test:
- Psychologische testen meten psychologische eigenschappen, zoals bijvoorbeeld intelligentie
of persoonlijkheid.
- Psychologische eigenschappen zijn niet direct waarneembaar of meetbaar.
- Daarom construeren we indicatoren (items) die gedrag oproepen dat iets zegt over het te
meten construct (bijv. intelligentie)
Pas op…
- Psychologische tests worden alleen afgenomen wanneer je geen goed beeld hebt van een
persoon. Een test is een hulpmiddel, dus pas op voor het verabsoluteren van testscores.
- Een psycholoog dient m.b.v. de test tot een oordeel te komen, op basis van een combinatie
van verschillende waarnemingen.
- Dus vertrouw niet blind op een enkele testuitslag. Dit is b.v. een gevaar met testen op internet.
Onderdelen in een test:
- Testmateriaal: bijvoorbeeld een testboekje, tekenpapier.
- Testformulieren: hierop worden de antwoorden, reacties of gedragsgegevens verzameld.
- Testhandleiding: een handleiding varieert van een uitvoerig boekwerk tot beknopte richtlijnen.
Er moeten 4 onderwerpen terug komen:
- Testinstructie
- Verwerkingsprocedure
- Normtabellen
- De wetenschappelijke kwaliteiten van de test
De bedoeling van het testonderzoek is het doen van een uitspraak die een voorspelling, classificatie of
beschrijving met betrekking tot het onderzochte individu bevat. Een uitspraak over iemand heeft
alleen zin als de onderzochte ten aanzien van die eigenschap wordt vergeleken met anderen. De aard
en de grootte van de vergelijkingsgroep hebben belangrijke gevolgen voor de draagwijdte van de
conclusie ver de geteste persoon.
Een test = een systematisch onderzoek van gedrag met behulp van speciaal geselecteerde vragen of
opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk van de onderzochte in
vergelijking met anderen.
3
,Kenmerken van een test (BOSVEN):
- Betrouwbaarheid
- Objectiviteit
- Standaardisatie
- Validiteit
- Efficiëntie
- Normering
Efficiëntie
Het creëren van een testsituatie, waarin bijkomstigheden en storende invloeden zo veel mogelijk
worden geweerd.
Standaardisatie
Om iets over een testprestatie te kunnen zeggen, dient deze vergelijkbaar te zijn met de prestaties van
anderen. Wil je de onderzochte ter vergelijking naast anderen plaatsen, dan moet men de betrokkenen
in gelijke omstandigheden hebben zien opereren. Bij een goede test wordt de vergelijkbaarheid van
prestaties bereikt door de condities en invloeden die op de testprestatie kunnen inwerken zo vel
mogelijk te standaardiseren. De gelijkschakeling van de procedure van afneming, van testmateriaal,
instructie en oefenvoorbeelden, van tijdlimieten en verwerkingstegels zorgt voor een zo goed
mogelijke vergelijkbaarheid van testprestaties. De standaardisatie-eis is een norm waaraan een test
meer of minder kan beantwoorden. Deze eis is een ideaal waarnaar men bij tentconstructie en
testafneming zo veel mogelijk dient te streven.
Normering
Een genormeerde psychologische test is veel beter in staat een eisen te beantwoorden dan een
praktijkbeoordeling. Het vaststellen van een rangorde is de eenvoudigste vorm van normering. Vaak
kunnen afstanden tussen testscores in de normering worden opgenomen.
Een discrete verdeling kun je benaderen met een normaalverdeling (de Kolmogorov-Smirnov-toets). Is
de benadering redelijk, dan zou je vervolgens een geschikt gemiddelde en een geschikte
standaarddeviatie kunnen kiezen en de verdeling om kunnen zetten naar een normaalverdeling (dan
werk je met kansen en kun je precieze berekeningen maken). Hiermee verandert wel de schaal, maar
de personen houden dezelfde rangorde. De benadering met een normaalverdeling doe je doorgaans
als de steekproef uit een normaal verdeelde populatie afkomstig is, en je steekproeffouten wilt
gladstrijken. Het kiezen van nieuwe verdelingskenmerken, zoals gemiddelde en spreiding, doe je om
een handige schaal te verkrijgen.
De beschikbaarheid van normen is meestal een noodzakelijke voorwaarde voor het gebruik van een
test. In een enkel geval kan men volstaan met een ongenormeerde test. Bijvoorbeeld bin
experimenteel onderzoek waarin een relatie wordt nagegaan tussen een test en een andere variabelen
of in situaties waarin slechts binnen de onderzochte groep beslissingen moeten worden genomen,
zodat een rangorde volstaat. De beschikbaarheid van normen is nodig bij het gebruik van alle soorten
tests, dus ook bij observatietests en projectieve technieken. Dit geldt ook voor de Thematic
Apperception Test (TAT, inktvlekken test). Wanneer iemand hier iets is ziet, wil je juist weten of dit iets
is wat door anderen ook wordt gezien of juist niet. Dus ook dan is het belangrijk om een normering te
hebben.
4
,Objectiviteit
Objectiviteit is de onafhankelijkheid van storende invloeden vanuit de persoon van de waarnemer,
beoordelaar of interpretator. Voor de testinterpretatie mag je dus aannemen dat het proces van het
registreren en verwerken van het testgedrag van de onderzochte tot score, beoordelingscategorie of
classificatie, vrij is van aan de testleider gebonden invloeden.
Twee eisen:
- Ten eerste moet het bij het objectieve testonderzoek voor de onderzochte niet uitmaken wie
de beoordelaar is.
- Ten tweede impliceert objectiviteit openheid en reproduceerbaarheid van de test en
evaluatieprocedure.
Het objectieve testonderzoek vereist controleerbaarheid, repliceerbaarheid en mogelijk tot verificatie
van de gedachtegang. De omschrijving van de objectiviteit als onafhankelijkheid van de specifieke
beoordelaar, dus als intersubjectiviteitsprincipe, geeft tevens een methode om in praktische situaties
de mate van de objectiviteit te bepalen. De mate van overeenstemming van de resultaten van de
beoordelaars, uit te drukken in de interbeoordelaarsbetrouwbaarheid, geeft dan de mate van
objectiviteit van de procedure aan. Indien twee onafhankelijk van elkaar werkende beoordelaars
beiden een rangorde produceren, kan de interbeoordelaarsbetrouwbaarheid worden uitgedrukt in
een rangcorrelatie. Hiervoor kun je Spearmans rangcorrelatie of Kendalls tau gebruiken. Om grotere
aantallen onafhankelijke beoordelaars te kwantificeren kan er gebruik gemaakt worden van Kendalls
‘coefficient of concordance’. Wanneer de beoordelingen niet alleen een rangorde vormen, maar de
afstanden tussen de plaatsen in die rangorde betekenis hebben, kan er gebruik gemaakt worden van
de product-momentcorrelatie.
De Kappa gebruik je wanneer er geen sprake van een rangorde is en er geen afstand bestaat tussen
categorieën.
Kappa = de mate van overeenstemming tussen beoordelaars (kinderen/objecten op dezelfde wijze
classificeren)
𝑝0 −𝑝𝑡
𝐾= 1−𝑝𝑡
→ Kappa
𝑝0 = kans van overeenstemming
𝑝𝑡 = kan van toeval D C N Fa
D 8 3 1 12¹
C 4 7 5 16²
𝑝0 =
8+7+10 25
= 40 = 0,625 = 62,5% N 0 2 10 12³
40
Fb 12¹ 12² 16³ 40
12×12 16×12 12×16
+ + 3,6+4,8+4,8
40 40 40
𝑝𝑡 = 40
= 40
= 0,33 = 33%
𝑝0 −𝑝𝑡 0,625−0.33 0,295
𝐾= 1−𝑝𝑡
= 1−0,33
= 0,67
= 0,44
5
, Vuistregels Kappa:
- 0,00 – 0,20 = geringe overeenstemming
- 0,20 – 0,40 = matige overeenstemming
- 0,40 – 0,60 = redelijke overeenstemming / 0,44 → redelijke overeenstemming
- 0,60 – 0,80 = voldoende tot goede overeenstemming
- 0,80 – 1,00 = bijna perfecte overeenstemming
Bij observatietests en projectietests is het lastig om een verantwoorde mate van objectiviteit te krijgen,
maar toch is dit wel mogelijk. Dit bereikt je door je bij de oordeelsvorming zo veel mogelijk te baseren
op het direct waarneembare gedrag. De subjectiviteit van het oordeel neemt toe naarmate men zich
meer richt op verklaring en interpretatie dan op beschrijving van gedrag. Het is alleen de vraag of deze
tests wel als volwaardige tests bestempeld kunnen worden, omdat observatietests en projectietests
juist gaan om verklaring en interpretatie.
Hoe groter de inbreng van de beoordelaar in het proces van verwerken van testsgegevens, hoe groter
de kans op een subjectieve beïnvloeding van dit proces. Wanneer je verder wil dan de objectief
controleerbare gedragsaspecten, zal een exact voorgeschreven verwerkingsprocedure de objectiviteit
bevorderen.
Betrouwbaarheid
Wanneer er tussen twee metingen zeer weinig verschillen zitten, kan er gezegd worden dat de meting
betrouwbaar is. Door de rangordes met elkaar te vergelijken en bijvoorbeeld uit te drukken in een
rangcorrelatie, beschikken we over een kwantitatieve maar voor deze betrouwbaarheid. Bij deze
meting en herhaling gaan we er vanuit dat deze onder dezelfde condities plaatsvinden: dezelfde
testsituatie, instructie en proefleider, hetzelfde tijdstip van de dag, etc. De reden dat een hoge
betrouwbaarheid vereist is, is dat het niet zou mogen uitmaken wanneer iemand getest wordt.
Validiteit
De validiteit en de psychologische betekenis van de test vormen het belangrijkste kenmerk. Validiteit
gaat erom of de test meet wat hij moet meten. Van een goede test is de psychologische betekenis
bekend. Je weet naar welke eigenschap van de persoon de test verwijst, en alternatieve verklaringen
zijn in wetenschappelijk onderzoek voldoende weerlegd. Er is dus geen verschil van mening mogelijk
over de interpretatie en de betekenis van de testprestatie. Het vastgesteld hebben van de
psychologische betekenis van de test biedt echter nog geen vrijbrief voor het ongecontroleerde
gebruik van de test voor allerlei praktische doeleinden. De betekenis kan hoogstens een suggestie
geven voor een mogelijke samenhang tussen test en criterium. Het praktisch voorspellend gebruik van
de test moet vervolgens altijd gebaseerd zijn op empirisch onderzoek, waarin een veronderstelde
samenhang is aangetoond.
6