Testtheorie
Hoofdstuk 2
Definitie, kenmerken en toepassingen van de test
2.1 Wat is een test?
2.1.1 Onderdelen van een test
In het algemeen komt men in een verantwoorde en gepubliceerde test de volgende oneerdelen
tegen:
Testmateriaal: dit varieert sterk met het soort van de test. Bijvoorbeeld een testboekje met
opgaven die ter oplossing worden voorgelegd, maar ook materiaal in niet-strikte zin, bv.
wanneer de test bestaat uit een discussie.
Testformulieren: op de testformulieren worden de antwoorden, reacties of gedragsgegevens
verzameld, die vervolgens het materiaal vormen waaruit de psychologische interpretatie of
conclusies worden afgeleid.
Testhandleiding: varieert van een uitvoerig boekwerk tot beknopte richtlijnen. Van een
goede handleiding mag men verwachten dat daarin de volgende vier onderwerpen aan de
orde komen:
o Een exacte testinstructie: bevat al datgene wat betrekking heeft op de gang van
zaken tijdens het testonderzoek, bv. de volgorde van de opgaven, de toegestane
responstijden.
o De verwerkingsprocedure: bestaat voornamelijk uit de richtlijnen voor de
toekenning van numerieke scores aan de antwoorden of de reacties op de opgaven.
|Men dient daarvoor te beschikken over de sleutels van de opgaven. Dit zijn de
aanwijzingen voor de vraag welke antwoorden juist of onjuist zijn of indicatief of
contra-indicatief zijn voor een bepaald verschijnsel, en hoe deze antwoorden van
scores te voorzien. Ook moet men weten hoe de niet beantwoorde opgaven moeten
worden beoordeeld.
o De normtabellen: de testprestatie wordt vrijwel altijd uitgedrukt in een numerieke
testscore, gewaardeerd en geïnterpreteerd tegen de achtergrond van de prestaties
van anderen. |Deze mogelijkheid tot vergelijking vormt een voorwaarde voor een
nadere interpretatie en evaluatie van de testprestatie of het testgedrag.
o Bespreking wetenschappelijke kwaliteiten van de test: het gaat hier om gegevens
die een indicatie geven van de betrouwbaarheid van de test (de vraag in hoeverre de
testprestatie herhaalbaar is), een bespreking van de testbetekenis (de vraag welke
psychologische eigenschap de test meet) en de vraag voor welke voorspellingen de
test gebruikt kan worden.
2.1.2 Eerste omschrijving
Doel testonderzoek: het doen van een uitspraak die een voorspelling, classificatie of beschrijving
met betrekking tot het onderzochte individu behelst. |Ook al wordt dat niet altijd expliciet in de
conclusie geformuleerd, impliciet gaat het daarbij vrijwel altijd om een vergelijking met andere
mensen.
Psychologische test: een systematisch onderzoek van gedrag met behulp van speciaal geselecteerde
vragen of opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk van de
onderzochte in vergelijking met anderen.
2.1.3 Kenmerken van een test
,Bij de beschikbaarheid van voldoende juiste informatie is het niet altijd nodig een test te gebruiken
bij de oordeelsvorming over het menselijk gedrag. Indien de psychologische test wel een juister
beeld oplevert dan het voorwetenschappelijk oordeel, of een verbetering en aanvulling hierop kan
betekenen en de kosten of ethische bezwaren niet onoverkomelijk zijn, is het gebruik ervan
gerechtvaardigd.
Zes kenmerken waarop een goede test in de meeste gevallen in het voordeel is ten opzichte van het
voorwetenschappelijk oordeel:
Efficiëntie:
o Voorwetenschappelijk oordeel: in het dagelijks leven doen zich talrijke situaties voor
die aanwijzingen verschaffen voor het schatten van bepaald gedrag, bv. intelligentie.
Probleem: men moet wachten tot deze situaties zich voordoen.
o Test: speciaal samengesteld om een schatting te maken van bepaald gedrag, bv.
intelligentie.
Voordeel:
Men is niet afhankelijk van het min of meer toevallig beschikbaar zijn van
gelegenheden waarin bepaald gedrag zich voordoet.
Bijkomstigheden en storende invloeden kunnen zoveel mogelijk worden
geweerd.
Standaardisatie: wil een de onderzochte ter vergelijking naast anderen plaatsen, dan moet
men de betrokkenen in gelijke omstandigheden hebben zien opereren. Het beste bereikt
men dit door die situatie te standaardiseren. Standaardisatie-eis: een norm waaraan een
test meer of minder kan beantwoorden.
o Voorwetenschappelijk oordeel: van een standaardsituatie is nauwelijks sprake.
o Test: bij een goede test wordt de vergelijkbaarheid van prestaties bereikt door de
condities en invloeden die op de testprestatie kunnen inwerken zo veel mogelijk te
standaardiseren.
Normering: wil je bepaald gedrag, bv. intelligentie, van persoon A vergelijken met die van
persoon B met behulp van elke indicatie dan ook, bv. belezenheid of schoolprestatie, dan
moet men de afstand tussen A en B zo exact mogelijk schatten. Exactheid stelt de
beoordelaar in staat kleinere verschillen vast te stellen.
o Voorwetenschappelijk oordeel: bv. een paar maal doubleren is ‘duidelijk’
bedenkelijker dan het diploma in het vereiste aantal jaren behalen, maar bv. de ene
gezichtsuitdrukking is veel intelligenter dan de ander. Van een exacte vergelijking is
in deze voorbeelden echter geen sprake en daar ligt nu juist de moeilijkheid; hoe
veel intelligenter? |Bij grote verschillen zijn er niet zo veel problemen, maar voor de
vaststelling van kleinere verschillen is een gevoeliger instrument nodig dat niet
uitgaat van de grove maatstaven die in het lekenoordeel worden gebruikt
o Test: in het normeringsonderzoek is op zijn minst een rangorde vastgesteld van zeer
goede tot zeer slechte prestaties, zodat iemands prestatie door middel van een
plaatsbepaling in deze rangorde kan worden beoordeeld. Hierbij is men gebonden
aan de groep proefpersonen waarop deze normen worden vastgesteld.
Voorwaarde: de beschikbaarheid van normen. |Men kan volstaan met een
ongenormeerde test in experimenteel onderzoek (causale relatie zoeken) of in
situaties waarin slechts binnen de onderzochte groep beslissingen moeten worden
genomen zodat een rangorde volstaat.
Objectiviteit (intersubjectiviteit): de onafhankelijkheid van storende invloeden vanuit de
persoon van de waarnemer, beoordelaar of interpretator. |Tests beantwoorden niet zonder
mee aan de eis van objectiviteit. Volledige objectiviteit is een ideaal dat meer of minder
verwezenlijkt wordt. Bij objectiviteit is het resultaat van het onderzoek onafhankelijk van de
, persoon van degene die de gegevens verzamelt of uitwerkt. Deze opvatting heeft twee
gevolgen:
o Bij het objectieve testonderzoek moet het voor de onderzochte niet uitmaken wie de
beoordelaar is.
o Objectiviteit impliceert openheid en reproduceerbaarheid van de testen
evaluatieprocedure. Het objectieve testonderzoek vereist controleerbaarheid,
repliceerbaarheid en mogelijkheden tot verificatie van de gedachtegang.
Mate van objectiviteit: kun je meten door verschillende mensen onafhankelijk van elkaar
een registratie en codering van hetzelfde testgedrag te laten verrichten. De mate waarin zij
overeenstemmen kan als indicatie worden gebruikt voor de mate van objectiviteit.
Onafhankelijkheid beoordelaars: beoordelaars kunnen niet overleggen en weten zelfs niet
van elkaars beoordelen.
Interbeoordelaarsbetrouwbaarheid: de mate van objectiviteit van de procedure. |Welke
statistische maat men hiervoor gebruikt, hangt vooral af van de soort gegevens die de
beoordelaars produceren.
o Spearmans rangcorrelatie of Kendalls tau: wanneer twee onafhankelijk van elkaar
werkende beoordelaars beiden een rangorde produceren.
o Kendalls coefficient of concodance (W): voor de overeenstemming tussen grotere
aantallen beoordelaars die dezelfde stimuli – objecten maar ook personen – hebben
geordend naar dezelfde eigenschap.
o Product-momentcorrelatie: indien de beoordelingen niet alleen een rangorde
vormen, maar de afstanden tussen de plaatsen in die rangorde betekenis hebben.
o Een beoordeling kan ook inhouden dat gedrag wordt ingedeeld in categorieën, bv.
dyslectisch. Er is dan geen sprake van een rangordening, laat staan dat er een
afstand bestaat tussen deze categorieën. Hier is het de mate waarin twee of meer
onafhankelijke beoordelaars tot dezelfde indeling komen van belang.
Bij observatietest en projectietests is de mate van objectiviteit niet erg hoog. Een
verantwoorde mate van objectiviteit bereikt men door zich bij de oordeelsvorming zo veel
mogelijk te baseren op het direct waarneembare gedrag. )e subjectiviteit van het oordeel
neemt toe naarmate men zich meer richt op verklaring en interpretatie dan op beschrijving
van gedrag.
Betrouwbaarheid: de resultaten van meerdere metingen van dezelfde testcondities
verschillen weinig van elkaar. Consistent meten. |Hoge betrouwbaarheid is vereist, omdat
het niet zou mogen uitmaken wanneer iemand getest wordt. Iemands testprestatie moet
niet in belangrijke mate bepaald worden door het toevallige moment waarop hij getest
wordt, en de meetresultaten moeten dus in beginsel herhaalbaar zijn.
Bij het meten van psychologische eigenschappen zijn fluctuaties in prestaties en gedrag in
reactie op testvragen groot en complex. Veel groter dan bij bijvoorbeeld fysische
eigenschappen (bv. lengte). Daarmee worden de verschillen tussen beide metingen ook
groter. Het is vaak onmogelijk om twee onafhankelijk metingen te verkrijgen bij
psychologische tests.
Validiteit: meet je wat je beoogt te meten?
Psychologische betekenis: men weet naar welke eigenschap van de persoon de test verwijst,
en alternatieve verklaringen, zijn in wetenschappelijk onderzoek voldoende weerlegd. Er is
dus geen (sterk) verschil van mening mogelijk over de interpretatie en de betekenis van de
testprestatie.
2.2 Meten van eigenschappen door middel van tests
2.1.1 Meetniveaus en toegestane operaties
Meten: getallen worden volgens een consistente procedure aan objecten toegekend. Vier
meetniveaus:
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Lisje. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,48. Je zit daarna nergens aan vast.