Testtheorie en testgebruik - Psychologie
Hoofdstuk 1 – De definitie, kenmerken en toepassingen van een test
2.1 Wat is een test?
Welke onderdelen bevat een
test? Een test bestaat uit 3
onderdelen:
1. Testmateriaal
Schriftelijke intelligentietest -> testmateriaal = boekje met opgaven die opgelost moeten worden.
2. Testformulieren
Worden gebruikt om de resultaten van de test op te schrijven om hieruit conclusies/interpretaties te trekken.
3. Testhandleiding
Deze geeft aan hoe de test gebruikt dient te worden. Een testhandleiding moet aan 4 eisen voldoen:
1) Goede testinstructie: er moet duidelijk zijn hoe de test verloopt. > Testprocedure, uitleg,
proefopgaven, …
2) Verwerkingsprocedure: instructies over hoe de test gescoord en verwerkt moet worden. > Sleutels
van opgaven zijn nodig: aanwijzingen welke antwoorden (on)juist of (contra)indicatief zijn voor een
bepaald verschijnsel en hoe deze van scores voorzien moeten worden.
3) Normtabellen: hiermee worden de scores vergeleken met die van de representatieve normgroep. >
Voorwaarde voor nadere interpretatie en evaluatie.
4) Wetenschappelijke kwaliteit van de test: gaat om de betrouwbaarheid van de test, wat de
test betekent en wat het voorspelt.
Bij een test gaat het om een systematisch onderzoek met een bepaald doel. -> Doel kan zijn: het voorspellen,
classificeren of beschrijven van een individu in vergelijking met andere mensen.
Kenmerken van een test waardoor het te onderscheiden is van het voorwetenschappelijk oordeel
Psychologische test: een systematisch onderzoek van gedrag mbv speciaal geselecteerde vragen of opgaven, om
inzicht te krijgen in een kenmerk van de onderzochte in vergelijking met anderen.
Het gebruik van een psychologische test heeft 6 voordelen tov het voorwetenschappelijk oordeel:
1. Efficiëntie
Intelligentietests zijn speciaal samengesteld, niet afhankelijk van toeval en storende invloeden kunnen geweerd
worden binnen de testsituatie.
2. Standaardisatie
Standaardiseren van de situatie: de test op precies dezelfde manier, onder precies dezelfde condities bij iedereen
afnemen. -> Maakt een test betrouwbaar en vergelijkbaar.
3. Normering
Om de resultaten van personen te vergelijken, moet je weten hoe groot de afstand tussen de resultaten ongeveer is.
Dit moet zo exact mogelijk worden geschat -> kleinere verschillen vaststellen.
Vaak kunnen afstanden tussen testscores in de normering worden opgenomen -> kan weergegeven worden in een
discrete verdeling. Soms kan die discrete verdeling als een normaalverdeling worden benaderd. Je moet dan een
geschikt gemiddelde en standaarddeviatie kiezen en de schaal van testscores omzetten naar die onder de
normaalverdeling. > Schaal verandert, rangorde blijft gelijk.
4. Objectiviteit
Objectiviteit: wie het onderzoek ook doet, het resultaat moet steeds hetzelfde zijn. Openheid, reproduceerbaarheid
van de test en evaluatie moeten mogelijk zijn.
Als je 2 personen dezelfde test laat doen onder dezelfde omstandigheden, kun je de resultaten met elkaar
vergelijken dmv correlatieonderzoek. Je kan zo de objectiviteit toetsen -> interbeoordelaarsbetrouwbaarheid.
De interbeoordelaarsbetrouwbaarheid kan worden uitgedrukt in een statistische maat die afhankelijk is van de
beschikbare gegevens:
• Rangordecorrelatie: als beide beoordelaars een rangorde produceren
• Product-momentcorrelatie: als beoordelingen niet alleen een rangorde vormen, maar de afstanden
tussen de plaatsen op de rangorde ook betekenis hebben
1
, lOMoARcPSD|14840171
• Cohen’s Kappa: als de personen ingedeeld worden in categorieën is er geen rangorde of afstand, maar
kan de mate waarin de beoordelaars tot dezelfde indeling komen worden berekend.
Cohen’s kappa berekenen:
- Bereken de kans dat persoon A en persoon B bij een aselect gekozen proefpersoon het met elkaar eens zijn
-> overeenstemmingskans P0.
- Dan kijk je wat de statistische onafhankelijkheid is: de overeenstemming die er zou zijn als de
beoordelaars hun eigen frequentieverdeling aanhouden -> de toevalskans: Pt.
- Dan bereken je Cohen’s kappa met de volgende formule:
Het is mogelijk bij observaties en projectietests om een verantwoorde mate van objectiviteit te bereken door:
- Het waarneembare gedrag te beschrijven (niet interpreteren) -> Verhoogd objectiviteit,
verlaagd subjectiviteit.
- Registratie ipv evaluatie van het gedrag. Door inbreng van de verwerker worden resultaten subjectiever.
- Een duidelijk voorgeschreven verwerkingsprocedure.
- Objectiviteit als grondhouding van de wetenschapsbeoefenaar. Dus geen invloeden van buitenaf -
> maatschappij, organisatie, onderzoeker, …
5. Betrouwbaarheid
Als we een meting nog een keer doen op dezelfde manier, moeten de uitkomsten hetzelfde zijn. Metingen moeten
onder dezelfde condities plaatsvinden (standaardisatie) maar er zijn altijd toevalsinvloeden. > Lastig om 2
onafhankelijke metingen te krijgen.
Betrouwbaarheid is noodzakelijk -> meetresultaten moeten herhaalbaar zijn: het moet nauwelijks uitmaken wanneer
iemand getest wordt.
6. Validiteit
Een goede test heeft een vaststaande psychologische betekenis -> de betekenis is aan de praktijk getoetst.
Valide testen moeten altijd gebaseerd zijn op empirisch onderzoek, waarin samenhang is aangetoond.
Eigenschappen meten dmv tests
Meetniveaus en toegestane
operaties
Dmv tests kunnen we allerlei eigenschappen meten. Meten: zodra getallen volgens een consistente procedure aan
objecten worden toegekend. Dit leidt tot 4 meetschalen, van laag naar hoog:
1. Nominale schaal
Op deze schaal gebruikt men getallen om de categorieën te onderscheiden en objecten in te delen. Er is geen
rangorde -> het gaat slechts om de verschillende getallen. Op de nominale schaal is geen wiskundige berekening
mogelijk.
> Geslacht, groep
2. Ordinaire schaal
Hier is er sprake van een rangorde, dus van meer of minder. Getallen worden gebruikt om categorieën of objecten te
ordenen. Het is mogelijk om rangordes met elkaar te vergelijken -> rangordecorrelatie. Niet alle wiskundige
berekeningen zijn toegestaan.
> Hoe goed ben jij in voetbal? Goed – matig – slecht
3. Intervalschaal
Er is een rangorde van meer of minder en de afstanden tussen de verschillende posities zijn belangrijk en hebben
betekenis. De afstanden tussen de verschillende posities zijn gelijk.
Er is een arbitrair nulpunt: geen echt nulpunt, de verhoudingen tussen de afstanden blijven gelijk als je het nulpunt
verschuift.
Er zijn wiskundige berekeningen toegestaan -> lineaire transformaties van het type Y = a + bX
> Temperatuur, IQ-test.
2
, lOMoARcPSD|14840171
4. Verhoudingsschaal / ratioschaal
Alle rekenkundige beweringen zijn hierop toegestaan omdat er sprake is van een gelijke afstand tussen de
verschillende posities op de schaal en van een absoluut nulpunt.
> Lengte, gewicht, hoeveelheid loon
Opvattingen over meten
Fysica model voor het meten van psychologie: ideaal was het meten van psychologische eigenschappen zoals je ook
lengte meet. > Veel te hoog gegrepen.
Ook veel fysische eigenschappen zijn niet direct observeerbaar. Oplossing: dmv experimenten de relatie tussen
objecten verhelderen en voor die eigenschap een bruikbare schaal kiezen.
In de psychologie zijn theorieën en begrippen altijd abstracter en diffuser gedefinieerd en in experimenten is het
gedrag van proefpersonen minder goed te manipuleren. -> Hooguit zwakke of matige verbanden vinden in
experimenten, die vaak niet goed repliceerbaar zijn. -> Hooguit arbitraire schalen vinden.
Oplossing van Stevens is het operationalisme: de meting als uitkomst van de procedure. -> De test wordt
gelijkgesteld aan de uitkomst. Een testconstructie is pure technologie en staat los van de psychologische
theorievorming. > Minder aandacht voor psychologische metingen: theorie- en kennisvorming bestonden nog
nauwelijks.
Operationalisme werd omarmd omdat men hiermee verlost was van het lastige probleem van ‘meten volgens het
fysische model’. Testontwikkeling werd een technologisch recept zonder wetenschappelijke bijdrage. > Dat is
onjuist: het meten van psychologische eigenschappen en het onderzoek naar de betekenis van testscores leveren
juist een wetenschappelijke bijdrage.
Gangbare procedure voor het meten van psychologische eigenschappen
Bij het operationalisme wordt testen gelijkgesteld aan meten en ook scoren van tests worden gelijkgesteld aan
meten. Maar het gaat daarin eigenlijk om tellen -> meten: pas als je conclusies trekt over een bepaalde eigenschap
obv tellingen.
Er zijn 4 stappen om te komen tot een meting:
1. Identificatie van de eigenschap
Je moet vaststellen wat de achterliggende theorie is over de te meten eigenschap en je moet alternatieve theorieën
in kaart brengen.
Er zijn een aantal problemen bij het identificeren van de eigenschap en de keuze van de theorie:
- Er is te weinig theorievorming over veel psychologische eigenschappen
- Eigenschappen worden vaak beschreven in algemene en abstracte termen -> lastig om gedrag te herkennen
- Sommige psychologische eigenschappen zijn niet altijd waarneembaar in gedrag
- Voor sommige eigenschappen is het lastig een test te bedenken waarmee het bedoelde gedrag kan
worden opgeroepen
- Grootste probleem: eigenschappen met een onduidelijke/dubieuze theoretische status. ->
Veel eigenschappen komen op en verdwijnen weer, zonder empirische onderbouwing
2. Operationalisering van de eigenschap
Operationalisering: het specificeren van de operaties die nodig zijn om de eigenschap te meten.
Maar psychologische eigenschappen zijn hypothetische begrippen -> niet direct waarneembaar -> operaties kunnen
het niet direct rechtstreeks meten.
Er zijn 2 stappen nodig om te komen tot een operationalisatie:
1) Het definiëren van de gedragingen die kenmerkend zijn voor de bedoelde eigenschap.
2) Stimuli (items) afstemmen aan deze gedragingen, zodat ze die reacties uitlokken die een indicatie geven
van de bedoelde eigenschap.
3. Onderzoek en kwantificering van reacties
3
, lOMoARcPSD|14840171
Kwalitatief gegeven reacties (verbaal of gedrag) worden geregistreerd en moeten gekwantificeerd worden (=
omgezet naar getallen). Bij een item heeft 1 antwoord vaak een hoger niveau op de achterliggende eigenschap ->
krijgt een numerieke waarde: score.
4. Terugkoppeling naar de theorie
De uitkomsten van statistische analyse hebben gevolgen voor de theorie over de gemeten uitkomst -> kan
aanvullende ondersteuning geven.
Zo’n theorie bestaat vaak uit een nomologisch netwerk: een theorie ter verklaring van waarneembare
verschijnselen, waarbinnen de gemeten eigenschap een plaats heeft.
Deze procedure sluit aan bij de statistische methoden om tests te construeren en meeteigenschappen vast te stellen.
• Klassieke testtheorie: nadruk op betrouwbaarheid
• Item-responstheorie: nadruk op hoe de testprestatie tot stand komt
• Representional measurement: er is alleen sprake van een meting als de formele relaties tussen de
testscores overeenkomen met de relaties die in de empirie bestaan.
Voorbeeld in JOHO
Definitie van een test
Test: een systematische meetprocedure om uitspraken te doen over een individu, die reageert op
gestandaardiseerde stimuli in vergelijking met de reactie van anderen.
Toepassingsmogelijkheden van tests
Er zijn 3 toepassingsmogelijkheden van de psychologische test:
1. Beoordeling van individuen
De beoordeling van individuen kan op 6 verschillende manieren, afhankelijk van het doel van het onderzoek:
1) Criterium
Als er sprake is van een criterium waaraan het individu wel/niet aan kan voldoen. De test correleert met het
criterium -> bijv. wel/niet een bepaalde opleiding volgen.
2) Meerdere criteria
Als er een keuze gemaakt moet worden uit meerdere criteria die verschillen qua niveau/kwaliteit. Bijv. het
kiezen van een studierichting. De test moet correleren met het criterium en differentiatie moet mogelijk zijn.
3) Onderlinge verhoudingen van testscores bij 1 persoon: ipsatieve scores
Als je iemands zwakke en sterke punten en zijn interesse wil meten, is de onderlinge verhouding van de
verschillende scores in een testscore belangrijk en niet de hoogte.
Ipsatieve scores: de testscores van 1 persoon worden met elkaar vergeleken en niet met een externe
standaard.
4) Ontwikkelingen van een persoon
Als je de ontwikkeling van iemand wilt volgen wordt hetzelfde onderzoek herhaald op een ander tijdstip.
Doel: erachter komen of de persoon zich op een bepaald gebied ontwikkeld heeft. Bijv longitudinaal
onderzoek.
5) Beschrijving van het onderzochte
Bijv. in de hypothesevormende fase van het onderzoek kan er een beschrijving van het onderzochte gegeven
moeten worden. Er zijn verschillende vormen van beschrijven:
- Intern rapport: de psycholoog geeft een subjectieve beschrijving van het gedrag van de
onderzochte of een beschrijving van de testprestaties
- Extern rapport: een verklarende beschrijving aan bijv de ouders van de onderzochte. -> Kan
ook pedagogische adviezen en psychologische uitspraken bevatten.
6) Counseling
Counseling: een niet-directieve vorm van therapie. Het testonderzoek wordt gebruikt als startpunt en
daaruit gaat de hulpverlener samen met de cliënt de problemen van hem analyseren, bewust maken en
herformuleren.
2. Beoordeling van groepen
Bij de beoordeling van groepen worden verschillen tussen groepen onderzocht -> vooral vergelijkend onderzoek. Je
bent geïnteresseerd in de grootte van het verschil van een bepaalde eigenschap tussen groepen.
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller florinenevels. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.04. You're not tied to anything after your purchase.