Hierbij een complete samenvatting van de tentamenstof voor het vak Testtheorie gegeven tijdens het schakeljaar Pedagogische Wetenschappen op de SPO. Het zijn uitgebreide aantekeningen van alle colleges, aangevuld met de stof uit het boek. Samen vormt dit een complete weergave van de tentamenstof, w...
College 1
➢ Inleiding
➢ Historische ontwikkeling van het testen
➢ Definitie, kenmerken, toepassingen
➢ Indelingen, onderscheidingen en begrippen
➢ Uitleg groepsopdracht
Waar gaat Testtheorie over?
1. Testconstructie: hoe maak je een test, hoe zet je een test in elkaar?
2. Testgebruik: hoe gebruik je een test?
3. Testevaluatie: hoe bepaal je de kwaliteit van een test (goed/niet goed)?
Leerdoelen Testtheorie
Kennis hebben van:
➢ Terrein van testen en testconstructie
➢ Testanalyse (SPSS) → PSPP mag ook. Heeft alles wat je nodig hebt om in ieder geval een
voldoende te kunnen halen. JASP wordt nog uitgezocht. R kan ook.
➢ Testgebruik
Kunnen:
➢ Test beoordelen op kwaliteit
➢ Nieuwe test maken, analyseren, aanpassen
Hoofdstuk 1 (geen tentamenstof)
Historie van het testen
Wat is er vooraf gegaan aan het vak testtheorie?
➢ Oude voorlopers (voorwetenschappelijke oordeelsvorming)
o 2000 BC China: kijken of er vorderingen werden gemaakt.
o Oude Testament: Gideon wou de beste krijgers in zijn leven. Dit onderzocht hij aan
de hand van een persoonlijkheid. Allemaal water drinken uit een bekertje en letten
op de manier waarop mensen dronken. Soort test.
o ME en NT intelligentie – karaktereigenschappen van mensen zouden samengaan met
uiterlijke kenmerken (groot voorhoofd → intelligent) (fysische kenmerken;
astrologie)
➢ Wetenschappelijke benadering:
o 20e eeuw - systematisch bestuderen en empirisch funderen van test. Onderzoeken
of een test goed presteerde. Testresultaat controleren met hoe het echt zou zijn.
Binet
Dit begon met de Franse filosoof.
➢ Hij bedacht verbale complexe opgaven. Mensen moesten hun best doen om antwoord te
geven.
➢ Via empirisch onderzoek ging hij de moeilijkheidsgraad bepalen. Welke is moeilijker? Welke
is makkelijker?
➢ Werken met een totaalscore: hier verbond hij conclusies aan
➢ Begrip mentale leeftijd: dit begrip is toen bedacht. De chronologische leeftijd
(kalenderleeftijd) verschilt hier dus van.
Terman – Stanford-Binet
➢ Formuleren van standaardinstructies: zo heeft iedereen gelijke kansen om een score neer te
zetten.
, ➢ Normen gebaseerd op representatieve: kijken hoe de score zich verhoudt tot bijv. een
gemiddelde score.
➢ streekproef
Stern:
➢ IQ = mentale leeftijd/kalender leeftijd x 100. Is toen voor het eerst bedacht.
Verdere ontwikkelingen
Testen kwam in een stroomversnelling.
Door nood aan selectie van personeel voor leger WO → testen in stroomversnelling. In korte tijd
moesten veel mensen op plekken worden gezet waar ze geschikt voor waren. Er werd heel veel
energie in testen gestoken. Er werden verschillende accenten gelegd:
➢ Europa: individuele diagnostiek, later ook collectief (Ned.: CITO, COTAN)
➢ VS: collectief testen, migrantenproblemen → niet-verbale testen. Migranten spraken nog
niet de Engelse taal, dus mocht niet met taal erin zijn.
➢ Engeland: tussenpositie, aandacht voor objectief evalueren van schoolprestaties (MC test)
Ontwikkeling tot wetenschap
In Nederland is de testtheorie nog verder geprofessionaliseerd door het te mengen met wiskunde. Zo
werden er echt berekeningen gemaakt. Vanaf de jaren 50: stimulering van testgebruik en
ontwikkeling van psychologie tot een wetenschap.
Omschrijving van een test
Systematisch onderzoek van gedrag met behulp van speciaal geselecteerde vragen/opgaven (items)
met als doel inzicht in (psychologische) kenmerken van een individu in vergelijking met anderen
Doel van testen: voorspellen, classificeren, beschrijven – in vergelijking met anderen!
Boek: Een systematische classificatie- of meetprocedure, waarbij het mogelijk is om een uitspraak te
doen over één of meer empirisch-theoretisch gefundeerde eigenschappen van de onderzochte of
over specifiek niet-testgedrag, door uit te gaan van een objectieve verwerking van reacties van
hem/haar, in vergelijking tot die van anderen, op een aantal gestandaardiseerde, zorgvuldig gekozen
stimuli.
,Hoofdstuk 2
De Psychologische test
Hier gaat de meeste belangstelling naar uit. Omvat het grootste deel van dit vakgebied.
➢ Systematisch onderzoek van gedrag met behulp van speciaal geselecteerde vragen of
opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk van de
onderzochte in vergelijking met anderen.
➢ Doel: psychologische testen meten psychologische eigenschappen, zoals bijvoorbeeld
intelligentie of persoonlijkheid.
➢ Probleem: psychologische eigenschappen zijn niet direct waarneembaar of meetbaar. Je kunt
het niet zien. Je kunt wel iemands lengte meten en dat zie je direct. Maar je kunt niet het IQ
aflezen ergens.
➢ Daarom construeren we indicatoren (items, vragen) die gedrag oproepen dat iets zegt over
het te meten construct (bijv. intelligentie). Je moet het dus indirect via een test.
Voorbeeld:
Stel je voor dat je iemand niet naar de leeftijd kunt vragen. Voorbeelden van items om ouderdom te
meten:
1. Ik doe overdag vaak een dutje (ja/nee)
2. Ik ben af en toe vergeetachtig (ja/nee)
3. Ik heb soms moeite om ‘s morgens op te staan (ja/nee)
Deze items hebben waarschijnlijk wel iets met ouderdom te maken, maar het zijn geen perfecte
indicatoren.
➢ Jonge mensen doen ook wel eens een dutje overdag (b.v. in de collegezaal na een avondje
stappen).
➢ Omslachtig om op zo’n manier ouderdom te meten, maar het principe komt overeen met
hoe we psychologische eigenschappen meten.
Pas op…
➢ Psychologische tests worden alleen afgenomen wanneer je geen goed beeld hebt van een
persoon. Een test is een hulpmiddel, dus pas op voor het verabsoluteren van testscores.
➢ Een psycholoog dient m.b.v. de test tot een oordeel te komen, op basis van een combinatie
van verschillende waarnemingen.
➢ Dus vertrouw niet blind op een enkele testuitslag. Dit is b.v. een gevaar met testen op
internet.
➢ Gebruik het spaarzaam. Gebruik een combi van verschillende instrumenten/waarnemingen.
Kenmerken/eigenschappen van een goede test:
Niet alles nodig om een test te gebruiken bij de oordeelsvorming over het menselijk gedrag. Gebruik
gerechtvaardigd als de psychologische test wel een juister beeld oplevert dan het
voorwetenschappelijk oordeel, of een verbetering en aanvulling hierop kan betekenen en de kosten
of ethische bezwaren niet onoverkomelijk zijn.
1. Betrouwbaarheid
2. Objectiviteit
3. Standaardisatie
4. Validiteit
5. Efficiëntie
6. Normering
1. Betrouwbaarheid
Een test is betrouwbaar als bij herhaalde metingen (ongeveer) dezelfde score behaald wordt. Stel je
voor dat je een IQ test maakt, en daar komt 115 uit. Dan zal het fijn zijn als je, wanneer je de test
, over een paar weken nog eens maakt, weer rond de 115 uitkomt. Stel je zou iets heel anders hebben,
dan is het geen stabiel resultaat, en dus geen goede test. De reden waarom een hoge
betrouwbaarheid vereist is, is dat het niet zou mogen uitmaken wanneer iemand getest wordt.
Probleem is dat het moeilijk of zelfs onmogelijk is om 2 onafhankelijke metingen te verkrijgen.
2. Objectiviteit
Een test is objectief als het niet uitmaakt wie de beoordelaar is. Stel dat je een tentamen krijgt met
open vragen. Dat kan niet met een machine worden nagekeken. Dat wordt door meerdere mensen
gedaan. Het zou niet goed zijn als het uitmaakt door wie jouw tentamen is beoordeeld. Dit gaat niet
vanzelf, beoordelaars zijn ook maar mensen. Naast dat het niet moet uitmaken wie de beoordelaar
is, is ook openheid en reproduceerbaarheid van de test en evaluatieprocedure. Objectief
testonderzoek vereist controleerbaarheid, repliceerbaarheid en mogelijkheden tot verificatie van de
gedachtegang.
Gedrag proefleider: valkuilen
Je kunt bijvoorbeeld beoordeeld worden op je uiterlijk. Iemand die er bijv. aantrekkelijker uitziet
krijgt een hoger cijfer.
➢ Vooroordelen
➢ Sympathieën en antipathieën
➢ Eerste indruk
➢ Vermoedens bevestigd willen zien
➢ Ideaaltypen willen vinden
➢ Eigen theorieën bevestigd willen zien
Deze zaken hebben niks te maken met hetgeen wat moet worden getest. Hoe groter de inbreng van
de beoordelaar in het proces van verwerken van testgegevens, hoe groter de kans op een subjectieve
beïnvloeding. Exact voorgeschreven verwerkingsprocedure bevordert de objectiviteit. Dit wordt
daarom zoveel mogelijk dichtgetimmerd. Degene die de test afneemt, krijgt specifieke aanwijzingen
wat betreft puntentoegift. Ook moet het hen niet uitmaken wat de uitslag wordt.
Onderzoek
Hoe kun je onderzoeken in hoeverre beoordelaars op eenzelfde manier scores toekennen?
Correlatie tussen de scores:
➢ Kendalls Tau en Spearmans Rho (correlatie tussen rangscores): De interbeoordelaars-
betrouwbaarheid geeft de mate van objectiviteit van de procedure aan en het is de mate van
overeenstemming van de resultaten van beoordelaars.
➢ Cohen’s Kappa. In dit college alleen deze manier. Indien de beoordelingen niet alleen een
rangorde vormen, maar de afstanden tussen de plaatsen in die rangorde betekenis hebben,
kan de product-momentcorrelatie de mate van overeenstemming uitdrukken.
o Po= de kans van overeenstemming. Dus hoe vaak de onderzoekers het met elkaar
eens zijn delen door het totaal.
o Pt= toevalskans. Marginale waarden met elkaar vermenigvuldigen delen door het
totaal. Deze kansen bij elkaar optellen en weer delen door het totaal.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller AMBR. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.23. You're not tied to anything after your purchase.