SAMENVATTING TESTEN EN METEN
HOORCOLLEGE 1
Werkgeheugen is een niet observeerbaar construct (= latent, hypothetisch construct).
→ Onze constructen zijn bijna altijd latent.
→ We gebruiken operationele definities om deze constructen te meten.
Geef bij elk van de onderstaande begrippen aan of het begrip met een voorbeeld van een latente variabele gemeten wordt.
a. Werkgeheugencapaciteit > latent
b. Aantal cijfers dat onthouden kan worden > niet latent (je meet het direct)
c. Zelfredzaamheid > latent
d. Agressie > latent
Wel observeerbaar zijn:
• Aantal cijfers onthouden (digit-span)
• Aantal woorden (reading-span)
• Aantal rekensommen goed bij een rekentest
Een nomologisch netwerk geeft theorie weer van hoe bepaalde latente constructen gerelateerd zijn aan observeerbare constructen
→ theorie nodig om het hypothetische construct en het oberveerbare gedrag te linken.
Bij reading-span en digit-span lijkt het plausibel dat dit door het werkgeheugen komt, maar dit hoeft niet. We hebben zoiets als een
digit-span en we willen iets weten over het onderliggende construct bij dit vak: bijvoorbeeld het werkgeheugen.
Er is empirisch onderzoek nodig om de validiteit en betrouwbaarheid te bepalen.
• Valide = meet de test wat je wilt meten
• Betrouwbaarheid = nauwkeurigheid
We hebben dus een test nodig waarmee we iets kunnen zeggen over de niet-observeerbare constructen. Test volgens Cronbach:
“a systematic procedure for comparing the behavior of two or more people”
• Gedragingen: heel breed (= een reactie van een persoon, ook ongewild)
• Worden systematisch verzameld (liefst allemaal onder dezelfde omstandigheden zodat goede vergelijking mogelijk is)
• Uiteindelijk worden de gedragingen gebruikt om mensen te vergelijken
Testen moeten in staat zijn om het gedrag van verschillende mensen (interindividuele verschillen) of het gedrag van dezelfde
individuen op verschillende momenten in de tijd of tijdens verschillende omstandigheden (intra-individuele verschillen) te
vergelijken.
Welke van de onderstaande metingen zijn volgens Cronbach een test?
• Tentamen beschrijvende statistiek*
• Leraar die vraagt hoe het met een kind gaat
• Sollicitatiegesprek
• Bloeddrukmeting bij één patiënt* (addertje: wordt wel gebruikt om te vergelijken)
• SPSS-opdracht van testen en meten*
• Doorstroomtoets basisonderwijs*
Niet alle tests hebben dezelfde kwaliteit, aan de buitenkant kan je de test moeilijk beoordelen. Bij testen en meten leren wij hoe wij
deze onderzoeken en kijken wij naar meerdere onderwerpen.
Norm referenced: score van de respondent wordt geïnterpreteerd ten opzichte van de scores van andere respondenten.
• Scores worden vergeleken met een referentie/normatieve steekproef. Deze steekproef wordt gezien als representatief
voor een bredere populatie van mensen.
,Criterium referenced: score van de respondent wordt geïnterpreteerd aan de hand van vaste criteriumscores, onafhankelijk van
andere respondenten.
Norm-referenced of criterium referenced?
• Tentamen beschrijvende statistiek: is criterium, maar deze is ooit wel vastgesteld op basis van vergelijkingen over waar
de respondenten toe in staat zijn.
• Cito eindtoets basisonderwijs: is criterium, maar deze is ooit wel vastgesteld op basis van vergelijkingen over waar de
respondenten toe in staat zijn.
• Beck’s Depression Inventory: norm-referenced, scores worden vergeleken met andere respondenten.
Er zijn geen harde externe criteria, waardoor bij alle criterium referenced testen normen op een manier een rol spelen.
Speeded test (snelheidstest): tijdgebonden testen. Bijvoorbeeld stipjes op een blaadje en alle
groepjes van 5 stipjes omcirkelen. Het wordt niet verwacht van je dat je de hele test afmaakt
binnen de tijd.
Bijna alle testen zijn power tests. Deze zijn niet tijdgebonden en van je wordt verwacht dat je alle
vragen beantwoordt.
De meeste procedures zijn relevant voor scores die gebaseerd zijn op reflectieve indicatoren. Bijvoorbeeld de score op een
intelligentietest, hiervan verwachten wij dat deze het gevolg is van je level van intelligentie.
Een voorbeeld van een formatieve indicator is SES. Inkomen, schoolniveau etc. worden hiervoor gecombineerd, maar deze
worden niet als gevolg gezien van de SES.
Uitdagingen
(1) Het identificeren en vastleggen van de belangrijke aspecten van menselijke psychologische attributen (zoals intelligentie,
depressie, etc.) in een getal of score.
(2) Participanten reactiviteit: mensen weten vaak dat ze gemeten worden. Hierdoor kunnen ze zich anders gedragen.
- Karakteristieken naar de vraag: sommige participanten kunnen het doel van het onderzoek achterhalen en
veranderen hun gedrag om de onderzoeker tegemoet te komen.
- Sociale wenselijkheid: sommige participanten veranderen hun gedrag om indruk te maken op de onderzoeker.
- Malingeren: sommige participanten veranderen hun gedrag om negatief over te komen.
➢ In elk van bovenstaande gevallen wordt de validiteit aangetast.
(3) Bias van de onderzoeker
(4) Psychologen vertrouwen op samengestelde scores. Een persoonlijkheidstest heeft bijvoorbeeld 10 vragen die extraversie
meten.
(5) Score sensitiviteit: sensitiviteit verwijst naar het vermogen van een meting om onderscheid te maken tussen
betekenisvolle hoeveelheden van de dimensie die wordt gemeten.
- Wanneer een psycholoog aan haar cliënt aan het einde van de sessie vraagt hoe hij zich voelt en hij moet kiezen
tussen ‘goed’ en ‘niet goed’, dan is dit niet voldoende sensitief om kleine verschillen van de stemming te meten.
- De psycholoog kan ontmoedigd worden wanneer haar cliënten steeds ‘niet goed’ kiezen. Ze maken wel
vooruitgang, maar voelen zich nog niet goed genoeg om ‘goed’ te kiezen. Dit ziet zij niet.
Gedragswetenschappen draaien om individuele verschillen. Pedagogen en leraren houden zich (voornamelijk) bezig met (het
belang van) individuele personen. Cruciale hypothese binnen de gedragswetenschappen: “als een test of een vragenlijst een
bepaald construct meet, dan zouden de verschillen in testscores moeten duiden op verschillen in het construct”.
→ Of deze hypothese plausibel is, moet onderzocht worden.
Schalen heeft betrekking op de manier waarop numerieke waarden worden toegewezen aan psychologische attributen.
Voor scores met alleen de eigenschap van identiteit geldt:
➢ Meest algemene eigenschap.
• Scores maken alleen onderscheid: bijvoorbeeld rugnummers bij voetbal of 0 = jongen en 1 = meisje.
• Scoresverschillen zijn niet betekenisvol.
- Als je de scores 1, 2 en 3 verandert in -1, 0 en 300 geldt de eigenschap van identiteit nog steeds.
• Berekenen van het gemiddelde, spreiding en correlatie is niet mogelijk
• Scores van categorische variabelen zonder ordening hebben alleen de eigenschap van identiteit.
,Scores met eigenschap van ordening hebben ook de eigenschap van identiteit:
• Scores onderscheiden en geven ordening aan in de mate van de eigenschap.
- Stokje met score 3 is langer dan stokje met score 2 en die is weer langer dan stokje met score 1.
• Scoreverschillen zijn niet noodzakelijkheid betekenisvol:
- Het verschil tussen scores 3 en 2 hoeft niet even groot te zijn als het verschil tussen scores 2 en 1.
- Als je scores “1, 2 en 3” verandert in “-1, 0 en 300”, geldt de eigenschap van ordening nog steeds.
• Berekenen van het gemiddelde, de standaarddeviatie, correlatie etc. is niet mogelijk.
• Scores van ordinale categorische variabelen hebben de eigenschap van ordening.
Scores met de eigenschap van kwantiteit hebben ook eigenschappen van identiteit en ordening.
➢ Bijvoorbeeld temperatuur.
• Scores onderscheiden, ordenen en hebben betekenisvolle verschillen.
• Het verschil tussen 1 en 2 graden is even groot als het verschil tussen 2 en 3 graden.
• Score 0 is arbitrair (score 0 betekent niet dat de eigenschap afwezig is, er is wel temperatuur).
• Berekenen van het gemiddelde, de standaarddeviatie, correlatie etc. is wel mogelijk.
• Omzetten naar andere meeteenheden is wel mogelijk (bijvoorbeeld Celcius naar Fahrenheit).
• Van veel variabelen binnen POW wordt verondersteld dat ze de eigenschap van kwantiteit hebben.
Scores met de eigenschap van een absolute 0 hebben ook eigenschappen van identiteit, ordening en kwantiteit.
• Scores onderscheiden, ordenen betekenisvolle verschillen en score 0 betekent “eigenschap ontbreekt”.
- Score 0 = geen lengte
- Hierdoor geldt ook dat score 2, twee keer zoveel is als score 1
• Berekenen van het gemiddelde, de standaarddeviatie, correlatie etc. is wel mogelijk.
• Omzetten naar andere meeteenheden is mogelijk (bijvoorbeeld van centimeters naar meters).
➢ Scores met deze eigenschap geven je de meeste informatie.
, Welke meeteigenschappen heeft de variabele hartslag?
a) Alleen de eigenschap van identiteit
b) De eigenschappen van identiteit en ordening
c) De eigenschappen van identiteit, ordening en kwantiteit
d) De eigenschappen van identiteit, ordening, kwantiteit en absolute 0*
Welke meeteigenschappen heeft de variabele geslacht?
a) Alleen de eigenschap van identiteit*
b) De eigenschappen van identiteit en ordening
c) De eigenschappen van identiteit, ordening en kwantiteit
d) De eigenschappen van identiteit, ordening, kwantiteit en absolute 0
Welke meeteigenschappen heeft de variabele tentamencijfer?
a) Alleen de eigenschap van identiteit
b) De eigenschappen van identiteit en ordening
c) De eigenschappen van identiteit, ordening en kwantiteit*
d) De eigenschappen van identiteit, ordening, kwantiteit en absolute 0
Religie: A
Aantal kilometers hardgelopen: D
Graden Celcius: C
Sekse: A
Welke eigenschap geeft informatie over relatieve verhoudingen? Ordening, kwantiteit, absoluut nulpunt.
Meeteenheden
Voor kwantitatieve constructen moet een meeteenheid worden gedefinieerd. Bij een meting worden meeteenheden geteld om
respondenten te kunnen vergelijken.
• Voor fysieke constructen zijn er vastgestelde meeteenheden
- Lichaamslengte: centimeter
- Gewicht: kilogram
- Snelheid: km/h
• Voor psychologische constructen zijn er nauwelijks vastgestelde meeteenheden.
- Intelligentie: IQ-score
• Voor psychologische constructen moeten meeteenheden bedacht worden.
- Meestal testscores of bewerkte testscores.
- Hierdoor zijn ze minder algemeen bruikbaar dan meeteenheden voor fysieke constructen.
Willekeurigheid
Meeteenheden van psychologische constructen zijn minder algemeen bruikbaar dan meeteenheden voor fysieke constructen.