Samenvatting Testen en Meten UvA (DY) - Psychometrics
40 views 4 purchases
Course
Testen en Meten (70110103DY)
Institution
Universiteit Van Amsterdam (UvA)
Book
Psychometrics
Ik heb een 8.5 gehaald voor het tentamen met deze Samenvatting voor het vak Testen en Meten aan de UvA van de bachelor Pedagogische Wetenschappen en de premaster (Forensische) Orthopedagogiek. Het document bestaat uit de hoorcolleges aangevuld met de opgegeven hoofdstukken uit het boek en informati...
Hoofdstuk 1 tot en met 7 met een paar paragrafen uitgezonderd
February 18, 2024
38
2023/2024
Summary
Subjects
premaster
pow
testen en meten
statistiek
furr
psychometrics
pscychometrie
uva
pedagogische wetenschappen
samenvatting testen en meten
samenvatting
Connected book
Book Title:
Author(s):
Edition:
ISBN:
Edition:
More summaries for
Test Theory: book summary
Test Bank for Psychometrics An Introduction, 4th Edition, Richard Michael Furr.
Psychometrics: An Introduction 4th Edition R. Michael Furr ISBN 9781071824085, 1071824082. All Chapters 1-14 (Complete Download). TEST BANK.
All for this textbook (7)
Written for
Universiteit van Amsterdam (UvA)
Pedagogische Wetenschappen
Testen en Meten (70110103DY)
All documents for this subject (24)
Seller
Follow
marisalensen
Reviews received
Content preview
SAMENVATTING TESTEN EN METEN
HOORCOLLEGE 1
Werkgeheugen is een niet observeerbaar construct (= latent, hypothetisch construct).
→ Onze constructen zijn bijna altijd latent.
→ We gebruiken operationele definities om deze constructen te meten.
Geef bij elk van de onderstaande begrippen aan of het begrip met een voorbeeld van een latente variabele gemeten wordt.
a. Werkgeheugencapaciteit > latent
b. Aantal cijfers dat onthouden kan worden > niet latent (je meet het direct)
c. Zelfredzaamheid > latent
d. Agressie > latent
Wel observeerbaar zijn:
• Aantal cijfers onthouden (digit-span)
• Aantal woorden (reading-span)
• Aantal rekensommen goed bij een rekentest
Een nomologisch netwerk geeft theorie weer van hoe bepaalde latente constructen gerelateerd zijn aan observeerbare constructen
→ theorie nodig om het hypothetische construct en het oberveerbare gedrag te linken.
Bij reading-span en digit-span lijkt het plausibel dat dit door het werkgeheugen komt, maar dit hoeft niet. We hebben zoiets als een
digit-span en we willen iets weten over het onderliggende construct bij dit vak: bijvoorbeeld het werkgeheugen.
Er is empirisch onderzoek nodig om de validiteit en betrouwbaarheid te bepalen.
• Valide = meet de test wat je wilt meten
• Betrouwbaarheid = nauwkeurigheid
We hebben dus een test nodig waarmee we iets kunnen zeggen over de niet-observeerbare constructen. Test volgens Cronbach:
“a systematic procedure for comparing the behavior of two or more people”
• Gedragingen: heel breed (= een reactie van een persoon, ook ongewild)
• Worden systematisch verzameld (liefst allemaal onder dezelfde omstandigheden zodat goede vergelijking mogelijk is)
• Uiteindelijk worden de gedragingen gebruikt om mensen te vergelijken
Testen moeten in staat zijn om het gedrag van verschillende mensen (interindividuele verschillen) of het gedrag van dezelfde
individuen op verschillende momenten in de tijd of tijdens verschillende omstandigheden (intra-individuele verschillen) te
vergelijken.
Welke van de onderstaande metingen zijn volgens Cronbach een test?
• Tentamen beschrijvende statistiek*
• Leraar die vraagt hoe het met een kind gaat
• Sollicitatiegesprek
• Bloeddrukmeting bij één patiënt* (addertje: wordt wel gebruikt om te vergelijken)
• SPSS-opdracht van testen en meten*
• Doorstroomtoets basisonderwijs*
Niet alle tests hebben dezelfde kwaliteit, aan de buitenkant kan je de test moeilijk beoordelen. Bij testen en meten leren wij hoe wij
deze onderzoeken en kijken wij naar meerdere onderwerpen.
Norm referenced: score van de respondent wordt geïnterpreteerd ten opzichte van de scores van andere respondenten.
• Scores worden vergeleken met een referentie/normatieve steekproef. Deze steekproef wordt gezien als representatief
voor een bredere populatie van mensen.
,Criterium referenced: score van de respondent wordt geïnterpreteerd aan de hand van vaste criteriumscores, onafhankelijk van
andere respondenten.
Norm-referenced of criterium referenced?
• Tentamen beschrijvende statistiek: is criterium, maar deze is ooit wel vastgesteld op basis van vergelijkingen over waar
de respondenten toe in staat zijn.
• Cito eindtoets basisonderwijs: is criterium, maar deze is ooit wel vastgesteld op basis van vergelijkingen over waar de
respondenten toe in staat zijn.
• Beck’s Depression Inventory: norm-referenced, scores worden vergeleken met andere respondenten.
Er zijn geen harde externe criteria, waardoor bij alle criterium referenced testen normen op een manier een rol spelen.
Speeded test (snelheidstest): tijdgebonden testen. Bijvoorbeeld stipjes op een blaadje en alle
groepjes van 5 stipjes omcirkelen. Het wordt niet verwacht van je dat je de hele test afmaakt
binnen de tijd.
Bijna alle testen zijn power tests. Deze zijn niet tijdgebonden en van je wordt verwacht dat je alle
vragen beantwoordt.
De meeste procedures zijn relevant voor scores die gebaseerd zijn op reflectieve indicatoren. Bijvoorbeeld de score op een
intelligentietest, hiervan verwachten wij dat deze het gevolg is van je level van intelligentie.
Een voorbeeld van een formatieve indicator is SES. Inkomen, schoolniveau etc. worden hiervoor gecombineerd, maar deze
worden niet als gevolg gezien van de SES.
Uitdagingen
(1) Het identificeren en vastleggen van de belangrijke aspecten van menselijke psychologische attributen (zoals intelligentie,
depressie, etc.) in een getal of score.
(2) Participanten reactiviteit: mensen weten vaak dat ze gemeten worden. Hierdoor kunnen ze zich anders gedragen.
- Karakteristieken naar de vraag: sommige participanten kunnen het doel van het onderzoek achterhalen en
veranderen hun gedrag om de onderzoeker tegemoet te komen.
- Sociale wenselijkheid: sommige participanten veranderen hun gedrag om indruk te maken op de onderzoeker.
- Malingeren: sommige participanten veranderen hun gedrag om negatief over te komen.
➢ In elk van bovenstaande gevallen wordt de validiteit aangetast.
(3) Bias van de onderzoeker
(4) Psychologen vertrouwen op samengestelde scores. Een persoonlijkheidstest heeft bijvoorbeeld 10 vragen die extraversie
meten.
(5) Score sensitiviteit: sensitiviteit verwijst naar het vermogen van een meting om onderscheid te maken tussen
betekenisvolle hoeveelheden van de dimensie die wordt gemeten.
- Wanneer een psycholoog aan haar cliënt aan het einde van de sessie vraagt hoe hij zich voelt en hij moet kiezen
tussen ‘goed’ en ‘niet goed’, dan is dit niet voldoende sensitief om kleine verschillen van de stemming te meten.
- De psycholoog kan ontmoedigd worden wanneer haar cliënten steeds ‘niet goed’ kiezen. Ze maken wel
vooruitgang, maar voelen zich nog niet goed genoeg om ‘goed’ te kiezen. Dit ziet zij niet.
Gedragswetenschappen draaien om individuele verschillen. Pedagogen en leraren houden zich (voornamelijk) bezig met (het
belang van) individuele personen. Cruciale hypothese binnen de gedragswetenschappen: “als een test of een vragenlijst een
bepaald construct meet, dan zouden de verschillen in testscores moeten duiden op verschillen in het construct”.
→ Of deze hypothese plausibel is, moet onderzocht worden.
Schalen heeft betrekking op de manier waarop numerieke waarden worden toegewezen aan psychologische attributen.
Voor scores met alleen de eigenschap van identiteit geldt:
➢ Meest algemene eigenschap.
• Scores maken alleen onderscheid: bijvoorbeeld rugnummers bij voetbal of 0 = jongen en 1 = meisje.
• Scoresverschillen zijn niet betekenisvol.
- Als je de scores 1, 2 en 3 verandert in -1, 0 en 300 geldt de eigenschap van identiteit nog steeds.
• Berekenen van het gemiddelde, spreiding en correlatie is niet mogelijk
• Scores van categorische variabelen zonder ordening hebben alleen de eigenschap van identiteit.
,Scores met eigenschap van ordening hebben ook de eigenschap van identiteit:
• Scores onderscheiden en geven ordening aan in de mate van de eigenschap.
- Stokje met score 3 is langer dan stokje met score 2 en die is weer langer dan stokje met score 1.
• Scoreverschillen zijn niet noodzakelijkheid betekenisvol:
- Het verschil tussen scores 3 en 2 hoeft niet even groot te zijn als het verschil tussen scores 2 en 1.
- Als je scores “1, 2 en 3” verandert in “-1, 0 en 300”, geldt de eigenschap van ordening nog steeds.
• Berekenen van het gemiddelde, de standaarddeviatie, correlatie etc. is niet mogelijk.
• Scores van ordinale categorische variabelen hebben de eigenschap van ordening.
Scores met de eigenschap van kwantiteit hebben ook eigenschappen van identiteit en ordening.
➢ Bijvoorbeeld temperatuur.
• Scores onderscheiden, ordenen en hebben betekenisvolle verschillen.
• Het verschil tussen 1 en 2 graden is even groot als het verschil tussen 2 en 3 graden.
• Score 0 is arbitrair (score 0 betekent niet dat de eigenschap afwezig is, er is wel temperatuur).
• Berekenen van het gemiddelde, de standaarddeviatie, correlatie etc. is wel mogelijk.
• Omzetten naar andere meeteenheden is wel mogelijk (bijvoorbeeld Celcius naar Fahrenheit).
• Van veel variabelen binnen POW wordt verondersteld dat ze de eigenschap van kwantiteit hebben.
Scores met de eigenschap van een absolute 0 hebben ook eigenschappen van identiteit, ordening en kwantiteit.
• Scores onderscheiden, ordenen betekenisvolle verschillen en score 0 betekent “eigenschap ontbreekt”.
- Score 0 = geen lengte
- Hierdoor geldt ook dat score 2, twee keer zoveel is als score 1
• Berekenen van het gemiddelde, de standaarddeviatie, correlatie etc. is wel mogelijk.
• Omzetten naar andere meeteenheden is mogelijk (bijvoorbeeld van centimeters naar meters).
➢ Scores met deze eigenschap geven je de meeste informatie.
, Welke meeteigenschappen heeft de variabele hartslag?
a) Alleen de eigenschap van identiteit
b) De eigenschappen van identiteit en ordening
c) De eigenschappen van identiteit, ordening en kwantiteit
d) De eigenschappen van identiteit, ordening, kwantiteit en absolute 0*
Welke meeteigenschappen heeft de variabele geslacht?
a) Alleen de eigenschap van identiteit*
b) De eigenschappen van identiteit en ordening
c) De eigenschappen van identiteit, ordening en kwantiteit
d) De eigenschappen van identiteit, ordening, kwantiteit en absolute 0
Welke meeteigenschappen heeft de variabele tentamencijfer?
a) Alleen de eigenschap van identiteit
b) De eigenschappen van identiteit en ordening
c) De eigenschappen van identiteit, ordening en kwantiteit*
d) De eigenschappen van identiteit, ordening, kwantiteit en absolute 0
Religie: A
Aantal kilometers hardgelopen: D
Graden Celcius: C
Sekse: A
Meeteenheden
Voor kwantitatieve constructen moet een meeteenheid worden gedefinieerd. Bij een meting worden meeteenheden geteld om
respondenten te kunnen vergelijken.
• Voor fysieke constructen zijn er vastgestelde meeteenheden
- Lichaamslengte: centimeter
- Gewicht: kilogram
- Snelheid: km/h
• Voor psychologische constructen zijn er nauwelijks vastgestelde meeteenheden.
- Intelligentie: IQ-score
• Voor psychologische constructen moeten meeteenheden bedacht worden.
- Meestal testscores of bewerkte testscores.
- Hierdoor zijn ze minder algemeen bruikbaar dan meeteenheden voor fysieke constructen.
Willekeurigheid
Meeteenheden van psychologische constructen zijn minder algemeen bruikbaar dan meeteenheden voor fysieke constructen.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller marisalensen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.84. You're not tied to anything after your purchase.