Clear complete summary! Has dragged me through the exam with ease
Seller
Follow
mlepilon
Reviews received
Content preview
Psychometrie & Besliskunde
Samenvatting Ellis
Hoofdstuk 1 – Constructie van tests, schalen en vragenlijsten
1.1.1. Gebruik van de termen test en schaal
Een meetinstrument is elke methode die leidt tot kwantitatieve data. Een test is een meetinstrument
dat bestaat uit meerdere componenten, items genoemd, op grond waarvan voor elke persoon een
enkele totaalscore wordt bepaald. Een vragenlijst kan dus ook een test zijn, namelijk als men een
totaalscore berekent. Een test is niet per definitie een ‘prestatietest’, maar kan ook andere dingen (bv.
attitudes, emoties etc.) meten. Het woord schaal slaat op test. Meetinstrumenten die uit meerdere,
samenhangende tests bestaan, heten subschalen of subtest. Het woord schaal word ook gebruikt om
een test aan te duiden waarvan de items goed bij elkaar passen.
1.1.2. Fasen in een valideringsonderzoek
Bij de constructie van een test moet je de validiteit en betrouwbaarheid onderzoeken, dit heet een
valideringsonderzoek. Hierbij komen vaak de volgende stappen aan de orde:
1. Voorbereiding
a. Keuze van het soort eigenschap dat gemeten zal worden (voor elke eigenschap moet
een aparte subschaal van meerdere items gemaakt worden)
b. Exploratie van het domein met literatuur en interviews
2. Formulering van de items
a. Inhoud van de individuele items (duidelijk passen bij het gekozen domein)
b. Representativiteit van de verzameling items samen (samen een goede
vertegenwoordiging van het domein zijn)
c. Aantal items (lastig te zeggen hoeveel items genoeg is. Te veel items heeft als nadeel
dat de proefpersonen ze niet serieus meer beantwoorden. Reken op 30% uitval
items)
d. Precieze formulering van de items (ook aanpassen aan doelgroep)
e. Inhoud en aantal van de antwoordcategorieën (waar redelijke spreiding op te
verwachten is. Aangeraden is 5 tot 7 categorieën)
f. Expert oordeel
3. Planning van de eerste afname
a. Gebruik van meerdere beoordelaars (interbeoordelaarsbetrouwbaarheid)
b. Andere variabelen die gemeten moeten worden (bv. achtergrond variabelen)
c. Aantal proefpersonen dat nodig is (hangt af van de eigenschappen van de data)
4. Eerste afname van de schaal
5. Analyse van de data van individuele items (o.a. slechte items worden verwijderd)
a. Interbeoordelaarsbetrouwbaarheid van items (Cohens kappa of intra-class correlatie)
b. Variantie van de items (grotere variantie is beter, liefst minimaal variantie = 1)
c. Scheefheid en eentoppigheid van de verdeling van items (normaal verdeeldheid
verondersteld. Afwijking zo klein mogelijk houden en items verwijderen)
6. Analyse van de relaties tussen de items (of de items hetzelfde meten = homogeniteit of
unidimensionaliteit).
a. Correlatie tussen de items (moeten positief correleren)
b. Factor analyse van de items (of de correlaties tussen de items hetzelfde meten)
c. Analyse van de interne consistentie betrouwbaarheid (of de schaal genoeg items
heeft om de somscore te zien als een betrouwbare meting)
7. Normering
1
, 8. Analyse van de relaties van de testscores met andere variabelen
a. Test hertest betrouwbaarheid (hoe stabiel scores over tijd zijn)
b. Criteriumvalidering (in hoeverre de test andere variabelen kan voorspellen)
c. Constructvalidering (of de test de relaties heeft die theoretische verwacht worden)
1.1.3. Unidimensionaliteit
Unidimensionaliteit wil zeggen dat de items hetzelfde meten (kan worden gezien als onderdeel van
constructvalidering). Constructvalidering wil zeggen dat de items het beoogde construct meten, en
daarvoor is op zijn minst nodig dat ze allemaal hetzelfde meten. Het soort data dat wordt gebruikt is
vergelijkbaar met interne consistentie betrouwbaarheid. Unidimensionaliteit heeft ook invloed op die
betrouwbaarheid.
Unidimensionaliteit is van belang om te rechtvaardigen dat de itemscores worden samengevat tot
een enkele totaalscore per persoon. Maar, hoe weet je welke items bij elkaar op te moeten tellen?
(appels en peren kan je niet met elkaar vergelijken).
Nog een probleem is dat je met een test menselijk gedrag probeert te kwantificeren, en dit is niet zo
vanzelfsprekend. Menselijk gedrag kan je niet zomaar kwantificeren.
Ook is de vraag in hoeverre de somscores een goede samenvatting geven van het gedrag dat de
persoon op de test vertoonde (= in hoeverre de itemscores adequaat worden samengevat). Bv. test
met 50 ja/nee vragen, waarbij mensen een itemscore van 25 hebben. In zo’n geval is de somscore
geen goede samenvatting van de itemscore. Wanneer is de somscore wel een goede samenvatting?
dat is als personen met dezelfde somscore in de regel ongeveer dezelfde itemscore hebben, afgezien
van random ruis. Modellen beschrijven dit nauwkeurig. Deze hebben de volgende aannames:
- Unidimensionaliteit (De Latente trek : het onbekende getal waarbij een eigenschap van
een persoon gekarakteriseerd kan worden en in welke mate de persoon die eigenschap
heeft die men wilt meten). Getal wordt aangeduid met : θ of τ
- Monotoniciteit ; de verwachte score op een item neemt toe met θ .
- Locale onafhankelijkheid ; Binnen een groep subjecten met dezelfde waarde van θ
hangen de items niet samen. M.a.w. alle correlaties tussen de items kunnen worden
verklaard met θ
Dus, een tentamenvraag waar goede studenten juist slechter op scoren , dus waarop je minder
punten krijgt naarmate je de stof beter kent, is onwenselijk.
Unidimensionaliteit en monotoniciteit zijn empirisch niet van elkaar te onderscheiden. Hoe dan? alle
items van de schaal moeten niet-negatieve correlaties met elkaar hebben (dus, scoort iemand laag op
item van agressiviteit, dan scoort hij ook laag op de andere items van agressiviteit).
Wat is het verband tussen unidimensionaliteit en betrouwbaarheid? betrouwbaarheid zegt iets over
de ‘random ruis’ waar unidimensionaliteit mee te maken krijgt (zie definitie). Bovendien zegt
unidimensionaliteit niets over het aantal items en niks over de hoogte van de correlaties (correlaties
zijn positief, niet hoe hoog te zijn). De interne consistentiebetrouwbaarheid zegt in wezen of het
aantal items groot genoeg is, rekening houdend met de hoogte van de correlaties.
Hoofdstuk 2 - Uitvoeren en verslag leggen van een factor analyse
2.1 Achtergrond
Factor analyse is een statistische methode die door psychologen is ontwikkeld om de empirische
patronen van psychologische testscores te bestuderen (uitgevonden door Spearman). Thurstone
heeft de factor analyse in zijn intelligentieonderzoek uitgebreid. In de persoonlijkheidsleer is factor
analyse bekend geworden door de 16-factor theorie van Cattell en door de Big Five theorie. De
doelen in de psychologie waarvoor factor analyse wordt gebruikt:
1. Om een bepaald domein theoretisch te beschrijven (confirmatieve factor analyse : een
inhoudelijke theorie wordt getoetst)
2
, 2. Om inzicht te krijgen in een domein, zonder dat daar van te voren een theorie over
bestaat (exploratieve factor analyse : er bestaat geen theorie van te voren, maar het doel
is wel om tot een theorie te komen).
3. Om het aantal variabelen te beperken (factor analyse is een vorm van datareductie)
4. Bij Testvalidering (om de constructvaliditeit te onderzoeken) Dit kan op 2 manieren:
a. Relatie van de test met andere tests te onderzoeken
b. Relaties tussen de items binnen de test te onderzoeken
Echter, de meeste psychometrici (o.a. J. Ellis) vinden factor analyse omstreden en pleiten voor de
Item Respons Theorie (IRT). De rede om toch factor analyse te gebruiken bij constructtheorie (4b) is
omdat:
- In de meeste publicaties wordt factor analyse gebruikt
- Factor analyse zit in SPSS en IRT niet.
Factor analyse is (volgens Ellis) op zichzelf een prima techniek en niet verouderd, maar als een
‘methode voor item-analyse’ dubieus. Overigens zijn factor analyse en IRT voor een groot deel
hetzelfde. In beide gevallen is de vraag of de items bij elkaar passen en hetzelfde meten. Het
belangrijkste verschil is dat bij factor analyse wordt uitgegaan van normaal verdeelde variabelen en
lineaire verbanden, terwijl in IRT wordt uitgegaan van categoriale variabelen met non-lineaire
verbanden.
2.2 Leerdoelen van dit hoofdstuk
Na dit hoofdstuk kun je in een valideringsonderzoek een factor analyse toepassen op items om
daarmee:
- Unidimensionaliteit te beoordelen
- Items in subschalen te verdelen
- Onbruikbare items te definiëren
Zie diktaat Ellis voor alle leerdoelen uitgeschreven
2.3 Definitie van een elementair rapport van een factor analyse
Een elementair rapport is een uitgebreid puntsgewijs verslag van de analyse.
Design
Mate van Controle
Geaggregeerde data
Hypothesen
Analyse
Schatters
Toetsting
Beslissing
Interpretatie
2.4 Doorlopend voorbeeld
Voor het uitgeschreven voorbeeld bekijk het Diktaat van Ellis.
Een onderzoek dat suggereert dat de items een hoge waarde van Kappa hebben, betekent dat bij
afnames waarbij 2 observatoren aanwezig waren , die het meestal eens waren over de scoring.
3
, 2.5 Design
In het design schrijf je op wat de manifeste variabelen (=observeerbare variabele) zijn waar de
onderzoeksvraag over gaat.
Een factor analyse gebruik je om de correlaties tussen een groot aantal manifeste variabelen te
verklaren met behulp van een klein aantal gemeenschappelijke factoren. De manifeste variabelen kan
je in dit geval zijn als de afhankelijke variabele en de factoren als onafhankelijke variabelen.
Kenmerkend voor factor analyse is dat de onafhankelijke variabelen Latente variabelen zijn. Dit wil
zeggen ; ze zijn niet geobserveerd en meestal zelfs niet observeerbaar.
Voorbeeld Design Manifeste variabele : de 15 Items op de Depressielijst
2.6 Mate van Controle
Bijna altijd passief-observerend, want je kan ze niet manipuleren (zijn latent)
2.7 Geaggregeerde data
De geaggregeerde data bestaan uit de correlatiematrix van de manifeste variabelen. Als de items
geordende antwoordcategorieën hebben, kan het beste gebruik worden gemaakt van Polychorische
correlaties. Het rapport moet vermelden welk type correlatie is gebruikt.
Doel factoranalyse de correlaties tussen de manifeste variabelen te verklaren
Als de manifeste variabelen items van een vragenlijst zijn, dan zijn zij meestal niet continu, maar
discrete geordende categorieën, zoals bv rating (1-2-3-4). Zulke items worden Poly(cho)toom
genoemd. Items met twee antwoordcategorieën (bv. goed-fout), worden Dichotoom genoemd.
Pearson en Galton (uitvinders correlatiecoëfficiënt), besefte dat een gewone correlatiecoëfficiënt een
vertekend beeld kan geven van het verband tussen twee dichotome variabelen. Hij ontwikkelde een
alternatief ; Tetrachorische correlatie. De generalisatie hiervan naar polychotome items wordt de
Polychorische correlatie genoemd (meest gebruikt in de psychologie).
Onthoudt ‘binnen een groep variabelen zijn de correlaties in het algemeen hoger dan tussen
verschillende groepen’. Je zou factoranalyse dus kunnen beschouwen als een veredelde manier om
variabelen te sorteren op grond van hun correlaties. De reden dat binnen groep correlaties hoger
zijn, is omdat zulke variabelen deels een gemeenschappelijke oorzaak hebben, dit wordt de
gemeenschappelijke factor genoemd.
2.8 Hypothesen
Hierbij geef je allereerst aan of de factor analyse exploratief of confirmatief is (Belangrijk voor
tentamen! Je krijgt outputs waarin je in de syntax moet herkennen welke het is ; dit komt in latere
weken).
*Bij een exploratieve factor analyse heb je geen hypothese over de hoeveelheid en aard van de
factoren. In dat geval gebruik je factor analyse om inzicht te krijgen in de data, wat vervolgens
misschien tot een theorie leidt.
*Bij een confirmatieve factor analyse heb je wel een hypothese over de hoeveelheid en aard van de
factoren. Deze hypothese is gebaseerd op een inhoudelijke theorie. Hierbij geef je aan hoeveel
gemeenschappelijke factoren er worden verondersteld. Als dit er meer dan 1 is, dan moet je
aangeven of er een simple structure (=houdt in dat elke manifeste variabele bij precies 1
gemeenschappelijke factor hoort) wordt verwacht. Ook geef je aan welke variabelen bij welke
factoren horen, plus of er wordt verwacht dat de gemeenschappelijke factoren ongecorreleerd zijn.
*Zelden heb je Data reductie. Er is geen hypothese, en er wordt ook geen hypothese gevormd. Het
enige doel is het aantal variabelen te verminderen met zo min mogelijk verlies van informatie
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller mlepilon. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.27. You're not tied to anything after your purchase.