Een complete Nederlandse samenvatting van het vak Psychodiagnostiek uit het schooljaar . Alle literatuur is gelezen en extra's uit de onderwijsgroep zijn erin verwerkt.
Psychodiagnostiek
Maastricht University
Alle verplichte literatuur
Leerjaar 2016 – 2017
Taak 1: Test uw geheugen
Taak 2: Die vlieger gaat niet op…
Taak 3: Hot item
Taak 4: Wat is de norm?
Taak 5: Breinreiziger
Taak 6: Miskend talent?
Taak 7: Projectietest: Leitmotiv of pejoratief?
Taak 8: Manneke Pis en de diagnostische cyclus
Taak 9: Diagnosticus versus statisticus
,Taak 1 – Test uw geheugen
Kaplan, R.M., & Saccuzzo, D.P. (2012). Chapter 4: Reliability.
Verschil in werkelijke en gemeten vaardigheid zorgt voor errors in de metingen.
• Error: betreft alle onnauwkeurigheden in metingen (= niet accuraat). Dit moet minimaal zijn, want
testen met veel error zijn niet betrouwbaar, terwijl testen met weinig error wel betrouwbaar zijn.
o Psychologen meten geen ‘duidelijke’ dingen, maar complexe eigenschappen zoals agressie
en intelligentie. Metingen kunnen echte score verkeerd schatten → measurement error.
• Betrouwbaarheid: mate waarin meetinstrument dezelfde uitkomsten geeft bij herhaalde metingen.
Hoe sterker de overeenkomst tussen verschillende metingen, hoe groter de betrouwbaarheid.
o Spearman is de grondlegger van betrouwbaarheid, maar ondertussen meer gevorderde
varianten, zoals de item-response theorie, die voortbouwen op deze ideeën.
Basics of Test Score Theory
• Classical Test Theory: neemt aan dat elk persoon een ware score
(T = true) zou hebben, wanneer de meting geen errors betreft. Doordat
metingen niet perfect zijn, wijkt de geobserveerde score (X = observed) af
van de ware vaardigheid van een persoon. Het verschil tussen de ware en
geobserveerde score komt door error in de meting (E = error).
o X (observed) = T (true) + E (error)
o X – T = E, oftewel verschil tussen verkregen score en score van interesse is gelijk aan error.
o Heet ook Klassieke Testtheorie (KTT).
• Assumptie over errors: is dat deze random zijn, dus een error heeft nooit dezelfde grootte en kan
een meting over- of onderschatten. Je verkrijgt dus niet dezelfde scores op elke meting, maar er
ontstaat een verdeling van scores op basis van erorrs.
o Errors of measurement (E) kunnen positief of negatief zijn:
− Positieve error: de geobserveerde score (X) is hoger dan de ware score (T).
− Negatieve error: de geobserveerde score (X) is lager dan de ware score (T).
Basic Sampling Theory: verdeling van random errors is bell-shaped (U-curve).
Het midden van de verdeling is de ware score en de spreiding eromheen is de
verdeling van errors, oftewel hoeveel error de meting heeft. De ware score kan
geschat worden door het gemiddelde van meerdere metingen te nemen.
− Bij een brede verdeling, is er veel variatie rondom de ware score, waardoor
er meer observaties nodig zijn om een conclusie te trekken over de ware
score, omdat observaties ook ver van het middelpunt liggen.
− Bij weinig verdeling rondom de ware score, liggen alle metingen hier
dichtbij, waardoor je minder metingen nodig hebt voor conclusie.
− Over het algemeen wijken scores weinig af van gemiddelde (zie midden).
Ø Klassieke testtheorie neemt aan dat de ware score van een individu over meerdere metingen niet
verandert, dus enkel random errors bij herhaalde metingen kunnen verschillende scores opleveren.
o Random error = verantwoordelijk voor spreiding van scores.
Ø Voordelen: makkelijk in gebruik, statistisch makkelijk, weinig werk, maar slechte theorie.
Ø Standaarddeviatie: van de errorverdeling laat zien hoe groot de gemiddelde error is. De verdeling
van random errors is hetzelfde voor alle personen, dus de standaarddeviatie van de error wordt
gebruikt als basismeting van de errors → standard error of measurement (σ).
o SEM (Standard Error of Measurement) zien hoeveel een score afwijkt van de ware score.
Assumpties van Klassieke Testtheorie:
− Meetfouten zijn random
− Ware score van een persoon blijft constant
− Gemiddelde meetfout is 0: is dus het betrouwbaarste rond het gemiddelde (want variatie = error)
− Verdeling van random errors is hetzelfde voor alle personen
− Ware scores en meetfouten correleren niet
, Domain Sampling Model (centraal concept in KTT)
• Domain Sampling Model: gebruikt een beperkt aantal items om een groter en meer gecompliceerd
construct te representeren. Betrouwbaarheid uitgedrukt als de ratio variantie van de geobserveerde
score op de korte test en de variantie van de ware score op de lange termijn. Error komt door het
gebruiken van een ‘sample items’ in plaats van het gehele domein (= construct).
o Hoe groter sample, hoe accurater het hele domein gerepresenteerd wordt.
o Hoe meer items van domein, hoe groter betrouwbaarheid en hoe kleiner de error (alpha).
o Betrouwbaarheid kan worden geschat met correlatie tussen geobserveerde en ware score.
Echter is de ware score is bijna nooit beschikbaar (onmogelijk om hele construct te meten).
o Het alternatief is ware score schatten → random items gebruiken uit domein bij
verschillende proefpersonen, dus elke test/groep items geeft een unbiased schatting van de
ware score. Door sampling errors, geven verschillende itemsamples verschillende
schattingen van de ware score. Verdeling van deze schattingen zijn random en normale
verdeling van schatters van ware score.
o Betrouwbaarheid = veel random parallelle testen met verschillende itemsamples van
hetzelfde domein. Correlatie tussen elk van deze testen wordt dan gemiddeld.
o Vb: enkele woorden om spelvaardigheid te meten omdat hele woordenboek te veel tijd kost.
Percentage correct van alle woorden in het woordenboek zou je ware score zijn.
Item Response Theory
Steeds meer theorieën wijken af van de klassieke testtheorie, omdat bij KTT precies dezelfde testitems en
de gehele test moeten worden afgenomen bij elke persoon, wat vaak onmogelijk is (bv. elk item meet
een specifiek vaardigheidsniveau, waarbij sommige items te moeilijk of makkelijk zijn om een vaardigheid
te meten en te weinig items gericht zijn op globale vaardigheidsniveau → betrouwbaarheid wordt
slechter) = nadeel KTT. Bij IRT wordt ook vaardigheidsniveau meegenomen en dus minder items nodig.
• Item Response Theory (IRT): gebruikt computer om te focussen op bepaalde range van moeilijkheid
van items, die zich aanpast op het vaardigheidsniveau van een persoon (bv. als persoon meerdere
items goed doet, worden items moeilijker; bij meerdere items fout, gaat test een stapje terug). Het
niveau dat bij de persoon past wordt intensief gemeten. Je meet persoon dus niet op alle items.
o Meer betrouwbare schatting van de vaardigheid van een persoon verkregen, wat mogelijk is
met een kortere test met minder items dan bij de KTT. Echter wel meer mensen nodig.
o Nadeel: database met items nodig die systematisch geëvalueerd zijn op moeilijkheidsgraad.
Klassieke Testtheorie vs. Item Response Theory:
− Standaardfout is bij KTT constant en onafhankelijk van vaardigheidsniveau. Bij IRT wordt de
standaardfout groter bij lage en hoge scores van vaardigheid, waardoor mensen met een gemiddelde
score een betrouwbaardere testscore hebben. IRT houdt rekening met vaardigheid!
− Bij KTT zijn langere testen betrouwbaarder, terwijl bij IRT vaak kortere testen al betrouwbaar zijn.
− IRT toetsen zijn beter voor gedigitaliseerde adaptieve testen.
− Bij IRT veel meer mensen nodig dan bij KTT.
Models of Reliability
• Betrouwbaarheidscoëfficiënt: is de ratio variantie in de ware
score tegenover de ratio variantie in de geobserveerde score.
Meeste coëfficiënten zijn correlaties, maar het uitdrukken van
betrouwbaarheid in ratio kan nuttig zijn.
− Ratio variantie in ware score tegenover de variantie in de
geobserveerde score is als een percentage.
− Percentage van de geobserveerde variatie die toewijsbaar is aan
de variantie in de ware score wordt hierbij gebruikt. Wanneer we
het overgebleven getal aftrekken van 1.0 blijft het percentage variatie
over dat toewijsbaar is aan random error (O = T – E).
− Bv: betrouwbaarheid van een test is 0,4 → wil zeggen dat 40% van de variatie of verschillen tussen
mensen kan worden toegeschreven aan ware verschillen tussen mensen. Overige % is random.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller PsychMAAS. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.61. You're not tied to anything after your purchase.