Validiteit
Validiteit betekent wat de test beoogt te meten. Hier zijn een aantal eisen aan verbonden:
1. Referent: er bestaat iets wat we kunnen meten
2. Causaliteit: verandering in de referent is oorzakelijk gerelateerd aan de meetscore. Het moet
eenduidig zijn
3. Verklaring: er bestaat een theorie die de referent aan de meetscore koppelt.
De feitelijke situatie van validiteit ligt echter anders:
1. Referent: niet duidelijk of de referent bestaat of er is geen eenduidigheid over (dyslexie,
angst, hoog-sensitiviteit)
2. Causaliteit: verandering in de referent is correlationeel gerelateerd aan de meetscore
3. Verklaring: er bestaat geen eenduidigheid hoe een referent gemeten moet worden (geen
theorie)
Temperatuur
De bolletjes zijn moleculen die bewegen. Daarom wordt er vaak aan een bolletje een pijl verbonden.
Als we de temperatuur willen meten van iets, dan meten we de kinetische energie van de moleculen.
Betrouwbaarheid
1. De mate waarin een geobserveerde score de ‘ware’ score van een meting representeert
2. De mate waarin de score vrij is van meetfouten
3. Het verschil tussen de gemeten en de werkelijke score
Galileo Galilei
Galileo Galilei sprak over de theorie van de fouten. Als je iets meet weet je al snel dat je bepaalde
resultaten verkeerd kunt interpreteren. Galilei realiseerde zich dat er problemen waren bij het meten
1. Er is één ware waarde T
2. Elke meting heeft een meetfout
3. De meeste fouten liggen rond T
4. Enkele fouten liggen ver van T
5. (Meetfouten zijn onafhankelijk)
Nummer vijf heeft hij niet zelf gezegd, maar er werd verondersteld dat hij dit ook dacht.
Bijvoorbeeld: meten hoe hoog de toren van Pisa is. Dit mat hij 10x door 10 verschillende mensen.
De beste schatter van T is de mediaan. Eeuwen later werd dat het gemiddelde.
Meten en fouten
Je wilt de lengte van de tafel meten. Hiervoor kunnen verschillende instrumenten gebruikt worden.
Deze instrumenten moeten worde bestuurd door een persoon.
Lengte = gemiddelde van n waarnemingen + een fout
Lengte = 2.05 ± 0.5 cm = 2.00 < lengte < 2.10
Meten van psychologische of mentale eigenschappen
Geheugen, woordleessnelheid, depressie, verslaving, woordenschat, etc. zijn voorbeelden die we
willen meten in de sociale wetenschappen. Het probleem is wel dat leren niet kan worden
uitgeschakeld waardoor er sprake kan zijn van een leer- en gewenningsproces.
Klassieke testtheorie (KTT)
De KTT vindt zijn oorsprong bij Quetelet. Hij veronderstelde dat de variabliteit binnen een persoon
gelijk is aan de variabiliteit tussen personen. Anders gezegd, 10x dezelfde meting bij 1 persoon staat
,gelijk aan 1x meten van 10 personen. Dit meetproces voerde hij uit bij de borstomvang van soldaten.
Hij veronderstelde dat het gemiddelde = SD. Ook veronderstelde hij dat een gemiddeld mens een
goed mens is. De natuur wil van zichzelf een normaalverdeling creëren.
Door de opvattingen van Quetelet kwam er meer interesse in testprocedures en analysemethodes.
Testuitslagen diende hierdoor als bron voor theorievorming en toevallige omstandigheden werden
naast persoonlijke kwaliteiten ook toegeschreven aan testuitkomsten. Er werd geen onderscheid
gemaakt tussen heterogene en homogene steekproeven en er ontstond een norm. Een norm is een
standaard, een patroon. Het is een gebruikelijke situatie of conditie.
De KTT ging uit van de opvattingen van Quetelet. Het doel van de KTT is het kwantificeren van
meetfouten, zodat er uitspaken kunnen worden gedaan over het individu. In de KTT werd er gebruik
gemaakt van het gedachte-experiment van Lord en Novick: Vraag een subject vele keren dezelfde
vraag, maar zorg ervoor dat je telkens voor je de vraag stelt de hersenen van het subject spoelt. Zorg
er ook voor dat je een tijdmachine gebruikt, zodat de wereld exact hetzelfde was als bij de
beantwoording van e eerste keer en de volgende keren dat de vraag gesteld wordt. Op deze manier
is het mogelijk om de ware score van een individu vast te stellen. Dit gedachte-experiment is echter
praktisch onmogelijk. De oplossing hiervoor is dat we dankzij de statistiek de hersenspoeling en
tijdmachine kunnen vervangen door andere mensen en andere tijden en daarvan kunnen we dan het
gemiddelde nemen. Deze steekproeven zijn dan echter niet meer onafhankelijk. Het is niet
homogeen.
Zo komen we aan bij het begrip ergodiciteit. Er is sprake van ergodiciteit, als voldaan is aan twee
voorwaarden:
1. Homogeniteit
a. Psychologie: niet houdbaar (ieder mens is uniek)
b. Fysica: alleen voor systemen in evenwicht. Dit is vrijwel nooit het geval
2. Stationair
a. Psychologie: niet houdbaar (mensen veranderen)
b. Fysica: op menselijke tijdschaal wel, maar..
Het groepsgemiddelde is onbruikbaar voor het individu.
De KTT schendt dus beiden voorwaarden. Toch blijft er in de praktijk een toename van testgebruik.
Ter illustratie wordt de Scared-R gegeven:
- Er zijn 66 stellingen waarbij er 3 antwoordmogelijkheden zijn (nooit/bijna nooit (0 pt) – soms
(1pt) – vaak (2 pt))
- Minimale score = 0 en maximale score 132
Het kwantificeren van de meetfouten gebeurd volgens de formule: Xj,p= Tp+ Ej,p. D.m.v.
herhaaldelijk meten van de eigenschap (referent) levert de standaardmeetfout op:
Dit is geen probleem voor gewicht, lengte, borstomvang…etc.
De oplossing van de KTT is een eenmalige afname bij duizenden personen. De
betrouwbaarheid wordt vastgesteld aan de hand van Cronbachs alfa:
Standaardfout wordt berekent met:
De 95% betrouwbaarheidsinterval wordt bepaalt met:
Je hebt nu een betrouwbaarheidsinterval met eigen SE en SE van de test. Er zijn een aantal
discutabele punten hierbij:
1. Iedere cliënt heeft zelfde SE en betrouwbaarheidsinterval
2. Individuele score wordt vergeleken met een gemiddelde score van een relatief willekeurig
ensemble
We mogen dit niet doen omdat het ensemble niet homogeen en niet stationair is. Het gevolg van de
KTT is dat:
a. Het gemiddelde (en de SD) mede de norm bepalen. Er wordt geen rekening gehouden met
de (individuele) context
, b. Gemiddelde wordt bepaald door de steekproef. Dus er zullen altijd mensen (ab)normaal zijn.
Een oplossing hiervoor is de idiografische benadering: individu wordt over de tijd gevolgd en dus
met zichzelf vergeleken.
Hoorcollege 2 Introductie tot tijdserieanalyse
Een tijdserie is een verzameling van metingen die van nature geordend zijn in de tijd. Waar
tijdserieanalyse een meerwaarde aan bied, is dat metingen van menselijk gedrag vaak niet stabiel of
homogeen zijn, en kunnen daarom beter worden begrepen als veranderingsprocessen. Dit
onderscheidt tijdreeksanalyse van andere analyses, waarbij er geen natuurlijke ordening van de
waarnemingen is. Tijdserie richt zich op systematische patronen over tijd, vaak binnen één individu.
Het doel is vaak niet om te generaliseren naar een populatie, maar wel om concrete uitspraken te
kunnen doen over het individu → idiografische benadering. Het zijn veel herhaalde metingen. De
toetsende statistiek van vorig jaar ging uit van een nomothetische benadering (vaak één
meetmoment, inferenties over een populatie, gebaseerd op M en SD en richt zich op systematische
patronen binnen een grote steekproef).
Een onderzoeksvraag voor een depressieonderzoek die nomothetisch is: Is er een verband
tussen depressie bij adolescenten en psychopathologie bij ouders? Dit is met één meetmoment. Er
mag dan een inferentie worden gemaakt naar de populatie als het voldaan heeft aan bepaalde
voorwaarde. De berekening die hierbij gebruikt wordt is: X = T + E (meting = ware score + meetfout).
De X1 is onafhankelijk van X2, etc. Het is een aselecte steekproef met lineaire verbanden. Het is géén
uitspraak over het individu.
Een onderzoeksvraag voor een depressieonderzoek die idiografisch is: welbevinden na
ingrijpende levenstransitie – Hoe is uw stemming vanavond. De gedragsvariable is dagelijkse zelf-
rapportage stemming. N=1 met vele metingen. Dit geeft informatie over het individuele proces. De
gebruikte berekening hierbij is: X = T + E. De X1 is onafhankelijk van X2.Het gaat hier om lineaire en
niet-lineaire verbanden. Kan er bij idiografisch een gemiddelde worden berekend? Het gemiddelde
brengt ons niet dichter bij het veranderingspatroon . Het gemiddelde alleen is niet genoeg als
beschrijving van de steekproef.
Voorbeeld woordenschatontwikkeling: niet-lineair en dynamisch. Een gemiddelde kan soms
bepaalde karakteristieken van een onderzoek vermommen. Dit is te zien aan de afbeeldingen
hieronder:
Wanneer is een gemiddelde dan wel inzichtelijk? Je zou kunnen zeggen dat de intra-individuele
variatie gelijk is aan inter-individuele variatie. Dit is een voorwaarde van ergodiciteit. Het tweede
punt is dat het proces stationair moet zijn. Het gemiddelde moet niet hoger of lager worden. De
statistische eigenschappen van het proces veranderen niet tijdens het meten. Bij een stationair
proces heb je een goede kans dat je onafhankelijke metingen krijgt.
, het is niet stationair want het gemiddelde
veranderd. Door histogrammen te maken van lag 0-100 bijvoorbeeld en van 101 tot 200 kun je
helemaal zien of er sprake is van wisseling van gemiddelde. Dit zie je bijvoorbeeld bij het plaatje
hieronder.
De grafiek links is het eerste deel van de tijdserie. De rechter is
het tweede deel. Je ziet dat het gemiddelde van deel 1 lager is
dan het gemiddelde van deel 2.
Hierdoor kun je stellen dat het niet
stationair is. Ook kun je goed kijken
naar de x-as. Als de spreiding namelijk
anders is (plaatje aan de rechterkant), dan is het ook niet stationair
Dit is wel een stationair proces. Het gemiddelde en spreiding blijven in het
eerste en tweede deel van de tijdserie ongeveer gelijk.
Dit is niet stationair en ook niet homogeen. Het
gemiddelde veranderd en de processen zijn niet
gelijk aan elkaar.
Korte samenvatting: bij niet-stationaire processen blijft het gemiddelde en de standaarddeviatie
veranderen. Herhaalde metingen zijn vaak niet onafhankelijk, maar vormen een temporeel patroon.
Intra-individuele (=bij dezelfde mens verschillend) variatie is meer dan alleen ‘willekeurige meetfout’.
→ meetfouten middelen elkaar niet uit – meer data leidt niet tot een betere benadering van T – er is
dus geen ware score. Gemiddelden kunnen eigenschappen van individuele veranderingsprocessen
verbergen. Kan er meer geleerd worden door tijdserieanalyse?
Random processen:
1. onafhankelijke metingen
2. wet van de grote getallen
3. centrale limiet theorema
4. X = T + E
Niet-random processen:
1. afhankelijke metingen
2. geen betekenisvolle gemiddelde
3. niet stationair, niet ergodisch
4. geen ‘ware score. Het zijn temporele patronen
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper loekedesmet. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,99. Je zit daarna nergens aan vast.