PB1712 Longitudinaal onderzoek Samenvatting
Introductie
In deze cursus gaat het over het onderzoeken van verbanden tussen twee variabelen.
Een onderzoeksvraag moet dan voorafgegaan worden door een model die dit verband schematisch
weergeeft. Dat model is gebaseerd op eerder onderzoek of theoretische overwegingen. Om de
onderzoeksvraag te kunnen beantwoorden, verzamelt men data en toets men het model statistisch.
In deze cursus bestuderen we modellen met één afhankelijke variabele. Dit noem je een univariaat
model. Met univariate modellen kun je de scores op de afhankelijke variabele verklaren. Deze cursus
is een voorbereiding op de bachelorthesis.
,Thema 1 Inleiding
Als men personen op meerdere momenten meet, spreek je van longitudinale data. Belangrijk
voordeel hiervan is dat veranderingen binnen een persoon kunnen worden gemeten. Lazerfeld stelde
het panelonderzoek voor, een vorm van longitudinaal onderzoek. Hij twijfelde namelijk aan het
causale mechanisme van cross-sectioneel onderzoek. Door variabelen bij een onderzoekspanel
herhaaldelijk te meten en de effecten van deze variabelen te bekijken over de tijd, zou er pas een
uitspraak kunnen worden gedaan over het causale effect.
Cross laged-effect-> Cross-lagged panel-analyse is een analytische strategie die wordt gebruikt om
wederkerige relaties of directionele invloeden tussen variabelen in de loop van de tijd te beschrijven.
Model
Variabele A gemeten op tijdstip t -> variabele B gemeten op tijdstip t+1
Vergelijken met
Variabele B gemeten op tijdstip t-> variabele A gemeten op tijdstip t+1
Met dit model kun je een causale uitspraak doen in plaats van een correlationele.
Een veelvoorkomend longitudinaal design is gebaseerd op herhaalde metingen bij één enkele
onderzoekseenheid. Dit noem je een N=1 studie, ook wel single case design genoemd. Doel van dit
design is om het verschil op één of meer variabelen voor en na een interventie te vergelijken. Of om
een trend in de afhankelijke variabele te onderzoeken (bv. effect van een behandeling op lange
termijn).
Om algemeen geldende uitspraken te doen, worden data van verschillende case-studies
gecombineerd door middel van multilevel-analyses.
Een andere methode is de Experienze Sampling Methode (ESM). Hierbij wordt meestal meerdere
keren, op willekeurige momenten per dag, bij mensen een kort vragenlijstje afgenomen gedurende
een aantal dagen. Doel is om te onderzoeken welke psychologische processen zich dagelijks binnen
een persoon afspelen. Dit is vrij intensief voor deelnemers en wordt daarom ook wel een intensief
longitudinaal design genoemd. De analyse van ESM-dat gebuert vaak met multilevelanalyses.
1.1 Causaliteit
Causaliteit wil zeggen dat er sprak is van één of meer onafhankelijke variablen (predictoren) en één
of meer afhankelijke variabelen, waarbij een onafhankelijke variabele effect heeft op een
afhankelijke variabele.
Om van causaliteit te kunnen spreken moet worden voldaan aan drie voorwaarden.
, 1. De predictor moet in de tijd voorafgaan aan de afhankelijke variabele
2. Er moet een statistisch significant verband zijn tussen de predictor en de afhankelijke
variabele
3. De relatie tussen de predictor en de afhnakelijke variabele wordt niet veroorzaakt door een
derde, mogelijke onbekende, variabele.
De eerste voorwaarde betekent dat de onderzoeker de predictor eerst meet en pas daarna de
afhankelijke variabele.
De tweede voorwaarde betekent dat de samenhang ongelijk is aan nul. Zo’n resultaat zegt echter
niets over de grootte van het verband of over het belang of de relevantie van het verband. Om te
beoordelen of een verband voldoende sterk of relevant is, moet er gekeken worden naar de grootte
van het effect (effect size). Bij een regressie-analyse kan de grootte van het effect worden afgelezen
aan de gestandaardiseerde regressiecoëfficiënt (beta).
Statische significantie betekent overigens niet dat er sprake is van een cauaal verband. Alleen dat er
sprake is van correlatie. Soms is er geen sprake van statische significantie, terwijl er mogelijk wel een
causaal verband is. Dit kan komen door een te kleine steekproef, en dus doordat de toets te weinig
power heeft om de samenhang te ontdekken. Wat ook zou kunnen is dat er een derde variabele is
die het verband maskeert. Dit probleem doet zich extra sterk voor bij interactie-effecten. Om een
moderatiemodel te testen moeten er in het algemeen nog grotere datasets worden gebruikt dan bij
modellen met alleen een hoofdeffect.
Een zuiver experiment is een geschikte methode om causaliteit te onderzoeken. Aan voorwaarde 1
kan worden voldaan door het experiment zo op te zetten dat de manipulaties die leiden tot de
condities van het experiment (die de waarden van een predictor voorstellen) voorafgaan aan het
meten van de afhankelijke variabele. Aan voorwaarde 2 wordt voldaan door middel van een statische
toets en aan de 3e voorwaarde kan worden voldaan door de subjecten aan willekeurige condities toe
te delen (randomisatie), zodat de invloed van een onbekende variabele wordt gereduceerd.
Er kan geen uitspraak worden gedaan over causaliteit als de data via een survey zijn verkregen. De
vragen zijn dan allemaal min of meer tegelijk verkregen en dus is alleen voldaan aan voorwaarde 1.
Men spreekt dan wel van het ‘effect’ of van de ‘invloed’ van een varibele op een andere, maar het
gaat dan dus over een verondersteld effect dat in de analyse hooguit aannemelijk wordt gemaakt. De
causaliteit wordt aannemelijker, als er meer onderzoeken in dezelfde richting wijzen en vooral
wanneer eer sprake is van een goed gefundeerde theoretische onderbouwing.
Bij longitudinaal onderzoek wordt voldaan aan de eerste voorwaarde doordat de predictor kan
worden gemeten voorafgaand aan de afhankelijke variabele. Of aan de derde voorwaarde is voldaan
kan niet worden vastgesteld, omdat er geen controlegroep is. Causaliteit lijkt echter wel iets
gefundeerder dan bij survey dat op één enkel moment in de tijd is verkregen. Bij longitudinaal
onderzoek is het dus extra belangrijk dat er een goed gefundeerde theorie ten grondslag ligt aan de
veronderstelde causale effecten.
Het kiezen van de tijdstippen van meting is bij longitudinaal erg belangrijk. De vraag is hoe lang het
duurt voor de predictor effect heeft; enkele seconden, dagen, maanden? Is het interval te kort dan
kan er nog geen causaal effect worden gemeten en is het interval te lang, dan kunnen er allerlei
verstorende factoren een rol gaan spelen.
Moderatie en mediatie
Een gecombineerd effect van twee of meer predictorvariabelen heet als concept moderatie, en in
statistische termen een interactie-effect. Een moderator beïnvloedt de relatie tussen een predictor
en de uitkomst. Dus wanneer een variabele het effect van een andere variabele op een
criteriumvariabele beïnvloedt, spreken we van moderatie. Moderatie is een causaal model, waarbij
de predictor en de moderator op het 1 e tijdstip zijn gemeten (of zij vormen de experimentele
condities) en de afhankelijke variabele op het 2 e tijdstip.
, Je spreekt van mediatie als de relatie tussen een predictorvariabele en de uitkomst (c) verklaard
wordt door de relatie met een derde variabele, de mediator. De predictor voorspelt dan de mediator,
en de mediator voorspelt de uitkomst. Bij mediatie veronderstellen we dus dat het effect van een
variabele op een andere (deels) wordt verklaard door een derde variabele. Mediatiemodellen zijn
heel belangrijk omdat ze inzicht kunnen verschaffen hoe bepaaldecausale processen verlopen. Met
die kennis kunnen effectieve interventies worden ontwikkelt. Bij een mediatiemodel gaan we in
principe uit van 3 meetmomenten.
Causaliteit speelt een belangrijke rol bij mediatie en betreft drie vragen;
1. De voorspeller heeft causale invloed op de mediator
2. De mediator heeft causale invloed op de afhankelijke variabele
3. De voorspeller heeft causale invloed op de afhankelijke variabele
1.2 Longitudinale modellen
Als bij onderzoekseenheden dezelfde informatie op meerdere tijdstippen wordt gemeten, spreken
we van longitudinale data. Het verschil met cross-sectioneel ondezoek is dat de data daar maar op
één moment worden gemeten. Ook al wordt er op meerdere momenten gemeten, maar bij andere
steekproeven, dan nog spreken we van cross-sectionele data. Belangrijk voordeel van longitudinaal
onderzoek is dat veranderingen binnen een persoon kunnen worden gemeten en worden dan ook
veel gebruikt om het effect van een interventie te evalueren. Ook worden ze gebruikt om een
patroon of trend in de tijd te ontdekken.
Belangrijke vragen bij longitudinaal onderzoek:
1. Hoeveel metingen zijn er nodig?
2. Welke tijdsontervallen moeten er worden gebruikt?
3. Hoe lang moet de gehele studie duren?
De antwoorden hangen af van het onderwerp en het onderzoeksdoel. Meer metingen geven wel
meer informatie, maar zijn ook belastender voor de respindenten, wat mogelijke negatieve gevolgen
kan hebben, doordat respondenten uitvallen gedurende een studie.
Voorbeeld longitudinaal panelonderzoek met 3 variabelen op 3 meetmomenten
X= Predictor
M= Mediator
Y= Afhankelijke variabele
Rode pijlen = Dubbele pijlen geven verbanden aan tussen verschillende variabelen binnen een
‘wave’, dus op hetzelfde tijdstip gemeten. Dit is de situatie bij cross-sectioneel
onderzoek
Blauwe pijlen = Verbanden tussen dezelfde variabelen gemeten op verschillende tijdstippen. Dit
worden auto-regressieve verbanden genoemd, omdat het om een regressie van
variabelen met zichzelf (op een ander tijstip) gaat. Deze verbanden hebben wel een
richting, want een effect kan nooit terug gaan in de tijd. Het effect van X1 op X2
noem je lag-1-effect en van X1 op X3 noem je lag-2-effect.
Zwarte pijlen = Verbanden tussen verschillende variabelen op verschillende tijdstippen, bv. tussen X1
en M2. Ook hier wordt een richting verondersteld. De pijl loopt altijd in de richting
van de meest recent gemeten variabele.
Figuur 1 is het conceptuele model dat hoort bij een driedemensionale datatabel.