PB1712 Onderzoekspracticum Longitudinaal Onderzoek
Thema 1: Inleiding longitudinaal onderzoek
Leerdoelen Thema 1:
- U bent bekend met de criteria die gelden bij het toetsen van causale relaties.
- U kunt beschrijven wat longitudinale data zijn.
Als bij onderzoekseenheden dezelfde informatie op meerdere tijdstippen wordt
gemeten, spreken we van longitudinale data. Een voordeel hiervan is dat veranderingen
binnen een persoon kunnen worden gemeten.
Een veelvoorkomend design is gebaseerd op herhaalde metingen bij een enkele
onderzoekseenheid. Dit heet een N=1-studie (single case design). Het doel is dan om
verschillen voor en na een interventie te vergelijken. Het combineren van verschillende
case-studies gebeurt meestal met multilevenanalyses.
De Experience Sampling Method (ESM) levert ook longitudinale data op. Deze meet
meerdere keren op willekeurige momenten op een dag, voor een aantal dagen. Door middel
van bijvoorbeeld een app. Hiermee kan je dagelijkse psychologische processen meten.
Vanwege de intensiteit worden dit ook wel intensieve longitudinale designs genoemd. Ook
ESM-data wordt meestal geanalyseerd met multilevelanalyses.
Thema 1.1: Causaliteit
Causale relatie: sprake van een of meer onafhankelijke variabele (predictoren) en een
of meer afhankelijke, waarbij de predictor effect heeft op de afhankelijke variabele. Om
hiervan te mogen spreken zijn er drie voorwaarden:
1. De predictor moet in de tijd voorafgaan aan de afhankelijke variabele,
2. Er moet een statistisch significant verband zijn tussen de predictor en de afhankelijke
variabele,
3. De relatie tussen de predictor en de afhankelijke variabele wordt niet veroorzaakt
door een derde, mogelijke onbekende variabele.
Bij de eerste voorwaarde kunnen longitudinale modellen hun nut hebben. De tweede
voorwaarde betekent in het algemeen dat de samenhang waarschijnlijk ongelijk is aan nul.
Verder zegt het weinig over de grootte van het verband. Tegelijkertijd is statistische
significantie niet gelijk aan causaliteit. Er zou een causaal verband kunnen bestaan zonder
sprake van statistische significantie door bijv. een te kleine steekproef. Dit doet zich
voornamelijk voor in interactie-effecten - voor het testen van moderatiemodellen moeten er
in het algemeen nog grotere datasets worden gebruikt dan modellen met alleen een
hoofdeffect.
, PB1712 Onderzoekspracticum Longitudinaal Onderzoek
Een geschikte methode van dataverzameling om causale relaties te onderzoeken is
een zuiver experiment. Voorwaarde 2 kan worden getoetst dmv een statistische toets.
Data verzameld via een survey kan geen uitspraken doen over causale relaties, omdat alleen
aan voorwaarde 1 kan worden voldaan.
Bij longitudinale modellen kan aan de eerst voorwaarde worden voldaan. Hoewel de derde
voorwaarde niet kan worden voldaan, lijken causale uitspraken iets gefundeerder dan
cross-sectioneel onderzoek. Echter, ook bij longitudinaal onderzoek is een goed gefundeerde
theorie ten grondslag nodig.
Een probleem bij longitidinaal onderzoek is dat het tijdsinterval tussen de metingen
goed moet worden gekozen. Het effect van de predictor (op T1) moet goed zichtbaar zijn in
de afhankelijke variabele (op T2).
Het probleem van causaliteit kan vermeden worden door onderzoek een exploratief
karakter te geven. Hierbij is het toetsen van causale verbanden niet het belangrijkste, maar
wil men een indruk krijgen over bijvoorbeeld de verdeling van variabelen en welke
verbanden er in de data aanwezig zijn. Er worden dan verschillende modellen vergeleken
om te zien welke het beste past bij de data.
Moderatie en mediatie
Moderatie: wanneer een variabele het effect van een andere variabele op een
criteriumvariabele beïnvloed. In principe is een moderatie model een causaal model en moet
daarom ook aan die voorwaarden voldoen. De predictor en moderator zijn in principe
gemeten op het eerste tijdstip, en de afhankelijke variabele op het tweede tijdstip.
Mediatie: (drie meetmomenten) wanneer verondersteld wordt dat het effect van een
variabele op een andere (deels) wordt verklaard door een derde variabele. Deze modellen
zijn belangrijk omdat deze inzicht kunnen verschaffen hoe bepaalde causale processen
verlopen. Deze onderzoeksvragen kunnen informatief zijn, maar ook moeilijk te
onderzoeken. Deze vragen betreffen immers drie vragen naar causaliteit:
1. De voorspeller heeft causale invloed op de mediator,
2. De mediator heeft causale invloed op de afhankelijke variabele,
3. De voorspeller heeft causale invloed op de afhankelijke variabele.
Ondanks de nood voor een passende onderzoeksopzet worden de modellen nog
vaak gebruikt in cross-sectioneel onderzoek. Het volgt dat een onderzoeker een goede
onderbouwing moet hebben om de modellen bij die data te gebruiken.
, PB1712 Onderzoekspracticum Longitudinaal Onderzoek
Thema 1.2: Longitudinale modellen
Ook wanneer dezelfde info op meerdere tijdstippen wordt gemeten, maar bij andere
steekproeven spreken we van cross-sectioneel onderzoek. Longitudinale data heeft het
voordeel verandering binnen een persoon te kunnen meten. Ze worden veel gebruikt om het
effect van een interventie te evalueren. De interventie vindt plaats na T1 of meerder
metingen. Een andere toepassing is het ontdekken van een fenomeen, een patroon of trend.
Hoeveel metingen er nodig zijn, welke tijdsintervallen er gebruikt moeten worden,
en hoe lang de studie moet duren, zijn belangrijke vraagstukken bij het ontwerpen van een
studie. De antwoorden hierop zijn niet eenvoudig en hang samen met het onderzoeksdoel.
Langere metingen geven meer data, maar ook meer kans op uitval.
Dit figuur is een voorbeeld van
longitudinaal panelonderzoek met drie
variabelen op drie meetmomenten.
X = predictor
M = Mediator
Y = Afhankelijke variabele
1, 2, 3 = tijdstippen
De pijlen representeren verbanden.
Dubbele pijlen tussen verschillende variabele op een meetmoment (of “wave”) zijn verbanden zoals in een
cross-sectionele studie.
Vervolgens zijn er verbanden/pijlen tussen variabelen gemeten op verschillende tijdstippen. Deze heten
auto-regressieve verbanden, omdat het om een regressie van variabelen met zichzelf (op een ander tijdstip) gaat.
Effect van X1 op X2 is een lag-1-effect, X1 op X3 is een lag-2-effect.
Tot slot zijn er verbanden/pijlen tussen verschillende variabelen op verschillende tijdstippen, deze heten
cross-lagged-verbanden. Bijvoorbeeld het verband tussen X1 en M2, met een richting altijd richting de meest
recente variabele.
Dit is het conceptueel model bijbehorend bij een dridimensionele datatabel. Dimensie 1 zijn
de personen of subjecten (N), dimensie 2 zijn de variabele (K) in dit geval dus (K = 3),
dimensie 3 is de tijdsdimensie in waves (T) in dit geval T=3.
Cross-sectioneel is tweedimensioneel (N x K). Wanneer alle variabelen op alle tijdstippen
zijn vormen er N rijde en K x T kolommen in de databestand.
, PB1712 Onderzoekspracticum Longitudinaal Onderzoek
Opbouw van de cursus
Thema 1: Inleiding van de cursus
Thema 2: Moderatieanalyse
Wanneer er een variabele effect van een andere variabele op een criteriumvariabele
beïnvloed, spreken we van moderatie. Rekenkundig houdt dit een interactie-effect in zoals
de cursus Experimenteel Onderzoek had. Deze waren op nominaal niveau
(variantieanalyse), nu komt er ook interval niveau bij. Dit is meestal op twee
meetmomenten, al kan het ook met een.
(Eenvoudig moderatie-effect) (Statistisch model met interactieterm)
Thema 3: Mediatie model
Gaan uit van drie meetmomenten, zoals
hier ->
Veronderstellen hier dat het effect van een
variabele op een andere (deels) wordt
verklaard door een derde variabele.
Causaliteit speelt een belangrijke rol bij mediatie. Een onderzoeker moet een goede
onderbouwing en/of hele goed opzet hebben om een dergelijk model te toetsen.
Thema 4: Multilevel-model, waarbij de nadruk ligt op longitudinale data met relatief veel
metingen. Hebben dan ook te maken met driedimensionale tabel van subjecten x variabelen
x tijdstippen. Bij ML data rangschikken de datatabellen wel anders. Tijdstippen en subjecten
vormen de rijen en de variabelen de kolommen. N x T rijen en K kolommen.
Thema 5 is een oefenopdracht ter voorbereiding op Thema 6.