Samenvattin
Longitudinaal onderzoe
Thema 1: Inleidin
1. Causalitei
2. Longitudinale modelle
Thema 2: Moderati
1. Theoretisch kade
2. Moderatie met dichotome moderatorvariabele
3. Moderatie met intervalvariabele
4. Uitbreidingen van het basis moderatiemode
Thema 3: Mediati
1. Theoretisch kader en conceptueel mode
2. Mediatieanalyse met één mediato
3. Mediatie analyse met meerdere mediatoren en verslagleggin
4. Effect size bij mediatieanalys
Thema 4: Multilevelmodelle
1. Theoretisch kade
2. Eenvoudige multilevelmodelle
3. Modellen met covariate
4. Multilevel analyse van herhaalde metinge
Uitwerking oefententamen
t
r
e
g
e
g
n
n
s
n
e
n
n
r
l
n
l
n
g
k
, 1. Inleidin
Longitudinale data: wanneer bij onderzoekseenheden (personen) dezelfde informatie op meerdere
tijdstippen wordt gemeten. Zo kunnen veranderingen binnen een persoon gemeten worden
Panelonderzoek (Lazerfeld, 1940): vorm van longitudinaal onderzoek waarbij een vaste groep wordt
gevolgd en er op verschillende tijdstippen metingen gedaan worden. De effecten van de variabelen
worden zo over tijd bestudeerd
Cross-lagged effect: een panelstudie waarbij 2 of meer variabelen herhaaldelijk worden gemeten op
2 of meer verschillende momenten. Het causaal effect van de ene op de andere variabele kan zo zo
op verschillende tijdstippen ingeschat worden
Single case design: gebaseerd op herhaalde metingen bij een enkele onderzoekseenheid (dit wordt
ook een N=1 studie genoemd). Het doel is het verschil op 1 of meer variabelen voor en na een
interventie te vergelijken en na te gaan of er een trend te vinden is in de afhankelijke variabele
Experience sampling method: intensief longitudinaal design waarbij meestal meerdere keren per
dag, op willekeurige momenten, een korte vragenlijst wordt afgenomen. Dit gedurende een aantal
dagen teneinde psychologische processen te onderzoeken die zich dagelijks binnen een persoon
afspelen
Multilevel analyse: de gegevens van verschillende niveaus worden in één databestand gezet zodat
de gegevens tegelijkertijd in een analyse kunnen worden opgenomen
Causalitei
Causaal verband
Causaliteit betekent dat een verandering in de ene variabele een verandering in de andere
variabele veroorzaakt. Hiervoor moet aan 3 voorwaarden voldaan zijn
1. Er moet statistisch signi cant verband zijn tussen de predictor de afhankelijke variabele
2. De predictor moet in de tijd voorafgaan aan de afhankelijke variabele
3. De relatie tussen de predictor en de afhankelijke variabele mag niet veroorzaakt worden
door een derde (mogelijk onbekende) variabele.
Voorwaarde 1: statistisch verband tussen de predictor en de afhankelijke variabele
Dit betekent in het algemeen dat de samenhang waarschijnlijk ongelijk is aan nul. Zo’n resultaat
zegt niets over de grootte van het verband en dus ook niet over het belang of de relevantie van het
verband. Een klein verband kan bij een grote steekproef immers ook statistisch signi cant zijn. Als
de steekproef maar groot genoeg is dan wordt elke afwijking van nul, hoe klein ook, in de
steekproef signi cant. Om te zien of een verband voldoende sterk of relevant is moet er naar de
effect size gekeken worden
Voorwaarde 2: de predictor moet in tijd voorafgaan aan het effec
Het gevolg mag niet optreden als de oorzaak niet aanwezig is en het gevolg moet (in theorie) altijd
optreden als de oorzaak aanwezig is
.
t
fig
fi .
.
.
.
t
.
:
:
fi .
.
.
,Voorwaarde 3: het effect mag niet veroorzaakt zijn door een derde variabele
Het is belangrijk om eventuele confounding variabelen uit te sluiten. Men moet er zeker van zijn
dat een causaal verband niet veroorzaakt is door een andere variabele dan degene die bestudeerd
wordt. Er mag behalve de predictor dus geen andere plausibele verklaring te vinden zijn voor het
optreden van het gevolg
Bij longitudinale methodes van dataverzameling kan voldaan worden aan de 2e voorwaarde van
causaliteit, doordat de predictor voorafgaand de afhankelijke variabele kan gemeten worden
Longitudinale modelle
Cross-sectionele data: wanneer informatie op 1 tijdstip wordt gemeten, of op meerdere tijdstippen
bij telkens andere steekproeven
Longitudinale data kunnen verandering binnen een persoon meten en worden vaak gebruikt om
het effect van een interventie te evalueren door voormetingen te vergelijken met metingen tijdens
en na de interventie. Ook kan men ahv longitudinale data van een fenomeen een patroon of trend
in de tijd ontdekken
Belangrijke vragen die men zich dient te stellen bij het ontwerpen van longitudinaal onderzoek
• Hoeveel metingen zijn nodig
• Welke tijdsintervallen worden best toegepast
• Welke moet de duur van de volledige studie zijn
De antwoorden op deze vragen zijn sterk afhankelijk van het onderwerp en onderzoeksdoel van
de studie. Uiteraard leiden meer metingen tot meer data, maar dit is ook belastender voor de
respondenten, waardoor het risico op uitval groter wordt
Wave: moment van data-analyse: op hetzelfde tijdstip gemeten variabelen. Dit is de situatie bij
cross-sectioneel design
Auto-regressieve verband: verband dat gemeten is tussen dezelfde variabelen op verschillende
tijdstippen. Het gaat om een regressie van variabelen met zichzelf (op een ander tijdstip). Deze
verbanden hebben een richting, wat een effect kan niet teruggaan in de tijd.
• Lag-1 effect: een effect tussen 2 opeenvolgende tijdstippen
• Lag-2 effect: een effect dat 2 stappen vooruit gaat, bvb tussen meetmomenten 1 en 3
Crossed lagged verband: verband tussen verschillende variabelen op verschillende tijdstippen.
Moderatie: een variabele beïnvloedt het effect van
een predictor op de afhankelijk variabele. Dit betreft
dus een interactie effect
Mediatie: een derde variabele verklaart (deels) het
effect van de variabele
Multilevelmodel: longitudinale data met relatief
veel metingen leiden tot een 3D datatabel met N
subjecten, K variabelen en T aantal metingen
N*K*T waarbij N+T de rijen zijn en K de kolommen
.
.
.
!
.
?
.
n
.
?
?
.
.
.
:
.
.
:
, 2. Moderati
Moderator
Een modererende variabele beïnvloedt de sterkte en richting van de predictor op de afhankelijke
variabele, waardoor de richting of kracht van het verband verandert. Voor mensen die hoog
scoren op de moderator is het effect van de predictor op de afhankelijke variabele anders dan
voor mensen die laag scoren op de moderator.
In een moderatiemodel is er sprake van een predictor en een moderator die interacteren met elkaar.
De interactie tussen beide betekent heel algemeen dat ze een gezamenlijk effect hebben op de
afhankelijke variabele, waarbij het effect van de ene afhangt van de andere. Een moderatiemodel is
een speciale vorm van interactie, waarbij aan de variabelen een rol wordt toegekend van predictor
en moderator. Moderatie komt voort uit theorie, interacties zijn daar het rekenkundige equivalent
van
Theoretisch kade
Als er een verband bestaat tussen 2 variabelen, kan het zijn dat dit effect alleen aanwezig is of
sterker is bij een bepaalde groep mensen. De variabele die het verschil tussen groepen aangeeft en
dus het verband beïnvloedt, is de moderator
Een moderator kan verschillende vormen aannemen
• Categorische variabele: wanneer de moderator een groepsindeling representeert, bvb zoals bij
geslacht (dichotoom!) of opleidingsniveau
• Intervalvariabele: wanneer er geen sprake is van natuurlijke groepsindeling, maar nog steeds
onderscheid kan gemaakt worden tussen mensen die relatief hoog of relatief laag scoren op de
variabele, bvb iemand bezit een eigenschap minder of meer
Moderatie effecten kunnen op verschillende manieren uitwerken
• Een moderator kan een effect of verband laten verschijnen of versterken
• Een moderator kan een effect of verband laten verdwijnen of verzwakken
• Een verband kan positief of negatief worden afhankelijk van de waarde van de moderator.
In een moderatiemodel worden idealiter zowel
de predictor als de moderator experimenteel
gemanipuleerd en worden subjecten random
Predictor toebedeeld aan de verschillende condities. Als er
sprake is van moderatie, mogen hoofdeffecten
niet zonder meer geïnterpreteerd worden, maar
dient de moderator steeds betrokken te worden
Voor de berekening van een moderatie is het altijd nodig om een interactieterm op te nemen in het
model. Een interactieterm wordt gevormd als het product van 2 variabelen, hier de moderator en
de predictor. Om de parameters (regressiecoëf ciënten) van een moderatiemodel te berekenen is er
dus minstens een predictor (X), een moderator (Z) en een interactieterm (XZ) nodig. Het statistisch
model maakt dus geen onderscheid tussen de moderator en de predictor, maar het conceptueel
model doet dat wel
.
e
.
r
.
.
fi!
:
.
:
.
.
, Moderatie met dichotome moderatorvariabele
Moderatie met de predictor op dichotoom nivea
Wanneer de afhankelijke variabele van intervalniveau is en er 2 dichotome predictorvariabelen
zijn, wordt voor de analyse meestal een variantieanalyse of ANOVA gebruikt
Voorbeeld: heeft een managementbaan invloed op de ervaren stress en verschilt deze invloed
tussen mannen en vrouwen? Oftewel: modereert het geslacht het effect dat het soort werk op stress
heeft
Predictor: leidinggevend / niet-leidinggevend
Afhankelijke variabele: gerapporteerde stres
Moderator: geslacht
Mogelijke hypothese: leidinggevend werk tov niet-leidinggevend werk leidt tot meer stress en dit
effect is sterker bij vrouwen dan bij mannen
SPSS: ANOVA met 2 factoren die dichotome predictoren zijn
Analyze —> General Linear Model —> Univariate
Effecten die geschat moeten worden
• De hoofdeffecten van het soort werk (Swerk) en geslacht (sekse)
• De interactie tussen beide (sekse*Swerk)
De interactieterm (sekse*Swerk) vormt de essentie van moderatieanalyse. Wanneer dit interactie-
effect signi cant is, is dat een aanwijzing dat er sprake is van moderatie. De tabel toont dat zowel
sekse, Swerk als sekse*Swerk (de interactie tussen geslacht en het soort werk) signi cant zijn. Er
lijkt dus sprake te zijn van interactie
Of deze interactie ook belangrijk is, valt af te lezen aan de groote van het interactie-effect. Dit kan
zichtbaar gemaakt worden met een gra ek
De guur toont dat vrouwen over het algemeen meer stress ervaren dan mannen, want de groene
lijn ligt in het algemeen hoger dan de blauwe lijn. Verder blijkt dat leidinggevend werk over het
algemeen meer stress geeft, maar dat bij mannen het verschil met stress bij niet-leidinggevend
fi ?
fi .
.
:
fi.
.
.
s
.
.
u
.
n
.
fi
,werk slechts heel klein is. Het patroon van ervaren stress over soort werk is dus anders voor
vrouwen dan voor mannen: dit ondersteunt de hypothese dat sekse dit verband modereert.
Het moderatie-effect is niet alleen signi cant, maar ook substantieel: bij vrouwen neemt stress met
4 punten toe over het soort werk, terwijl de toename bij mannen verwaarloosbaar is
Verder is de partieel èta-kwadraat (partial η2) van de interactie gelijk aan .145 en ook dat wijst op
een substantieel moderatie-effect
Moderatie met de predictor op intervalnivea
De situatie kan ook zo zijn dat de predictor op intervalniveau is gemeten en de moderator een
nominale dichotome variabele is
Voorbeeld: hangt arbeidstevredenheid af van het maandsalaris? En is dit verband anders voor
vrouwen dan voor mannen
Predictor: maandsalari
Afhankelijke variabele: arbeidstevredenhei
Moderator: geslacht
Mogelijke hypotheses: bij mannen bestaat er een sterk positief verband tussen maandsalaris en
arbeidstevredenheid, en: bij vrouwen bestaat er een zwak positief verband tussen maandsalaris en
arbeidstevredenheid
Om arbeidstevredenheid te voorspellen uit het maandsalaris en het geslacht, gaat men uit van
volgend regressiemodel: Arbeidstevredenheid = b0 + b1 salaris + b2 seks
b0: intercep
b1 en b2: de regressiecoëf ciënten die de sterkte van het effect van respectievelijk salaris en
geslacht op arbeidstevredenheid weergeven
t
.
.
s
?
fi .
.
fi d
.
u
e
.
, Om latere interpretatie te verbeteren dient de variabele salaris gecentreerd te worden rond de
waarde 5 tot Csalaris. Dit omdat 5 de middelste waarde van de schaal is, er wordt dus niet rondom
het gemiddelde gecentreerd. Iemand die oorspronkelijk in groep 5 viel, krijgt daardoor waarde 0
Transform —> Compute variable
De variabele sekse is reeds gecodeerd: mannen zijn gecodeerd als -0.5 en vrouwen als 0.5
Ahv een regressieprocedure kan bovenstaande dan geanalyseerd worden
Analyze —> Regression —> Linear
De R2 van dit model is 0.44, oftewel het model
kan 44% van de variantie in arbeidstevredenheid
verklaren
.
.
.
.
, Een vrouw in salarisklasse 3 (die bvb €1.700 verdient) zal volgens de gecentreerde salarisklassen in
categorie -2 vallen. De regressievergelijking ATV= b0 + b1 salaris + b2 sekse kan dan ingevuld
worden met sekse 0.5, -2 voor de salarisklasse en de 3 geschatte coëf ciënten
ATV= 6.32 + 0.42*-2 + 0.29*0.5 = 5.6
Een man met hetzelfde salaris zal 0.29 lager scoren (aangezien de sekse man gecodeerd is met -0.5).
Het effect van salaris op arbeidstevredenheid is in dit model gelijk voor mannen en vrouwen. De
regressielijnen zullen parallel lopen, waarbij die voor vrouwen dan 0.29 hoger ligt
Stel dat sekse in dit voorbeeld de relatie tussen salaris en arbeidstevredenheid moderen en men
veronderstelt dat salaris bij vrouwen weinig en voor mannen veel invloed op arbeidstevredenheid
heeft
Mogelijke hypothese: bij mannen is er sprake van een sterk positief verband tussen salaris en
arbeidstevredenheid en bij vrouwen bestaat er een zwak positief verband tussen salaris en arbeids-
tevredenheid. De regressielijn voor mannen zal dan stijl omhoog en voor vrouwen relatief vlak
lopen
De regressievergelijking van dit moderatiemodel bevat nu een interactieterm
Arbeidstevredenheid= b0 + b1 salaris + b2 sekse + b3 sekse*salaris
• Voor mannen: ATV = (b0-0.5b2) + (b1-0.5b3) salari
• Voor vrouwen: ATV = (b0+0.5b2) + (b1+0.5b3) salari
Als de interactie signi cant is, zal b3 niet gelijk zijn aan 0 en zullen de regressielijnen niet parallel
lopen. Het effect van salaris op arbeidstevredenheid hangt nu mede af van de interactieparameter.
Bij signi cantie interactie moet dus altijd de interactieterm betrokken worden bij de interpretatie
van de hoofdeffecten
Transform —> Compute variable
.
.
fi !
fi 3
s
s
:
fi :
:
.
, Analyze —> Regression —> Linear
Merk op dat de R2 is gestegen naar 0.74: dit model verklaart arbeidstevredenheid dus veel beter
dan een model zonder interactie
Verder is het interactie-effect vrij sterk vergeleken met de coëf ciënt van Csalaris en statistisch
signi cant (b3 = -0.70, SE = 0.04)
Analyze —> Regression —> Linear —> Save.
In de dataview verschijnt een nieuwe kolom, hernoem deze tot ‘ATV_voorspeld’. En verander het
meetniveau van sekse in nominaal (in variable view)
Graphs —> Chart Builder
fi .
!
.
fi
, Moderatie met intervalvariabele
Voorbeeld: een moderatiemodel waarbij betrokkenheid het effect van autonomie op bevlogenheid
modereert
Autonomie Bevlogenheid
Betrokkenheid
Men veronderstelt een verband tussen autonomie in het werk en bevlogenheid: mensen die meer
autonomie krijgen, zijn in het algemeen meer bevlogen. Dit verband geldt vooral wanneer iemand
zich affectief betrokken voelt bij de organisatie
Dus als betrokkenheid ontbreekt, zal autonomie geen of een minder sterk effect positief effect
hebben op bevlogenheid. In het regressiemodel moet de interactieterm betrokkenheid*autonomie
moet dus worden opgenomen
BVL = b0 + b1 AUT + b2 AFB + b3 (AFB*AUT
NB: in het voorbeeld zijn de variabelen reeds gestandaardiseerd: het gemiddelde werd van elke
oorspronkelijke variabele afgetrokken en deze gecentreerde variabele werd vervolgens gedeeld
door zijn standaardafwijking. Een gestandaardiseerde variabele heeft dus een gemiddelde van 0
en een standaardafwijking van 1. Na standaardisatie wordt elke variabele in standaardafwijkingen
gemeten en is de oorspronkelijke meeteenheid niet meer relevant.
Alvorens de interactieterm te berekenen is het belangrijk de variabelen standaardiseren, zoniet kan
de interactieterm in sommige gevallen sterk gaan samenhangen met een van de predictoren. Deze
collineariteit dient vermeden te worden in een regressieanalyse
Transform —> Compute variable
.
.
)
.
n
.