Samenvatting Methoden en statistiek 2020-2021
Hoorcollege 1 Padanalyse
Verschillende analyses
Padanalyse
Dit is een causaal model. De variabele worden veroorzaakt door andere variabele in het model. De
vraag die je met dit model wilt beantwoorden is: “Kunnen de correlaties tussen een groep variabelen
verklaard worden door een causaal model?”
Factoranalyse
In dit model zijn de rechthoeken observeerbare variabelen (zien of meten). De variabele die in de
cirkel staan, in dit geval g van algemene intelligentie, kun je niet observeren. De vraag die je met dit
model wilt beantwoorden is: “Kunnen de correlaties tussen een groep variabelen verklaard worden
door één onderliggend construct (of meerdere)?”
Structural equation modeling
Dit is een combinatie van padanalyse en factoranalyse. De link tussen intelligence en academic
performance is de padanalyse en van intelligence naar beneden is de factoranalyse. De vraag die je
met dit model wilt beantwoorden is: “Kunnen de correlaties tussen een groep variabelen verklaard
worden door onderliggende constructen en causale effecten daartussen?”
Het padmodel
Doel van padmodel
Het doel van een padmodel is om theorieën te vangen in een formele vorm, het “paddiagram”, om
daarna te kunnen onderzoeken of de veronderstelde theorie overeenkomt met geobserveerde
correlaties in de werkelijkheid.
De basiselementen van een padmodel
Variabelen
Relaties tussen variabelen
Pagina 1 van 74
, o Covariantie (correlatie)
o Causale effecten
Soorten relaties/effecten
o Direct
o Indirect
o (Onbekend)
o Schijnrelaties (spurious)
o Wederkerige effecten (reciprocal)
o Conditionele effecten
Variabelen
Variabelen zijn de eigenschappen van onderzoekseenheden (zoals personen, echtparen, scholen…)
waar je in geïnteresseerd bent. Een belangrijke eigenschap is dat er variatie moet zijn in de
eigenschap over de eenheden. Als er geen variatie is in de eigenschap over de eenheden is het geen
variabele maar een constante. Als je bijvoorbeeld in het vak MTO-E vraagt wie er allemaal
student/geen student is dan antwoord iedereen student en dat is dan de constante. Maar vraag je dit
in de algemene populatie dan heb je wel variatie en dus een variabelen.
Er zijn enkele veelvoorkomende fouten die worden gemaakt bij variabelen:
1. Verwarring van de waarden van de variabele met de variabele zelf
a. Bijvoorbeeld: “rijk” en “arm” zijn twee waarden van dezelfde variabelen “inkomen”
niet apart in padmodel opnemen
2. Verwarring van een proces of een theorie met een variabele
a. Bijvoorbeeld: attribution theorie, math-related career chocie process hoef je niet op te
nemen in het padmodel
Relaties
Dit is een uitspraak waarin twee variabelen voorkomen en de waarden van de ene variabele
samengaan met die van de andere. Er zijn twee soorten uitspraken: (1) Covariantie-uitspraak en (2)
Causale uitspraak.
Een causale relatie betekent dat de ene variabele leidt tot verandering in de andere. Als je de
onafhankelijke verandert, dan verandert daardoor ook de afhankelijke. Enkele andere causale
woorden zijn: veroorzaken/ voorbrengen/ produceren/ induceren. Een voorbeeld van een causale
uitspraak is “Opletten leidt tot kennis”. Een voorwaarde van een causale relatie is dat er ook altijd
covariantie is tussen de variabelen (andersom niet het geval).
Een covariantie relatie betekent dat de ene variabele samengaat met de andere variabele, maar er
hoeft niet per se een causaal verband tussen de variabele te zijn.
Soorten relaties/ effecten
Een schijnrelaties (spurious relations) tussen twee kenmerken die in feite gebaseerd is op het
effect van een derde kenmerk. Uitspraak 1 is “Variabele X veroorzaakt y1” en uitspraak 2 is “Variabele
x veroorzaakt y2” dus de covariantie uitspraak wordt “y1 hangt samen met y2”.
Er is dus sprake van een covariantie tussen y1 en y2, maar er staat geen pijl in
de tekening omdat het niet door een van de variabele veroorzaakt wordt. Ze
hebben covariantie omdat ze beide worden veroorzaakt door een
gemeenschappelijke oorzaak, x. Dit betekent dus dat er geen causaal effect is
tussen y1 en y2.
Een voorbeeld van een schijnrelatie is de relatie tussen ijsverkoop en verdrinken. Men zag dat
wanneer er meer ijs werd verkocht er ook meer mensen verdronken en dus is ijs gevaarlijk. Maar als
je goed kijkt dan zie je dat ze beide een gemeenschappelijke oorzaak hebben, namelijk het warme
weer. Er is dus een covariantie tussen ijsverkoop en verdrinken, maar er is geen causale relatie.
Je kunt ook te maken hebben met directe en indirecte
effecten. Valence of emotion heeft in dit voorbeeld een direct
effect op self-care en een indirect effect op health (via mediator
Pagina 2 van 74
,self-care). Als er iets veranderd in valence of emotion verandert er ook iets in health en dat gaat via
een verandering en de mediator self-care.
Soms doen we geen uitspraak over de richting van een effect. We nemen dan
gewoon de correlatie op in het padmodel (dubbele pijl = correlatie). Dit is een
‘onbekende effect’. In het figuur is er sprake van een direct effect tussen X en
Y2. Je hebt ook geen interesse in de richting van het effect van X en Y1 en
neemt gewoon aan dat er iets gaande is tussen X en Y1 (onbekende effect). Er
zou sprake kunnen zijn van een schijnrelatie door X of een indirect effect via X,
maar daar heb je hier geen interesse in. Verder zet je alleen een pijl tussen Y1 en Y2 als uit de
hypothese blijkt dat er samenhang is tussen die twee variabelen.
Een vierde soort relatie zijn wederkerige effecten (reciprocal effects). In het algemeen betekent dat
dat (uitspraak 1) “Variabele Y1 veroorzaakt Y2” en (uitspraak 2) “Variabele Y2 veroorzaakt Y1.”
In het figuur zie je dat er nu sprake is van twee directe effecten die elkaar
versterken en dus NIET 1 dubbele pijl. Echter worden reciprocal effects in
de theorie niet expliciet genoemd, maar maken we gebruik van directe
effecten.
Als laatst kun je ook nog te maken krijgen met conditionele effecten. Soms beïnvloedt een variabele
niet (alleen) een andere variabele, maar (ook) een effect. Hierbij is de andere variabele de moderator.
In dit figuur is relatie als moderator toegevoegd. Als je een relatie
hebt zal het effect tussen valence of emotion en self-care zwakker
zijn of zelfs verdwijnen waardoor het effect conditioneel is op de
moderator.
Conclusie
Een kort overzicht van de basiselementen in een padmodel. Dit zijn mogelijke verklaringen voor
covariatie tussen X en Y:
Direct effect Verandering in X veroorzaakt verandering in Y
Indirect effect Verandering in X zorgt voor verandering in
mediator en dat zorgt voor verandering in Y
Spurious relation (schijnrelatie) X en Y correleren, maar er is geen
causatie. Er is wel sprake van een
gemeenschappelijke oorzaak S
Conditioneel effect Effect van X op Y en dit effect hangt af van de
waarde van de moderator
LET OP!!: Covariatie ≠ causatie!!
Hoorcollege 2 Van theorie paddiagram lijnrechte vergelijkingen
Recap Padanalyse
Basiselementen van een padmodel
In het padmodel heb je te maken met variabelen en dat zijn eigenschappen van onderzoekseenheden.
Enkele voorbeelden zijn intelligentie, hechtheid, activiteit en gezondheid. Een belangrijke eigenschap
van een variabele is dat er variatie is in de eigenschap over de eenheden!
Er is ook sprake van een relatie tussen variabelen en dit kan covariatie (correlatie) of causaliteit zijn.
Bij covariatie vindt je hoge/lage waarden op de twee vaak samen, terwijl bij causale effecten is het zo
dat als je één van de variabelen zou veranderen door in te grijpen zou daardoor de andere
veranderen.
Pagina 3 van 74
,Covariatie of causale uitspraak?
Covariatie Causatie
Vaak woorden over samengaan: gerelateerd, Vaak causale woorden: induceren,
geassocieerd, vaak ook, hangt samen… voortbrengen, produceren, veroorzaken,
beïnvloeden, heeft een effect op, vergroot de
kans dat, zorgt ervoor dat…
Je kunt de variabelen omwisselen zonder de Als je de variabelen omwisselt, verandert de
boodschap te veranderen: bv. Mensen die betekenis: bv. Gelukkig zijn maakt dat je
langer leven zijn gelukkiger EN Gelukkige chocolade eet EN Chocolade maakt je gelukkig
mensen leven langer
Overzicht
Covariatie impliceert niet altijd causatie. Mogelijke verklaringen voor covariatie tussen x en y:
Direct effect Verandering in X veroorzaakt verandering in Y
Indirect effect Verandering in X zorgt voor verandering in
mediator en dat zorgt voor verandering in Y
Spurious relation (schijnrelatie) X en Y correleren, maar er is geen
causatie. Er is wel sprake van een
gemeenschappelijke oorzaak S
Conditioneel effect Effect van X op Y en dit effect hangt af van de
waarde van de moderator
Van theorie naar paddiagram
Van tekst naar paddiagram
1. Lijst met variabelen maken
2. Causale ordening vaststellen
3. Causale hypotheses formuleren
Lijst met variabelen maken
Uit de tekst van een artikel kwamen de volgende hypothese naar voren. Als je van een tekst naar een
paddiagram wilt dan begin je met een lijst van variabelen te maken. In dit voorbeeld zijn dat de
volgende variabelen: agression/ anxiety/ peer relations/ self-concept/ peer concept/ adjustment. Deze
variabelen zet je vast in de vierkantjes en dat ziet er als volgt uit:
Causale ordening vaststellen
Nadat je de variabelen uit de tekst gehaald hebt, ga je deze in de juiste volgorde zetten. De volgorde
die in de tekst staat is niet altijd de juiste volgorde.
Pagina 4 van 74
,Causale hypotheses formuleren
Als je de causale hypothese gaat formuleren dan helpt het om de vakjes al te rangschikken. Dit komt
neer op de precieze pijlen tekenen tussen de variabelen.
Toetsen van causale hypothesen
Als je kijkt in het voorbeeld hierboven dan is ieder pijltje een causale hypothese. In de praktijk zien we
niet of een causale hypothese waar is, alleen of twee variabelen “samengaan”. Dat is niet per sé een
causaal verband omdat een schijnrelatie een alternatieve verklaring kan zijn voor het “samengaan”.
Causale hypothese kunnen daarom niet bewezen worden met correlaties, want er kan altijd nog een
schijnrelatie zijn die je vergeten bent.
Stel: we hebben deze causale hypothese (direct effect); . Maar er kan ook iets anders
aan de hand zijn, namelijk dat er sprake is van een schijnrelatie en dus geen causale relatie tussen Y1
en Y2. Of een combinatie van die twee dus dan is er een gemeenschappelijke oorzaak X, maar
ook een causale relatie tussen Y1 en Y2. Ze verklaren allebei een stukje van de correlatie. We
nemen dus een schijnrelatie op in een padmodel om na te gaan of b1 ≠ 0 (direct effect).
Gouden regel
Alle variabelen die een schijnrelatie kunnen veroorzaken tussen twee variabelen met een
verondersteld causaal verband ertussen, moeten worden meegenomen in het model.
Noodzakelijke uitbreidingen van model: gemeenschappelijke oorzaken toevoegen.
Noodzakelijke uitbreidingen van het model
Als je nu kijkt naar het eerdere voorbeeld bij de relatie tussen peer relations en self-concept dan kan
daar sprake zijn van realistische gemeenschappelijke oorzaken die invloed hebben op de causale
relatie. Een voorbeeld van een gemeenschappelijke oorzaak is parental pressure.
Toetsen van causale hypotheses
We stoppen voor het schatten van de padcoëfficiënten een direct effect en schijnrelatie in het
padmodel. Na het schatten zijn er drie mogelijke bevindingen van de padcoëfficiënten:
1. De schijnrelatie is niet van toepassing en vormt dus geen verklaring. De covariatie wordt
volledig verklaard door het directe effect van peer en self.
2. Zowel het schijneffect als het direct effect verklaren een stuk van de correlatie.
3. Het schijneffect verklaart de correlatie volledig en het directe effect is 0
Dit geldt ook als er een combinatie is van schijnrelaties. Deze schijnrelaties moeten dan samen de
volledige covariatie bepalen om het causaal effect weg te halen.
Pagina 5 van 74
, Causale hypothese kunnen niet bewezen worden met correlaties, maar wél ontkracht (falsified). Een
causale hypothese is ontkracht als: grootte van schijnrelatie(s) = correlatie. De gehele correlatie kan
dan verklaard worden door schijnrelatie(s). Er zijn twee mogelijkheden:
1. Grootte van schijnrelatie(s) = correlatie b1 = 0, geen causaal verband, causale hypothese
weerlegd
2. Grootte van schijnrelatie(s) ≠ correlatie wél een causaal verband, OF, niet alle variabelen
die een schijnrelatie veroorzaken zijn meegenomen in het model
Het weglaten van schijnrelatie leidt tot foute schatting b1 (schaadt toetsing causale hypothese). Het
effect van Y1 op Y2 wordt overschat met het gevolg dat er een causaal effect kan ontstaan wat
eigenlijk helemaal niet bestaat. Daarom is de gouden regel erg belangrijk!
Endogene & exogene variabelen
Endogeen is een variabele die verklaard wordt (waar een pijl
naartoe wijst, minstens 1x afhankelijke variabele). Exogeen is een
variabele die niet verklaard wordt (waar geen pijl naartoe wijst) en
dus alleen maar verklaart.
Onbekende effecten (correlaties) tussen exogene variabelen
Er kan een relatie bestaan tussen anxiety en agression, maar we verklaren ze niet met causale
hypothese en dit geldt voor alle exogene variabele. Je kan hiervoor wel pijlen tekenen, maar dit maakt
het onoverzichtelijk waardoor ze vaak worden weggelaten, maar dat betekent niet dat ze er niet zijn.
Disturbance terms
“Angst leidt tot slechtere relaties”, maar er zijn ook andere oorzaken bijv.
verhuizen, vriendelijkheid, tot outgroup behoren, enz. Het is praktisch niet
mogelijk om alle variabelen die endogene variabelen beïnvloeden te meten. Al die
extra invloeden worden ingenomen in de disturbance terms/error term.
ζ (“zeta”) stelt hiervoor:
1. Onbekende variabelen die endogene
2. Bekende maar weggelaten variabelen (ze zijn niet interessant voor je studie)
3. Menselijke onvoorspelbaarheid (er zijn veel verschillen tussen mensen)
4. Meetfouten in endogene variabele
Belangrijk is dat je voor iedere endogene variabele een disturbance term meeneemt. Die is er altijd bij
de endogene variabele net als je bij exogeen te maken hebt met onbekende effecten. Ook hier geldt
dat je deze niet altijd in het model opneemt, maar ze zijn er wel altijd.
Er zijn ook enkele assumpties (aannames) over disturbance terms: disturbance terms zijn klein,
ongecorreleerd aan elkaar en ongecorreleerd aan exogene variabelen. Dus:
Alle variabelen die zijn weggelaten uit het model hebben een relatief klein effect op de
endogene variabelen
Alle variabelen die zijn weggelaten uit het model zijn onderling ongerelateerd
Er zijn geen schijnrelaties weggelaten uit het model
Van theorie naar paddiagram: overzicht
Drie stappen om tekst in paddiagram om te zetten: variabelen, causale ordening, hypothesen
Toetsen (niet: “bewijzen”!) van causale hypotheses de gouden regel
De gouden regel noodzakelijke uitbreidingen van het model: gemeenschappelijke
oorzaken!
Disturbance terms
Exogene/endogene variabelen
Pagina 6 van 74