Toegepaste methoden en statistiek
Hoorcollege 1 (28-08)
Wat is toegepaste methoden en statistiek?
We beginnen met padanalyse, daarna gaan we door naar factoranalyse, daarna voegen we
die samen in structural equation modeling (klein gedeelte van de cursus). Aan het einde
bespreken we een overzicht van alle behandelde methoden en technieken binnen de MTO.
Padanalyse
Hierbij kijken we naar figuren zoals die op het plaatje hieronder. We gaan alles leren over
deze figuren, wat zowel de pijlen als de blokjes betekenen.
We kijken bij padanalyse naar de vraag “kunnen de correlaties tussen groep variabelen
verklaard worden door een causaal model?”
Factoranalyse
Hierbij kijken we naar figuren zoals die op het plaatje hieronder. We kijken naar de vraag
“Kunnen de correlaties tussen een groep variabelen verklaard worden door één onderliggend
construct (of meerdere)?”.
Structural equation modeling
In structural equation modeling worden padanalyse en factoranalyse samengenomen (zoals
te zien op het plaatje hieronder) om op antwoord te vinden op de vraag “Kunnen de
correlaties tussen groep variabelen verklaard worden door onderliggende constructen en
causale effecten daartussen?”
,Toegepaste methoden en statistiek
Leerdoelen van de cursus:
- Padanalyse toepassen en interpreteren om conclusies te trekken over causale
hypothesen
- Drie soorten van factoranalyse toepassen en interpreteren: a) principale
componentenanalyse (PCA), b) exploratieve factoranalyse (EFA), en c) confirmatieve
factoranalyse (CFA)
- De verschillen tussen PCA, EFA en CFA uitleggen en beargumenteren welke van deze
methoden het meest geschikt is voor een gegeven onderzoeksvraag
- De toepassingen van pad- of factoranalyse in (stukjes uit) psychologische relevante
onderzoeksartikelen kritisch evalueren
- De verschillen tussen de geleerde methoden uit de MTO cursussen uitleggen en de
meest geschikte methode kiezen voor een gegeven onderzoeksvraag
Waarom is het belangrijk om kritisch te kunnen evalueren?
- Nuttig voor je bachelor thesis. Uit de elektronische studie gids (ESG): “verslag op een
analyse van wetenschappelijke literatuur of van empirische data”;
o Doen, en/of
o Begrijpen literatuur
- Als je onderzoeker wilt worden
o Doen (uitgebreider na research master), én
o Begrijpen literatuur
- Als je (bijvoorbeeld) GZ-psycholoog wilt worden
o Begrijpen literatuur
Wat gaan we doen in de cursus?
We hebben 11colleges met nieuwe stof (inclusief het eerste college), daarnaast is er 1
responsiecollege. Er zijn tevens 6 werkgroepen, niet verplicht, maar wel aan te raden. Daarin
worden oefeningen gemaakt en wordt een bestaand artikel kritisch uitgepluisd.
Er zijn ook 3 verplichte computerpractica. Daarin worden analyses uitgevoerd in SPSS.
In elk hoorcollege wordt eerst de stof van het vorige hoorcollege even herhaald, daarna volgt
de nieuwe leerstof en uiteindelijk maken we voorbeeld tentamenvragen. De antwoorden
daarop worden enkel tijdens de hoorcolleges en het responsiecollege besproken.
Tijdens 3 van de werkcolleges wordt padanalyse besproken en in de overige werkcolleges
wordt factoranalyse besproken. De slides komen op CANVAS, maar zonder de volledige
uitwerkingen van de opgaven.
Twee van de practica gaan over padanalyse, 1 over factoranalyse. WE hoeven hier geen
huiswerk voor te maken, maar we de leerstof bijhouden.
Je haalt het vak door aan de practicumeis te voldoen en minstens een 6 voor het tentamen.
Het tentamen bestaat uit ongeveer 40 multiple choice vragen (kennis, begrip, toepassing,
interpretatie, inzicht!).
Voorkennis
,Toegepaste methoden en statistiek
We zullen eerst een interactieve toets doen via Presenterswall over voorkennis uit MTO-
vakken.
Eenheden: de groep en/of personen waarin je geïnteresseerd bent
Leerdoelen college 1
Na dit college
- Begrijp je het doel van een padmodel/padanalyse
- Begrijp je het verband tussen padanalyse en regressieanalyse (MTO-D)
- Kun je uit een theorie (tekst, filmpje) de variabelen en causale hypothesen halen
- Kun je zes soorten relaties herkennen in een theorie en tekenen: direct, indirect,
schijn-, onbekend, wederkerig, conditioneel effect
- Ken je het verschil tussen causatie en correlatie
- Kun je causale van niet-causale uitspraken onderscheiden
Doel van padmodel
Het doel van een padmodel is om theorieën (zoals die van Hank Green, slide 27) te vertalen in
een formele vorm, het “paddiagram”, om daarna te kunnen onderzoeken of de
veronderstelde theorie overeenkomt met geobserveerde correlaties in de werkelijkheid.
Basiselementen van een padmodel
1. Variabelen
= de eigenschappen van onderzoekseenheden waar je in geïnteresseerd bent. Er moet
variatie zijn in de eigenschap over de eenheden, als dat niet zo is heb je het niet over
een variabele maar een constante.
Veelvoorkomende fouten bij variabelen zijn een verwarring van de waarden van de
variabele met de variabele zelf & verwarring van een proces of een theorie met een
variabele.
2. Relaties tussen variabelen
Een relatie is een uitspraak waarin twee variabelen voorkomen, de waarden van de
ene variabele gaan samen met die van de andere. Er zijn twee soorten uitspraken:
a. Covariatie (correlatie)
b. Causale effecten
Betekent dat de ene variabele leidt tot verandering in de andere variabele. Als
je de onafhankelijke veranderd, dan verandert daardoor ook de afhankelijke.
3. Soorten relaties/effecten
a. Direct
Bij een direct effect heeft variabele y1 een effect op y2. En bijvoorbeeld y2 op
y3.
b. Indirect
Bij een indirect effect heeft variabele y1 een effect op y3 VIA y2. Y2 is hier een
mediator.
c. (Onbekend)
Bij een onbekend effect wordt er geen uitspraak gedaan over de richting van
een effect. In het padmodel wordt dan simpelweg de correlatie opgenomen
(aangegeven met een dubbele pijl).
Afhankelijk van de WARE relatie tussen de variabelen kan de richting van de
pijl een schijnrelatie of een indirect effect aanduiden.
,Toegepaste methoden en statistiek
d. Schijnrelaties (spurious)
(uitspraak 1) “variabele x veroorzaakt y1”
(uitspraak 2) “variabele x veroorzaakt y2”
(covariatie-uitspraak) “y1 hangt samen met y2”
X is een gemeenschappelijke oorzaak van y1 en y2, maar doordat die allebei
door x worden beïnvloed is er een covariatie tussen y1 en y2. Er is echter geen
causale relatie tussen y1 en y2.
Vb. hogere ijsverkoop gaat samen met hogere aantallen haaienaanvallen.
Maar worden die aanvallen dan veroorzaakt door de ijsjes? Nee. Ze worden
allebei verklaard door de variabele mooi weer.
e. Wederkerige effecten (reciprocal)
Vb. gezond veroorzaakt geluk, maar andersom geldt dit ook.
Oftewel (Uitspraak 1) “variabele y1 veroorzaakt y2” en (uitspraak 2) “variabele
y2 veroorzaakt y1”.
In het padmodel herken je dit effect niet aan 1 dubbele pijl, maar aan twee
directe effecten (en dus twee losse pijlen). Daarnaast wordt een
wederkerig/reciprocal effect niet expliciet genoemd.
f. Conditionele effecten
Soms beïnvloedt de variabele niet (alleen) een andere variabele, maar ook een
effect. Dit is ook wel moderatie of interactie. De variabele heet dan ook wel
een moderator.
Basiselementen overzicht
Het verschil tussen covariatie en causale verklaringen zie je vooral bij de “spurious relation”.
Hier hangen x en y wel samen, maar dit wordt veroorzaakt door een de variabele s. Covariatie
is dus NIET hetzelfde als causatie
Oefenvraag
“Stress-induced increases in dopamine secretion are thus thought to explain (...) enhanced
reward-learning [due to stress].” (Oei et al. 2014, Psychoneuroendocrinology, 39:111-120).
Wat voor relatie wordt hier beschreven?
a. Schijnrelatie
b. Indirect effect
c. Covariatie
d. Conditioneel effect (moderatie)
Antwoord: b. De relatie is als volgt, stress -> dopamine secretion -> reward-learning. Stress
heeft dus een indirect effect op reward-learning.
,Toegepaste methoden en statistiek
Hoorcollege 2
Leerdoelen na dit college:
- Kun je een padmodel tekenen op basis van een theorie
- Weet je wanneer een causale hypothese al dan niet verworpen is (een causale
hypothese is nooit bewezen!)
- Ken je de gouden regel en de daaruit volgende noodzakelijke uitbreidingen van een
padmodel
- Kun je de exogene en endogene variabelen identificeren in een padmodel
- Ken je de betekenis en aannames van disturbance terms
- Kun je een padmodel omzetten in lineaire regressievergelijkingen
Van theorie naar paddiagram
Om vanuit een tekst een paddiagram op te stellen, zijn er 3 stappen die je kunt volgen:
1. Als eerste maak je een lijst met variabelen
2. Vervolgens stel je de causale ordening vast
3. Als laatste formuleer je de causale hypotheses
Toetsen van causale hypothesen
Probleem: je hebt allemaal causale hypotheses in het padmodel, maar in de werkelijkheid kun
je niet direct observeren of dit ook echt zo is. Causale hypotheses kunnen nooit bewezen
worden met correlaties. Je ziet enkel of twee variabelen met elkaar “samen gaan”, maar dat is
niet per sé een causaal verband omdat een schijnrelatie een alternatieve verklaring kan zijn
voor het “samen gaan”.
Stel je hebt de volgende causale hypothese:
, Toegepaste methoden en statistiek
Er kan ook het volgende aan de hand zijn, y1 en y2 hebben dezelfde oorzaak x. Daardoor is er
ook een samenhang te zien tussen y1 en y2:
Of juist een combinatie van de vorige twee:
Om na te gaan of b1≠0 (causaal verband) nemen we een schijnrelatie op in
het padmodel.
Hierop volgt de gouden regel:
“Alle variabelen die een schijnrelatie kunnen veroorzaken tussen twee variabelen met een
verondersteld causaal verband ertussen, moeten worden meegenomen in het model.”
Uit het voorgaande plaatje blijkt dus de noodzakelijke uitbreidingen van het model, je moet
namelijk de gemeenschappelijke oorzaken (x) toevoegen.
Voorbeeld:
Een mogelijke gemeenschappelijke oorzaak hier is
parent-overambition. Als de ouders te veel van hun kind verwachten heeft deze wellicht te
weinig tijd voor zijn vrienden.
Hoe kun je deze causale hypothese nu toetsen? Als je het model gaat schatten kunnen er
verschillende mogelijkheden zijn: