Leerdoelen Toegepaste methoden en statistiek
Leerdoelen voor de gehele cursus
Padanalyse toepassen en interpreteren om conclusies te trekken over causale hypothesen.
Drie soorten van factoranalyse toepassen en interpreteren: principale componentenanalyse
(PCA), exploratieve factoranalyse (EFA) en confirmatieve factoranalyse (CFA).
De verschillen tussen PCA, EFA en CFA uitleggen en beargumenteren welke van deze
methoden het meest geschikt is voor een gegeven onderzoeksvraag.
De toepassing van pad- of factoranalyse in (stukjes uit) psychologisch relevante
onderzoeksartikelen kritisch evalueren.
De verschillen tussen de geleerde methoden uit de MTO cursussen uitleggen en de geschikte
methode kiezen voor een gegeven onderzoeksvraag.
Hoorcollege 1
Begrijp je het doel van een padmodel/padanalyse
Theorie omzetten in een formele vorm. Theorieën vangen in een formele vorm = paddiagram, om
daarna te kunnen onderzoeken of de veronderstelde theorie overeenkomt met geobserveerde
correlaties in de werkelijkheid.
Begrijp je het verband tussen padanalyse en regressieanalyse
Padanalyse kan veel groter worden dan regressieanalyse. Padanalyse is een samenknoping van
verschillende regressies. Bij regressieanalyse was het daarnaast ook vooral predictief, je deed alleen
voorspellingen en bij padanalyse kun je ook iets zeggen over causaliteit.
Kun je uit een theorie (tekst, filmpje) de variabelen en causale hypothesen halen
Voorbeeld:“Researchers don’t know exactly how chronic negative emotional states influence health
but it maybe some combination of lifestyle or behavioral factors, like neglecting your health or not
taking your heart medication when you’re feeling blue, or social factors like the way that depression
can be isolating and thus prevents others from helping you out. Or biological factors like increases in
certain kind of inflammatory proteins released by the immune system in response to stress and
sadness.”
Kun je zes soorten relaties herkennen in een theorie en tekenen: direct, indirect, schijn-, onbekend,
wederkerig, conditioneel effect
1. Schijnrelatie= Spurious relation = Een causale relatie met een
gemeenschappelijke oorzaak. Covariantie met y1 en y2. Meer ijs verkocht en
meer verdrinkingen beide veroozaakt door warmer weer, dus covariantie
tussen ijs en verdrinking. Beide worden echter
veroorzaakt door een andere variabele. Er is
dus geen causatie tussen Y1 en Y2!
2. Direct effect = Het effect van valence of
emotion op Self-care
3. Indirect effect = Het effect van valence of
emotion op health, via de variabele self-care. Selfcare is hier de mediator. Verandering in
emoties gaat samen met verandering van gezondheid, via verandering in self-care.
, 4. Onbekend effect = Geen uitspraak over een richting van een effect dubbele pijl opnemen
in je padmodel = correlatie. Hier hoef je niet per se in geïnteresseerd te zijn, maar je neemt
het voor je volledigheid wel op in je model.
5. Wederkerig (reciprocal) effect = Effect dat de ene kant op gaat, en dan ook weer terug gaat.
Twee directe effecten die allebei de andere kant op wijzen: NIET één pijl met
twee richtingen, echt twee losse pijlen. VB: gezondheid gelukkig
gezondheid.
6. Conditioneel effect = Het effect van X op Y hangt af van een andere
variabele, en die andere variabele is de moderator. De moderator heeft een
effect op het effect van X op Y. In zo’n situatie is er ook sprake van een
interactie. ‘Relationship’ is hier de moderator.
Ken je het verschil tussen causatie en correlatie.
Covariatie = samengaan van ene variabele met andere variabele
Causatie = ene variabele leidt tot verandering in de andere. Effect van de ene variabele veroorzaakt
een verandering in een andere variabele.
Bij covariatie heb je niet altijd causatie, maar bij causatie heb je wel altijd covariatie!
Covariatie is GEEN causatie!
Kun je causale van niet-causale uitspraken onderscheiden.
Voorbeeld: Jeanne Calment (1875-1997) was de oudste mens ooit (van wie de leeftijd is
geverifiëerd). Ze at 1kg chocolade per week tot haar dood op 122 jarige leeftijd. Covariatie
uitspraak.
,Hoorcollege 2
Kun je een padmodel tekenen op basis van een theorie
- Maak een lijst met variabelen vierkantjes in je paddiagram
- Causale ordening vaststellen
- Causale hypotheses formuleren teken pijlen tussen de vakjes. Elke pijl is een causale
hypothese
Weet je wanneer een causale hypothese al dan niet verworpen is (nooit bewezen!)
In praktijk alleen zien dat twee variabelen samengaan, niet zeggen over of de causale hypothese
waar is. Toch wil je die gaan toetsen. Schijnrelatie kan alternatieve verklaring zijn voor ‘samen
gaan/zijn’. Causale hypotheses kunnen hierdoor niet bewezen worden met correlaties, want
‘schijnrelatie’ mogelijk.
De causale hypothese van Y1 op Y2 kan er op de onderste drie manieren uit zien. Het kan zijn dat de
relatie tussen Y1 en Y2 verklaard wordt door een alternatieve verklaring en dan is er geen causale
relatie. Je neemt zowel het directe effect als de schijnrelatie op in je padmodel om na te gaan of er
echt een effect is = b1. Je kijkt of b1 ≠ 0
Causale relaties kunnen niet bewezen worden met correlaties, maar ze kunnen wel ontkracht
worden grootte schijnrelatie (s) = correlatie, dan wordt de hele correlatie verklaard door
schijnrelaties : direct effect b1 =0. Volledige effect wordt verklaard door schijnrelatie.
Ken je de gouden regel en de daaruit volgende noodzakelijke uitbreidingen van een padmodel
Gouden regel = Alle variabelen die een schijnrelatie kunnen veroorzaken tussen twee variabelen
met een verondersteld causaal verband ertussen, moeten worden meegenomen in het model. Je
moet dan noodzakelijke uitbreidingen van je model doen= Als er een causale relatie is moet je alle
mogelijke gemeenschappelijke variabelen meenemen in je model. In het voorbeeld hieronder: voor
alle zekerheid bijvoorbeeld de directe relatie tussen peer-relations en self-concept meenemen, maar
ook de mogelijke gemeenschappelijke oorzaak : ‘parental pressure’ meenemen, schijnrelatie voor de
zekerheid ook meenemen in je model. Vóór het schatten van padcoëfficiënten stop je mogelijke
relaties in het model. Ná het schatten krijg je mogelijke bevindingen van wat er aan de hand is.
Wanneer parental pressure in dit voorbeeld volledig de covariatie tussen peer relations and self-
concept verklaart, dan is de causale hypothese weerlegd, dan is er geen causale relatie b1=0 tussen
die twee variabelen.
Belang van de gouden regel wanneer je schijnrelaties vergeet mee te nemen in je model, wordt
,het effect van Y1 op Y2 overschat. Je corrigeert niet voor het stukje covariatie dat verklaard wordt
door gemeenschappelijke oorzaak dus overschat je het effect, dat mogelijk in werkelijkheid 0 is.
Kun je de exogene en endogene variabelen identificeren in een padmodel
Endogeen = Een variabele die verklaard wordt (waar een pijl naartoe wijst, minstens 1x een
afhankelijke variabele.
Exogeen = Een variabele die niet verklaard wordt, waar géén pijl naartoe wijst. Variabele die je
gebruikt om de rest te verklaren en alléén te verklaren. Alleen vertrekkende pijlen die uit het vakje
gaan. Let op bij exogene variabelen: Er kunnen covarianties bestaan tussen exogene variabelen,
maar die wil je niet gaan verklaren, maar je neemt ze wel op in je model onbekende effecten (één
pijl met twee richtingen⇔ ). Er zijn altijd onbekende effecten tussen exogene variabelen, ook als ze
niet getekend zijn!
Ken je de betekenis en aannames van disturbance terms
Disturbance term = error term = residu. Het verschil tussen de geobserveerde score en de geschatte
score. Het is vaak onmogelijk om álle invloeden in je model te stoppen, factoren die invloed hebben
op de relatie. Er zijn dus altijd variabelen die een invloed op een relatie hebben, maar die niet in het
model zitten. Die extra invloeden neem je samen in de error term = disturbance term = residu = ζ.
Het is een stukje relatie dat niet verklaard wordt door variabelen in je model. Elke te verklaren
variabele = endogene variabele heeft een error term, altijd! Ook als je ze niet tekent.
Onbekende variabelen die invloed hebben op endogene variabelen
Bekende maar weggelaten variabelen
Menselijke onvoorspelbaarheid
Meetfouten (allerlei soorten mogelijke fouten) in endogene variabele
Aannames van de errorterm = disturbance term:
Ze zijn klein, er is niets belangrijks weggelaten
Ongecorreleerd aan elkaar onverklaarde stukje van twee variabelen zijn niet met elkaar
gecorreleerd
Ongecorreleerd aan exogene variabelen
Variabelen die je weglaat uit model hebben een relatief klein effect op de endogene
variabelen
Variabelen die zijn weggelaten uit het model zijn onderling ongerelateerd.
Er zijn geen schijnrelaties weggelaten uit het model.
,Assumpties disturbance terms bij meerdere endogene variabelen
Neem aan dat de disturbance terms die bij de verschillende endogene variabelen horen
ongecorreleerd zijn aan elkaar. Correlatie = 0
Iedere disturbance term is ongecorreleerd met de geobserveerde scores op de exogene
variabelen
Kun je een padmodel omzetten in lineaire regressievergelijkingen
De relatie van lineaire vergelijkingen kun je uitdrukken in een paddiagram. Je
regressiecoëfficiënt, is in je padanalyse je padcoëfficiënt. Voor elke waarde van X
verandert Y met b1 eenheden. Een verandering van één eenheid in x leidt tot een
verandering van b eenheden in y, ongeacht de waarde van x zelf. B is
ongestandaardiseerde regressiecoëfficiënt.
De best passende lijn is géén perfecte weergave van de dataset dus je
hebt altijd nog de errortermen = verschil tussen regressielijn en de
geobserveerde data. Een ander intercept kan ook van invloed zijn,
bijvoorbeeld een hele andere variabele die ook invloed heeft. In het 2 e
figuurtje hiernaast lopen de lijnen nog parallel aan elkaar ongeacht
de waarde van de andere variabele, is er een effect. Stel nu dat de lijnen kruisen, dat er wél een
interactie effect is van de twee variabelen, dan neem je dit ook op in je model.
Meerdere variabelen verklaard door theorie? voor elke endogene variabele
maak je dan een aparte regressievergelijking met alléén directe effecten. Géén
vergelijking per pijltje, maar alleen vergelijkingen opstellen per endogene
variabele waarin je geïnteresseerd bent, anders krijg je foute schattingen. A
staat hier voor intercept van de variabele. Voor elke endogene variabele heb je
óók een disturbance term die je in je padmodel tekent én opneemt in je
regressievergelijking.
Hoorcollege 3
Kun je directe, indirecte en totale effecten berekenen en interpreteren.
Iedere variabele doet wat de vorige variabele deed. Als x 1 eenheid
omhoog gaat, gaat y1 ook 1 eenheid omhoog en dit geldt ook voor
y2 wave in een stadion. Gaat om verandering van X ipv de
waarde van x.
Het directe effect van X op Y is b1. Het Indirecte effect van X op Y2
is b1 maal b2.
Wanneer er een direct effect van X op Y2 bij komt, dan tel je het
indirecte effect van X op Y2 op bij het directe effect van X op Y2 en
dat is het totale effect. Direct effect (b3)+ indirect (= b1xb2) effect
= totaal effect.
Begrijp je in hoeverre we iets kunnen zeggen over causatie op basis van
correlaties.
In praktijk weet je niet hoe variabelen zich gedragen, je ziet alleen een hoop correlaties tussen
variabelen en je ziet geen causaliteit. Er is echter wel een patroon van samengaan matchen de
, effecten in onze theorie met de geobserveerde correlaties? Je gaat het patroon van verwachte
correlaties obv theorie (padmodel) vergelijken met geobserveerde correlaties.
Je hebt verschillende patronen van samengaan. Welke samenhang verwacht je, op basis van een
bepaald padmodel = theorie? Bij het rechter plaatje is ten minste één van X of Y2 endogeen, dus dan
impliceer je geen relatie tussen X en Y2 verwachte correlatie van 0. Wanneer ze beide exogeen
zijn dan heb je nog een onbekend effect en dan is de correlatie gelijk aan het onbekende effect.
Tracing rule = wanneer je padcoëfficiënten mag vermenigvuldigen.
Vermenigvuldig coëfficiënten voor paden waarbij je geen enkele
variabele binnengaat én verlaat via een pijlpunt (tenzij pijlpunt van
onbekende effect). Wanneer pijlpunten botsen in één variabele mag je
niet vermenigvuldigen. TENZIJ van een onbekend effect, dan mag het
wel, maar bij TWEE onbekende effecten is het pad = 0, twee onbekende
effecten is overbodig.
Kun je de decompositieregel toepassen om model geïmpliceerde correlaties en padcoëfficiënten te
berekenen voor een eenvoudig padmodel (zie ook WC2).
Decompositieregel =
De COVARIANTIE tussen twee variabelen in een padmodel is gelijk aan de som van
alle directe effecten, indirecte effecten, onbekende effecten en schijnrelaties,
uitgedrukt in niet-gestandaardiseerde padcoëfficiënten. (tot nu toe vooral behandeld)
o Aantal eenheden toename in AV bij toename van 1 eenheid in OV
Deze ga je vanaf nu gebruiken De CORRELATIE tussen twee variabelen in een
padmodel is gelijk aan de som van alle directe effecten, indirecte effecten,
onbekende effecten en schijnrelaties, uitgedrukt in gestandaardiseerde
padcoëfficiënten
o Aantal standaarddeviaties toename in AV bij toename van 1 standaarddeviatie
in OV
Met behulp van de padcoëfficiënten kun je a.h.v. decompositieregel geimpliceerde (verwachte)
correlaties verkrijgen. Het kan ook andersom: Dat je met behulp van de geobserveerde correlaties