Dit document bevat uitgebreide en volledige aantekeningen van alle colleges van de cursus 'Toegepaste methoden en statistiek'. De hoorcolleges worden in het eerste blok van het 3e jaar van de psychologie bachelor gegeven door W. Emons.
De samenvatting bevat alle te kennen stof met uitgebreide voor...
Inhoudsopgave
HC 1 – Basiselementen van padanalyse ............................................................................................................ 3
Padmodel............................................................................................................................................................ 3
Enkele basisbegrippen ........................................................................................................................................ 4
Vijf basisrelaties tussen variabelen .................................................................................................................... 5
Samenvatting...................................................................................................................................................... 7
Padmodel checklist ............................................................................................................................................. 7
HC 2 – Van theorie naar padmodel & van padmodel naar lineaire regressievergelijkingen ............................... 8
Opstellen van een padmodel .............................................................................................................................. 8
Toetsen van causale hypothesen ...................................................................................................................... 10
Noodzakelijke uitbreidingen van het model ..................................................................................................... 11
Recursieve VS niet-recursieve modellen............................................................................................................ 12
Het vertalen van het padmodel naar het statistische model ............................................................................ 14
Padmodellen met rechtelijnrelaties .................................................................................................................. 19
HC 3 – Evalueren van padmodellen: decompositie & tracing rules ................................................................. 20
Het totale causale effect ................................................................................................................................... 20
Geïmpliceerde correlaties ................................................................................................................................. 23
Een uitgebreider voorbeeld .............................................................................................................................. 26
Model fit ........................................................................................................................................................... 27
HC 4 – Moderated mediation I........................................................................................................................ 31
Moderatie ......................................................................................................................................................... 31
Interacties binnen padmodellen ....................................................................................................................... 35
Mediatie (met behulp van Hayes’ macro’s) ...................................................................................................... 37
Moderatie (met behulp van Hayes’ macro’s) ................................................................................................... 40
Moderated mediation ...................................................................................................................................... 43
HC 6 – Factoranalyse I..................................................................................................................................... 55
, Een eerste kennismaking .................................................................................................................................. 55
Factoranalyse (FA) VS principale componenten analyse (PCA) ......................................................................... 59
Principale componentenanalyse ....................................................................................................................... 60
HC 7 – Principale componentenanalyse .......................................................................................................... 66
Principale componentenanalyse ....................................................................................................................... 66
Interpreteren van de resultaten na VARIMAX-rotatie ....................................................................................... 80
Interpreteren van resultaten na OBLIMIN-rotatie ............................................................................................ 83
HC 8 – PCA versus Factoranalyse .................................................................................................................... 85
Principale componentenanalyse VS. factoranalyse .......................................................................................... 85
Exploratieve factoranalyse ............................................................................................................................... 86
Het schatten van een factormodel ................................................................................................................... 89
Toepassen van exploratieve factoranalyse (EFA) .............................................................................................. 93
HC 9 – Exploratieve VS confirmatieve factoranalyse ..................................................................................... 105
Herhaling ........................................................................................................................................................ 105
Realistische praktijktoepassing van de EFA .................................................................................................... 107
Intro confirmatieve factoranalyse (CFA) ......................................................................................................... 114
Confirmatieve factoranalyse in de praktijk ..................................................................................................... 118
Model-fit onderzoek ....................................................................................................................................... 120
HC 11 – De keuze van een toets of methode................................................................................................. 130
Keuze van een toets of methode? ................................................................................................................... 130
t-test ............................................................................................................................................................... 131
AN(C)OVA ....................................................................................................................................................... 132
Regressieanalyse ............................................................................................................................................ 134
Oefenvragen → welke methode is het meest geschikt? ................................................................................. 137
2
, HC 1 – Basiselementen van padanalyse
In deze cursus worden er verschillende analyse-strategieën
behandeld:
1. Padanalyse = beantwoord de vraag ‘kunnen de
correlaties tussen een groep variabelen verklaard
worden door een causaal model?’
2. Factoranalyse = beantwoord de vraag ‘kunnen de
correlaties tussen een groep variabelen verklaard
worden door één onderliggend construct (of
meerdere)?’
- Plaatje = de vierkantjes staan voor variabelen die
gemeten kunnen worden. Het rondje staat voor
een variabele die niet direct gemeten kan
worden
• Intelligentie (g) op zichzelf kan je niet meten,
maar onderdelen van intelligentie zoals het oplossen van wiskundeproblemen kun je wel
meten
3. Structural equation modelling = beantwoord de
vraag ‘kunnen de correlaties tussen een groep
variabelen verklaard worden door onderliggende
constructen én causale effecten daartussen?’ →
Er is hierbij sprake van een padanalyse én
factoranalyse
Padmodel
Padmodel = een hypothese over onderliggende causale processen die de geobserveerde correlaties
tussen twee of meerdere variabelen verklaren → het doel van een padmodel is om theorieën op te
vangen in een formele vorm, om daarna te onderzoeken of de veronderstelde theorie overeenkomt met
de geobserveerde correlaties in de werkelijkheid
Waarom is dit nuttig?
Uit de plaatjes zou je kunnen concluderen
dat er een samenhang is tussen ‘aantal
Facebookvrienden’ en ‘welzijn’. Je zou dus
kunnen zeggen dat hoe meer
Facebookvrienden je hebt, hoe gelukkiger je
bent.
MAAR wanneer variabelen samenhangen betekent dit niet per se dat er sprake is van een causale relatie
(correlatie is geen causatie), er kan namelijk ook sprake zijn van een gemeenschappelijke
oorzaak = schijneffect!
- Je zou een correlatie kunnen vinden tussen ‘het eten van ijsjes’ en ‘verbrande
mensen’, maar als je dit verder onderzoekt zul je zien dat ‘warm weer’ de
gemeenschappelijke oorzaak is tussen deze twee variabelen, aangezien
warm weer ervoor zorgt dat mensen meer ijsjes eten, maar ook dat mensen
sneller verbranden. Het warme weer is hier dus een schijneffect.
→ Een belangrijk doel van causale analyses is het uitsluiten van schijneffecten!
3
,De vraag is dus: waarom correleren deze variabelen? → Is er een causale relatie? Welke andere
variabelen spelen een mogelijke rol is het causale mechanisme? Zijn er variabelen die als
gemeenschappelijke oorzaak dienen?
- Met andere woorden: wat is een mogelijk verklaringsmechanisme?
Plaatje = een mogelijk verklaringsmechanisme voor het
voorbeeld van de correlatie tussen ‘aantal
Facebookvrienden’ en ‘welzijn’ kan zijn dat mensen met
veel vrienden veel sociale steun ervaren, wat weer zorgt
voor een hogere mate van welzijn. Sociale steun is hierbij
een mediator. Sociale steun en welzijn worden beide weer
deels bepaald door:
1. De mate waarin men een positief zelfbeeld heeft
2. De mate waarin men een reëel beeld van zichzelf
heeft
→ We kunnen deze hypothesen in een paddiagram
weergeven, en onderzoeken tot in hoeverre dit model past
bij de data
Het doel van padanalyse → verklaren wáárom variabelen correleren
Onderzoek naar verklaringsmechanismen is:
1. Nuttig om te weten dat variabelen correleren, om bijvoorbeeld risico’s te voorspellen of
preventieve maatregelen te nemen. Maar de vraag ‘wáárom correleren de variabelen?’ is nog
interessanter, met name om schijneffecten van de echte effecten te onderscheiden
2. Belangrijk voor theorieontwikkeling en de ontwikkeling van effectieve interventies
→ Als je weet dat introverte mensen gevoeliger zijn voor burn-outs, kun je extra op hen letten. Maar als
je niet weet wáárom juist introverte mensen hier gevoeliger voor zijn wordt het lastiger om er écht iets
mee of aan te doen
Plaatje = de padanalyse wordt gebruikt om te zien of de
theoretische verbanden overeenkomen met wat we zien in de
data (de empirische verbanden)
Enkele basisbegrippen
Experimenteel onderzoek = actieve manipulatie van de onafhankelijke variabelen en random toewijzing
aan experimentele condities
Correlationeel onderzoek = het bestuderen van de samenhang tussen variabelen verkregen uit
vragenlijsten of veldobservaties. Er heeft GEEN manipulatie plaatsgevonden, in tegenstelling tot bij een
(quasi-)experimenteel onderzoek
Variabelen = de eigenschappen van onderzoekseenheden waar je in geïnteresseerd bent, hetgeen wat je
onderzoekt (personen, echtparen, scholen) → er moet variatie zijn in de eigenschappen over de
eenheden. Wanneer er geen variatie is in de eigenschap is het geen variabele maar een constante.
- LET OP! Of een eigenschap een variabele of een constante is hangt af van je specifieke
onderzoeksgroep (als je onderzoeksgroep alleen uit meisjes bestaat, is geslacht in jouw
onderzoek geen variabele maar een constante)
4
,Er zijn een paar veelvoorkomende fouten als het over variabelen gaat:
- Er kan een verwarring ontstaan van de waarden van de variabelen met de variabele zelf
→ ‘rijk’ en ‘arm’ zijn twee waarden van dezelfde variabele ‘inkomen’, en moet je dus niet
apart in het padmodel opnemen
- Dezelfde verwarring zie je soms terug in de opgestelde hypothese → het is onjuist om te
zeggen dat ‘een hoge opleiding samenhangt met inkomen’. ‘Een hoge opleiding’ is namelijk
een constante in dit geval. Je kan dan beter zeggen dat ‘opleiding samenhangt met inkomen’
of dat ‘hoogopgeleiden gemiddeld genomen meer verdienen dan laag opgeleiden’
Hypothese = een uitspraak over de veronderstelde relatie tussen twee (of meer) variabelen. Hierbij kan
het gaan om een causale of een correlationele hypothese
- Bovenste plaatje = een causale hypothese → het maken van
opgaves leidt tot een beter begrip van de stof
- Onderste plaatje = een correlationele hypothese → extraverte
personen ervaren gemiddeld genomen minder stress dan
introverte personen
→ Het verschil tussen een causale en een correlationele hypothese zie je door
de andere soort pijl in het model
Basisbegrippen uit de beschrijvende statistiek
- Gemiddelde
- Variantie = een maat voor spreiding, altijd een positief getal
- Standaarddeviatie = maat voor spreiding
- Covariantie = maat voor lineaire samenhang
• > 0 = positieve samenhang, < 0 = negatieve samenhang, 0 = geen samenhang
- Correlatie = een gestandaardiseerde maat voor lineaire samenhang
- Gestandaardiseerde scores = Z-scores
• Gemiddelde = 0, SD = 1 en variantie = 1 (deze moet je kennen!)
Vijf basisrelaties tussen variabelen
Elk padmodel kun je opsplitsen in een aantal basisrelaties = mogelijke verklaringen voor de
geobserveerde covariantie/correlatie tussen variabelen. De vijf basisrelaties zijn:
1) Directe effecten = de hypothese is dat veranderingen in X voor veranderingen in
Y zorgen. Hierbij geldt NIET dat veranderingen in Y ook voor veranderingen in X
zorgen (andersom geldt het effect dus niet) → X is de oorzaak en Y is het gevolg
- Een hoger salaris (X) zorgt voor een hogere motivatie (Y), maar als de motivatie wordt
vergroot door interessanter werk heeft dit geen direct effect op het salaris
2) Indirecte effecten = de hypothese is dat een verandering in X direct
voor een verandering in M zorgt, waarbij de verandering in M weer
direct voor een verandering in Y zorgt → een verandering in X zorgt
voor een verandering in Y, maar dit loopt indirect via M, dus variabele X heeft een indirect effect op Y
- Variabele M wordt ook wel de mediator of interveniërende variabele genoemd,
aangezien het de relatie tussen X en Y medieert
→ Voorbeeld
- Hypothese 1 = hoe meer negatieve gedachten,
hoe minder goed mensen zich verzorgen
- Hypothese 2 = hoe minder goed mensen
zichzelf verzorgen, hoe minder goed de
gezondheid is
5
,3) Schijnrelaties = de hypothese is dat er een direct effect is van Z op X, én een
direct effect van Z op Y → variabele Z is een gemeenschappelijke oorzaak voor
zowel X als Y
- Omdat beide X en Y dezelfde gemeenschappelijke oorzaak hebben
ontstaat er een samenhang tussen de twee variabelen. Maar een
verandering in X heeft GEEN effect op Y, en omgekeerd ook niet. Er
lijkt een effect te zijn, maar dat is schijn!
- Variabele Z wordt vaak aangeduid als een confounder
- Correlationeel onderzoek is er vaak op gericht om mogelijke
confounders op te sporen of uit te sluiten
→ De schijnrelatie tussen ijsjes eten en verdrinkingen, waarbij meer ijsjes eten tot meer verdrinkingen
zou leiden. Het warme weer is hier echter een verklaring voor, omdat dit zorgt voor het eten van ijsjes
en meer zwemmen (en dus ook meer verdrinkingen). Er is dus geen correlatie tussen ijsjes eten en
verdrinkingen zelf
4) Onbekende effecten = de hypothese is dat er een relatie is tussen X1 en X2, maar
dat we geen theoretische verwachting hebben t.a.v. de richting van het verband (het
kan direct, indirect of wederkerig zijn)
- Deze effecten worden weergegeven met een gebogen dubbele pijl →
geeft aan dat we een correlatie verwachten, maar we niet weten waarom
5) Wederkerige/reciproke effecten = de hypothese is dat een verandering in
X1 een verandering in X2 veroorzaakt, en dat X2 weer een verandering in X1
veroorzaakt, waarna dit weer een verandering veroorzaakt in X2 enz.
- Dit type relatie wordt vaak gebruikt om verschillen in traits (algemene trekken) en states
(tijdelijke toestanden) te onderzoeken
- Het onderzoeken van wederkerige effecten vereist longitudinaal onderzoek
→ Voorbeeld
1. Uitspraak 1 = variabele Y1 veroorzaakt Y2 → gezondheid veroorzaakt geluk
2. Uitspraak 2 = variabele Y2 veroorzaak Y1 → geluk veroorzaakt gezondheid
Conditionele effecten
Conditionele effecten = soms beïnvloedt een variabele
niet (alleen) een andere variabele, maar (ook) een effect.
Deze variabele is in dit geval een moderator/interactie →
negatieve emoties leiden tot zelfverwaarlozing (Self-care),
tenzij die persoon in een relatie zit
- Er is alleen een effect onder een bepaalde
conditie, en niet onder een andere conditie
(er is in dit voorbeeld alleen een effect als een persoon NIET in een relatie zit)
Nogmaals schijnrelaties → de maatschappelijke impact
Wanneer twee variabelen correleren KAN er sprake zijn van een causaal direct of indirect effect, maar
dat hoeft niet! Daarnaast kan je nooit met 100% zekerheid uitsluiten dat er nog een (onbekende)
gemeenschappelijke oorzaak is → je kunt causaliteit nooit bewijzen wanneer je gebruikmaakt van
correlationele data! Echter kunnen we wel proberen om zoveel mogelijk gemeenschappelijke oorzaken
uit te sluiten. Hoe beter dit lukt, hoe beter de theorie is!
6
,Samenvatting
Type relatie Padmodel Symbolisch Wordt er een causale relatie
tussen X en Y tussen X en Y verondersteld?
Direct effect X Y 𝑋 →𝑌 Ja
Indirect effect X M Y 𝑋 →𝑀 →𝑌 Ja
Schijnrelatie X 𝑋 ←𝑍 →𝑌 Nee
Z
Y
Onbekend effect X Y 𝑋 ↔𝑌 Nee
Wederkerig effect X Y 𝑋⇆𝑌 Ja
Padmodel checklist
Onderzoeksstadium Nr. Checklist-item
Model formuleren 1 De namen van de variabelen komen overeen met wat er daadwerkelijk
gemeten wordt
2 Er zijn geen variabelen weggelaten die volgens de theorie (of een
alternatieve theorie) een invloed hebben op ten minste twee van de
variabelen in het model, waarvan ten minste één endogeen (directe of
indirecte schijnrelaties)
3 De effecten in het padmodel zijn theoretisch verantwoord
4 Er zijn geen (directe of indirecte) effecten weggelaten tussen de variabelen
in het model, die er volgens de theorie wel moeten zijn
5 Er zijn geen moderatie-effecten weggelaten die er volgens de theorie wel
moeten zijn
6 We kunnen ervan uit gaan dat de disturbance terms klein zijn,
ongecorreleerd aan elkaar en ongecorreleerd aan de exogene variabelen:
• Alle variabelen die zijn weggelaten uit het model hebben een
relatief klein effect op de endogene variabelen
• Alle variabelen die zijn weggelaten uit het model zijn onderling
ongerelateerd
• Er zijn geen schijnrelaties weggelaten uit het model (zie nr. 2)
7
,HC 2 – Van theorie naar padmodel & van padmodel naar
lineaire regressievergelijkingen
Opstellen van een padmodel
Het tekenen van een paddiagram a.d.h.v. een tekst gaat volgens 5 stappen:
1. Maak een lijst met de variabelen
2. Beschrijf de causale hypothesen tussen deze variabelen → maak een lijst met wat wanneer in
de tijd komt
• Let erop dat de causale ordening niet altijd dezelfde volgorde is als de volgorde van de
variabelen die in de tekst staan beschreven
3. Teken de relaties in een conceptueel model → teken de pijlen tussen de variabelen. Hierbij geef
je aan welke variabele effect heeft op een andere variabele, en welke richting de pijlen hebben
4. A. Identificeer de endogene variabelen
B. Voeg disturbance termen aan de endogene variabelen toe en teken de correlaties tussen de
exogene variabelen
5. Ga na of er noodzakelijke uitbreidingen nodig zijn → toepassen van de gouden regel
Voorbeeld
Stel onderzoekers gaan uit van de volgende theoretische relaties tussen piekeren en fysieke gezondheid:
“Naarmate je meer piekert, slaap je slechter. Doordat je slechter slaapt, wordt je fysieke gezondheid
ook minder goed. Maar een slechte slaapkwaliteit is niet alleen afhankelijk van piekeren. Zo
verwachten we dat de kwaliteit van slapen mede wordt bepaald door de intensiteit van
schermgebruik (telefoon, tv, computer) in de avonduren.”
1. Variabelen → piekeren, kwaliteit van slapen, fysieke gezondheid, schermgebruik in de
avonduren
2. Causale hypothesen:
• Piekeren heeft een effect op slaapkwaliteit
• Slaapkwaliteit heeft een effect op fysieke gezondheid
• Schermgebruik in de avonduren heeft een effect op kwaliteit van slapen
3. Teken een conceptueel model:
• Naarmate je meer piekert, slaap je slechter → H1
• Slechter slapen heeft een negatief effect op fysieke
gezondheid → H2
• Schermgebruik in de avonduren heeft een effect op
kwaliteit van slapen → H3
4. A. Endogene variabelen → binnen causale modellen
maken we een onderscheid tussen exogene en endogene
variabelen (zie voorbeeld hieronder):
• Endogene variabele = een variabele die verklaard wordt door andere variabelen. Dit zijn de
variabelen waar een pijl naartoe wijst. Deze variabele kan eventueel zelf ook iets verklaren,
waardoor er dus pijlen in en uit kunnen gaan
• Exogene variabele = een variabele die NIET verklaard wordt door de andere variabelen, de
variabele fungeert alleen als een predictor. Dit zijn de variabelen waar GEEN pijl naartoe
wijst. Het is dus een verklarende variabele
8
, Endogene variabelen Exogene variabelen
B. Disturbance termen (onverklaarde variantie) → volgens ons model is piekeren een
causale factor voor de slaapkwaliteit, maar piekeren is vast niet de enige predictor (het weer,
je dagelijkse activiteit kunnen ook invloed hebben op je slaapkwaliteit)! Niet alle mogelijke
predictoren zijn namelijk in het model opgenomen
• Bovendien kunnen we piekeren en slaapkwaliteit niet direct meten. Hiervoor gebruiken
we meestal vragenlijsten, maar het gevolg hiervan is dat er onvoorspelbare meetfouten
in de data ontstaan → piekeren zal slechts een deel van de variantie in slaapkwaliteit
voorspellen (= verklaarde variantie), en een deel van de variantie in slaapkwaliteit blijft
onverklaard (= onverklaarde variantie)
• Bij regressieanalyses spreken we van errorvariantie of residuele variantie. Padanalyse
spreekt van disturbance termen, wat aangeduid wordt met het Griekse symbool 𝜁 (zéta)
→ disturbance terms is dus hetzelfde als errorvariantie!
• Conclusie = bij elke endogene variabele hoort ALTIJD een disturbance term die aangeeft
welk deel van de variantie in de endogene variabele NIET door andere variabelen in het
model wordt verklaard
o In ons voorbeeld zijn slaapkwaliteit en
fysieke gezondheid de endogene
variabelen, en dus krijgen deze een
disturbance term (plaatje)
- Rood = exogeen
- Groen = endogeen
- Paars = disturbance term
Assumpties over disturbance terms:
- Disturbance terms zijn klein → hoe kleiner de
disturbances, hoe groter de ‘verklaringskracht’ van het model
- Disturbance terms zijn ongecorreleerd aan elkaar
- Disturbance terms zijn ongecorreleerd aan elk van de andere variabelen in het model
En dus kunnen we stellen dat:
- Alle variabelen die zijn weggelaten uit het model een relatief klein effect hebben op de
endogene variabelen
- Er geen schijnrelaties zijn weggelaten uit het model
- De endogene variabelen voldoende betrouwbaar gemeten zijn
9
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller sannehielkema. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.57. You're not tied to anything after your purchase.