Voortgezette statistiek blok 2b
Paddiagram
- Paden geven zwakke causale ordening aan:
o Het pad van x naar y beweert niet dat onafhankelijke variabele x de afhankelijke variabele y
direct veroorzaakt, maar eerder dat als x en y causaal gerelateerd zijn, de oorzaak in de
richting van de pijl in het paddiagram ligt.
o Een verandering in de staart (= tail variabele) resulteert in een verandering in de kop (= head
variabele) gegeven dat alle andere variabelen constant blijven.
- Paden zijn gestandaardiseerde regressie coëfficiënten:
o Hierdoor kunnen paden direct met elkaar vergelijken worden met betrekking tot sterkte.
o Interpretatie in termen van standaarddeviaties.
Doel padmodel
- Is om theorieën over causale verbanden te representeren aan de hand van regressiemodellen.
- Padmodel controleert voor derde variabelen door gebruik te maken van regressiemodellen
- Wordt gebruikt om oorzaken en gevolgen te achterhalen.
- We maken hierbij onderscheid tussen directe en indirecte effecten want je vraagt je af, hoeveel
gewicht hangt er aan elke pijl in het paddiagram.
Effecten
- Direct effect = 1 variabele heeft een directe pijl naar een andere variabele.
- Indirect effect = een variabele heeft via een tweede variabele effect op een andere variabele.
- Totale effect = het directe en indirecte effect opgeteld.
Voorwaarden causaliteit (3)
1. Er is sprake van een verband tussen 2 variabelen.
2. Er is sprake van een logische tijdsvolgorde waarin een verandering in de ene variabele voorafgaat
aan een verandering in de tweede variabele.
3. Er wordt gecontroleerd voor derde variabelen.
a. Als relatie tussen x en y verdwijnt bij controle van derde variabelen, is er geen sprake van
causaal verband tussen x en y.
- Causaliteit kan nooit bewezen worden: als relatie tussen x en y verdwijnt bij controle van derde
variabelen, is er geen sprake van causaal verband tussen x en y. als de relatie echter niet
verdwijnt, kunnen we nog niet stellen dat er sprake is van een causaal verband.
- ‘’Cause’’ is meer een probalistische term dat de kans op Y wordt vergroot door X.
Common causes
Variabelen die zowel de veronderstelde oorzaak als gevolg beïnvloeden. Zij kunnen dus een
gemeenschappelijke oorzaak zijn voor het ontstaan van de x en y waardoor ze de relatie tussen die
twee variabelen spurious maken.
- Problem of the omitted common causes: lasting om te voldoen aan de voorwaarde dat de relatie
tussen 2 variabelen een echte relatie is en geen spurieuze. Daarom moeten alle omitted causes
worden meegenomen.
- Omission of an common cause: weglaten van een belangrijke variabelen, mogelijk wordt dan
effecten overschat.
,Common consequence
Situatie waarin 2 of meer variabelen dezelfde gevolg delen.
- Een gedeelde consequentie die wordt veroorzaakt door verschillende oorzaken (variabele Z is
zowel het gevolg van X1 als het gevolg van X2.
Aannames paddiagram (4)
1. Geen sprake van omgekeerde causaliteit
Paden gaan de juiste richting op
Model is recursief
2. Variabelen zijn perfect gemeten
Zowel betrouwbaar als valide gemeten anders zijn de schattingen vertekend
3. Staat van equilibrium
Causale processen moeten een kans hebben gehad om te werken
4. Geen common causes
Er moeten geen vergeten gezamenlijke oorzaken zijn
Extra aannames paddiagram (2)
1. Oorzaken zijn unitair
Een gehele variabele T is de oorzaak van variabele A en B gezamenlijk.
Een deel van variabele T wordt niet verklaard door A en de andere door B.
o Uitzondering: residuele variantie die meer oorzaken weergeeft buiten het paddiagram (de
pijl van de errorterm naar variabele T).
2. Causale relaties die worden weergeven met pijlen zijn lineair.
Soorten variabelen in paddiagram
- Exogene variabelen = oorzaken (causale bronnen) liggen buiten het model.
o Er gaan geen pijlen naar de variabele.
o Variabele is causaal onafhankelijk van de andere variabelen in het model.
o Het is een source variabele of een upstream variabele.
- Endogene variabelen = oorzaak (ten minste één causale bron) liggen binnen het model.
o Er gaan wel pijlen naar de variabele.
o Variabele is causaal afhankelijk van de andere variabelen in het model.
o Het is een downstream variabele.
- Manifeste variabele = variabelen die gemeten/geobserveerd zijn.
- Latente variabele = variabelen die niet gemeten of niet direct observeerbaar zijn.
VB: de errorterm, die alles wat niet verklaard kan worden door de predictoren weergeeft. Deze
errorterm wordt weergeven als er een variabele gebruikt wordt om een andere te voorspellen.
Vormgeving paddiagram
- Rechthoek = geobserveerde variabelen (manifest)
- Cirkels = ongeobserveerde variabelen (latent, bijvb. errorterm)
- Variabelen met hoofdletters
- Paden met kleine letters
- Relaties met pijlen
o Rechte pijl met 1 pijlpunt = causale relaties
o Vermoedelijke oorzaak naar vermoedelijk effect
2
, o Op basis van theorie en voorgaand onderzoek.
o Kromme pijl met 2 pijlpunten = correlatie
o Geen indicatie van richting.
o Enkel indicatie van samenhang.
Wright’s Tracing Rule
First law op path analysis = ‘’de correlatie tussen twee variabelen is de som van het product van alle
paden op alle mogelijke routes’’.
Uitzonderingen (3):
1. Geen loops: je mag niet 2x door dezelfde variabele.
2. Je mag niet eerst vooruit gaan en daarna terug: een relatie via een gezamenlijk oorzaak mag,
maar niet via een gezamenlijk gevolg.
3. Maximaal één kromme pijl per pad.
Compound path = als een situatie kan worden weergeven in een proper diagram, dan wordt er
voldaan aan Wrights Tracing Rule en zijn de paden die twee variabelen verbinden compound paths
(=de correlatie tussen elk paar variabelen kan geschreven worden als de som van alle paden die de
twee variabelen verbinden).
De numerieke waarden van een compound path is gelijk aan het product van de waarden van de
samenstellende pijlen.
Gegeven de correlaties tussen geobserveerde waarden, kunnen de waarden van de causale
paden berekend worden. De opgestelde vergelijkingen moeten dan worden opgelost.
Paddiagram is ‘’proper’’ en ‘’complete’’ als (3)
1. alle source/exogene variabelen verbonden zijn door kromme pijlen (correlaties) behalve als er
expliciet wordt verondersteld dat de correlatie tussen deze variabelen 0 is.
2. alle downstream/endogene variabelen verbonden zijn aan residuele pijlen (errorterm) behalve als
er expliciet wordt verondersteld dat alle oorzaken van variatie wordt weergeven door upstream
variabelen.
3. alle directe causale verbanden tussen 2 variabelen weergeven zijn met rechte pijlen.
Soorten causale relaties paddiagram (3)
1. Downstream flow of causation
Variabelen A en B leiden tot variabele T, weergeven met een rechte pijl.
T is endogeen en een downstream variabele.
A en B zijn exogeen en source variabelen.
A en B zijn gecorreleerd, weergeven met een kromme pijl.
2. Mutual influences
Er lopen dubbele pijlen van variabelen A naar B en van B naar A.
Dit is een nonrecursief model.
3. Feedback loops
Er lopen pijlen van variabelen A naar B naar variabele C weer terug naar A.
Dit is een nonrecursief model.
Recursief model = paden (oorzaken) lopen in 1 richting.
Nonrecursief model = paden (oorzaken) lopen in 2 richtingen waarbij een variabele zowel een
oorzaak als een gevolg is.
3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper nadiaschadenberg. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €13,99. Je zit daarna nergens aan vast.