Samenvatting Toegepaste Methoden En Statistiek (424532-B-6)
212 views 27 purchases
Course
Toegepaste Methoden En Statistiek (424532B6)
Institution
Tilburg University (UVT)
Een duidelijke samenvatting van alle colleges van het vak toegepaste methoden en statistiek gegeven door Kim de Roover en Wilco Emons, hiermee omvat deze samenvatting alle stof die je moet kennen voor het tentamen. In de samenvatting worden veel afbeeldingen en voorbeelden gebruikt om de stof beter...
Hoorcollege 1
Pad-analyse geeft antwoord op de vraag: “kunnen de correlaties
tussen een groep variabelen verklaard worden door de causaal
model?”.
Factoranalyse geeft antwoordt op de vraag: “kunnen de
correlaties tussen een groep variabelen verklaard worden door
één onderliggend construct (of meerdere?”.
Structural equation modeling geeft antwoord op de vraag
“kunnen de correlaties tussen een groep variabelen verklaard
worden door onderliggende constructen en causale effecten
daartussen.
In de figuren hiernaast die je van boven naar beneden een pad-
analyse, factoranalyse en een structural equation modeling.
Hierbij staan in de cirkels variabelen die niet rechtstreeks te
observeren/meten zijn en in de vierkantjes staan variabelen die
observeerbaar/meetbaar zijn.
Pad-analyse
Het doel van een pad-model is om theorieën te vangen in een formele vorm, het
“paddiagram”, om daarna te kunnen onderzoeken of de veronderstelde theorie overeenkomt
met geobserveerde correlaties in de werkelijkheid.
Basiselementen van een pad-model
Variabelen
Relaties tussen variabelen: covariatie (correlatie) of causale effecten.
Soorten relaties/effecten: direct, indirect, onbekend, schijnrelaties (spurious), wederkerige
effecten (reciprocal) of conditionele effecten.
Variabelen
Variabelen zijn de eigenschappen van onderzoekseenheden (bv. personen, echtparen,
scholen) waar je in geïnteresseerd bent.
Er moet variatie zijn in de eigenschap over de eenheid.
Als er geen variatie is in de eigenschap over de eenheden is het geen variabele maar een
constante (bv. bij TM&S studenten is student/geen student gaan variabele meer maar een
constante).
Veelvoorkomende fouten:
1. Verwarring van de waarden van de variabele met de variabele zelf (bv. “rijk” en “arm”
zijn twee waarden van dezelfde variabele “inkomen”, dus deze moet je niet apart
opnemen in het model).
2. Verwarring van een proces of een theorie met een variabele (bv. attribution theory of
math-related career choice process).
Relaties
Een relatie is een uitspraak waarin twee variabelen voorkomen, waarbij de waarden van de
ene variabelen samengaan met die van de anderen.
Covariate relatie: het waarde op de ene variabele gaat hand in hand met de waarde van de
andere variabele (er is dus geen causaliteit). Woorden die hierbij vaak gebruikt worden zijn:
gerelateerd, geassocieerd, vaak ook, hangt samen, ect.
Causale relatie: de ene variabele leidt tot verandering in de andere variabele (er is een
oorzakelijk verband). Dus als je de onafhankelijke variabele verandert, dan verandert
, daardoor ook de afhankelijke variabele (bv. opletten leidt tot kennis). Woorden die hierbij
vaak gebruikt worden zijn: induceren, voortbrengen, produceren, veroorzaken, beïnvloed,
geeft een effect op, vergroot de kans dat, zorgt ervoor dat, ect.
Schijnrelaties (spurious relations): correlaties die ontstaan omdat beide
variabele causaal worden verklaard door 1 andere variabele X ze zijn dus
eigenlijk niet gerelateerd. Er is hierbij dus sprake van een gemeenschappelijke
oorzaak (bv. causale uitspraak 1: chocolade leidt tot geluk, causale uitspraak 2:
chocolade leidt tot langer leven, dit leidt tot de covariatie: gelukkige mensen
leven langer).
Direct effect: variabele 1 heeft rechtstreeks uitwerking op variabele 2
(bv. valence of emotion heeft direct effect op self-care).
Indirect effect: variabele 1 heeft effect op variabele 2 via een derde
variabele (een mediator)(bv. valence of emotion heeft indirect effect op health via de
mediator self-care).
Onbekende effect: effecten waarbij geen uitspraak gedaan wordt over de richting van het
effect, deze effecten worden als correlatie (dubbele pijl) in het pad-model opgenomen. Bij
deze effecten zijn we in werkelijkheid niet geïnteresseerd in de richting.
Wederkerige effecten (reciprocal): variabele 1 veroorzaakt een effect op
variabele 2, maar variabele 2 veroorzaakt ook een effect op variabele 2,
hierbij versterken beide variabele elkaar. Dit wordt weergegeven met twee
directe effecten (dus twee enkele pijlen, en geen dubbele pijl) (bv.
gezondheid leidt tot geluk en geluk leidt tot gezondheid). Wederkerige effecten worden vaak
niet expliciet vermeld.
Conditionele effecten: soms beïnvloedt een variabele niet (alleen) een
andere variabele, maar (ook) een effect, dan is deze variabele een
moderator. Dit wordt ook wel een moderatie of interactie genoemd (bv.
negatieve emoties leiden tot zelfverwaarlozing, tenzij de persoon een
relatie heeft (de variabele relatie is hier de moderator)).
Een correlatie tussen X en Y kan dus door veel verschillende effecten
verklaard worden:
1. Belangrijk is dat een correlatie tussen X en Y niet betekent
dat er een causaal verband bestaat tussen X en Y.
2. Bij een indirect effect staat de ‘m’ voor een mediator, bij een
conditioneel effect staat de ‘m’ voor moderator.
Hoorcollege 2
Van tekst naar paddiagram
1. Maak een lijst van de variabelen (let op dat de verschillende waarde van 1 variabele niet als
losse variabele ziet).
2. Stel de causale ordening vast (in welke volgorde komen de variabele voor?).
3. Formuleer causale hypothese (pijlen trekken tussen de verschillende variabele).
Toetsen van causale hypothesen
, In de praktijk zien we niet of een causale hypothese waar is, we zien alleen of twee variabele
“samen gaan”. Dit is niet persé een causaal verband omdat een schijnrelatie een alternatieve
verklaring kan zijn voor het “samen gaan”
Causale hypotheses kunnen dus nooit bewezen worden met correlaties, wel kunnen ze
ontkracht worden als de schijnrelatie even groot is als de correlatie!
Omdat er altijd sprake kan zijn van een schijnrelatie moet je je houden aan de gouden regel:
alle variabelen die een schijnrelatie kunnen veroorzaken tussen twee variabelen met een
verondersteld causaal verband ertussen, moeten worden meegenomen in het model
noodzakelijk uitbreiding van het model: gemeenschappelijke oorzaken toevoegen.
Als de grootte van de schijnrelatie even groot is als de correlatie, dan is de causale hypothese
ontkracht.
De mogelijke bevindingen over de relatie tussen peer relations en self concept met een
mogelijk schijneffect van parental pressure zie je hieronder.
Twee mogelijkheden:
1. Grootte van de schijnrelaties(s) = correlatie b1 = 0, geen causaal verband, causale
hypothese weerlegd.
2. Groote van de schijnrelatie(s) ≠ correlatie wel een causaal verband, of niet alle
variabelen die een schijnrelatie veroorzaken zijn meegenomen in het model (de causale
relatie is dus niet bewezen).
Endogene & exogene variabele
Endogene variabele: een variabele die verklaard wordt (waar een pijl naartoe wijst).
Exogene variabele: een variabele die niet verklaard wordt (waar geen pijl naartoe wijst).
Je moet er rekening mee houden dat er altijd onbekende effecten (correlaties) zijn tussen de
exogene variabelen, ook als deze niet getekend zijn in het model. Dit zijn effecten waarin we
niet geïnteresseerd zijn, maar dat betekent niet dat ze er niet zijn!
Disturbance terms
Er zijn altijd andere variabele die de endogene variabele beïnvloeden, het is alleen praktisch
niet mogelijk om deze allemaal op te nemen in het model (en te meten). daarom wordt er
gebruik gemaakt van disturbance terms (zeta ζ).
disturbance terms (zeta ζ):
1. onbekende variabelen die effect hebben op endogene
variabele.
2. Bekende maar weggelaten variabelen (klein effect die niet
mogelijk is om te meten).
3. Menselijke onvoorspelbaarheid.
4. Meetfouten in endogene variabele.
, Disturbance terms zijn er altijd, ook als ze niet expliciet in het model vermeld staan.
De disturbance terms kun je zien als een soort ‘errors’: deel van de endogene variabele dat
niet verklaard kan worden door de exogene variabele(n).
Assumpties over disturbance terms: disturbance terms zijn klein, ongecorreleerd aan elkaar
en ongecorreleerd aan exogene variabelen. Dus:
o Alle variabelen die zijn weggelaten uit het model hebben een relatief klein effect op
de endogene variabelen.
o Alle variabelen die zijn weggelaten uit het model zijn onderling ongerelateerd.
o Er zijn geen schijnrelaties weggelaten uit het model.
Van paddiagram naar lijnrechte vergelijking
Je kan een relatie tussen 2 variabelen vaak ook in een lijnrechte
vergelijking weergeven, hierbij geeft de pad-coëfficiënt ‘b’ de
verandering van variabele Y waar, als de onafhankelijk variabele X
1 eenheid verandert (de padcoëfficiënt is dus de niet-
gestandaardiseerde regressiecoëfficiënt).
In de praktijk is er eigenlijk nooit sprake van 1 variabele X
die een eenduidig causaal effect heeft op de andere
variabele Y meestal spelen er meerdere variabelen een
rol, hiermee moet je dus ook rekening houden in het model
(je gaat er voor nu vanuit dat er geen interactie is tussen
deze verschillende variabelen, dus de lijnen in de grafiek
moeten parallel lopen).
Tot nu toe hebben we het gehad over situaties waarin
er maar één afhankelijk variabele was, maar er is ook
mogelijk dat er meerdere endogene variabelen zijn in
een paddiagram. In dit geval maak je 1 vergelijking per
endogene variabele met daarin:
o Alle variabelen die de endogene variabele
verklaren (direct effect)
o Een intercept
o Een disturbance term
Belangrijk: je maakt 1 vergelijking per endogene
variabele en niet per pijl!
Hoorcollege 3
Schatten van padcoëfficiënten
Probleem: je bent geïnteresseerd in een causale hypothese tussen Y1 en Y2, maar je
observeert alleen een correlatie tussen Y1 en Y2 hoe kan je dan ooit iets zeggen over je
causale theorie op basis van deze correlatie en hoe kom je aan de Pad-coëfficiënten van de
effecten.
Als er sprake is van een direct effect van X op Y1 is het effect gelijk aan b1, en het effect van
Y1 op Y2 is gelijk aan b2. Er is hier dus ook een indirect effect van X op Y2 via Y1, dit effect is
gelijk aan het product van b1 en b2.
Wanneer X naast het indirecte effect op Y2 via Y1 ook een
direct effect heeft op Y2 is de pad-coëfficiënt gelijk aan de
som van het indirect effect (product van b1 en b2) en het
directe effect (b3).
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller juliasistermans. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.33. You're not tied to anything after your purchase.