Dit is een uitgebreide samenvatting van "Toegepaste methoden en statistiek". De samenvatting is geschreven aan de hand van de colleges, en extra uitleg vanuit de werkgroepen zijn toegevoegd. Zelf heb ik een 9 gehaald voor het tentamen.
Hoorcollege aantekeningen Toegepaste Methoden en Statistiek
College 1
- In TMS gaan we verder met de vraag hoe je een theorie kunt vertalen in een
statistisch model, hoe je het model kunt toepassen op onderzoeksgegevens, en
hoe je vervolgens inhoudelijke conclusies kunt trekken op basis van het
toegepaste model.
- Daarnaast zullen we ingaan op technieken voor data reductie. Deze technieken
worden gebruikt om variabelen zo goed mogelijk samen te vatten in beperkt
aantal scores, en voor de analyse van tests en vragenlijsten.
Causale analyse
- Correlatie betekent geen causatie!
- Het feit dat twee kenmerken samenhangen wil niet zeggen
dat er ook sprake is van een oorzaak-gevolg relatie!
- Hoe onderzoeken we of er (mogelijk) sprake is van een
causale relatie tussen twee fenomenen?
- Door een experiment uit te voeren: je verdeelt personen in 2 groepen. Elke groep
ondergaat een verschillende interventie. Zijn er significante verschillen in de
uitkomstmaten? Zijn de verschillen significant? Dan is er voldoende bewijs voor
een causaal effect. Als er geen significant effect is, is er dus onvoldoende bewijs
dat er een causaal effect is.
- Maar experimenten zijn niet altijd mogelijk. In dat geval moeten we natuurlijk
gedrag analyseren = correlationeel onderzoek. We moeten het doen met data
die verkregen is uit observaties of vragenlijsten. Hoe kan ik op basis van
correlaties zinvolle uitspraken doen over causaliteit?
- Algemene opzet van causale analyse (padanalyse):
1. Begin met het opstellen van hypotheses: een causale theorie waarin de
causale mechanismen worden beschreven (waarbij we zoveel mogelijk varen
op wat we al weten!).
2. Vertaal de theorie in een statistisch
(causaal) model.
3. Verzamel data en schat hieruit de causale
effecten in het model.
4. Bekijk in hoeverre de verwachte correlaties
tussen de variabelen op basis van het
model overeenkomen met de
waargenomen correlaties. Als de
observaties niet bij de verwachtingen
passen dient het model aangepast (of
eventueel) verworpen te worden.
- Wanneer twee variabelen correleren, dan mag je niet zonder meer concluderen
dat er een directe causale relatie is tussen de twee variabelen, maar je hoeft een
causaal effect ook niet direct uit te sluiten!
, - Wanneer twee variabelen (zeg X en Y) correleren, dan zijn er verschillende
verklaringsmechanismen mogelijk die de correlatie geheel of gedeeltelijk
verklaren. Sommige verklaringsmechanismen veronderstellen een
causaal effect tussen X en Y, andere doen dat niet.
- Op basis van de correlatie alleen kunnen we geen conclusies trekken
welke van deze mechanismen het meest plausibel is, maar het betekent
dus dat het mogelijk is dat de correlatie een causaal effect weerspiegelt.
→ Om meer inzicht te krijgen in de vraag of de samenhang mogelijk causaal is, moeten
we meer variabelen in de analyses opnemen. Dit is wat we zullen doen in padanalyses!
Bijv. Als er meer ijsjes worden gegeten, zijn er ook meer ongevallen met haaien. Is er een
causale relatie? Door een derde variabele erbij te onderzoeken, in dit geval “het weer”,
kunnen we de relatie beter verklaren. Bij padanalyse kijk je dus naar een heel netwerk
aan variabelen.
o Bijv.: Er is een duidelijk verband tussen mensen die meer sporten en het
ervaren van geluk.
- Je zou kunenn zeggen dat geluk een direct effect is van sporten. Dus
als ik meer ga sporten wordt ik per definitie gelukkiger.
- Maar er zit nog iets tussen. Want als je meer sport, maak je meer
endorfine aan. Dus sporten heeft in dit model een causaal effect
op geluk maar het is een indirect effect.
- Maar misschien zijn er ook andere verklarignen mogelijk. Bijv.
Sporten kost geld. Het zou kunnen zijn dat mensen met een hoger
inkomen meer sporten en mensen met een hoger inkomen ook wat
gelukkiger zijn. Volgens dit model heeft sporten geen causaal
effect op geluk. Dit noem je een confounder, een schijnrelatie.
Als het model waar is zouden we moeten controleren op inkomen.
We kijken naar de relatie bij mensen met hetzelfde inkomen. Als de
relatie dan verdwijnt hebben we steun dat er een schijneffect is.
- We kunnen nog veel meer variabelen verzinnen die invloed hebben
op de correlatie tussen sport en geluk.
- Wat de werkelijkheid is, weten we nooit 100% zeker, maar naarmate
we meer te weten komen over de relaties met andere variabelen,
kunnen we (hopelijk) steeds betere modellen opstellen waarmee
we de samenhang adequaat causaal kunnen verklaren =>
wetenschappelijke theorievorming.
, - Maar waar we vooral naar streven is het uitsluiten van schijnrelaties!
Hoe meer schijnrelaties we kunnen uitlsuiten, hoe beter de
theorie!
- Dus wat is precies een schijnrelatie:
- Er is sprake van een schijnrelatie tussen X en Y als zij een
gemeenschappelijke oorzaak hebben (zoals variabele Z in
het figuur hiernaast).
- Omdat zowel X als Y dezelfde gemeenschappelijke
oorzaak hebben ontstaat er samenhang tussen de twee
variabelen. Maar een verandering in X heeft geen effect op
Y, en ook niet omgekeerd. Door de correlatie lijkt er een
causaal verband te zijn tussen de variabelen, maar dat is
schijn!
- Variabele Z wordt ook wel een confounder genoemd; best vertaald als
verstorende variabele. De confounder veroorzaakt de samenhang!
- Schijnsamenhang wordt in het Engels spurious relationship genoemd.
o Bijv. Kinderen die meer gamen vertonen meer agressie. Is hier sprake van
causaal verband, of zijn er variabelen denkbaar die zowel een direct effect
hebben op gamen en agressie? M.a.w., zijn er mogelijke confounders die
de relatie tussen gamen en agressie verklaren? Bijv. Geslacht. Misschien
gamen jongens meer en vertonen jongens meer agressie.
- Bij regreissieanalyse had je vaak 1 afhankelijke variabele, en een aantal
predictoren. Maar nu gaan we uitbreiden. Nu leren we met behulp van
padanalyse causale hypothesen tussen meerdere variabelen kunt onderzoeken
(= causale analyse).
- Padanalyse is eigenlijk een beschrijving van alle mogelijke causale processen.
- Vervolgens gaan we het model dat we hebben vergelijken met wat we zien. Het
doel van padanalyse is om meer te weten te komen zodat we uiteindelijk
theorieen kunnen maken.
Padmodellen
- Een padmodel is een beschrijving/weergave
van causale relaties.
- Het padmodel is 1 omvattende hypothese
over de correlaties tussen de variabelen.
- Stel we zijn geinteresseerd in het effect van
facebook. Hypothese: mensen met veel
facebook vrienden ervaren veel sociale
support wat zorgt voor een hoger
welbevinden.
Zijstapje: Variabelen
- Variabele is een kenmerk dat varieert (lichaamslengte, haarkleur). Als er geen
variatie is, noemen we het een constante
- Als er alleen onderzoek wordt gedaan onder 15 jarige meisjes, dan is op dat
moment leeftijd geen variabele meer maar een constante.
, - Belangrijk: als je een hypothese formuleert moet dat of in termen van de
variabele of in termen van de niveau’s maar dan moet je wel altijd een variabele
hebben. Bijvoorbeeld:
- Het is onjuist om te zeggen: “Een hoge opleiding hangt samen met een
hoog inkomen”→ Beter: “opleiding hangt positief samen met inkomen” Of;
“hoog opgeleiden verdienen gemiddeld genomen meer dan laag
opgeleiden”.
Zijstapje 2: hypothese
- Onderscheid tussen causale hypotheses en correlationele hypotheses
- Bij padmodellen hebben we causale hypotheses: Als ik x manipuleer verandert Y
per definitie
- Bij correlationele hypotheses zeggen we dat twee variabelen samenhangen maar
we weten niet precies hoe dat zit.
Doelstellingen padanalyse
Doel:
1. Toetsen van complexe causale hypothesen:
- We willen bij het padmodel bij elk “pad” coëfficiënten krijgen die de
sterkte van het effect weergeven. Dit gewicht (coefficient) geeft aan hoe
groot het geschatte effect is.
- Als we de padcoefficienten kennen, kunnen we uit het model voorspellen
wat de correlaties hadden moeten zijn. We beginnen met hypotheses,
dan gaan we data verzamelen en de coefficienten schatten. Vervolgens
kunnen we schatten hoe goed het model verklaart.
- Op basis van het model en de coefficienten kunnen we de verwachte
samenhang tussen de variabelen berekenen en die vergelijken met de
empirische samenhang om te zien of het model een plausibele
beschrijving van de werkelijkheid geeft (we komen hier uitgebreid op terug
in de volgende HCs!).
2. Causaal redeneren: “Wat als?”
- Vervolgens kunnen we causaal
redeneren.
- Op basis van het model kunnen we
causale effecten beschrijven en
mogelijke schijnverbanden
identificeren.
- Hiermee kunnen we ook beredeneren
wat er (volgens) het model zou
gebeuren als we een variabele actief
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper evasijbring. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,36. Je zit daarna nergens aan vast.