Uitgebreide aantekeningen ALLE Hoorcolleges 1 t/m 12 - Toegepaste Methoden en Statistiek (424532-B-6) (23-24)
25 views 0 purchase
Course
Toegepaste Methoden en Statistiek (424532B6)
Institution
Tilburg University (UVT)
Uitgebreide college aantekeningen van alle hoorcolleges (1 t/m 12) voor het derdejaars statistiek vak Toegepaste Methoden en Statistiek.
Inclusief afbeeldingen uit de hoorcollege slides
Inhoudsopgave Hoorcolleges Toegepaste Methoden en Statistiek (23-24)
Hoorcollege 1…………………………………………………………………………………blz. 2 t/m 8
Introductie, padanalyse, de 5 basisrelaties
Hoorcollege 2…………………………………………………………………………………blz. 9 t/m 17
Opstellen van padmodellen (stappenplan; de gouden regel) recursieve & niet-
recursieve modellen, van padmodel naar statistisch model en regressievergelijkingen
opstellen
Hoorcollege 3……….………………………………………………………………………blz. 18 t/m 29
Totale causale effect, geïmpliceerde correlaties decompositieregel, tracing rules,
model fit en verzadigde & onverzadigde modellen
Hoorcollege 4………….……………………………………………………………………blz. 30 t/m 41
Moderatie/interacties, conditionele effecten, interactie in padmodel, mediatie en
moderatie (mbv Hayes’ Macro’s) en moderated mediation
Hoorcollege 5………………………………………………………………………blz. 42 t/m 51
Vervolg moderated mediation (probing), conditionele effecten
Hoorcollege 6 ………………………………………………………………………blz. 52 t/m 60
Introductie Factoranalyse (FA), Principale Componentenanalyse (PCA): gewogen
somscore, wiskundige optimalisatie (SPSS) en eigenwaarden
Hoorcollege 7 ………………………………………………………………………blz. 61 t/m 75
Vervolg PCA: uitgewerkt stappenplan, communaliteiten & uniciteiten, eenvoudige
structuur, rotatie: orthogonaal vs. obiek (interpreteren VARIMAX en OBLIMIN output
SPSS)
Hoorcollege 8 ………………………………………………………………………blz. 76 t/m 91
PCA vs. FA, Exploratieve Factoranalyse (EFA): gemeenschappelijke vs. unieke variantie,
schatten van factormodellen, toepassen EFA (stappenplan uitgewerkt, interpreteren
SPSS output) en model fit (residuele correlaties)
Hoorcollege 9 ………………………………………………………………………blz. 92 t/m 109
Realistische toepassing EFA, interpreteren geroteerde SPSS output, EFA checklist,
introductie Confirmatieve Factoranalyse (CFA; EFA vs. CFA) en model fit ( 𝜒2/Chi-
kwadraat toets en RMSEA)
Hoorcollege 10 ………………………………………………………………………blz. 110 t/m 113
Modellen vergelijken, Structural Equation Modelling (SEM; padanalyse + FA)
Hoorcollege 11………………………………………………………………………blz. 114 t/m 126
Verschillen en overeenkomsten tussen de 8 statische methodes, juiste methode kiezen
adhv onderzoeksomschrijving; soorten methodes: t-test, ANOVA, regressie,
padanalyse en factoranalyse
Hoorcollege 12: Q&A…………………………………………………………………………blz. 127 t/m 131
Bonus: Overzicht enkele tabellen en figuren…………………………………….…blz. 132 t/m 139
,Toegepaste Methoden en Statistiek
Docent: dr. Wilco H.M Emons (jaar 3, blok 1)
HC 1
Introductie
Van observaties naar (causale theorieën)
- Als we kijken naar de wereld om ons heen, dan zien we vaak opmerkelijke verschillen tussen
mensen in hoe zij denken, zich gedragen, omgaan met bepaalde situaties etc.
- We zien ook dat sommige kenmerken en gedragingen vaker in onderlinge samenhang
voorkomen dan andere kenmerken
- Hoe kunnen we deze verschillen verklaren? Wat kunnen we leren uit
deze verbanden? Welke onderliggende causale psychologische
processen geven mogelijk een verklaring voor die verschillen of
verbanden?
o Welke hangen samen, hoe (richting) en waarom
→ Vragen waar de psychologie als wetenschap zich (onder andere) mee bezig houdt
Deze cursus Toegepaste Methoden en Statistiek
- Leert je methoden en technieken waarmee je
(causale) theorieën over psychologische processen
kunt onderzoeken op basis van empirische data
- Deze theorieën kunnen betrekking hebben op Interactie
verschillende psychologie disciplines – waaronder
cognitieve- en neuropsychologie, sociale (en
economische) psychologie, forensische psychologie en
medische psychologie. Het kan gaan om theorieën
met een lange voorgeschiedenis, of om het toetsten
van eerste vermoedens
- Leert je hoe je een theorie kunt vertalen in een statistisch (toetsbaar) model, hoe je
het model kunt toepassen op onderzoeksgegevens en hoe je vervolgens inhoudelijke
conclusies kunt trekken op basis van het toegepaste model
o We gaan voornamelijk uit van data verkregen uit correlationele studies:
vragenlijstonderzoek, observaties, etc.
o Het onderzoek kan exploratief (‘’laat de data spreken’’) of confirmatief /toetsend van
aard zijn (bijv. in replicatieonderzoek, valideren van vragenlijsten, etc. → voor
padanalyse)
o Het gaat hierbij altijd om het bestuderen van verbanden tussen variabelen. Maar het
soort/type variabele kan erg verschillend zijn!
▪ Bijv. intelligentie is een prestatie variabele (zo hoog mogelijk willen scoren)
o Sommige variabelen zijn direct meetbaar/te observeren (gedrag, leeftijd) = manifeste
variabelen. Daartegenover staan latente variabelen = niet direct observeerbaar,
maar worden gemeten met speciaal daarvoor ontwikkelde instrumenten (tests,
toetsen, vragenlijsten, etc.)
,Dit college:
- Onderscheid tussen correlationeel onderzoek en experimenteel onderzoek beschrijven
- Het algemene doel van padanalyse uitleggen
- De verschillen tussen ruwe scores, gecentreerde scores en gestandaardiseerde scores
beschrijven
- Directe effecten, indirecte effecten, schijneffecten en onbekende effecten identificeren in een
verbale beschrijving van de verwachte relaties of een conceptueel model
Padmodellen – een eerste kennismaking
Wat is een padmodel?
- ‘’Een padmodel is een hypothese over onderliggende
causale processen die de geobserveerde correlaties tussen
2 of meerdere variabelen verklaren’’
Correlatie is geen causatie!
- Wanneer variabelen samenhangen dan betekent het nog niet dat er sprake is van een causale
relatie, er kan sprake zijn van een gemeenschappelijke oorzaak → schijneffect!
- Voorbeeld – samenhang tussen FB friends en subjective well-being → Waarom correleren
deze variabelen? Is er een causale relatie? Welke andere variabelen spelen mogelijk een rol in
het causale mechanisme (alternatieve verklaringen)? Zijn er variabelen die als
gemeenschappelijke oorzaak dienen? Met andere woorden: wat is een plausibel
verklaringsmechanisme?
Verklaring relatie tussen FB friends en SWB
Mogelijk verklaringsmechanisme:
1) Mensen met veel vrienden ervaren veel sociale support → hogere mate van welbevinden
2) Sociale support + welbevinden worden beide deels bepaald door:
A. Mate van positief zelfbeeld hebben
B. Mate waarin iemand een reëel (eerlijk) beeld van zichzelf heeft
- We kunnen deze hypothesen weergeven in een pad-diagram en
onderzoeken in hoeverre dit model past bij de data
✓ Het is nuttig om te weten dat variabelen correleren, bijv. om risico’s te voorspellen of om
preventieve maatregelen te nemen (praktisch). Maar interessanter is de vraag: waarom
correleren de variabelen? (theoretisch) En met name om schijneffecten van echte effecten te
onderscheiden
✓ Belangrijk voor theorieontwikkeling en voor de ontwikkeling van effectieve interventies
(therapieën, voorlichting, etc.)
o Bijv. als je weet dat introverte mensen gevoeliger zijn voor een burn-out, dan kun je
extra op hen letten. Maar als je niet weet waarom juist introverte mensen gevoeliger
zijn dan wordt het lastiger om er echt iets aan/mee te doen
o Padanalyse: Komen hypothetische verbanden overeen met empirische verbanden
(observaties van correlaties)
- Causale analyse
o Belangrijk doel hiervan is het uitsluiten van schijneffecten!
Opzet
1. Een eerste kennismaking – basisbegrippen en basiselementen van padmodellen:
in het bijzonder causale vs. niet-causale relaties (schijnrelaties)
2. Opstellen van padmodellen aan de hand van theorie en andersom: herleiden van de
achterliggende hypothesen bij een padmodel
3. Methoden voor het schatten van het model
4. Typen padmodellen: recursief vs. niet recursief; verzadigd vs. niet verzadigd
5. Interpreteren van padmodellen (zowel technisch als inhoudelijk)
6. Methoden waarmee je kunt onderzoeken of het model bij de data past
7. Toepassingen binnen psychologisch onderzoek; hoe beoordeel je de kwaliteit van het
onderzoek?
Enkele basisbegrippen
- Experimenteel onderzoek: actieve manipulatie van de onafhankelijke variabelen en random
toewijzing aan experimentele condities
- Correlationeel onderzoek: bestuderen van samenhang tussen variabelen verkregen uit
Surveys, veldobservaties. Er heeft geen manipulatie plaatsgevonden zoals bij (quasi-)
experimenteel onderzoek. Bestuderen de wereld zoals deze zich aan ons voordoet
- Variabelen: eigenschappen van onderzoekseenheden waarin je geïnteresseerd bent en
waarin de onderzoekseenheden variëren, mensen variëren op deze variabele
o Constante = als er geen variatie is in de variabele
▪ Let op: of een eigenschap een variabele is hangt af van je specifieke
onderzoeksgroep. Bijv. als je onderzoeksgroep alleen uit meisjes bestaat, dan
is geslacht in dit onderzoek geen variabele maar een constante
- Veel voorkomende fout: verwarring van de waarden van de variabele met de variabele zelf
o Voorbeeld: ‘rijk’ en ‘arm’ zijn 2 waarden van dezelfde variabele inkomen (uitkomsten
van zelfde variabele) → niet apart in model opnemen
o Dezelfde verwarring zie je soms terug in de opgestelde hypothese. Onjuist is om te
zeggen: ‘’Een hoge opleiding hangt samen met inkomen’’ → Beter: ‘’Opleiding hangt
samen met inkomen’’ of ‘’Hoog opgeleiden verdienen gemiddeld genomen meer dan
laag opgeleiden’’
,Basisbegrippen beschrijvende statistiek
- Gemiddelde
- Variantie: maat voor spreiding; altijd een positief getal
- Standaarddeviatie: maat voor spreiding
- Covariantie: maat voor lineaire samenhang; cov > 0 positieve samenhang, cov < 0 negatieve
samenhang)
- Correlatie: gestandaardiseerde maat voor lineaire samenhang
- Gestandaardiseerde scores: Z-scores; gemiddelde=0, SD=1 en variantie=1
Hypothese
- Een hypothese is een uitspraak over de veronderstelde relatie tussen 2 (of meerdere)
variabelen
- Het kan gaan om een causale of correlationele hypothese
5 basisrelaties
- Elk padmodel kun je uiteen splitsen in een aantal basisrelaties
- Deze basisrelaties zijn mogelijke verklaringen voor de geobserveerde covariantie/correlatie
tussen variabelen
- Deze basisrelaties dienen dus als de bouwstenen voor het padmodel
- De 5 basisrelaties:
1) Directe effect
2) Indirecte effect
3) Schijnrelatie
4) Onbekende effect
5) Wederkerend effect
1 – Het directe causale effect
- Causale hypothese: veranderingen in 𝑋 zorgen voor veranderingen in 𝑌 (𝑋 → 𝑌)
o 𝑋 is de oorzaak en 𝑌 het gevolg
- Het omgekeerde geldt niet, een verandering op 𝑌 heeft geen invloed op 𝑋! (pijl gaat 1
richting op)
Vooruitlopend op wat nog komen gaat: Als de hypothese waar is, dan verwachten we
samenhang te zien tussen observaties van X en Y => Als er geen samenhang is, dan kan er ook
geen sprake zijn van een direct effect (hypothese wordt verworpen). Als er wel samenhang is,
dan is er empirische ondersteuning (support) voor de veronderstelde causale relatie, maar dit
is nog geen bewijs! We kunnen nog steeds niet met zekerheid stellen dat de relatie causaal is,
want er kan ook sprake zijn van een schijneffect. Hiervoor is aanvullend onderzoek nodig, bij
voorkeur experimenteel
, 2 – Het indirecte effect
- Causale hypothese: een verandering in 𝑋 zorgt direct voor een verandering in 𝑀 (𝑋 → 𝑀),
een verandering in 𝑀 zorgt direct voor een verandering in 𝑌 (𝑀 → 𝑌); combinatie van 2
causale hypotheses
o Resultaat: een verandering in 𝑋 zorgt voor een verandering in 𝑌, maar dit loopt
indirect via 𝑀. Dus variabele 𝑋 heeft een indirect effect op 𝑌
o Mediator/interveniërende variabele = variabele 𝑀; het medieert de relatie tussen 𝑋
en 𝑌
3 – Schijnrelatie
- We veronderstellen een direct effect van 𝑍 op 𝑋 en een direct effect van 𝑍 op 𝑌 → variabele
𝑍 is een gemeenschappelijke oorzaak voor zowel 𝑋 als 𝑌 (en zorgt voor correlatie tussen 𝑋
en 𝑌)
- Omdat zowel 𝑋 als 𝑌 dezelfde gemeenschappelijke oorzaak hebben ontstaat er een
samenhang tussen de 2 variabelen. Maar een verandering in 𝑋 heeft geen effect op 𝑌, en ook
niet omgekeerd. Er lijkt een effect te zijn, maar dat is schijn!
- Confounder = variabele 𝑍
- Eng: spurious relationschip = schijnsamenhang → correlationeel onderzoek is veelal gericht
op het op sporen/uitsluiten van mogelijke confounders
Schijnrelaties en maatschappelijke impact
- Wanneer 2 variabelen correleren dan kan er sprake zijn van een causaal effect (direct of
indirect), maar dat hoeft niet!
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller maartjepsy21. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.21. You're not tied to anything after your purchase.