Dit is een volledige samenvatting van de hoorcolleges van statistiek 2 in 2023 aan de VU. Met deze samenvatting heb ik een 8.1 gehaald voor mijn tentamen. :)
Week 1, hoorcollege 1 - introductie tot multivariate verbanden
Multivariate relaties
Belangrijk om relevante alternatieve verklaringen te herkennen → Ken je theorie
En je statistische analyses en interpretatie hierop aan te passen. → Ken je statistiek
Zodat je vertekende resultaten door lurking (sluimerende) variabelen kunt vermijden:
Variabelen die niet zijn meegenomen in een studie, maar wel de onderzochte relatie
verklaren of beïnvloeden.
Wees hierbij beducht voor verschillende soorten multivariate relaties!
Spurieus verband tussen x en y
Wanneer beide variabelen ook samenhangen met een derde variabele en de relatie tussen x
en y verdwijnt (grotendeels) als gecontroleerd wordt voor deze derde variabele.
→ Het verband tussen lengte (x) en rekenvaardigheden (y) wordt volledig verklaard door
schooljaar!
→ Geschatte verband tussen variabelen kan dus drastisch veranderen, afhankelijk van de
gekozen data- analyse strategie.
Soms vind je (bijna) geen verband tussen x en y, totdat je controleert voor een derde
variabele. Dit noemen we suppressie (onderdrukking)
→ Het verband tussen de interventie (x) en leesvaardigheid (y) wordt onderdrukt doordat
kinderen in de interventiegroep voorafgaand aan de interventie een lagere leesvaardigheid
hadden!
Soms is het verband tussen x en y zelfs omgekeerd nadat we controleren voor een derde
variabele. Dit noemen we Simpson’s paradox.
https://www.youtube.com/watch?v=ebEkn-BiW5k
Voorbeeld: Typesnelheid en typo’s
→ Gemiddeld genomen: Negatief verband – ervaren typisten typen sneller en
maken weinig typefouten.
,→ Op individueel niveau: Positief verband – Hoe sneller je typt, hoe meer typefouten je
maakt.
Een andere reden waardoor het verband tussen x1 en y soms verdwijnt na controle voor x2
is een kettingrelatie (mediatie):
- x1 heeft een indirect effect op y, via mediator x2
In andere termen:
- x1 veroorzaakt x2
- x2 veroorzaakt y
Vaak onderwerp in interventiestudies:
→ Belangrijk om de ‘mechanismen van verandering’ van je interventie te identificeren.
Voorbeeld:
Het verband tussen onderwijs (x) en levensverwachting (y) verdwijnt of verzwakt als
inkomen (x2) wordt meegenomen als mediator.
Daarnaast is er soms sprake van een interactie-effect tussen voorspellers
- De relatie tussen x1 en y is verschillend voor verschillende niveaus van x2 (de
moderator)
Dit kan verschillende vormen aannemen:
Geen relatie tussen x en y
- Maar bijv. wel binnen subpopulaties op basis
van x2
- Bijv. Omdat positief/negatief effecten in
subpopulaties elkaar opheffen.
Positieve relatie tussen x en y
- Maar bijv. minder sterk of zelfs
negatief/niet-bestaand binnen subpopulaties
op basis van x2
Negatieve relatie tussen x en y
- Maar bijv. minder sterk of zelfs
positief/niet-bestaand binnen sommige
subpopulaties van x2
Ook hier: Vind je (g)een verband tussen x en y? Dit
kun je niet per se vertalen naar alle subpopulaties!
Meestal hebben verschillen in een uitkomstvariabelen echter meerdere oorzaken:
- Verschillende variabelen verklaren tezamen verschillen in y
Deze oorzaken zijn meestal gecorreleerd:
, - We noemen dit ook wel confounding
(verwarring).
- Het verband tussen x en y verandert (deels)
wanneer een extra x wordt opgenomen in
het model
- Bijv. In het geval van spurieuze verbanden,
suppressie en Simpson’s paradox.
En soms ongecorreleerd:
- Het verband tussen x en y verandert niet (of
nauwelijks) wanneer een extra x wordt
opgenomen in het model.
- Desondanks kan er sprake zijn van
statistische interactie (zie HC5.2)!
Samenvatting:
Vaak is het nuttig om extra variabelen op te nemen in een statistisch model, zodat de relatie
tussen je primaire voorspeller en uitkomstmaat betekenisvol geïnterpreteerd kan worden.
Om rekening te houden met:
● Confounding (i.e., vermijden sluimerende variabelen):
- Spurieuze verbanden
- Suppressie
- Simpson’s paradox
● Interactie-effecten
- Verschilt het verband tussen x en y tussen niveaus (of subgroepen) van x2?
● Meerdere oorzaken
- Verklaren variabelen x1 en x2 onafhankelijk
verschillen in y?
- OF verklaart x2 extra verschillen in y, naast de
verschillen die al door x1 verklaard worden?
● Ketting relaties [mediate]
- Directe en indirecte effecten
, Week 1, hoorcollege 2 - enkelvoudige regressie
Hypothese toetsen: Het proces
● Formuleer een hypothese
- Wat zijn je verwachtingen?
● Onderzoekskenmerken en variabelen inspecteren
- Steekproefprocedure, (experimenteel) ontwerp, meetniveaus
● Beschrijvende analyses
- Wat zijn de steekproefkenmerken, hoe zijn de relevante variabelen verdeeld
(incl. M en SD)?
● Inferentiële analyses
- Test een verband of verschillen, inclusief een controle van de
modeldiagnostiek.
● Resultaten interpreteren en rapporteren:
- Rapporteer je bevindingen in APA-stijl.
Onderzoeksvraag: Hangt klas omvang samen met schoolprestaties?
Ongericht:
- x hangt samen met y
→ Klasgrootte hangt samen met schoolprestaties
Met richting:
- Positief verband: Hogere x voorspelt hogere y (en vice versa)
→ Gemiddeld nemen prestaties toe wanneer de klasgrootte toeneemt
→ Gemiddeld nemen prestaties af wanneer de klasgrootte afneemt
- Negatief verband: Hogere x voorspelt lagere y (en vice versa)
→ Prestaties zijn meestal beter in kleinere klassen
→ Prestaties zijn meestal slechter in grotere klassen
Onderzoekskenmerken en variabelen inspecteren
● Cross-sectionele studie
→ onder willekeurig geselecteerde scholen in Nederland
● Class size: Gemeten als de gemiddelde klasgrootte van een school
→ Voorspeller
→ Kwantitatief
● Academic performance: De school’s gemiddelde score op een gestandaardiseerde
test
→ Criterium (uitkomstmaat)
→ Kwantitatief
Beschrijvende Statistieken
Univeriate statistieken beschrijven van één variabele
● Vorm: klok-vormig (scheef/uniform/bimodaal)
● Locatie: Gemiddelde (of Mediaan/Modus)
● Schaal: Standaarddeviatie (SD; of variantie/min/max)
Spreidingsdiagrammen visualiseren het verband tussen een response (y) en voorspellende
(x) variabele:
● Elke stip is een observatie
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper evyvanderwal. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €8,06. Je zit daarna nergens aan vast.