Regressie analyse
M10. Enkelvoudige lineare regressie
M11. Meervoudige regressie
M12. Regressie met categorische variabelen en interactie-effecten
M13. Assumpties in regressie analyse
M14. Interpreteren van regressie & mediatie + interactie (“plus”)
Dit vak gebruikt het boek Statistics The Art and Science of Learning From Data by Alan
Agresti, Christine A. Franklin, Bernhard Klingenberg. Een samenvatting van de
hoofdstukken uit dit boek is verwerkt in de aantekeningen per college.
M10 – Enkelvoudige lineaire regressie.................................................................................................................3
10.1 Het enkelvoudige regressiemodel........................................................................3
10.2 Hypothesetoetsing met de b-coëfficiënt...............................................................5
10.3 Voorspellingsfouten (prediction errors) en verklaringskracht (predictive power)10
10.4 Hoe ziet de berekening van r2 (r-kwadraat) eruit in de output van SPSS?..........17
10.5 Enkelvoudige regressie met een "dummy variabele".........................................19
M11 – Multipele regressie..................................................................................................................................21
11.1 Causale modellen: confounders en mediatoren..................................................21
11.2 Het multipele regressiemodel.............................................................................25
11.3 Model fit (R-kwadraat) en F-toets.......................................................................29
M12: Nadere beschouwing van het effect van X op Y........................................................................................33
12.1 De gestandaardiseerde slope (Beta)...................................................................33
12.2 Interactie-effecten.............................................................................................. 36
M13 Assumpties..................................................................................................................................................41
13.1 De conditionele standaarddeviatie.....................................................................41
13.2 Assumpties van lineaire regressie......................................................................46
M14 Het interpreteren van regressieresultaten.................................................................................................49
14.1: Het lezen en rapporteren van regressieresultaten.............................................49
M14.2PLUS: Stappenplan Mediatie-analyse (met regressie).............................................................................53
Mediatie en moderatie in regressie:...........................................................................53
Stappenplan mediatie-analyse...................................................................................53
M14.3PLUS: Stappenplan Moderatie-analyse (met regressie)...........................................................................57
Interactie-effect, inleiding........................................................................................... 57
Interactie-effect, met twee dichtonome X-en.............................................................58
Moderatie: X1 is dichotoom en X2 is continu (kwantitatief)........................................62
Overzicht van onderwerpen bij regressie (H12 + H13)
– Doel: Y voorspellen op basis van X-en (met formule)
M10.1
o Causaliteit (X Y) wordt verondersteld, niet bewezen!
– Prediction error en predictive power: hoe goed is onze voorspelling?
M10.3 + M10.4
o Voorspellingsfout: Residuals
o Verklaarde variantie = R2 (Explained variance) M13.1
2
, – Is er een invloed van X op Y? M10.2, M11
o Significantie testen van de slopes (de effecten van X-en op Y)
o Hoe verloopt de invloed van X op Y? (via welke “mediator”?)
o Gebruik meervoudige (multipele) regressie: meerdere onafhankelijke
variabelen.
o Interpretatie van effecten van X M12
– Statistische controle M11.1
o We testen het effect van X, “gecontroleerd voor andere factoren”.
o Gebruik meervoudige (multipele) regressie: meerdere onafhankelijke
variabelen.
– Assumpties bij regressie M13.2, M14
Oefencollege Week 5 – H12 (niet 12.5)
M10 – Enkelvoudige lineaire regressie
Met ons regressiemodel willen we uitspraken doen over een bredere populatie. We
kunnen een steekproevenverdeling gebruiken om hypothesen te toetsen over de
regressiecoëfficiënt, op dezelfde manier als de hypothesetoetsen die we eerder in dit vak
hebben besproken: hoe waarschijnlijk is het om deze b-coëfficiënt te vinden als de
nulhypothese waar zou zijn?
De eerste paragraaf legt de regressievergelijking bij een enkelvoudige regressiemodel
uit.
De tweede paragraaf legt uit hoe je een hypothesetoets kunt uitvoeren en conclusie kunt
trekken op basis van de t-waarde en P-waarde. Je kunt ook een betrouwbaarheidsinterval
voor de regressiecoëfficiënt berekenen, wat ook een goede manier is om inferenties te
maken met gegevens uit een steekproef.
NB: In het tweede filmpje laten we zien hoe SPSS een p-waarde geeft die bij (de t-waarde
van) een regressiecoëfficiënt hoort. Let op dat SPSS altijd de p-waarde van een
tweezijdige test geeft.
10.1 Het enkelvoudige regressiemodel
– Enkelvoudige regressie: 1 onafhankelijke variabele (X)
– Regressielijn veronderstelt causaliteit: (anders dan bij een correlatie of
spreidingsdiagram, waar het gaat om een verband tussen x en y) we voorspellen
bij een regressieanalyse dat variabele X invloed heeft op Y.
– De afhankelijke variabele (Y) is kwantitatief.
– De onafhankelijke variabele (X) kan zowel kwantitatief als categorisch zijn.
Controle op lineaire relatie en Outliers; een rechte lijn is de eenvoudigste benadering van
de relatie.
Om te kijken naar een enkelvoudige regressie, moet je altijd eerst kijken of er een lineaire
relatie is. Als er geen lineaire relatie is, kan er ook geen lineaire regressie uitgevoerd
3
, worden want die gaat altijd uit van een rechte lijn die je kunt trekken door de datapunten
(in onderstaande afbeelding dus linksboven).
Regressievergelijking
Het geschatte regressie model (“prediction equation”):
– = geschatte waarde (predicted value), de verwachte waarde voor y
– a = intercept (constante): waarde van Y bij X = 0. Deze waarde kan ook negatief
worden! --> don’t worry (it’s only prediction!)
– b = slope (richtingscoëfficiënt): helling van de lijn, de toename/afname van Y als
X met 1 toeneemt.
Variëren met a parallelle lijnen.
Variëren met b lijnen roteren; steilheid van de lijn
Enkelvoudige regressie;
Het geschatte regressie model (“prediction equation”):
de a en b zijn óók schattingen (gebaseerd op een steekproef) en zouden eigenlijk ook
met een dakje geschreven moeten worden.
Het theoretische regressie model (“population equation”):
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Anoniem21. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.