Regressie analyse
M10. Enkelvoudige lineare regressie
M11. Meervoudige regressie
M12. Regressie met categorische variabelen en interactie-effecten
M13. Assumpties in regressie analyse
M14. Interpreteren van regressie & mediatie + interactie (“plus”)
Dit vak gebruikt het boek Statistics The Art and Science of Learning From Data by Alan
Agresti, Christine A. Franklin, Bernhard Klingenberg. Een samenvatting van de
hoofdstukken uit dit boek is verwerkt in de aantekeningen per college.
M10 – Enkelvoudige lineaire regressie.................................................................................................................3
10.1 Het enkelvoudige regressiemodel........................................................................3
10.2 Hypothesetoetsing met de b-coëfficiënt...............................................................5
10.3 Voorspellingsfouten (prediction errors) en verklaringskracht (predictive power)10
10.4 Hoe ziet de berekening van r2 (r-kwadraat) eruit in de output van SPSS?..........17
10.5 Enkelvoudige regressie met een "dummy variabele".........................................19
M11 – Multipele regressie..................................................................................................................................21
11.1 Causale modellen: confounders en mediatoren..................................................21
11.2 Het multipele regressiemodel.............................................................................25
11.3 Model fit (R-kwadraat) en F-toets.......................................................................29
M12: Nadere beschouwing van het effect van X op Y........................................................................................33
12.1 De gestandaardiseerde slope (Beta)...................................................................33
12.2 Interactie-effecten.............................................................................................. 36
M13 Assumpties..................................................................................................................................................41
13.1 De conditionele standaarddeviatie.....................................................................41
13.2 Assumpties van lineaire regressie......................................................................46
M14 Het interpreteren van regressieresultaten.................................................................................................49
14.1: Het lezen en rapporteren van regressieresultaten.............................................49
M14.2PLUS: Stappenplan Mediatie-analyse (met regressie).............................................................................53
Mediatie en moderatie in regressie:...........................................................................53
Stappenplan mediatie-analyse...................................................................................53
M14.3PLUS: Stappenplan Moderatie-analyse (met regressie)...........................................................................57
Interactie-effect, inleiding........................................................................................... 57
Interactie-effect, met twee dichtonome X-en.............................................................58
Moderatie: X1 is dichotoom en X2 is continu (kwantitatief)........................................62
Overzicht van onderwerpen bij regressie (H12 + H13)
– Doel: Y voorspellen op basis van X-en (met formule)
M10.1
o Causaliteit (X Y) wordt verondersteld, niet bewezen!
– Prediction error en predictive power: hoe goed is onze voorspelling?
M10.3 + M10.4
o Voorspellingsfout: Residuals
o Verklaarde variantie = R2 (Explained variance) M13.1
2
, – Is er een invloed van X op Y? M10.2, M11
o Significantie testen van de slopes (de effecten van X-en op Y)
o Hoe verloopt de invloed van X op Y? (via welke “mediator”?)
o Gebruik meervoudige (multipele) regressie: meerdere onafhankelijke
variabelen.
o Interpretatie van effecten van X M12
– Statistische controle M11.1
o We testen het effect van X, “gecontroleerd voor andere factoren”.
o Gebruik meervoudige (multipele) regressie: meerdere onafhankelijke
variabelen.
– Assumpties bij regressie M13.2, M14
Oefencollege Week 5 – H12 (niet 12.5)
M10 – Enkelvoudige lineaire regressie
Met ons regressiemodel willen we uitspraken doen over een bredere populatie. We
kunnen een steekproevenverdeling gebruiken om hypothesen te toetsen over de
regressiecoëfficiënt, op dezelfde manier als de hypothesetoetsen die we eerder in dit vak
hebben besproken: hoe waarschijnlijk is het om deze b-coëfficiënt te vinden als de
nulhypothese waar zou zijn?
De eerste paragraaf legt de regressievergelijking bij een enkelvoudige regressiemodel
uit.
De tweede paragraaf legt uit hoe je een hypothesetoets kunt uitvoeren en conclusie kunt
trekken op basis van de t-waarde en P-waarde. Je kunt ook een betrouwbaarheidsinterval
voor de regressiecoëfficiënt berekenen, wat ook een goede manier is om inferenties te
maken met gegevens uit een steekproef.
NB: In het tweede filmpje laten we zien hoe SPSS een p-waarde geeft die bij (de t-waarde
van) een regressiecoëfficiënt hoort. Let op dat SPSS altijd de p-waarde van een
tweezijdige test geeft.
10.1 Het enkelvoudige regressiemodel
– Enkelvoudige regressie: 1 onafhankelijke variabele (X)
– Regressielijn veronderstelt causaliteit: (anders dan bij een correlatie of
spreidingsdiagram, waar het gaat om een verband tussen x en y) we voorspellen
bij een regressieanalyse dat variabele X invloed heeft op Y.
– De afhankelijke variabele (Y) is kwantitatief.
– De onafhankelijke variabele (X) kan zowel kwantitatief als categorisch zijn.
Controle op lineaire relatie en Outliers; een rechte lijn is de eenvoudigste benadering van
de relatie.
Om te kijken naar een enkelvoudige regressie, moet je altijd eerst kijken of er een lineaire
relatie is. Als er geen lineaire relatie is, kan er ook geen lineaire regressie uitgevoerd
3
, worden want die gaat altijd uit van een rechte lijn die je kunt trekken door de datapunten
(in onderstaande afbeelding dus linksboven).
Regressievergelijking
Het geschatte regressie model (“prediction equation”):
– = geschatte waarde (predicted value), de verwachte waarde voor y
– a = intercept (constante): waarde van Y bij X = 0. Deze waarde kan ook negatief
worden! --> don’t worry (it’s only prediction!)
– b = slope (richtingscoëfficiënt): helling van de lijn, de toename/afname van Y als
X met 1 toeneemt.
Variëren met a parallelle lijnen.
Variëren met b lijnen roteren; steilheid van de lijn
Enkelvoudige regressie;
Het geschatte regressie model (“prediction equation”):
de a en b zijn óók schattingen (gebaseerd op een steekproef) en zouden eigenlijk ook
met een dakje geschreven moeten worden.
Het theoretische regressie model (“population equation”):
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Anoniem21. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.59. You're not tied to anything after your purchase.