WEEK 1 -Grasple
1 Assumptions (initial)
Welke voorwaarden moeten worden gecheckt vóór het uitvoeren van een multipele regressieanalyse?
(1) De afhankelijke variabele moet van continue meetniveau zijn (= interval of ratio)
(2) De onafhankelijke variabelen moeten continue of dichotoom zijn (nominaal met twee
categorieën)
(3) Er bestaat een lineaire relatie tussen de afhankelijke en alle continue onafhankelijke variabelen
• Controleren door het maken van een scatterplot in SPPS → op de x-as een
onafhankelijke variabele en op de y-as de afhankelijke variabele
(4) De afwezigheid van uitschieters
• Controleren door het maken van een scatterplot en visueel kijken
2 Assumptions (statistical)
Welke voorwaarden moeten gecontroleerd worden gedurende een multipele regressieanalyse?
1 Afwezigheid van uitschieters
2 Afwezigheid van multicollineariteit
3 Homoscedasticiteit
4 Normaal verdeelde residuen
5 Beide variabelen continue
Wanneer is een assumptie geschonden en wanneer niet?
1 Afwezigheid van Uitschieters
Stap 1: Kijk naar de tabel ‘Residual Statistics’ en bekijk de minimum en maximum waarde van de
standardised residuals, de mahalanobis distance en cook’s distance
Stap 2:
a. Standardized Residuals
o Gebruiken om te controleren of er uitschieters zijn in de Y-space
o De waardes moeten tussen de -3.3 en +3.3 liggen (liggen de waardes hierbuiten, dan mogen ze
worden beschouwd als uitschieters)
b. Mahalanobis Distance
o Gebruiken om te controleren of er uitschieters zijn in de X-space
o Een uitschieter in de X-space is een extreme score op een predictor of een combinatie van
predictoren
o De waardes moeten lager zijn dan: 10 + 2 x (aantal onafhankelijke variabelen) → waarden
hoger dan deze kritieke waarde worden beschouwd als uitschieters
c. Cook’s Distance
o Gebruiken om te controleren of er uitschieters zijn in de XY-space
o Een uitschieter in de XY-space is een extreme combinatie van X en Y scores
o De waarde moet onder de 1 liggen → waarden hoger dan 1 worden beschouwd als influential
respondents (influential cases)
Stap 3: Om te beslissen om een uitschieter te verwijderen of niet, zijn meerdere dingen belangrijk:
1 Behoort deze participant tot de groep waarover je inferenties wil maken?
→ zo niet, neem deze participant dan niet mee in de analyse
2 Is de extreme score van de participant theoretisch mogelijk?
→ zo niet, neem deze participant niet mee in de analyse
→ als het wel mogelijk is, doe de analyse dan zowel met als zonder deze participant en bekijk de
overeenkomsten en verschillen tussen de uitkomsten
, 2 Afwezigheid van multicollineariteit
Stap 1: Bekijk de tabel ‘Coefficients’, de laatste tabel bevat informatie voor multicollineariteit
Stap 2: Hiermee kan gekeken worden of de relatie tussen twee of meerdere onafhankelijke variabelen
te sterk is (r > .8)
Drie consequenties wanneer je te sterk gerelateerde variabelen meeneemt in je model:
(1) De regressie coëfficiënten (B) zijn onbetrouwbaar
(2) De grootte van R (de correlatie tussen Y en Ŷ)
(3) Het belang van individuele onafhankelijke variabele kan dan niet of nauwelijks worden
vastgesteld
Stap 3: Vuistregels om te bepalen of multicollineariteit een issue is
o Waarden voor de ‘Tolerance’ kleiner dan .2 wordt beschouwd als een potentieel probleem
o Waarden voor de ‘Tolerance’ kleiner dan .1 wordt beschouwd als een probleem
o De VIF is gelijk aan 1/Tolerance → dus hiervoor geldt dat waarden groter dan 10 worden
beschouwd als een probleem
3 Homoscedasticiteit
Deze voorwaarde houdt in dat de spreiding van de residuen voor een X-waarde over alle punten
ongeveer gelijk moet zijn. Wij controleren dit door de gestandaardiseerde residuen uit te zetten tegen
de gestandaardiseerde voorspelde waarden. Als er voor elke voorspelde waarde (x-as) ongeveer
evenveel spreiding is rond de y-as, dan is aan de voorwaarde voldaan.
4 Normaal verdeelde Residuen
Stap 1: Bekijk of het overeenkomt met een klokvormige verdeling
Stap 2: Zo ja, dan wordt voldaan aan deze aanname
3 Performing and interpreting Multiple Linear Regression
Als aan de assumpties wordt voldaan, kan het regressie model geïnterpreteerd worden. Hierbij wordt
gekeken naar de eerste vier tabellen van de SPSS Output
1. Variables Entered/Removed
• Laat zien wat de afhankelijke en onafhankelijke variabelen zijn
2. Model Summary
• Laat de general quility zien van het regressie model
3. ANOVA
• Laat de uitkomsten van de F-test zien van het model, deze test of het model als geheel
significant is
4. Coëfficiënten
2
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller nienaatje11. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.56. You're not tied to anything after your purchase.