Week 1 – MRA
Pearson correlatie berekenen
Analyze > Correlate > Bivariate > verplaats alle gewenste variabelen onder Variables > indien dit nog
niet is gedaan vink je Pearson aan onder Correlation Coefficients > Ok.
Toelichting pearson correlatie: uit deze resultaten kan blijken dat het nuttig is om een lineaire
regressie uit te voeren van afhankelijke Y op onafhankelijke X(en). Dit is nuttig wanneer (een
aantal) variabelen hoog (en significant) correleren met Y.
Een goede voorspeller is waarschijnlijk degene die hoog correleert met Y.
Lineaire regressie met part and partial correlations, collinearity diagnostics, Cook’s distances en
Leverage values.
Analyze > Regression > Linear > verplaats de afhankelijke Y onder Dependent en de gewenste
predictoren onder Independent(s) > Statistics > check part and partial correlations en collinearity
diagnostics > Continue > Save > check Cooke’s distances en Leverage values > Continue > Ok.
Toelichting interpretatie lineaire regressie
Hypothese verwerpen: voor het verwerpen van de nul-hypothese (geen relatie tussen Y en
X(en)), kijk naar Regression in tabel ANOVA in de output. Noteer: ja/nee, want F(df van de
regression, df van het residual)=…, p = …, wanneer deze significant zijn kun je de nul-hypothese
verwerpen.
Verklaarde variantie: de R Square in de tabel Model Summary geeft de verklaarde variantie (ook
wel VAF) van Y door alle Xen.
Uniek verklaarde variantie: voor het bepalen van de unieke verklaarde variantie van een
predictor, kijk je naar Sig. en de Part Correlations in de tabel Coefficients. De predictor moet
significant zijn en vervolgens bereken je de unieke verklaarde variantie door de Part Correlation
te kwadrateren.
Multicollineariteit checken: voor het checken van de multicollineariteit kijk je naar de Tolerance
en de VIF, in de tabel Coefficients. Er is geen multicollineariteit als alle toleranties >.10 en alle
VIF <10.
Outliers checken met Cook’s distances en Leveragewaarden: je kijkt naar Cook’s Distance (=
influential data-points) en Centered Leverage Value (= outliers op onafhankelijke X variabel(en))
in de tabel Residuals Statistics. Er is geen bewijs voor outliers wanneer de maximum Cook’s
distance <1 en de maximum leveragewaarde < 3(k+1)/N, waarbij K het aantal predictoren is.
Tenslotte kunnen er nog outliers liggen op de Y variabele, hiervoor kijk je naar de Minimum en
Maximum van Std. Residual in de tabel Residual Statistics, wanneer deze tussen -3 en 3 liggen,
zijn er geen outliers.
Influential data-punt verwijderen: je kunt een outlier vinden d.m.v. Cook’s Distance of Leverage
value, zoals beschreven hierboven, vervolgens kun je in de Data view klikken op het nummer
van de participant met de outlier en op de delete-knop klikken, dan is deze participant
verwijderd uit de data. Wanneer je dit hebt gedaan en de data veranderd erg, dan bepaalde
deze participant vooral de uitkomst van de data, en dat is ongewenst.
Lineaire regressie zonder niet-significante predictoren en voeg een scatter plot van gestandaardiseerde
voorspelde warden vs. de gestandaardiseerde residuen toe en een normal probability plot.
In de tabel Coeffcients zie je bij Sig. welke predictor(en) niet significant zijn (p > .05).
1