Oefeningen les 7: Correlatie en regressie
1. Kunnen de scores op wiskunde, natuurwetenschappen en engels van het
laatste jaar humaniora de totaalscores in de 1e BA informatica voorspellen?
wiskunde wetenschappen engels totaalscore
6,50 7,20 6,90 6,70
7,80 7,50 8,50 7,30
6,90 7,20 7,80 7,40
4,60 5,90 6,50 5,90
9,30 8,90 8,80 8,40
6,50 6,20 6,90 6,60
7,80 8,50 6,80 7,20
6,90 7,20 7,80 7,50
4,60 5,90 6,50 5,80
9,30 7,90 7,80 7,90
8,30 7,90 7,00 8,20
6,80 6,10 7,70 6,90
9,20 8,90 6,80 7,90
5,60 8,40 6,20 5,20
6,80 6,10 5,30 6,60
8,30 7,80 7,60 8,00
7,10 6,90 6,80 6,80
6,30 7,60 7,90 7,00
4,90 5,30 6,30 5,80
6,00 6,80 7,10 7,40
We noteren: de analyse (meervoudige lineaire regressie, omdat er meerdere OV’s
zijn en het gaat over een voorspelling), de alfa (0.05) en de hypothesen (H0: geen
van de OV voorspelt de AV, Ha: minstens 1 OV voorspelt de AV).
Maak nu een simple scatterplot voor elke OV (met de AV op de y-as telkens). We
zien bij alle drie de vakken een redelijk lineair verband. Schets deze grafieken voor
stapje 4.
Hierna gaan we de multicollineariteit na (zijn er r waarden hoger dan 0.6?).
Analyze > correlate > bivariate (zet alle variabelen rechts).
Tussen wiskunde en wetenschappen is de r = 0.749 en dus groter dan 0.6. Bij
andere OV’s onderling is er geen r die groter is dan 0.6. Kijk dan naar wiskunde en
wetenschappen in vgl met de totaalscore. Wie daar de laagste waarde heeft, wordt
niet opgenomen in model. Dat is wetenschappen.
Laat de regressie lopen. Analyze > regression > lineair. Zonder wetenschappen! Kijk
of Anova significant is, zo ja, H0 verwerpen en Ha aanvaarden. Kijk naar de ‘model
summary’ en noteer de adjusted R square. Deze is hier 0.79, wat betekent dat 79%
van de variantie in de AF wordt voorspeld door de OV.
Stel dan de regressievgl op door de ‘coefficient’ tabel. Informatica = 1.959 +
0.444Wiskunde + 0.275Engels. Noteer ook de beta, p en t waarden van beide
vakken. Is de p significant, dan is het een significante voorspeller. Is de beta waarde
positief, dan is het dus een positieve voorspeller. Kijk welke van de 2 de hoogste
beta waarde heeft. Zowel wisk als Eng zijn sign pos voorspellers, hoe hoger de score
van wisk en Eng, hoe hoger de informatica score. Wisk is de beste voorspeller.
,