Verschil tussen correlatie en regressie
- Enkel continue variabelen
- Regressie impliceert niet per se dat er causaliteit is
- 1 afhankelijke variabele en 1 of meer onafhankelijke variabelen
Correlatie of regressie?
- Hebben andere vraagstelling:
- Correlatie: is er een verband tussen X en Y, of hoe sterk is dat verband?
o Bv. lengte en gewicht
o Lengte en gewicht zijn inwisselbaar (gelijkwaardig) symmetrische analyse
o X en Y moeten aselecte steekproeven (je kan ze niet zelf kiezen zoals tijd)
- Regressie: heeft variabele X invloed op Y? He verandert X met Y? Hoe voorspel je Y gegeven X…
o Bv. voorspel de lengte van een persoon op basis van het gewicht
o X en Y zijn niet inwisselbaar (niet gelijkwaardig)
o Soms oorzaak en gevolg (causaliteit) voorzichtig zijn met interpretatie
o Bv. neerslag per dag + verkeersongelukken ongelukken kunnen gevolg zijn van neerslag
o Dan zekere causaliteit MAAR voorzichtig zijn want is niet per se zo
Regressie:
X-variabele Y-variabele
Onafhankelijk Afhankelijk
Input variabele Outcome variabele
Verklarende variabele Resultaatsvariabele
Voorspellend Wordt voorspeld
Covariaat
(Oorzaak) (Gevolg)
, Pearson en spearman correlatie
- Twee continue variabelen
- Pearson = parametrisch
- Spearman = niet-parametrisch
Pearson
- Minstens 1 variabele moet normaal verdeeld zijn
- Parametrisch: zeer gevoelig voor outliers
o Indien je een outlier niet kan verwijderen: Spearman
- Gaat na of er een lineair verband is, of geen verband (een wolk is dus ook oke)
o Indien een duidelijk niet-lineair verband: Spearman
o SCATTERPLOT
- H0: de variabelen zijn niet lineair gecorreleerd
o P-waarde < 0,05: verwerpt H0 en zegt dat r ≠ 0
o r = de maat voor sterkte van het verband, ligt tussen -1 en 1
o Hoe verder naar 1 of -1, hoe meer de data op een rechte lijn ligt
o r² = of de variabiliteit vd ene variabele kan verklaard worden door de variabliteit vd andere
Spearman
- Niet-parametrisch: ongevoelig voor outliers
- Veronderstelt geen lineair verband, gaat na of x en y zich gelijkwaardig gedragen
- H0: de variabelen zijn niet gecorreleerd
o Significantie is meestal niet echt relevant
- Hoe groter ρ, hoe sterker de correlatie
SPSS:
Nagaan of er een relatie is tussen X en Y en hoe sterk dit verband is
Analyze correlate bivariate
Alle twee de variabelen rechts onder variables
Onder correlation coëfficiënts : ofwel Pearson ofwel Spearman aanduiden
OUTPUT: PEARSON
o Je kan in de 4 vakjes telkens: X & X correleren, X & Y correleren, Y & X en Y & Y
o X & X en Y & Y is natuurlijk altijd 1
o Bij Pearson maakt het ook niet uit of je X met Y correleert of Y met X (is hetzelfde)
o Pearson correlatie coëfficiënt (r) : hoe verder naar 1 of -1, hoe sterker het verband
o Daaronder: Sig. (2-tailed)
< 0,05: significant verband tussen X en Y
OUTPUT: SPEARMAN
o Je kan in de 4 vakjes telkens: X & Y correleren en Y & X
o Spearman’s rho (ρ) : hoe verder naar 1, hoe sterker het verband
o Sig (2-tailed)
< 0,05: significant verband tussen X en Y of Y en X