Samenvatting week 11
Introductie
In veel onderzoeken is het belangrijk om te weten of, en zo ja hoe, variabelen met elkaar
samenhangen. Hangt de behoefte aan zorg samen met bijvoorbeeld de leeftijd, de
gezondheidstoestand en/of het inkomen? Voor het analyseren van zulke verbanden en het doen van
dergelijke schattingen wordt vaak gebruik gemaakt van correlatie- en regressieanalyse.
In kwantitatief onderzoek gaat het vrijwel altijd om de samenhang tussen variabelen. In de statistiek
gebruiken we het begrip ‘correlatie’ voor de samenhang tussen twee variabelen. De mate waarin er
sprake is van samenhang wordt uitgedrukt in de correlatiecoëfficiënt die kan variëren tussen -1
(volledig negatieve lineaire samenhang), 0 (geen samenhang) en +1 (volledige positieve samenhang).
Het analyseren van correlaties staat bekend als correlatieanalyse.
Het is belangrijk om op te merken dat er een groot verschil is tussen correlatie en regressie. Met
regressieanalyse gaan we stap verder, omdat er hier altijd sprake is van een oorzaak-gevolgrelatie en
we de waarde van de ene variabele (de te verklaren variabele) willen verklaren en voorspellen uit de
waarden van andere variabelen (de verklarende variabelen). We werken meestal met meer dan één
verklarende variabele, zodat we in dat geval te maken hebben met meervoudige (of multipele)
regressieanalyse.
Leerdoelen
Na het bestuderen van deze leereenheid
heeft u inzicht in en begrip van correlatieanalyse, enkelvoudige en meervoudige
regressieanalyse.
kunt u deze analyses ook toepassen en de resultaten interpreteren.
Correlaties en regressieanalyse
Met een correlatie krijg je zicht op de (sterkte van de) lineaire relatie tussen twee variabelen. In een
regressieanalyse worden eveneens variabelen (bijv. X en Y) met elkaar in verband gebracht, maar dan
met bijvoorbeeld het doel te proberen Y te voorspellen (of te verklaren) uit X via een rechte lijn die
zo goed mogelijk de relatie tussen Y en X weergeeft. Let wel: dat impliceert niet automatisch dat X
kan worden opgevat als de ‘oorzaak’ van Y. Een regressieanalyse sec is op zich niet voldoende voor
conclusies over ‘invloed’ of ‘effect’. Met andere woorden, de causaliteit kan niet worden vastgesteld.
Ook kan men niet concluderen dat als de t-waarde niet hoog genoeg is, er geen relatie is. Enkel de
conclusie dat er geen lineaire relatie is, kan dan worden getrokken.
Correlatie
Pearson's r
Pearson’s correlatie coëfficiënt r, soms ook wel de produkt-moment-correlatie-coëfficiënt (PMCC)
genoemd, drukt de sterkte van een lineaire samenhang tussen twee variabelen uit in een getal. Het
gebruik van Pearson’s r eist dat beide variabelen continu van aard zijn.
Wanneer gebruik ik Pearson's r?
Je gebruikt dit coëfficiënt als je geïnteresseerd bent in de lineaire samenhang (= correlatie) tussen
twee continue variabelen X en Y, bijvoorbeeld een onderzoek naar de samenhang tussen leeftijd en
scores op een cognitieve test. De waarden van de coëfficiënt kunnen lopen van -1 tot +1. Is er sprake
van een positieve correlatie dan neemt met een stijgende waarde van X ook de waarde van Y toe. Bij
een negatieve (tegengestelde) correlatie neemt met een stijgende waarde van X, de waarde van Y af.
Bij correlatie van +1 of -1 is er een perfect verband. In dat geval is de waarde van Y volledig te
herleiden uit de waarde van X (en omgekeerd). Bij de waarde van 0 is er geen enkele lineaire
samenhang.
, De correlatie waarde is zogenaamd dimensieloos; dit betekent dat de correlatiewaarde ongevoelig is
voor de eenheden waarin X en Y gemeten zijn. Wat meer statistisch geformuleerd: r is ongevoelig
voor lineaire transformaties van de variabelen X en Y. Dus als je een correlatie zou hebben berekend
tussen de patiënt zijn gewicht in kilogrammen en zijn vetpercentage, dan zal die correlatie identiek
zijn als dat je het gewicht van de patiënt zou hebben gemeten in ponden.
Hoe interpreteer ik Pearson’s r?
Pearson’s ’ r is een eenvoudige statistische maat. Toch is de interpretatie daarvan niet altijd even
makkelijk. Bij de interpretatie moet je rekening houden met een aantal zaken. Als de correlatie 0 is,
dan is er geen lineair verband. Dat wil niet zegen dat er geen andersoortig verband kan zijn. Het is
daarom belangrijk om altijd eerst een scatterplot (spreidingsdiagram) te maken. Ook moet je
rekening houden met het feit dat Pearson’s r erg gevoelig is voor extreme waarden (uitbijters) in je
dataset. Verwar ook niet het begrip samenhang met causaliteit. X is de oorzaak van Y als een
verandering in Y het gevolg is van een verandering in X. Als er een correlatie is tussen X en Y is, dan
hoeft die samenhang niet causaal van aard te zijn. Er kan immers sprake zijn van wederzijdse
beïnvloeding, of de correlatie tussen X en Y kan (deels) verklaard worden door allerlei andere
factoren.
Waar vind ik Pearson’s r in SPSS?
Je vindt deze correlatietechniek in SPSS 16 onder Analyze -> Correlate -> Bivariate Correlations.
Spearman's rho
Wanneer gebruik ik Spearman’s rang-correlatie?
De variabelen X en Y zijn niet altijd continu van aard. Als beide of één van beide variabelen geen
continu (maar een discreet ordinaal) karakter hebben, kan geen Pearson’s correlatie worden
berekend. In dat geval kan je de associatie tussen X en Y het beste uitdrukken in een Spearman’s rang
correlatie. De Spearman’s rang correlatie coëfficiënt is nagenoeg gelijk aan de Pearson’s correlatie
coëfficiënt, berekend op de rangnummers van de data. De Spearman correlatie is ook een goed
alternatief voor de Pearson correlatie als in je dataset uitbijters voorkomen. Door de data te
vervangen door rangnummers krijgen uitbijters immers veel minder gewicht dan bij het berekenen
van de Pearson.
Ordinale variabelen
Op ordinaal niveau gemeten variabelen zijn kwalitatieve variabelen, waarvan de categorieën wel in
een vaste en zinvolle volgorde zijn te plaatsen. Bijvoorbeeld een stelling in een vragenlijst, zoals 'ik
heb de laatste tijd vaak sombere gedachtes', met als antwoordcategorieen: 'geheel mee eens', 'mee
eens', 'geen mening', 'niet mee eens' en 'geheel niet mee eens'. (Discrete) numerieke variabelen zijn
per definitie ordinaal (door het numerieke karakter is er een ordening in de getallen).
Waar vind ik Spearman’s rang-correlatie in SPSS?
Je vindt deze correlatietechniek in SPSS 16 onder Analyze -> Correlate -> Bivariate Correlations -> klik
Spearman aan.
Lineaire regressie
https://wikistatistiek.amc.nl/index.php/Lineaire_regressie