Hoofdstuk 11: Regressie en Correlatie methoden
11.1 Introductie
In dit hoofdstuk gaan we verbanden zoeken tussen variabelen en we gaan kijken of deze verbanden
er zijn door toeval of dat het authentieke verbanden zijn, ook wel significante verbanden genoemd.
Ook gaan we een multiple regressie doen, waarbij we het verband onderzoeken tussen meer dan
twee variabelen. We werken met lineaire regressie, wat betekent dat onze x-variabelen nooit in een
exponent wordt gezet (y = ax + b). De x-variabele wordt ook wel de predictor variabele genoemd.
Deze kan continue zijn (bijvoorbeeld lichaamsgewicht, er bestaat een oneindig aantal mogelijkheden
en/of oplossingen voor), of deze kan categorisch zijn (gegevens die volgens de categorie zo zijn,
bijvoorbeeld de oogkleur van iemand). De y-variabele zal altijd continue zijn.
11.2 General concepts
We gaan werken met een voorbeeld uit de verloskunde: We volgen 31 zwangere vrouwen op die
bijna aan het einde van hun zwangerschap
zijn. Het hormoon niveau van oestriol wordt
bepaald per 24 uur (= x-variabele). Dit
hormoonniveau wordt in verband gebracht
met het geboortegewicht (= y-variabele)
van de baby. We gaan zoeken naar een
correlatie tussen deze twee. Met andere
woorden: Het geboortegewicht willen we
graag voorspellen op basis van het
hormoonniveau. Wanneer we deze
metingen uitzetten in een scatterplot met
op de x-as de hormoonniveaus en op de y-
as het geboortegewicht, zien we een
puntenwolk. We willen hierdoor een rechte trekken, de regressielijn: y=α + βx , waarbij:
is de intercept, de hoogte waarop de rechte lijn de y-as snijdt
is de slope, ofwel de richtingscoëfficiënt, ofwel de hellingsgraad
x is de independent variabele (de onafhankelijke variabele) ofwel de predictor variabele. Dit
meet je en is onafhankelijk bepaald
y is de dependent variabele (de afhankelijke variabele), omdat y afhangt van x
Met deze regressielijn willen we voorspellingen doen van het geboortegewicht. Wanneer je kijkt in
de grafiek bij 12 mg/24hr oestriol zien we een geboortegewicht van 27 gram. Echter, de regressielijn
voorspelt een hoger gewicht! Dit zal een kleine fout zijn. Dus, de meting bij de moeder en de
voorspelling van de lijn is niet altijd hetzelfde! De regressielijn klopt dus niet per se voor iedere
moeder. Daarom moeten we een ‘error’ (e) toevoegen aan de formule: y=α + βx +e . Zoals je kan
zien in het figuur rechts, kunnen er voor iedere x-waarde meerdere punten
zijn. Dit komt omdat er verschillende moeders kunnen zijn met hetzelfde
hormoonniveau, maar dat de baby’s een ander geboortegewicht hebben.
Dit zijn de zwarte puntjes in de grafiek. Al deze zwarte puntjes wijken af
van de lineaire regressielijn, deze afwijking is de error (e) in de formule. De
fout e is normaal verdeeld (dus heeft een normale distributie) met een
gemiddelde en een variantie (2, zie curve links van de zwarte puntjes). Dit
is de verdeling die we bekomen voor de fout. De fouten voor de x-waarden
zijn allemaal fouten van de lineaire regressielijn. Echter, symmetrisch
gezien zal boven/onder de regressielijn dezelfde fout zitten, dit leidt dus tot de normale verdeling.
Maar, dit moeten we gaan checken, voordat we verder mogen gaan met de regressie. Ook moeten
we nagaan of de spreiding van de normale verdelingen even breed zijn, ofwel dat ze een constante
variantie hebben, dit noemen we homostedasticiteit. Wanneer er geen constante variantie aanwezig
is, spreken we van heterostedasticiteit.
Pagina 1 van 22
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper lisaankersmit. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €10,00. Je zit daarna nergens aan vast.