Hoofdstuk 11: Regressie en Correlatie methoden
11.1 Introductie
In dit hoofdstuk gaan we verbanden zoeken tussen variabelen en we gaan kijken of deze verbanden
er zijn door toeval of dat het authentieke verbanden zijn, ook wel significante verbanden genoemd.
Ook gaan we een multiple regressie doen, waarbij we het verband onderzoeken tussen meer dan
twee variabelen. We werken met lineaire regressie, wat betekent dat onze x-variabelen nooit in een
exponent wordt gezet (y = ax + b). De x-variabele wordt ook wel de predictor variabele genoemd.
Deze kan continue zijn (bijvoorbeeld lichaamsgewicht, er bestaat een oneindig aantal mogelijkheden
en/of oplossingen voor), of deze kan categorisch zijn (gegevens die volgens de categorie zo zijn,
bijvoorbeeld de oogkleur van iemand). De y-variabele zal altijd continue zijn.
11.2 General concepts
We gaan werken met een voorbeeld uit de verloskunde: We volgen 31 zwangere vrouwen op die
bijna aan het einde van hun zwangerschap
zijn. Het hormoon niveau van oestriol wordt
bepaald per 24 uur (= x-variabele). Dit
hormoonniveau wordt in verband gebracht
met het geboortegewicht (= y-variabele)
van de baby. We gaan zoeken naar een
correlatie tussen deze twee. Met andere
woorden: Het geboortegewicht willen we
graag voorspellen op basis van het
hormoonniveau. Wanneer we deze
metingen uitzetten in een scatterplot met
op de x-as de hormoonniveaus en op de y-
as het geboortegewicht, zien we een
puntenwolk. We willen hierdoor een rechte trekken, de regressielijn: y=α + βx , waarbij:
is de intercept, de hoogte waarop de rechte lijn de y-as snijdt
is de slope, ofwel de richtingscoëfficiënt, ofwel de hellingsgraad
x is de independent variabele (de onafhankelijke variabele) ofwel de predictor variabele. Dit
meet je en is onafhankelijk bepaald
y is de dependent variabele (de afhankelijke variabele), omdat y afhangt van x
Met deze regressielijn willen we voorspellingen doen van het geboortegewicht. Wanneer je kijkt in
de grafiek bij 12 mg/24hr oestriol zien we een geboortegewicht van 27 gram. Echter, de regressielijn
voorspelt een hoger gewicht! Dit zal een kleine fout zijn. Dus, de meting bij de moeder en de
voorspelling van de lijn is niet altijd hetzelfde! De regressielijn klopt dus niet per se voor iedere
moeder. Daarom moeten we een ‘error’ (e) toevoegen aan de formule: y=α + βx +e . Zoals je kan
zien in het figuur rechts, kunnen er voor iedere x-waarde meerdere punten
zijn. Dit komt omdat er verschillende moeders kunnen zijn met hetzelfde
hormoonniveau, maar dat de baby’s een ander geboortegewicht hebben.
Dit zijn de zwarte puntjes in de grafiek. Al deze zwarte puntjes wijken af
van de lineaire regressielijn, deze afwijking is de error (e) in de formule. De
fout e is normaal verdeeld (dus heeft een normale distributie) met een
gemiddelde en een variantie (2, zie curve links van de zwarte puntjes). Dit
is de verdeling die we bekomen voor de fout. De fouten voor de x-waarden
zijn allemaal fouten van de lineaire regressielijn. Echter, symmetrisch
gezien zal boven/onder de regressielijn dezelfde fout zitten, dit leidt dus tot de normale verdeling.
Maar, dit moeten we gaan checken, voordat we verder mogen gaan met de regressie. Ook moeten
we nagaan of de spreiding van de normale verdelingen even breed zijn, ofwel dat ze een constante
variantie hebben, dit noemen we homostedasticiteit. Wanneer er geen constante variantie aanwezig
is, spreken we van heterostedasticiteit.
Pagina 1 van 22
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller lisaankersmit. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $10.73. You're not tied to anything after your purchase.