Hoofdstuk 4:
Lineaire regressie met één
regressor
Vaak weten we het effect niet op een variabele Y als we een verandering
aanbrengen in een andere variabele X.
Bijvoorbeeld wat is het effect als we minder leerlingen in een
klas zetten op de testscore?
Daarom gaan we het lineaire regressiemodel bekijken en dit relateert
één variabele X aan een andere variabele Y.
We willen nu de helling van deze lineaire relatie gaan schatten. We willen
dus het effect op Y gaan schatten van een verandering van één eenheid in
X en we gaan daar steekproefgegevens voor gebruiken van de twee
variabelen.
Hoe gaan we voor onze schatting van de helling nu zo een lijn tekenen
doorheen de gegevens: dit gaan we doen met de kleinste
kwadratenmethode of in het Engels ordinary least squares.
Het lineaire regressie model
Voorbeeld: men wil het aantal leerlingen per leerkracht verminderen door
nieuwe leerkrachten aan te werven en dit omdat de ouders zeggen dat de
kinderen zo meer individuele aandacht krijgen. Nu is de vraag of de
resultaten van de leerlingen er echt op vooruit gaan als men de grootte
van de klassen vermindert.
De populatie regressielijn wordt hier: TestScore= β0 + β 1 × KlasGrootte
β 1 is dan de helling van de populatie regressielijn en dat is de
verandering van de testscore ten opzichte van de verandering van één
eenheid in de grootte van de klas.
β 0 en β 1 zijn de populatieparameters. De waarde van β 1 willen we
graag weten, maar die weten we niet. We moeten deze warde gaan
schatten door steekproefgegevens te gebruiken.
Algemene notatie
Het Lineaire Regressie Model: Y i=β 0 + β 1 X i+u i
Het onderschrift i gaat zover als het aantal observaties
Yi is de afhankelijke variabele, de regressand
Xi is de onafhankelijke variabele, de regressor
β 0 is de intercept
β 1 is de helling
ui is de storingsterm of error term
, Deze storingsterm omvat alle factoren die verantwoordelijk zijn voor het
verschil tussen de gemiddelde uitkomst van de observatie i en de
geschatte uitkomst door de regressielijn. De storingsterm bevat alle andere
factoren buiten X die de waarde van de
afhankelijke variabele Y bepalen voor een
bepaalde specifieke observatie i.
De populatie regressielijn: β 0+ β1 X
Grafische voorstelling van de regressielijn:
Op de grafiek zien we dat de regressielijn een
negatieve helling heeft. De zwarte bolletjes zijn de
observaties van X en Y. Zoals we zien staan deze
niet mooi op de getekende populatie regressielijn
omdat er ook andere factoren dan enkel X zijn die
de waarde van Y bepalen. De afwijking die we zien is de regressiefout u.
De coëfficiënten van het lineaire regressiemodel schatten
Meestal zijn de intercept β 0 en de helling β 1 van de populatie
regressielijn niet geweten. We moeten daarom gegevens gebruiken zodat
we de intercept en de helling kunnen schatten.
De populatiewaarde schatten we meestal door een willekeurige steekproef
te nemen.
Op deze samenvatting zien we de gegevens die we gevonden hebben. We
zien bijvoorbeeld dat het 10de percentiel van de verdeling van de student-
teacher ratio 17.3 is, dit is dat slechts 10% van de districten een student-
teacher ratio hebben die lager is dan 17.3%. Deze tabel zegt ons wel niets
over de relatie tussen de student-teacher ratio en de testscore.
In de volgende puntenwolk van de steekproef zien we dat er een lichte
negatieve correlatie is tussen de twee variabelen.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Christophe1994. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.