Hoofdstuk 4:
Lineaire regressie met één
regressor
Vaak weten we het effect niet op een variabele Y als we een verandering
aanbrengen in een andere variabele X.
Bijvoorbeeld wat is het effect als we minder leerlingen in een
klas zetten op de testscore?
Daarom gaan we het lineaire regressiemodel bekijken en dit relateert
één variabele X aan een andere variabele Y.
We willen nu de helling van deze lineaire relatie gaan schatten. We willen
dus het effect op Y gaan schatten van een verandering van één eenheid in
X en we gaan daar steekproefgegevens voor gebruiken van de twee
variabelen.
Hoe gaan we voor onze schatting van de helling nu zo een lijn tekenen
doorheen de gegevens: dit gaan we doen met de kleinste
kwadratenmethode of in het Engels ordinary least squares.
Het lineaire regressie model
Voorbeeld: men wil het aantal leerlingen per leerkracht verminderen door
nieuwe leerkrachten aan te werven en dit omdat de ouders zeggen dat de
kinderen zo meer individuele aandacht krijgen. Nu is de vraag of de
resultaten van de leerlingen er echt op vooruit gaan als men de grootte
van de klassen vermindert.
De populatie regressielijn wordt hier: TestScore= β0 + β 1 × KlasGrootte
β 1 is dan de helling van de populatie regressielijn en dat is de
verandering van de testscore ten opzichte van de verandering van één
eenheid in de grootte van de klas.
β 0 en β 1 zijn de populatieparameters. De waarde van β 1 willen we
graag weten, maar die weten we niet. We moeten deze warde gaan
schatten door steekproefgegevens te gebruiken.
Algemene notatie
Het Lineaire Regressie Model: Y i=β 0 + β 1 X i+u i
Het onderschrift i gaat zover als het aantal observaties
Yi is de afhankelijke variabele, de regressand
Xi is de onafhankelijke variabele, de regressor
β 0 is de intercept
β 1 is de helling
ui is de storingsterm of error term
, Deze storingsterm omvat alle factoren die verantwoordelijk zijn voor het
verschil tussen de gemiddelde uitkomst van de observatie i en de
geschatte uitkomst door de regressielijn. De storingsterm bevat alle andere
factoren buiten X die de waarde van de
afhankelijke variabele Y bepalen voor een
bepaalde specifieke observatie i.
De populatie regressielijn: β 0+ β1 X
Grafische voorstelling van de regressielijn:
Op de grafiek zien we dat de regressielijn een
negatieve helling heeft. De zwarte bolletjes zijn de
observaties van X en Y. Zoals we zien staan deze
niet mooi op de getekende populatie regressielijn
omdat er ook andere factoren dan enkel X zijn die
de waarde van Y bepalen. De afwijking die we zien is de regressiefout u.
De coëfficiënten van het lineaire regressiemodel schatten
Meestal zijn de intercept β 0 en de helling β 1 van de populatie
regressielijn niet geweten. We moeten daarom gegevens gebruiken zodat
we de intercept en de helling kunnen schatten.
De populatiewaarde schatten we meestal door een willekeurige steekproef
te nemen.
Op deze samenvatting zien we de gegevens die we gevonden hebben. We
zien bijvoorbeeld dat het 10de percentiel van de verdeling van de student-
teacher ratio 17.3 is, dit is dat slechts 10% van de districten een student-
teacher ratio hebben die lager is dan 17.3%. Deze tabel zegt ons wel niets
over de relatie tussen de student-teacher ratio en de testscore.
In de volgende puntenwolk van de steekproef zien we dat er een lichte
negatieve correlatie is tussen de twee variabelen.
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur Christophe1994. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €5,49. Vous n'êtes lié à rien après votre achat.