Samenvatting slides OZM
OLS = Ordinary Least Squares // GKK = Gewone Kleinste Kwadraten techniek voor het
schatten van beste curve door de puntenwolk
Minimaliseer telkens SSR (sum of squared residuals)
Afhankelijk = y-variabele, onafhankelijk = x-variabelen
Werkelijke waarde van Y = Voorspelling + residu
Residu = fout = storingsterm = error term = werkelijke waarde – voorspelde waarde
Geen patroon in de residuen, anders is er iets mis met de schatting
OLS-schatters zijn …
Puntschatters
De regressielijn gaat door het gemiddelde van X en Y
Het gemiddelde van de geschatte Y = gemiddelde van de werkelijke Y
Gemiddelde van de residuen = 0
Residuen vertonen geen correlatie met de voorspelde Y of met X
Residuen moeten normaal verdeeld zijn beta’s normaal verdeeld testen betrouwbaar
Gemiddelde = 0 (mhu), variantie = constant (sigma²)
Efficiënt = minimum variantie = observaties liggen dicht bij elkaar
Onvertekend = gemiddelde is gelijk aan de werkelijke waarde = observaties liggen dicht bij
het midden
OLS = BLUE (Best Linear Unbiased Estimator) minimum variantie, lineaire schatters,
onvertekende schatters
Variantie = mate waarin de waarde van een variabele afwijkt van het gemiddelde. Het zegt
iets over de stabiliteit van de parameter. Gemiddelde gekwadrateerde afwijking van het
gemiddelde!
Variantie storingsterm of residuen zo klein mogelijk = preciezere geschatte beta
Variantie van X zo groot mogelijk = stabielere parameter geschat
Correlatie = een maat voor de sterkte van de relatie tussen twee variabelen. Hoeveel
verandert de ene variabele als de andere variabele verandert? Of hoe afhankelijk is de ene
van de andere? Ligt tussen -1 en +1. De covariantie wordt gedeeld door het product van de
standaard deviaties.
Covariantie = een maat voor de sterkte van de correlatie tussen twee variabelen. Het is de
verwachte waarde van het product van telkens het verschil tussen de werkelijke waarde van
X en het gemiddelde van X en het verschil tussen de werkelijke waarde van Y en het
gemiddelde van Y
R² = hoeveel % van de variantie van Y wordt verklaard door het model? Hoe groter hoe beter
Decompositie van de variantie
TSS = total sum of squares MSS + RSS
MSS = model sum of squares zo groot mogelijk
RSS (of SSR) = residual sum of squares zo klein mogelijk
R² = MSS/TSS = 1 – RSS/TSS
Root MSE = standaard deviatie = vierkantswortel van RSS/df zo klein mogelijk
Df = aantal observaties – aantal parameters zo groot mogelijk
Standaard error = geeft de precisie van de schatting weer, hoe zeker ben je van de geschatte
waarde (betrouwbaarheid)? De waarde geeft de spreiding van de schatting weer indien er
1
, meerdere samples zouden zijn, waarbij er bij elke sample opnieuw een schatting wordt
gemaakt. Hoe kleiner hoe preciezer je schat wordt kleiner als steekproef groter wordt
Vierkantswortel van de variantie van een coëfficiënt
Meervoudige regressie: correlatie coëfficiënt in noemer variantie formule
Liefst kleine correlatie, als dit groot is zal de noemer zeer klein worden (1-r) en de
variantie heel groot geen precieze schatting
Opblazen variantie door hoge correlatie: zie later VIF waarde multicollineariteit
Beta’s staan in termen van covarianties en varianties
Twee modellen vergelijken
Steekproefgroottes van de modellen moet gelijk zijn
De AFHANKELIJKE variabele moet hetzelfde zijn geen modellen vergelijken met
een andere functionele vorm
Aantal geschatte parameters moet gelijk zijn
Gebruik R²-adjusted in plaats van R²: gecorrigeerd voor het aantal vrijheidsgraden want R² zal
altijd stijgen bij het toevoegen van een variabele en de df’s zullen altijd dalen of deze nu
bijdrage levert of niet. Bij R²-adjusted kan je zien of de variabele bijdrage levert als deze stijgt
dus wanneer de stijging de daling van de vrijheidsgraden meer dan compenseert.
ALGEMEEN (zonder transformaties) Interpretatie beta’s: een coëfficiënt meet de impact
van een stijging van de X-variabele met 1 eenheid op de waarde van Y (afhankelijke
variabele) terwijl de andere X-variabelen constant blijven (=netto impact)
Dit is een marginaal effect omdat de beta de afgeleide van Y naar X is.
Constante term = snijpunt van de regressielijn met de Y-as autonome component:
verwachte waarde van Y als alle afhankelijke variabelen gelijk zijn aan 0 (en de storingsterm)
of de constante term is dan gelijk aan het gemiddelde van Y
Dummy variabele = waarde die aangeeft of een variabele een bepaalde eigenschap vertoont
of niet
Afwijking meten t.o.v. categorie die op 0 staat (= referentiecategorie)
Slope: dummy bij een X-variabele
Interactie-effect = product van de dummy met een X-variabele
Intercept: dummy bij een beta
Dummy variable trap = wanneer je evenveel dummies opneemt als dat er categorieën zijn
neem altijd 1 dummy minder op dan het aantal categorieën!
Dummies worden gebruikt voor structuurbreuken, extreme observaties en
seizonaliteitseffecten te analyseren.
Gestandaardizeerde variabelen = variabelen die op gelijke schaal gezet worden
(werkelijke waarde – gemiddelde waarde) / standaard deviatie
Zo kan je makkelijker variabelen vergelijken met elkaar als ze in verschillende
eenheden staan
In stata: commando ‘beta’: als X met 1 standaardafwijking stijgt, zal Y ook met 1
standaardafwijking stijgen
Logaritmische transformaties: variabelen transformeren van lineair naar niet-lineaire vorm of
andersom het zijn de variabelen, NIET de beta’s die getransformeerd worden!
Naam van transformatie: afhankelijk – onafhankelijk
Vb. Log-lin: afhankelijk = logaritmisch, onafhankelijk = lineair
Log-log model: coëfficiënten zijn elasticiteiten
Log-lin model: beta = procentuele verandering in Y ten gevolge van een absolute
wijziging in X
2
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper robinbakker3. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.