Samenvatting slides OZM
OLS = Ordinary Least Squares // GKK = Gewone Kleinste Kwadraten techniek voor het
schatten van beste curve door de puntenwolk
Minimaliseer telkens SSR (sum of squared residuals)
Afhankelijk = y-variabele, onafhankelijk = x-variabelen
Werkelijke waarde van Y = Voorspelling + residu
Residu = fout = storingsterm = error term = werkelijke waarde – voorspelde waarde
Geen patroon in de residuen, anders is er iets mis met de schatting
OLS-schatters zijn …
Puntschatters
De regressielijn gaat door het gemiddelde van X en Y
Het gemiddelde van de geschatte Y = gemiddelde van de werkelijke Y
Gemiddelde van de residuen = 0
Residuen vertonen geen correlatie met de voorspelde Y of met X
Residuen moeten normaal verdeeld zijn beta’s normaal verdeeld testen betrouwbaar
Gemiddelde = 0 (mhu), variantie = constant (sigma²)
Efficiënt = minimum variantie = observaties liggen dicht bij elkaar
Onvertekend = gemiddelde is gelijk aan de werkelijke waarde = observaties liggen dicht bij
het midden
OLS = BLUE (Best Linear Unbiased Estimator) minimum variantie, lineaire schatters,
onvertekende schatters
Variantie = mate waarin de waarde van een variabele afwijkt van het gemiddelde. Het zegt
iets over de stabiliteit van de parameter. Gemiddelde gekwadrateerde afwijking van het
gemiddelde!
Variantie storingsterm of residuen zo klein mogelijk = preciezere geschatte beta
Variantie van X zo groot mogelijk = stabielere parameter geschat
Correlatie = een maat voor de sterkte van de relatie tussen twee variabelen. Hoeveel
verandert de ene variabele als de andere variabele verandert? Of hoe afhankelijk is de ene
van de andere? Ligt tussen -1 en +1. De covariantie wordt gedeeld door het product van de
standaard deviaties.
Covariantie = een maat voor de sterkte van de correlatie tussen twee variabelen. Het is de
verwachte waarde van het product van telkens het verschil tussen de werkelijke waarde van
X en het gemiddelde van X en het verschil tussen de werkelijke waarde van Y en het
gemiddelde van Y
R² = hoeveel % van de variantie van Y wordt verklaard door het model? Hoe groter hoe beter
Decompositie van de variantie
TSS = total sum of squares MSS + RSS
MSS = model sum of squares zo groot mogelijk
RSS (of SSR) = residual sum of squares zo klein mogelijk
R² = MSS/TSS = 1 – RSS/TSS
Root MSE = standaard deviatie = vierkantswortel van RSS/df zo klein mogelijk
Df = aantal observaties – aantal parameters zo groot mogelijk
Standaard error = geeft de precisie van de schatting weer, hoe zeker ben je van de geschatte
waarde (betrouwbaarheid)? De waarde geeft de spreiding van de schatting weer indien er
1
, meerdere samples zouden zijn, waarbij er bij elke sample opnieuw een schatting wordt
gemaakt. Hoe kleiner hoe preciezer je schat wordt kleiner als steekproef groter wordt
Vierkantswortel van de variantie van een coëfficiënt
Meervoudige regressie: correlatie coëfficiënt in noemer variantie formule
Liefst kleine correlatie, als dit groot is zal de noemer zeer klein worden (1-r) en de
variantie heel groot geen precieze schatting
Opblazen variantie door hoge correlatie: zie later VIF waarde multicollineariteit
Beta’s staan in termen van covarianties en varianties
Twee modellen vergelijken
Steekproefgroottes van de modellen moet gelijk zijn
De AFHANKELIJKE variabele moet hetzelfde zijn geen modellen vergelijken met
een andere functionele vorm
Aantal geschatte parameters moet gelijk zijn
Gebruik R²-adjusted in plaats van R²: gecorrigeerd voor het aantal vrijheidsgraden want R² zal
altijd stijgen bij het toevoegen van een variabele en de df’s zullen altijd dalen of deze nu
bijdrage levert of niet. Bij R²-adjusted kan je zien of de variabele bijdrage levert als deze stijgt
dus wanneer de stijging de daling van de vrijheidsgraden meer dan compenseert.
ALGEMEEN (zonder transformaties) Interpretatie beta’s: een coëfficiënt meet de impact
van een stijging van de X-variabele met 1 eenheid op de waarde van Y (afhankelijke
variabele) terwijl de andere X-variabelen constant blijven (=netto impact)
Dit is een marginaal effect omdat de beta de afgeleide van Y naar X is.
Constante term = snijpunt van de regressielijn met de Y-as autonome component:
verwachte waarde van Y als alle afhankelijke variabelen gelijk zijn aan 0 (en de storingsterm)
of de constante term is dan gelijk aan het gemiddelde van Y
Dummy variabele = waarde die aangeeft of een variabele een bepaalde eigenschap vertoont
of niet
Afwijking meten t.o.v. categorie die op 0 staat (= referentiecategorie)
Slope: dummy bij een X-variabele
Interactie-effect = product van de dummy met een X-variabele
Intercept: dummy bij een beta
Dummy variable trap = wanneer je evenveel dummies opneemt als dat er categorieën zijn
neem altijd 1 dummy minder op dan het aantal categorieën!
Dummies worden gebruikt voor structuurbreuken, extreme observaties en
seizonaliteitseffecten te analyseren.
Gestandaardizeerde variabelen = variabelen die op gelijke schaal gezet worden
(werkelijke waarde – gemiddelde waarde) / standaard deviatie
Zo kan je makkelijker variabelen vergelijken met elkaar als ze in verschillende
eenheden staan
In stata: commando ‘beta’: als X met 1 standaardafwijking stijgt, zal Y ook met 1
standaardafwijking stijgen
Logaritmische transformaties: variabelen transformeren van lineair naar niet-lineaire vorm of
andersom het zijn de variabelen, NIET de beta’s die getransformeerd worden!
Naam van transformatie: afhankelijk – onafhankelijk
Vb. Log-lin: afhankelijk = logaritmisch, onafhankelijk = lineair
Log-log model: coëfficiënten zijn elasticiteiten
Log-lin model: beta = procentuele verandering in Y ten gevolge van een absolute
wijziging in X
2
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller robinbakker3. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.83. You're not tied to anything after your purchase.