Onderzoeksmethoden 3
Basis principes OLS
OLS = een type lineaire kleinste kwadraten methode voor het schatten van de onbekende parameters
in een lineaire regressie model.
1 Introductie
1.1 Wat is econometrie?
= een techniek om (statistisch significante) relaties tussen bepaalde variabelen aan te tonen of te
verwerpen en deze relatie te kwantificeren.
→ Grafisch: het tekenen van een curve in een spreidingsdiagram/correlatiediagram (scatter plot)
MAAR: Correlatie impliceert niet noodzakelijkerwijs causaliteit. Niet omdat je correlatie hebt tussen
twee variabelen, dat er ook een oorzaakgevolg relatie is en daar zijn we naar op zoek!
- Bv de theorie van de ooievaar: Hamburg heeft een van de grootste populaties ooievaars in en
rond de stad. Daarnaast worden er gemiddeld meer kinderen geboren per 1000 inwoners dan in
de rest van Duitsland. De voor de hand liggende, maar zo foute, conclusie is dat baby’s worden
gebracht door ooievaars.
Lijn zoeken die best aansluit bij puntenwolk, ene zal zwart zeggen
ander rode. Dus mogelijk op zicht te zeggen, dus OLS techniek zal
beste lijn kiezen.
Een goed onderliggend model is dus noodzakelijk. Dus ga na wat
er in die modellen thuishoort en wat niet. Bv voetbal match en
bbp heeft weinig met elkaar te maken.
Waarom gebruiken we econometrie?
- Beschrijf en verklaar de (economische) werkelijkheid
- Verifiëren of testen van een bepaalde theorie
o Wordt de particuliere consumptie bv beïnvloed door de prestaties van de beurs?
- Beleid
o Bv met hoeveel moet de prijs van sigaretten stijgen om het verbruik met 10% te
verminderen? Hoeveel % zou er minder gaan roken? Wat is het gevolg?
- Voorspellingen
o Wat zal bijvoorbeeld de wisselkoers euro/dollar zijn, de prijs van olie, de werkloosheid, ...
in 6 maanden?
,Mogelijke valkuilen bij het inschatten van een model
- Mechanisch' nabootsend gedrag, zonder begrijpen wat je aan het doen bent
- Correlatie (of significant effect) impliceert geen causaliteit
- Niet vertrouwen op een fatsoenlijk onderliggend model
- Weggelaten variabele vertekening → Variabelen die in uw model zouden moeten zitten en voor
een reden niet hebben opgenomen. Dit kan voor probs zorgen! (kan zorgen voor minpunten)
- Extreme waarnemingen (= outliers)
- Geen rekening houden met het gegevenstype (doorsnede, tijdreeksen, paneel,...)
- Geen rekening houden met het meetniveau van afhankelijke en onafhankelijke variabelen
1.2 Valse correlaties
Correlatie ≠ causaliteit. Goed onderliggend model is noodzakelijk.
- Vb 1 nicolas cage: relatief klein. Maar software weet het niet, die zouden wel een geval kunnen
aanduiden maar dan moet je zelf weten dat het niet zo is.
- Vb 2 consumptie kaas gecorreleerd met #mensen die stierven in het bed.
Goed model is nodig
- De vraag naar Coca-Cola → Positief verband: 3e variabele zal wrs goed weer zijn. Een variabele
die de twee aanstuurt.
o Verkoop van airco-apparaten
o Verkoop kerstwenskaarten
- Roken en longkanker? Misschien een bepaald genetisch effect? Die mensen aanzet om te roken
op jonge leeftijd en datzelfde gen zorgt ervoor dat je kanker krijgt. Dus bij relaties die zelfs
overduidelijk zijn toch zien of het mss iets anders kan zijn.
- Gezondheidsstatus en inkomen? wat is nu oorzaak en wat gevolg? Mensen met een hoog
inkomen leven die gezonder of sporten die vaker? Of zijn gezonde mensen in staat om meer te
werken en zo meer te verdienen?
Ondanks de wiskundige en statistische component is econometrie geen exacte wetenschap. Gezond
verstand (o.a. bij het interpreteren en analyse van gegevens en resultaten) is noodzakelijk
1.3 Weggelaten variabelen (ommited variables)
X-as = oorzaak & Y-as = gevolg. Positief verband maar waarschijnlijk niet! →
Er zal een derde variabele zijn namelijk hoe meer mensen roken, hoe meer
asbakken en dus hoe meer longkanker
,1.4 Extreme observatie
1.4.1 Schatting van de relatie tussen aantal ziekenhuisdagen en totale kosten van een ziekenhuis
Hoe meer ligdagen, hoe hoger de kost (logisch). Software geeft
rode lijn → waarom niet door de puntenwolk? Omdat er een
uitschieter is. Die kan alles scheeftrekken
X-as = output & y-as = kost → kostenfunctie aan het schatten.
Helling van kostenfunctie is de afgeleiden dus marginale kost.
Als je dit zou berekenen o.b.v. rode lijn (regressie) = 405 en
groene is steiler! Naargelang je de ene observatie weghaalt kom
je op meerdere kosten per dag.
Regressie = analyseren van gegevens waarin (mogelijk) sprake is van een specifieke samenhang. Het
is een bijzondere relatie tussen twee of meer numerische variabelen, waarin één variabele wordt
voorspeld op basis van de anderen.
Schatting van 𝛽1
- 1e regressie : 𝛽1 = €405
- 2e regressie : 𝛽1 = €510
1 extra dag (= marginale kosten) kost 405 of 510 euro. Verschil is belangrijk (bv voor de financiering
van het ziekenhuis). Dit kan zorgen voor onderfinanciering waardoor ziekenhuizen minder personeel
moeten aannemen en dus service minder is. Maar omgekeerd kan ook, je moet ze niet te veel geven.
Je moet betalen wat het werkelijk is!
1.4.2 Schatting van een consumptie functie
Economische theorie: particuliere consumptie wordt deels bepaald door het
inkomen. Regressie lijn zou beter aansluiten bij de blauwe punten, maar door de
outlier kriig je een vertekend beeld. Stel vermogen van Coecke zou heel de lijn
kunnen scheef trekken.
Model: 𝐶 = 𝛽0 + 𝛽1𝐼
- C = verbruik - 𝛽0 = autonoom verbruik
- I = besteedbaar inkomen - 𝛽1 = marginale neiging om te consumeren (mpc)
, 1.5 Regressie lijn
Lenge en gewicht
Regressie geeft een gemiddeld verband weer. Gemiddeld neemt de
lengte van kinderen toe met de leeftijd.
Geldt niet noodzakelijkerwijs voor elk individu → Dus hier wil het bv
niet zeggen dat kinderen van 10j niet groter kunnen zijn dan kinderen
van 11j en omgekeerd. De regressie geeft gewoon het gemiddelde
weer.
Positief verband (hoe ouder je wordt, hoe groter je bent). Hier zie je
op het einde dat er twee outliers zijn, het geldt dus niet voor ieder
individu, want het is een gemiddelde.
Consumptie en inkomen
We gaan proberen voor het gemiddelde de rode draad te
zoeken zonder 1 op 1 te moeten doen. Sommige mensen met
een inkomen van 80 of 100 geven meer uit dan iemand met een
hoger inkomen.
Globaal → positief verband tussen inkomen & consumptie
uitgave
1.6 Schatting van een consumptie functie
Model: 𝐶 = 𝛽0 + 𝛽1𝐼 → Doel is het kwantificeren van 𝛽0, 𝛽1. Consumptie wordt verklaard door inkomen.
- Variabelen: C & I = gekend (uit data) = afhankelijk (Y). Verklaard door het inkomen.
- Coëfficiënten of parameters: 𝛽0 & 𝛽1 = niet gekend, dit moet je schatten. Je kan die wel zoeken.
Dit is ons intercept. Het is onze helling/rico die bepaalt hoe onze rechte er gaat uitzien.
We hebben informatie nodig over C en I. De data die we hebben kunnen 3 types zijn:
- Kruising sectie: Voor een aantal landen / personen / gezinnen / bedrijven op één moment
- Tijdsreeksen: Voor een bepaald land gedurende een aantal perioden
o Stel je doet enqûetes en je vraagt telkens hoeveel iemand verdient en uitgeeft. En dit blijf
je herhalen. Op 1 jaar heb je dan 52 combinaties. Als je een tijdreeks hebt → Probleem
van autocorrelatie! Dus op voorhand al zien wat je moet testen etc.
o Autocorrelatie = In een reeks waarnemingen is er een correlatiepatroon tussen
opeenvolgende uitkomsten
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller hw1998. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $11.46. You're not tied to anything after your purchase.