Onderzoeksmethoden 3
Basis principes OLS
OLS = een type lineaire kleinste kwadraten methode voor het schatten van de onbekende parameters
in een lineaire regressie model.
1 Introductie
1.1 Wat is econometrie?
= een techniek om (statistisch significante) relaties tussen bepaalde variabelen aan te tonen of te
verwerpen en deze relatie te kwantificeren.
→ Grafisch: het tekenen van een curve in een spreidingsdiagram/correlatiediagram (scatter plot)
MAAR: Correlatie impliceert niet noodzakelijkerwijs causaliteit. Niet omdat je correlatie hebt tussen
twee variabelen, dat er ook een oorzaakgevolg relatie is en daar zijn we naar op zoek!
- Bv de theorie van de ooievaar: Hamburg heeft een van de grootste populaties ooievaars in en
rond de stad. Daarnaast worden er gemiddeld meer kinderen geboren per 1000 inwoners dan in
de rest van Duitsland. De voor de hand liggende, maar zo foute, conclusie is dat baby’s worden
gebracht door ooievaars.
Lijn zoeken die best aansluit bij puntenwolk, ene zal zwart zeggen
ander rode. Dus mogelijk op zicht te zeggen, dus OLS techniek zal
beste lijn kiezen.
Een goed onderliggend model is dus noodzakelijk. Dus ga na wat
er in die modellen thuishoort en wat niet. Bv voetbal match en
bbp heeft weinig met elkaar te maken.
Waarom gebruiken we econometrie?
- Beschrijf en verklaar de (economische) werkelijkheid
- Verifiëren of testen van een bepaalde theorie
o Wordt de particuliere consumptie bv beïnvloed door de prestaties van de beurs?
- Beleid
o Bv met hoeveel moet de prijs van sigaretten stijgen om het verbruik met 10% te
verminderen? Hoeveel % zou er minder gaan roken? Wat is het gevolg?
- Voorspellingen
o Wat zal bijvoorbeeld de wisselkoers euro/dollar zijn, de prijs van olie, de werkloosheid, ...
in 6 maanden?
,Mogelijke valkuilen bij het inschatten van een model
- Mechanisch' nabootsend gedrag, zonder begrijpen wat je aan het doen bent
- Correlatie (of significant effect) impliceert geen causaliteit
- Niet vertrouwen op een fatsoenlijk onderliggend model
- Weggelaten variabele vertekening → Variabelen die in uw model zouden moeten zitten en voor
een reden niet hebben opgenomen. Dit kan voor probs zorgen! (kan zorgen voor minpunten)
- Extreme waarnemingen (= outliers)
- Geen rekening houden met het gegevenstype (doorsnede, tijdreeksen, paneel,...)
- Geen rekening houden met het meetniveau van afhankelijke en onafhankelijke variabelen
1.2 Valse correlaties
Correlatie ≠ causaliteit. Goed onderliggend model is noodzakelijk.
- Vb 1 nicolas cage: relatief klein. Maar software weet het niet, die zouden wel een geval kunnen
aanduiden maar dan moet je zelf weten dat het niet zo is.
- Vb 2 consumptie kaas gecorreleerd met #mensen die stierven in het bed.
Goed model is nodig
- De vraag naar Coca-Cola → Positief verband: 3e variabele zal wrs goed weer zijn. Een variabele
die de twee aanstuurt.
o Verkoop van airco-apparaten
o Verkoop kerstwenskaarten
- Roken en longkanker? Misschien een bepaald genetisch effect? Die mensen aanzet om te roken
op jonge leeftijd en datzelfde gen zorgt ervoor dat je kanker krijgt. Dus bij relaties die zelfs
overduidelijk zijn toch zien of het mss iets anders kan zijn.
- Gezondheidsstatus en inkomen? wat is nu oorzaak en wat gevolg? Mensen met een hoog
inkomen leven die gezonder of sporten die vaker? Of zijn gezonde mensen in staat om meer te
werken en zo meer te verdienen?
Ondanks de wiskundige en statistische component is econometrie geen exacte wetenschap. Gezond
verstand (o.a. bij het interpreteren en analyse van gegevens en resultaten) is noodzakelijk
1.3 Weggelaten variabelen (ommited variables)
X-as = oorzaak & Y-as = gevolg. Positief verband maar waarschijnlijk niet! →
Er zal een derde variabele zijn namelijk hoe meer mensen roken, hoe meer
asbakken en dus hoe meer longkanker
,1.4 Extreme observatie
1.4.1 Schatting van de relatie tussen aantal ziekenhuisdagen en totale kosten van een ziekenhuis
Hoe meer ligdagen, hoe hoger de kost (logisch). Software geeft
rode lijn → waarom niet door de puntenwolk? Omdat er een
uitschieter is. Die kan alles scheeftrekken
X-as = output & y-as = kost → kostenfunctie aan het schatten.
Helling van kostenfunctie is de afgeleiden dus marginale kost.
Als je dit zou berekenen o.b.v. rode lijn (regressie) = 405 en
groene is steiler! Naargelang je de ene observatie weghaalt kom
je op meerdere kosten per dag.
Regressie = analyseren van gegevens waarin (mogelijk) sprake is van een specifieke samenhang. Het
is een bijzondere relatie tussen twee of meer numerische variabelen, waarin één variabele wordt
voorspeld op basis van de anderen.
Schatting van 𝛽1
- 1e regressie : 𝛽1 = €405
- 2e regressie : 𝛽1 = €510
1 extra dag (= marginale kosten) kost 405 of 510 euro. Verschil is belangrijk (bv voor de financiering
van het ziekenhuis). Dit kan zorgen voor onderfinanciering waardoor ziekenhuizen minder personeel
moeten aannemen en dus service minder is. Maar omgekeerd kan ook, je moet ze niet te veel geven.
Je moet betalen wat het werkelijk is!
1.4.2 Schatting van een consumptie functie
Economische theorie: particuliere consumptie wordt deels bepaald door het
inkomen. Regressie lijn zou beter aansluiten bij de blauwe punten, maar door de
outlier kriig je een vertekend beeld. Stel vermogen van Coecke zou heel de lijn
kunnen scheef trekken.
Model: 𝐶 = 𝛽0 + 𝛽1𝐼
- C = verbruik - 𝛽0 = autonoom verbruik
- I = besteedbaar inkomen - 𝛽1 = marginale neiging om te consumeren (mpc)
, 1.5 Regressie lijn
Lenge en gewicht
Regressie geeft een gemiddeld verband weer. Gemiddeld neemt de
lengte van kinderen toe met de leeftijd.
Geldt niet noodzakelijkerwijs voor elk individu → Dus hier wil het bv
niet zeggen dat kinderen van 10j niet groter kunnen zijn dan kinderen
van 11j en omgekeerd. De regressie geeft gewoon het gemiddelde
weer.
Positief verband (hoe ouder je wordt, hoe groter je bent). Hier zie je
op het einde dat er twee outliers zijn, het geldt dus niet voor ieder
individu, want het is een gemiddelde.
Consumptie en inkomen
We gaan proberen voor het gemiddelde de rode draad te
zoeken zonder 1 op 1 te moeten doen. Sommige mensen met
een inkomen van 80 of 100 geven meer uit dan iemand met een
hoger inkomen.
Globaal → positief verband tussen inkomen & consumptie
uitgave
1.6 Schatting van een consumptie functie
Model: 𝐶 = 𝛽0 + 𝛽1𝐼 → Doel is het kwantificeren van 𝛽0, 𝛽1. Consumptie wordt verklaard door inkomen.
- Variabelen: C & I = gekend (uit data) = afhankelijk (Y). Verklaard door het inkomen.
- Coëfficiënten of parameters: 𝛽0 & 𝛽1 = niet gekend, dit moet je schatten. Je kan die wel zoeken.
Dit is ons intercept. Het is onze helling/rico die bepaalt hoe onze rechte er gaat uitzien.
We hebben informatie nodig over C en I. De data die we hebben kunnen 3 types zijn:
- Kruising sectie: Voor een aantal landen / personen / gezinnen / bedrijven op één moment
- Tijdsreeksen: Voor een bepaald land gedurende een aantal perioden
o Stel je doet enqûetes en je vraagt telkens hoeveel iemand verdient en uitgeeft. En dit blijf
je herhalen. Op 1 jaar heb je dan 52 combinaties. Als je een tijdreeks hebt → Probleem
van autocorrelatie! Dus op voorhand al zien wat je moet testen etc.
o Autocorrelatie = In een reeks waarnemingen is er een correlatiepatroon tussen
opeenvolgende uitkomsten
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper hw1998. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €10,49. Je zit daarna nergens aan vast.