Oefenles 1 : Numerieke en statistische eigenschappen, hypothesetesten en
meeteenheden.
Numerieke en statistische eigenschappen, hypothesetesten
Cross-sectie : verschillende individuen op één bepaald tijd.
We hebben 2 variabelen (FOODEXP ,TOTALEXP). TOTALEXP gaan we gebruiken als proxy voor Beschikbaar
Inkomen (inkomensniveau).
Alle data’s zijn uitgedrukt in munteenheid (Roupie)
Fadia Farhat | VUB 2023-2024 1
,> # Vraag 1 : Wat is de het gemiddelde van de geschatte storingstermen
> mean(India_regression$residuals)
[1] -4.247612e-15
Quasi nul
µ =0
µ = 0 , omdat dit een numerieke eigenschap is van OLS. Wanneer we OLS uitvoeren, gaan we ∑ µ gaan
minimaliseren. Dit doen we door onze parameters zodanig te kiezen dat we het minimalisatieprobleem oplossen.
Dit leidt tot het verkrijgen van m eerste orde voorwaarden (met m= aantal variabelen)
Eén van die eerste orde voorwaarde is dat ∑ µ = 0. Dat is een numerieke eigenschap die altijd opgaat als je OLS
uitvoert. Het leert ons NIETS over de Statistische eigenschappen (zuiverheid, efficiëntie en consistentie) van onze
schatter en zegt ons NIETS over de kwaliteit van de regressie
Zuiverheid : Stochastische schatter is gemiddeld genomen correct; Eigenschap over herhaaldelijke
steekproeven
Efficiëntie : binnen de klasse van de zuivere schatters, is de schatter diegene met de kleinste variantie
over alternatieve steekproeven ; Eigenschap binnen de klasse van de zuivere schatters
Consistentie : als steekproefgrootte naar populatie tendeert, zal de schatter naar de werkelijke
parameter tenderen; Asymptotische eigenschap
De asymptotische eigenschap van een schatter verwijst naar het gedrag van die schatter als de steekproefgrootte naar oneindig gaat. Als we zeggen dat een
schatter asymptotisch onvertekend of asymptotisch normaal is, betekent dit dat, onder bepaalde voorwaarden, de schatter steeds nauwkeuriger wordt
naarmate de steekproefgrootte groter wordt en dat de verdeling van de schatter naar een normale verdeling convergeert. Deze asymptotische eigenschappen
worden vaak aangeduid met termen zoals "consistentie" en "asymptotisch normale verdeling."
Consistentie : Een schatter wordt als consistent beschouwd als deze naar de ware parameterwaarde convergeert naarmate de steekproefgrootte
naar oneindig gaat.
Asymptotische normaalheid : Een schatter is asymptotisch normaal als de verdeling van de schatter, genormaliseerd door de standaardfout, naar
een standaard normale verdeling convergeert naarmate de steekproefgrootte naar oneindig gaat. Dit resultaat volgt uit de centrale limietstelling.
Statistische eigenschappen gaan op, als de GM veronderstellingen opgaan. Eén van deze veronderstellingen is
dat de werkelijke storingstermen gemiddeld gezien nul zijn. Het is niet omdat het gemiddelde van de geschatte
storingstermen nul is, dat de werkelijke storingstermen gemiddeld nul zijn.
Deze zijn nul wanneer je geen specificatie fout maakt, dus als je
alle relevante varianten die een systematische impact hebben op uw AV opneemt in uw model en
wanneer je model de correcte functionele vorm heeft
Dan pas zal het gemiddelde van uw werkelijke storingstermen = o en zal je een zuivere, efficiënte en consistente
schatter hebben.
Fadia Farhat | VUB 2023-2024 2
, Vraag 1 : coëfficiënt is 0.43686
Regressiemodel is : 𝑌 = 𝛽 + 𝛽 𝑋 + µ
𝛽 =
𝑉𝑒𝑟𝑎𝑛𝑑𝑒𝑟𝑖𝑛𝑔 𝑖𝑛 𝑒𝑒𝑛ℎ𝑒𝑑𝑒𝑛
En een regressie is gemiddeld genomen correct
Dit betekent dat wanneer TOTALEXP toeneemt met 1
eenheid, hier 1 Roepie , dan zal gemiddeld genomen
FOODEXP toenemen met 0.43686 ( 𝜷𝟐 eenheden)
Roepie
Of nog : Als de totale uitgaven met 1 roepie toenemen, dan zullen de uitgaven voor voedsel gemiddeld genomen
met ongeveer 44 paise toenemen (1 roepie = 100 paise)
Het is een absolute wijziging in Y tgv een absolute wijziging in X
Vraag 2 : a-priori verwachtingen => Hypothesetest
uitvoeren.
1- Wat je theoretisch verwacht, dus positieve impact
=> stop je in je 𝐻 .
2- Dan bereken je je t-statistiek. Oplossing staat in R
output. Dit is die 5.576
3- Vul de waarde onder 𝐻 in de vergelijking van de
parameter van uw t-verdeling in . Je weet dat deze
parameter t-verdeeld is als de nulhypothese geldt en dat
95% van de waarden tussen uw kritische waarden liggen
als het tweezijdig is. Hier is het éénzijdig, dus moet ik het
teken van mijn kritische waarde gaan bepalen.
Daarvoor kijk je steeds naar 𝐻 . Hierin wil ik nagaan of
𝛽 > 0, dus zal je kritische waarden aan de rechterkant van uw grafiek komen te staan; dus positief teken.
Je gaat dus je kritische waarde op significantie niveau 5 % aan de rechterkant van de grafiek gaan bepalen.
Je hebt dus 95% interval aan de linkerkant en 5% aan de rechterkant van de grafiek.
Om de kritische waarde te bepalen heb jet aantal vrijheidsgraden nodig. Je schat twee parameters, dus df
= n-2.
In R: 095 want je hebt aan je linkerkant 95% van je waarden; dus 95% van de waarden is <0
> # Vraag 2 : Berekenen van t-statistiek
> qt(0.95,53)
[1] 1.674116
Teken is positief => +1.674116
4- Mijn t-statistiek = 5.576 ligt voorbij 1.674116, ligt in mijn zone van de 5%, dus kan ik mijn nulhypothese
verwerpen.
5- Bereken je P-waarde. In R staat die reeds in je regressieoutput. Die waarde is nagenoeg nul.
OPGELET: Deze P-waarde is voor een tweezijdige test. Hoe omvormen?
a. P/2 wanneer uw teststatistiek en uw kritische waarden in hetzelfde kwadrant liggen van de
grafiek; wat hier het geval is
b. 1- P/2 wanneer ze in verschillend kwadrant liggen
Fadia Farhat | VUB 2023-2024 3
, P/2 : Mijn P-waarde is nul, wat betekent dat indien ik de nulhypothese
verwerp ik nul kans maak op een fout => Ik verwerp de nulhypothese
1- P/2 : Mijn P-waarde is één, wat betekent dat indien ik de nulhypothese
verwerp ik 100 % kans maak op een fout => Ik verwerp de nulhypothese niet
Vraag 3 : Hier moet je een BI opstellen en deze gaan interpreteren. Hiervoor heb je de kritische waarden nodig
van een tweezijdige hypothesetest : 95% van de waarden liggen tussen -2.005746 en 2.005746
> # vraag 3 : Kritisch waarden voor BI van 95 %
> qt(0.975,53)
[1] 2.005746
Betrouwbaarheidsintervallen zijn anders bij elke steekproef.
Antwoord is D : Alle waarden die in het interval liggen zijn hypothesetesten dat je niet gaat kunnen verwerpen
=> 0.3 ligt in het BI => 0.437 is NIET significant verschillend van 0.3
Fadia Farhat | VUB 2023-2024 4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller fadia. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.74. You're not tied to anything after your purchase.