Oefenles 1 : Numerieke en statistische eigenschappen, hypothesetesten en
meeteenheden.
Numerieke en statistische eigenschappen, hypothesetesten
Cross-sectie : verschillende individuen op één bepaald tijd.
We hebben 2 variabelen (FOODEXP ,TOTALEXP). TOTALEXP gaan we gebruiken als proxy voor Beschikbaar
Inkomen (inkomensniveau).
Alle data’s zijn uitgedrukt in munteenheid (Roupie)
Fadia Farhat | VUB 2023-2024 1
,> # Vraag 1 : Wat is de het gemiddelde van de geschatte storingstermen
> mean(India_regression$residuals)
[1] -4.247612e-15
Quasi nul
µ =0
µ = 0 , omdat dit een numerieke eigenschap is van OLS. Wanneer we OLS uitvoeren, gaan we ∑ µ gaan
minimaliseren. Dit doen we door onze parameters zodanig te kiezen dat we het minimalisatieprobleem oplossen.
Dit leidt tot het verkrijgen van m eerste orde voorwaarden (met m= aantal variabelen)
Eén van die eerste orde voorwaarde is dat ∑ µ = 0. Dat is een numerieke eigenschap die altijd opgaat als je OLS
uitvoert. Het leert ons NIETS over de Statistische eigenschappen (zuiverheid, efficiëntie en consistentie) van onze
schatter en zegt ons NIETS over de kwaliteit van de regressie
Zuiverheid : Stochastische schatter is gemiddeld genomen correct; Eigenschap over herhaaldelijke
steekproeven
Efficiëntie : binnen de klasse van de zuivere schatters, is de schatter diegene met de kleinste variantie
over alternatieve steekproeven ; Eigenschap binnen de klasse van de zuivere schatters
Consistentie : als steekproefgrootte naar populatie tendeert, zal de schatter naar de werkelijke
parameter tenderen; Asymptotische eigenschap
De asymptotische eigenschap van een schatter verwijst naar het gedrag van die schatter als de steekproefgrootte naar oneindig gaat. Als we zeggen dat een
schatter asymptotisch onvertekend of asymptotisch normaal is, betekent dit dat, onder bepaalde voorwaarden, de schatter steeds nauwkeuriger wordt
naarmate de steekproefgrootte groter wordt en dat de verdeling van de schatter naar een normale verdeling convergeert. Deze asymptotische eigenschappen
worden vaak aangeduid met termen zoals "consistentie" en "asymptotisch normale verdeling."
Consistentie : Een schatter wordt als consistent beschouwd als deze naar de ware parameterwaarde convergeert naarmate de steekproefgrootte
naar oneindig gaat.
Asymptotische normaalheid : Een schatter is asymptotisch normaal als de verdeling van de schatter, genormaliseerd door de standaardfout, naar
een standaard normale verdeling convergeert naarmate de steekproefgrootte naar oneindig gaat. Dit resultaat volgt uit de centrale limietstelling.
Statistische eigenschappen gaan op, als de GM veronderstellingen opgaan. Eén van deze veronderstellingen is
dat de werkelijke storingstermen gemiddeld gezien nul zijn. Het is niet omdat het gemiddelde van de geschatte
storingstermen nul is, dat de werkelijke storingstermen gemiddeld nul zijn.
Deze zijn nul wanneer je geen specificatie fout maakt, dus als je
alle relevante varianten die een systematische impact hebben op uw AV opneemt in uw model en
wanneer je model de correcte functionele vorm heeft
Dan pas zal het gemiddelde van uw werkelijke storingstermen = o en zal je een zuivere, efficiënte en consistente
schatter hebben.
Fadia Farhat | VUB 2023-2024 2
, Vraag 1 : coëfficiënt is 0.43686
Regressiemodel is : 𝑌 = 𝛽 + 𝛽 𝑋 + µ
𝛽 =
𝑉𝑒𝑟𝑎𝑛𝑑𝑒𝑟𝑖𝑛𝑔 𝑖𝑛 𝑒𝑒𝑛ℎ𝑒𝑑𝑒𝑛
En een regressie is gemiddeld genomen correct
Dit betekent dat wanneer TOTALEXP toeneemt met 1
eenheid, hier 1 Roepie , dan zal gemiddeld genomen
FOODEXP toenemen met 0.43686 ( 𝜷𝟐 eenheden)
Roepie
Of nog : Als de totale uitgaven met 1 roepie toenemen, dan zullen de uitgaven voor voedsel gemiddeld genomen
met ongeveer 44 paise toenemen (1 roepie = 100 paise)
Het is een absolute wijziging in Y tgv een absolute wijziging in X
Vraag 2 : a-priori verwachtingen => Hypothesetest
uitvoeren.
1- Wat je theoretisch verwacht, dus positieve impact
=> stop je in je 𝐻 .
2- Dan bereken je je t-statistiek. Oplossing staat in R
output. Dit is die 5.576
3- Vul de waarde onder 𝐻 in de vergelijking van de
parameter van uw t-verdeling in . Je weet dat deze
parameter t-verdeeld is als de nulhypothese geldt en dat
95% van de waarden tussen uw kritische waarden liggen
als het tweezijdig is. Hier is het éénzijdig, dus moet ik het
teken van mijn kritische waarde gaan bepalen.
Daarvoor kijk je steeds naar 𝐻 . Hierin wil ik nagaan of
𝛽 > 0, dus zal je kritische waarden aan de rechterkant van uw grafiek komen te staan; dus positief teken.
Je gaat dus je kritische waarde op significantie niveau 5 % aan de rechterkant van de grafiek gaan bepalen.
Je hebt dus 95% interval aan de linkerkant en 5% aan de rechterkant van de grafiek.
Om de kritische waarde te bepalen heb jet aantal vrijheidsgraden nodig. Je schat twee parameters, dus df
= n-2.
In R: 095 want je hebt aan je linkerkant 95% van je waarden; dus 95% van de waarden is <0
> # Vraag 2 : Berekenen van t-statistiek
> qt(0.95,53)
[1] 1.674116
Teken is positief => +1.674116
4- Mijn t-statistiek = 5.576 ligt voorbij 1.674116, ligt in mijn zone van de 5%, dus kan ik mijn nulhypothese
verwerpen.
5- Bereken je P-waarde. In R staat die reeds in je regressieoutput. Die waarde is nagenoeg nul.
OPGELET: Deze P-waarde is voor een tweezijdige test. Hoe omvormen?
a. P/2 wanneer uw teststatistiek en uw kritische waarden in hetzelfde kwadrant liggen van de
grafiek; wat hier het geval is
b. 1- P/2 wanneer ze in verschillend kwadrant liggen
Fadia Farhat | VUB 2023-2024 3
, P/2 : Mijn P-waarde is nul, wat betekent dat indien ik de nulhypothese
verwerp ik nul kans maak op een fout => Ik verwerp de nulhypothese
1- P/2 : Mijn P-waarde is één, wat betekent dat indien ik de nulhypothese
verwerp ik 100 % kans maak op een fout => Ik verwerp de nulhypothese niet
Vraag 3 : Hier moet je een BI opstellen en deze gaan interpreteren. Hiervoor heb je de kritische waarden nodig
van een tweezijdige hypothesetest : 95% van de waarden liggen tussen -2.005746 en 2.005746
> # vraag 3 : Kritisch waarden voor BI van 95 %
> qt(0.975,53)
[1] 2.005746
Betrouwbaarheidsintervallen zijn anders bij elke steekproef.
Antwoord is D : Alle waarden die in het interval liggen zijn hypothesetesten dat je niet gaat kunnen verwerpen
=> 0.3 ligt in het BI => 0.437 is NIET significant verschillend van 0.3
Fadia Farhat | VUB 2023-2024 4
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur fadia. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €7,16. Vous n'êtes lié à rien après votre achat.