10.1: hypothesetoetsing met de b-coe cient
Overzicht voor regressie:
Kern is: Y wordt voorspeld adhv x of meerdere x
en
We veronderstellen dat x een invloed heeft op y.
Causaliteit is anders dan verband tussen variabelen <-.
X kan dus ook categorisch zijn.
Met meerdere onafhankelijke variabelen->
Als er geen lineaire relatie is dan kunnen we eigenlijk geen
regressie analyse uitvoeren, want die gaat altijd uit van een
rechte lijn die je kunt trekken door de data punten. (Links boven
is dus een goed voorbeeld).
Formule is: y dakje= a+bx -> is het geschatte regressie model
(“prediction
equation”).
De geobserveerde waarde/ geschatte
waarde dus niet echte waarde.
1
ffi
, Voor b berekenen= delta y gedeeld door delta x. Hoogste x - laagste x waarde.
Het onderliggende model (Griekse
symbolen:alpha en beta en y= mu. Dus mu
van y= gemiddelde van y in de populatie met
dakje is geschatte versie.)
Voor de populatie dus. Als er een dakje boven
komt betekent dat het geschatte waarde.
2: Hypothesetoetsing met de b-coe cient:
Een van de belangrijkste vragen bij regressie is: is er een invloed van x op y?
Dus we willen gaan testen of er sprake is van een signi cantie van een slope.
Dus van beschrijvende statistiek naar infertiele
statistiek, omdat we het over de gehele
populatie willen trekken. Of er daar dan
sprake is van een signi cantie. Dmv
teststatistic en betrouwbaarheidsintervallen.
Dus met
de beta
symbool:
wat is de
e ect van
x op y in
de gehele
populatie.
Is t waarde want hebben te maken met een
kwantitatieve variabele:
2
ff fi ffi fi
, Als die t-waarde heel groot is dan/ signi cant
is dan verwerpen wie de nulhypothese en accepteren we de ha.df is niet meer n-1 maar komt nu
iets bij: n-p-1. p=is aantal onafhankelijke variabelen in het model/ voorspellers.
In spss is nauwkeuriger dan a ezen in gra ek.
Dus is b (in het voorbeeld 0,5) een bijzondere afwijking of niet.
De SEB is altijd gegeven (hoef je zelf niet te kunnen
uitrekenen), want is complex.
Manier 1 is: dmv t- waarde en df in gra ek opzoeken
Manier 2 is: dmv p-waarde (in spss is altijd van tweezijdige)
als de p-waarde is 0,001 met een alpha van 5% dan is de
kans heel klein met dat de nulhypothese waar is.
Manier 3 is: 95% BBL van de slope
En 0 ligt dus niet in het interval en dus kunnen we
concluderen hier dan de h0 geen plausibele populatie
waarde is.
10.2: residuen en verklarende kracht
1: voorspellingsfouten (prediction errors) en verklaringskracht (predictie power)
Dit gaat dan dus over punt 2 bij overzicht over hoe goed is onze voorspelling?hier focus je op de
geschatte y waarde bij hypothese toets bij beta (b). Dus vooral nu naar de y.
Voorspellingsfouten zijn residuen genoemd.
3
fl fifi fi
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller oumaimaaziz. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.42. You're not tied to anything after your purchase.