Module 13: Het interpreteren van regressieresultaten..................................................................................16
SPSS.................................................................................................................................................................18
Scatterplot maken:..........................................................................................................................................18
1
,Herhaling
Proportie bij hoog hoog is: * * 510
Betrouwbaarheidsinterval van 95% zegt dat we met 95% zekerheid kunnen zeggen dat onze
puntschatter (gemiddelde of proportie) in B.I. valt. Als betrouwbaarheidsniveau omhoog gaat,
gaat wordt het betrouwbaarheidsinterval breder, dus grotere foutmarge.
Significantietest = op basis van informatie van een steekproef beoordelen of hypothese
zinnig is of niet.
Stappenplan hypothesetoetsing:
1. Assumpties: type data, grootte;
2. Hypotheses: H0 en Ha. Gaat om μ want populatiegemiddelde;
3. Test statistic: meet hoever de steekproefwaarde van de H0 afligt. Hoe kleiner p, hoe
beter het bewijs:
√
^p − p0 p 0( 1− p0 )
a. Proporties: z-score = , waarbij se0 =
se 0 n
x−μ0 s
b. Gemiddelden: t-score = , waarbij se =
se √n
4. P-waarde: de kans dat je de test statistic van de gevonden waarde observeert of nog
een extremere waarde (richting H0).
a. Hoe kleiner de p-waarde, des te sterker het bewijs tegen H0. Grens is 5%/0,05
als waarde daarbinnen valt is het bijzonder;
b. Proporties: tabel A (z-score);
c. Gemiddelden: tabel B (t-score)
5. Conclusie: twee mogelijkheden:
a. Proporties: via p-waarde = kleine waarde zoeken en vergelijken met α .
Meestal 5% dus p<0,05 = verwerpen;
i. Tweezijdig: als in de vraag staat wijkt af;
ii. Eenzijdig: als in de vraag staat versterkt of verzwakt.
b. Gemiddelden: t-waarde, grote waarde vinden. Als t-waarde in het kritieke
gebied ligt, dan verwerp je H0. Als de geobserveerde absolute t-waarde groter
is dan de kritieke waarde, dan kan je H0 verwerpen.
i. Tweezijdig: kritieke t-waarde bij bv. α /2=0,025;
ii. Eenzijdig: kritieke t-waarde bij bv. 0,05/5%.
Gestandaardiseerd residu = onderzoekt de sterkte van het verband en welke cellen een
verband tonen.
2
, Module 10 Enkelvoudige lineaire regressie
Regressiemodel = willen we uitspraken doen over een bredere populatie.
Regressie-analyse = voorspellen van de Y waarde op basis van een of meerdere X’en. We
veronderstellen hierbij causaliteit (x heeft invloed op y). Belangrijkste vraag is of er een effect
is van x op y.
- De afhankelijke variabele (y) is kwantitatief;
- De onafhankelijke variabele (x) kan zowel kwantitatief als categorisch zijn.
Verband tussen twee continue variabelen Causaliteit tussen twee variabelen
- Spreidingsdiagram (=scatterplot) - Regressielijn
- Correlatie
Bij enkelvoudige regressie moet je altijd eerst controleren of er een
lineaire relatie is (rechte lijn in de data).
Regressielijn = regressievergelijking, is het geschatte regressie
model. Formule:
^y =a+bx
^y = geschatte waarde.
a = intercept (constante) waarde: van y bij x = 0.
b = slope (richtingscoëfficiënt, helling van de lijn. De toe- of afname van y als x met 1
toeneemt. Geeft dus het effect van x op y aan.
Omdat a en b ook geschat is (o.b.v.) steekproef, moet daar ook een dakje op.
Theoretische regressie model = met Griekse symbolen, omdat we wat willen zeggen over de
gehele populatie. Formule:
μ y =α + βx
α = constante in populatie (met dakje geschatte).
β = effect in de populatie (met dakje geschatte).
μ y = mu y. Dit is het gemiddelde van y bij een bepaalde waarde van x. Is dus niet het
gemiddelde voor een hele populatie, maar uitgesplitst voor verschillende groepen naar
bepaalde waarden van y. De schatting is dus het gemiddelde van een groep binnen populatie
(bv. groep studenten met bepaald aantal studie-uren).
Om te toetsen of een regressie echt een significant
effect heeft (en dus van 0 afwijkt), moeten we
onderzoek doen naar de b in de formule. Dit effect
moet getoetst worden, omdat we nu steeds spreken
over steekproeven maar bestaat dit verband ook in de
populatie? Is het niet toevallig nu een effect?
We willen van de beschrijvende statistiek, naar de
inferentiële statistiek en kijken wat voor effect dit heeft
op de populatie.
3
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller BedrijfskundeHHS. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.88. You're not tied to anything after your purchase.