Het voorspellen van dagelijkse calorie inname vanuit inkomen
Bijvoorbeeld = hoe hoger het inkomen, hoe hoger de dagelijkse calorie inname (positieve relatie).
Landen zijn de individuele punten.
Simpele regressie, want gebruik makend van een voorspelling van de een voor de ander.
Wat is regressie?
Een manier om de waarde van de ene variabele voor de andere variabele te voorspellen
• Het is een hypothetisch model van de relatie tussen twee variabelen
• Het gebruikte model is lineair
• Om die reden beschrijven we de relatie gebruikmakend van een vergelijking met een rechte
lijn.
Het beschrijven van een rechte lijn
Kijken wat er gebeurd met Y (stijgen of dalen), wanneer we iets doen met X.
, 2
Als het inkomen met 1 dollar stijgt, stijgt de dagelijkse calorie inname met 0.059 (cal)
Standardized coëfficiënt Bèta = een onafhankelijke variabele
b-coëfficiënten
• Veranderen in uitkomst die geassocieerd is met de unit-verandering in de voorspeller
• Grootte is sterk afhankelijk van de schaal van de voorspeller
Bèta-coëfficiënten
• Vertellen ons hetzelfde, maar expressen zich als standaard deviaties
• Maakt de waarden ‘schaal-onafhankelijk’
• Om die reden kunnen de waarden vergeleken worden tussen studies of tussen voorspellers
in een multiple regressie
, 3
Omdat de intercept 0 is, verschijnt er niets bij de constante gestandaardiseerde coëfficiënt in SPSS.
Hoe goed is het model?
• De regressielijn is alleen een model gebaseerd op data
• Het model reflecteert misschien niet de werkelijkheid
- We hebben een manier nodig om te testen hoe goed het model past bij de
geobserveerde data
- Hoe?
Met een ANOVA
Als het model resulteert in een betere voorspeller dan het gebruiken van het gemiddelde, dan
verwachten we dat SSm veel groter is dan SSr.
Wat we kunnen verklaren en wat we niet kunnen verklaren.
Hierbij is SSm = 0, 0% is verklaard. Er is geen overlap tussen de
twee cirkels. De x-en verschillen veel.
Hierbij is SSe = 0, 100% is verklaard. Er is een totale overlap
tussen de twee cirkels. De x-en verschillen niet → zelfde lijn.
Modellen vergelijken → R^2 en ANOVA
Hier is SSm de Sum of Squares en dat deel je door het totaal → geeft een proportie tussen 0 en 1, als
het perfect is, is het 1, als er geen variantie is dan is het 0. → R^2.
Dus in dit geval is 13317638 = 57.7% (0.577) van 23078087, dus R^2 is 13317638/23078087 = .577
Dus 57.7% van de variantie in calorie inname kan verklaard worden door inkomen.
Maar om het model te testen, moet de vergelijking wel ‘eerlijk’ zijn.
Testing te Model: ANOVA
Mean Squared Error
• Sum of squares zijn de totale waarden
• Ze kunnen zich uiten in gemiddelden (MS = SS/df)
• Ze worden Mean Squares genoemd, MS.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller SFB98. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.61. You're not tied to anything after your purchase.