100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Lecture 2 $5.35   Add to cart

Summary

Samenvatting Lecture 2

 11 views  0 purchase
  • Course
  • Institution

College van statistiek en methoden, helemaal compleet inclusief plaatjes.

Preview 2 out of 8  pages

  • June 4, 2020
  • 8
  • 2019/2020
  • Summary
avatar-seller
Lecture 2: linear regression
What is the purpose of linear regression?
- De samenhang beschrijven tussen twee variabelen (leeftijd en bovendruk).
- Voorspellen (wat de leeftijd is van iemand met een bepaalde bovendruk).

How does linear regression work?
- How to find? De best passende lijn is de lijn die zo dichtmogelijk bij de punten in de punten
wolk ligt. Formeel; ‘each pair of observations (Xi, Y,i), i = 1,2, n can be displayed in a
scatterplot’
- Een regressie lijn is vastgelegd door..
 B0 (intercept) de plek waar de lijn de y-as snijdt.
 B1 (richtingscoëfficiënt/slope)
- Voorspelfout (Ɛ): als je een voorspelling doet doe je dit volgens de regressielijn, deze kan
verschillen met wat je daadwerkelijk observeert. Het verschil tussen de voorspelling en de
observatie heet de voorspel fout (Ɛ).
 Aanname dat de voorspelfout normaal verdeelt is.
 Gemiddelde van 0.
 Bepaalde variantie.


- Voorspelfouten kan je minimaliseren. Voorspelfouten nadat ze gekwadrateerd zijn moeten
zo klein mogelijk zijn. SPSS doet dit voor ons.




- Als je het hebt over een populatie dan gebruik je Griekse symbolen. Heb je het over een
steekproef gebruik je Romeinse letters. Hebbend over een schatting in een steekproef geld
deze formule:


- De richtingscoëfficiënt heeft te maken met de correlatie tussen x en y. Niet PRECIES
hetzelfde. Ook de standaarddeviatie van x en y spelen een rol. Als de correlatie positief is,
dan zijn standaarddeviatie (S) van x en y ook positief en zal ook de richtingscoëfficiënt
positief zijn. Een negatieve correlatie is een negatieve B1, geen correlatie geeft aan B1 = 0.




- Het intercept kan je ook berekenen. Je hebt het gemiddelde van y nodig en het gemiddelde
van x, ook b1 heb je nodig. SPSS doet dit ook voor ons.
- Je krijgt een schatting van de steekproef, hiermee kan je dan voorspellen. Ook hier kan je
voorspelfouten maken. Hiervoor gebruik je het teken e.


- Als je alle y waarden zou middelen en alle x waarden zou middelen dan kom je precies uit op
de regressie lijn.

, How adequate is the regression line?
De mate waarin verschillen van punten in de wolk te verklaren zijn met y. Hoe slechter je kan
voorspellen wat y is hoe slechter de kwaliteit. Dit wordt uitgedrukt in R2. Hoe hoger R2 hoe beter de
kwaliteit.

How to test for an effect in linear regression?
TOETSEN MET KRITIEK GEBIED /AREA OF ACCEPTANCE
Hoe kan je toetsen met regressie analyse? Het meest interessant om te toetsen is kijken of B1 gelijk
is aan 0, je weet dan dat er geen correlatie is tussen x en y. De nulhypothese zegt er is geen
samenhang tussen x en y (B1 = 0). Moet je de nulhypothese handhaven of verwerpen? Je gebruikt
dan de toetsingsgrootheid de T-toets voor regressie analyse.
- Als b1 verligt van B1 (wat in dit geval 0 is omdat dit de nulhypothese is), dan wordt de T
waarde groter, hierdoor wordt de kans groter dat je de nulhypothese verwerpt.
- De standaard error geeft aan hoeveel toeval fluctuaties er plaatsvinden tussen samples. De
SE geeft aan hoe stabiel de schatting is van b1. Hoe kleiner de SE (hoe stabieler), hoe groter
de T waarde wordt, hoe groter de kans dat nulhypothese verworpen wordt.




Een T toets heet zo omdat er uit gegaan kan worden van een T verdeling. Als de nulhypothese waar
zou zijn, dan zou de T-waarde 0 de grootste kans hebben. Bij een bepaalde T waarde, is deze dan
extreem genoeg om H0 te verwerpen? Je doet dit door te zoeken naar kritieke waarden, aan beide
staarten van de verdelingen moet je 0.025 grens zoeken. Bij elkaar opgeteld is er dus 5% kans om
waarde te vinden voor T die in de staarten liggen. Je kan dan zeggen, het is zo’n kleine kans, en ga je
H0 verwerpen. 5% geeft aan hoe groot de type 1 fout is, de kans dat je H0 verwerpt terwijl hij waar
is. Echter, de alfa waarde kan ook niet te laag zijn want dan wordt de area of acceptance te groot
waardoor je H0 nooit kan verwerpen.
 Dus: ligt T-waarde boven of onder kritieke T-waarde.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller liekejanssen11. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $5.35. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

67474 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$5.35
  • (0)
  Add to cart