Lecture 2: linear regression
What is the purpose of linear regression?
- De samenhang beschrijven tussen twee variabelen (leeftijd en bovendruk).
- Voorspellen (wat de leeftijd is van iemand met een bepaalde bovendruk).
How does linear regression work?
- How to find? De best passende lijn is de lijn die zo dichtmogelijk bij de punten in de punten
wolk ligt. Formeel; ‘each pair of observations (Xi, Y,i), i = 1,2, n can be displayed in a
scatterplot’
- Een regressie lijn is vastgelegd door..
B0 (intercept) de plek waar de lijn de y-as snijdt.
B1 (richtingscoëfficiënt/slope)
- Voorspelfout (Ɛ): als je een voorspelling doet doe je dit volgens de regressielijn, deze kan
verschillen met wat je daadwerkelijk observeert. Het verschil tussen de voorspelling en de
observatie heet de voorspel fout (Ɛ).
Aanname dat de voorspelfout normaal verdeelt is.
Gemiddelde van 0.
Bepaalde variantie.
- Voorspelfouten kan je minimaliseren. Voorspelfouten nadat ze gekwadrateerd zijn moeten
zo klein mogelijk zijn. SPSS doet dit voor ons.
- Als je het hebt over een populatie dan gebruik je Griekse symbolen. Heb je het over een
steekproef gebruik je Romeinse letters. Hebbend over een schatting in een steekproef geld
deze formule:
- De richtingscoëfficiënt heeft te maken met de correlatie tussen x en y. Niet PRECIES
hetzelfde. Ook de standaarddeviatie van x en y spelen een rol. Als de correlatie positief is,
dan zijn standaarddeviatie (S) van x en y ook positief en zal ook de richtingscoëfficiënt
positief zijn. Een negatieve correlatie is een negatieve B1, geen correlatie geeft aan B1 = 0.
- Het intercept kan je ook berekenen. Je hebt het gemiddelde van y nodig en het gemiddelde
van x, ook b1 heb je nodig. SPSS doet dit ook voor ons.
- Je krijgt een schatting van de steekproef, hiermee kan je dan voorspellen. Ook hier kan je
voorspelfouten maken. Hiervoor gebruik je het teken e.
- Als je alle y waarden zou middelen en alle x waarden zou middelen dan kom je precies uit op
de regressie lijn.
, How adequate is the regression line?
De mate waarin verschillen van punten in de wolk te verklaren zijn met y. Hoe slechter je kan
voorspellen wat y is hoe slechter de kwaliteit. Dit wordt uitgedrukt in R2. Hoe hoger R2 hoe beter de
kwaliteit.
How to test for an effect in linear regression?
TOETSEN MET KRITIEK GEBIED /AREA OF ACCEPTANCE
Hoe kan je toetsen met regressie analyse? Het meest interessant om te toetsen is kijken of B1 gelijk
is aan 0, je weet dan dat er geen correlatie is tussen x en y. De nulhypothese zegt er is geen
samenhang tussen x en y (B1 = 0). Moet je de nulhypothese handhaven of verwerpen? Je gebruikt
dan de toetsingsgrootheid de T-toets voor regressie analyse.
- Als b1 verligt van B1 (wat in dit geval 0 is omdat dit de nulhypothese is), dan wordt de T
waarde groter, hierdoor wordt de kans groter dat je de nulhypothese verwerpt.
- De standaard error geeft aan hoeveel toeval fluctuaties er plaatsvinden tussen samples. De
SE geeft aan hoe stabiel de schatting is van b1. Hoe kleiner de SE (hoe stabieler), hoe groter
de T waarde wordt, hoe groter de kans dat nulhypothese verworpen wordt.
Een T toets heet zo omdat er uit gegaan kan worden van een T verdeling. Als de nulhypothese waar
zou zijn, dan zou de T-waarde 0 de grootste kans hebben. Bij een bepaalde T waarde, is deze dan
extreem genoeg om H0 te verwerpen? Je doet dit door te zoeken naar kritieke waarden, aan beide
staarten van de verdelingen moet je 0.025 grens zoeken. Bij elkaar opgeteld is er dus 5% kans om
waarde te vinden voor T die in de staarten liggen. Je kan dan zeggen, het is zo’n kleine kans, en ga je
H0 verwerpen. 5% geeft aan hoe groot de type 1 fout is, de kans dat je H0 verwerpt terwijl hij waar
is. Echter, de alfa waarde kan ook niet te laag zijn want dan wordt de area of acceptance te groot
waardoor je H0 nooit kan verwerpen.
Dus: ligt T-waarde boven of onder kritieke T-waarde.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper liekejanssen11. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,99. Je zit daarna nergens aan vast.