Alle hoorcollege aantekeningen van ARMS . Hierin staan de volledige powerpoints en heb ik gesproken tekst meegeschreven. Zelf heb ik een 7.8 gehaald voor het tentamen.
ARMS hoorcollege aantekeningen
Opfrissen TOE
Voorwaarden voor correlatie:
1. Lineaire relatie tussen afhankelijke en onafhankelijke variabelen
2. Het moeten beide continue variabelen zijn
Algemene idee regressie:
• De relatie tussen een onafhankelijke en afhankelijke variabele
o Type relatie: regressie
o Sterkte van de relatie: Pearson correlatiecoëfficiënt
• Meetniveau: Y is continue, X kan zowel continue als categorisch zijn
OLS (Ordinary Least Squares) Method
• De gekwadrateerde (squared) afstand tussen de predicted values en de observerd values moet
geminimaliseerd worden
Regressie equation (vergelijking)
Formule: Y = b0 + B1X + e
Wat is wat?
Y De afhankelijke variabele DV
X De onafhankelijke variabele IV
b0 Constant (y-intercept) Het punt op de grafiek waar de lijn de y-
as raakt
b1 Slope / unstandardized regression Wanneer x met één eenheid verandert, is
coefficient de verandering in y gelijk aan b
eenheden (het effect van de
onafhankelijke variabele op de
afhankelijke)
e Error term Verschil tussen de predicted y en de
observed y, wordt ook wel residu
genoemd
Regressie Output SPSS
Tabel 1: Variables Entered/Removed
• Hierin staat de afhankelijke en onafhankelijke variabele
Tabel 2: Model Summary
• R → multiple correlatie coëfficiënt
• R Square
→ kwadraat v.d. correlatie (maat om aan te geven hoe goed de regressielijn bij de puntenwolk
past
→ hoeveel van de variatie van Y wordt verklaard vanuit de relatie met X
→ totale variantie = onverklaard + verklaard
• Std. Error of the Estimate → standaardschattingsfout
74% van de variantie in goal weight (Y) wordt
verklaard door actual weight (X)
26% van de variatie kan worden verklaard door
andere factoren (onverklaard)
,Tabel 3: ANOVA
• Significantie van het model in het algemeen
Tabel 4: Coëfficiënt
• Slope (b1) → tweede vakje onder Unstandardized B
• Intercept (b0) → onder (Constant) & Unstandardized B
• t → T-test
• Sig. → is het effect statistisch significant (p <.001)
• Standardized Coefficients Beta → de hoogste waarde is de beste voorspeller
Dus hier als voorbeeld is de regressie equation: Y = 20.731 + 0.665 x weight
Assumpties lineaire regressie
1. Er is een lineaire relatie tussen de onafhankelijke en afhankelijke variabele
2. Beide variabelen zijn van interval/ratio meetniveau
3. Residuen zijn normaal verdeeld → controleren door het maken van een histogram met
residuen in SPSS → kijken of die ongeveer normaal verdeeld wordt
4. Residuen rondom de regressielijn zijn ongeacht waar we langs de lijn liggen gelijk verdeeld is
(homocedasticity) → spreidingsdiagram X-as (predicited value) en y-as standardized residual :
is deze spreiding van de residuen gelijk?
5. Geen uitschieters (uitschieters zijn groter dan +3 of kleiner dan -3)
Hoorcollege 1: Multiple Lineaire Regressie
Geboortevolgorde effect
Galton (1874) merkte op dat het aantal eerstgeborenen onder wetenschappers opmerkelijk groot was
→ onderzoekers begonnen de relatie tussen geboortevolgorde en IQ te bestuderen en constateerden
een significant positief verband
Impliceert dit een echt effect van geboortevolgorde op IQ of is er iets anders aan de hand?
1. Kritisch kijken naar de manier waarop het onderzoek werd uitgevoerd:
• Was de steekproef representatief en zijn de resultaten generaliseerbaar?
• Zijn de variabelen gemeten op een betrouwbare manier? Meet het instrument wat het
zou moeten meten (validiteit)?
• Zijn de analyses correct uitgevoerd en de resultaten correct geïnterpreteerd?
2. Kritisch kijken naar alternatieve verklaringen voor de statistische associatie:
• Associatie ≠ causatie (het feit dat variabelen aan elkaar gerelateerd zijn betekend niet
dat het een het ander veroorzaakt)
• Blijft het effect bestaan wanneer extra variabelen worden opgenomen?
→ dit is iets wat kan worden getoetst met multipele lineaire regressie
2
, Het toevoegen van variabelen
• Simpele lineaire regressie: betreft 1 outcome (Y) en 1 predictor (X)
o Outcome = afhankelijke variabele (DV) → bijv. IQ
o Predictor = onafhankelijke variabele (IV) → bijv. geboortevolgorde
Is de predictor relevant voor het voorspellen van de uitkomst? Kijk naar:
1. R2 = de hoeveelheid verklaarde variantie (de grootte van de residuen)
Als de lijn de punten goed vertegenwoordigd omdat de punten dicht
tegen de lijn aanzitten, dan wordt veel van de variatie in Y verklaard
door het model
Hogere R2 (veel variatie in Y wordt verklaard door het model)
Als de punten wijder rond de lijn liggen, dan heb je meer residuen
(minder van de variatie in Y wordt verklaard door het model)
Lagere R2 (weinig variatie in Y wordt verklaard door het model)
2. Slope = bij een toename van 1 op X, gaat de voorspelde outcome omhoog met …(de slope van
de lijn)
Grotere B1 B1 dichtbij 0
3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper nienaatje11. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,49. Je zit daarna nergens aan vast.