In deze samenvatting zijn alle hoorcolleges opgenomen (eventueel geüpdatet!) Ook is stapsgewijs uitgelegd hoe je dingen moet uitvoeren in Grasple, waardoor je een makkelijk overzicht hebt waarin je alles snel kunt opzoeken. Ook staat uitgelegd wat er in de tabellen te vinden is. Tot slot zijn nog ...
[Meer zien]
Laatste update van het document: 11 maanden geleden
Stof per week
Week 1: Multipele regressieanalyse
Regressiemodel kan je een bepaalde waarde van iets
voorspellen met kennis van andere waardes?
Multipele regressie
- Eén afhankelijke variabele (Y) minimaal interval
meetniveau
- Meerdere onafhankelijke variabelen (minimaal interval óf dichotoom) (X)
o Dichotoom (nominaal met twee categorieën): twee antwoordopties
ja/nee
o Dummyvariabelen: nominaal/ordinaal meetniveau met meer dan
twee categorieën hierin omzetten.
- E = errors = meetfouten
Enkelvoudige regressie: één onafhankelijke variabele.
Hiërarchische multipele regressie vorig model uitbreiden met nieuwe
variabelen.
Doelen van een analyse:
- Beschrijven van relaties tussen variabelen (in steekproef)
- Toetsen hypothesen over relaties (significanties)
- Kwantificeren van relaties (effectgrootte)
- Kwalificeren van relaties (klein, middelmatig, groot)
- Beoordelen relevante relaties (subjectief)
- Voorspellen van iemands waarde met regressiemodel
Dit geldt ook voor de andere analyses!
Vergelijking Y
Voor geobserveerde variabele Y:
Uitkomst (Y) = model (X) + voorspellingsfout
- Model lineair regressiemodel
- Voorspellingsfout = residual of error
Voor voorspellen van waarde op Y:
Ỷ = model (X)
Regressievergelijking: Yi = B0 + B1X1 + E
Y = afhankelijke variabele
X = onafhankelijke variabele
B0 = intercept (constante (a))
B1 = regressiecoëfficiënt (slope)
E = voorspellingsfout (E)
Residu: het verschil tussen een geobserveerde score Y i en de voorspelde score Ỷi
dus:
Voorwaarden regressievergelijking
- Aselecte steekproef
- Meetniveau Y minimaal interval
,- Lineaire relatie tussen de variabelen (m.b.v. residuen/spreidingsdiagram)
- Per X-waarde is de spreiding in Y-scores gelijk (homoscedasticiteit) (m.b.v.
residuen)
- Per X-waarde zijn de Y-scores normaalverdeeld (m.b.v. residuen)
- Geen (multivariate) uitschieters en/of invloedrijke respondenten (m.b.v.
residuen/spreidingsdiagram)
- Geen hoge correlatie tussen de onafhankelijke variabelen
(multicollineariteit)
Kleinste kwadraten criterium
Best passende rechte lijn de lijn waarbij voorspellingsfout (error) zo klein
mogelijk is. Dit kan door het kleinste kwadraten criterium te nemen.
- Residuen kwadrateren en bij elkaar optellen zo zit je gemiddeld genomen
goed en zo is het model gevoeliger voor uitschieters.
Positieve e (errors) liggen boven de lijn: onderschatting door model.
Negatieve e liggen onder de lijn: overschatting door model.
Goodness-of-fit (R2)
Bepalen van de Goodness-of-fit
vergelijking (ratio) van lineair model
(regressielijn) met basismodel (basislijn).
Basislijn model als we geen kennis
hebben van de X’jes, maar alleen van de
Y’tjes dus gemiddelde van de Y’tjes is
dan het beste wat we hebben.
SST = SSm + SSR = totale kwadratensom
SS (m)
R2 = = proportie door X verklaarde
SS(R)
variantie in Y. Bereik R2 0 ≤ R2 ≤ 1 hoe dichter bij de 1, hoe beter.
SSm = kwadratensom van rechte lijn (model)
SSR = kwadratensom van voorspellingsfout (residual)
Hoe groter de M, hoe beter het model.
Interpretatie R en R2:
- Multipele correlatiecoëfficiënt R Correlatie tussen geobserveerde Y en Ỷ
- Determinatiecoëfficiënt R2 Proportie in Y verklaarde variantie door het
model
Toetsen van R2: Populatie hypothesen. Steekproef steekproefresultaten.
Toets voor R2 Met F-toets beoordeel je statistische significantie (α = .05)
kijken naar de p-waardes (Sig. in SPSS) kleiner dan alfa-waarde
nulhypothese verwerpen.
F-toets = formuleblad
Hypothesen
- Toetsen van de verklaarde variantie door het gehele model:
- Toetsen van een bepaalde voorspeller:
, Overig
Toets voor B’s t-toetsten van effecten van de afzonderlijke X’en (α = .05)
beoordeeld met grootte van beta’s gestandaardiseerde B hoe groter de
beta, hoe betere voorspeller.
Week 2: Meerweg ANOVA
Verschillende analyses
De afhankelijke variabele is altijd van interval of ratio niveau. Voor de
onafhankelijke variabele(n) geldt het volgende:
- t-toets: Deze gebruiken we wanneer we één categorische variabele met twee
categorieën (dichotoom) willen vergelijken op een continue variabele
(interval/ratio). We kijken dan naar het verschil tussen de twee gemiddelden.
- Eenweg ANOVA: Deze gebruiken we wanneer we één categorische variabele
(nominaal/ordinaal) met drie of meer categorieën willen vergelijken op een
continue variabele (interval/ratio). We kijken dan naar de structuur van de
spreiding/variantie.
- Meerweg ANOVA: Deze gebruiken we wanneer we twee of meer
categorische variabelen van nominaal/ordinaal meetniveau met twee of meer
categorieën willen vergelijken op een continue variabele van interval/ratio
meetniveau.
- Multipele regressie: Deze analysevorm gebruiken we als we willen weten of
variabele X (de score op) variabele Y kan voorspellen, in het geval van
enkelvoudige regressie. Bij multipele regressie gaat het dan om minimaal
twee X-en van dichotoom of interval/ratio meetniveau
Let op: Bij variantieanalyse ((meerweg) ANOVA) heet onafhankelijke variabele
een factor, bij multipele regressieanalyse een predictor.
Meerweg ANOVA
Onderzoeksvraag: Verschillen twee of meer groepen op het gemiddelde van een
variabele Y?
Voorwaarden
- De waarnemingen moeten onafhankelijk zijn van elkaar, wat inhoudt dat de
ene conditie de scores op de andere condities niet beïnvloedt. Controleer of er
geen verbanden zijn tussen personen in verschillende groepen. Ga na of er
sprake is van aselecte steekproeftrekking of random toewijzing aan
(experimentele) groepen.
- De afhankelijke variabele Y is van interval of ratio meetniveau.
- De afhankelijke variabele Y is normaalverdeeld (of residuen e zijn
normaalverdeeld) in alle populaties histogram van de afhankelijke
variabele voor iedere groep.
- De spreiding in scores (of residuen) op de afhankelijke variabele is gelijk in
de onderscheiden populaties controle met Levene’s test en visueel met
boxplots.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper doriendeboer. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.