In deze samenvatting zijn alle hoorcolleges opgenomen (eventueel geüpdatet!) Ook is stapsgewijs uitgelegd hoe je dingen moet uitvoeren in Grasple, waardoor je een makkelijk overzicht hebt waarin je alles snel kunt opzoeken. Ook staat uitgelegd wat er in de tabellen te vinden is. Tot slot zijn nog ...
Stof per week
Week 1: Multipele regressieanalyse
Regressiemodel kan je een bepaalde waarde van iets
voorspellen met kennis van andere waardes?
Multipele regressie
- Eén afhankelijke variabele (Y) minimaal interval
meetniveau
- Meerdere onafhankelijke variabelen (minimaal interval óf dichotoom) (X)
o Dichotoom (nominaal met twee categorieën): twee antwoordopties
ja/nee
o Dummyvariabelen: nominaal/ordinaal meetniveau met meer dan
twee categorieën hierin omzetten.
- E = errors = meetfouten
Enkelvoudige regressie: één onafhankelijke variabele.
Hiërarchische multipele regressie vorig model uitbreiden met nieuwe
variabelen.
Doelen van een analyse:
- Beschrijven van relaties tussen variabelen (in steekproef)
- Toetsen hypothesen over relaties (significanties)
- Kwantificeren van relaties (effectgrootte)
- Kwalificeren van relaties (klein, middelmatig, groot)
- Beoordelen relevante relaties (subjectief)
- Voorspellen van iemands waarde met regressiemodel
Dit geldt ook voor de andere analyses!
Vergelijking Y
Voor geobserveerde variabele Y:
Uitkomst (Y) = model (X) + voorspellingsfout
- Model lineair regressiemodel
- Voorspellingsfout = residual of error
Voor voorspellen van waarde op Y:
Ỷ = model (X)
Regressievergelijking: Yi = B0 + B1X1 + E
Y = afhankelijke variabele
X = onafhankelijke variabele
B0 = intercept (constante (a))
B1 = regressiecoëfficiënt (slope)
E = voorspellingsfout (E)
Residu: het verschil tussen een geobserveerde score Y i en de voorspelde score Ỷi
dus:
Voorwaarden regressievergelijking
- Aselecte steekproef
- Meetniveau Y minimaal interval
,- Lineaire relatie tussen de variabelen (m.b.v. residuen/spreidingsdiagram)
- Per X-waarde is de spreiding in Y-scores gelijk (homoscedasticiteit) (m.b.v.
residuen)
- Per X-waarde zijn de Y-scores normaalverdeeld (m.b.v. residuen)
- Geen (multivariate) uitschieters en/of invloedrijke respondenten (m.b.v.
residuen/spreidingsdiagram)
- Geen hoge correlatie tussen de onafhankelijke variabelen
(multicollineariteit)
Kleinste kwadraten criterium
Best passende rechte lijn de lijn waarbij voorspellingsfout (error) zo klein
mogelijk is. Dit kan door het kleinste kwadraten criterium te nemen.
- Residuen kwadrateren en bij elkaar optellen zo zit je gemiddeld genomen
goed en zo is het model gevoeliger voor uitschieters.
Positieve e (errors) liggen boven de lijn: onderschatting door model.
Negatieve e liggen onder de lijn: overschatting door model.
Goodness-of-fit (R2)
Bepalen van de Goodness-of-fit
vergelijking (ratio) van lineair model
(regressielijn) met basismodel (basislijn).
Basislijn model als we geen kennis
hebben van de X’jes, maar alleen van de
Y’tjes dus gemiddelde van de Y’tjes is
dan het beste wat we hebben.
SST = SSm + SSR = totale kwadratensom
SS (m)
R2 = = proportie door X verklaarde
SS(R)
variantie in Y. Bereik R2 0 ≤ R2 ≤ 1 hoe dichter bij de 1, hoe beter.
SSm = kwadratensom van rechte lijn (model)
SSR = kwadratensom van voorspellingsfout (residual)
Hoe groter de M, hoe beter het model.
Interpretatie R en R2:
- Multipele correlatiecoëfficiënt R Correlatie tussen geobserveerde Y en Ỷ
- Determinatiecoëfficiënt R2 Proportie in Y verklaarde variantie door het
model
Toetsen van R2: Populatie hypothesen. Steekproef steekproefresultaten.
Toets voor R2 Met F-toets beoordeel je statistische significantie (α = .05)
kijken naar de p-waardes (Sig. in SPSS) kleiner dan alfa-waarde
nulhypothese verwerpen.
F-toets = formuleblad
Hypothesen
- Toetsen van de verklaarde variantie door het gehele model:
- Toetsen van een bepaalde voorspeller:
, Overig
Toets voor B’s t-toetsten van effecten van de afzonderlijke X’en (α = .05)
beoordeeld met grootte van beta’s gestandaardiseerde B hoe groter de
beta, hoe betere voorspeller.
Week 2: Meerweg ANOVA
Verschillende analyses
De afhankelijke variabele is altijd van interval of ratio niveau. Voor de
onafhankelijke variabele(n) geldt het volgende:
- t-toets: Deze gebruiken we wanneer we één categorische variabele met twee
categorieën (dichotoom) willen vergelijken op een continue variabele
(interval/ratio). We kijken dan naar het verschil tussen de twee gemiddelden.
- Eenweg ANOVA: Deze gebruiken we wanneer we één categorische variabele
(nominaal/ordinaal) met drie of meer categorieën willen vergelijken op een
continue variabele (interval/ratio). We kijken dan naar de structuur van de
spreiding/variantie.
- Meerweg ANOVA: Deze gebruiken we wanneer we twee of meer
categorische variabelen van nominaal/ordinaal meetniveau met twee of meer
categorieën willen vergelijken op een continue variabele van interval/ratio
meetniveau.
- Multipele regressie: Deze analysevorm gebruiken we als we willen weten of
variabele X (de score op) variabele Y kan voorspellen, in het geval van
enkelvoudige regressie. Bij multipele regressie gaat het dan om minimaal
twee X-en van dichotoom of interval/ratio meetniveau
Let op: Bij variantieanalyse ((meerweg) ANOVA) heet onafhankelijke variabele
een factor, bij multipele regressieanalyse een predictor.
Meerweg ANOVA
Onderzoeksvraag: Verschillen twee of meer groepen op het gemiddelde van een
variabele Y?
Voorwaarden
- De waarnemingen moeten onafhankelijk zijn van elkaar, wat inhoudt dat de
ene conditie de scores op de andere condities niet beïnvloedt. Controleer of er
geen verbanden zijn tussen personen in verschillende groepen. Ga na of er
sprake is van aselecte steekproeftrekking of random toewijzing aan
(experimentele) groepen.
- De afhankelijke variabele Y is van interval of ratio meetniveau.
- De afhankelijke variabele Y is normaalverdeeld (of residuen e zijn
normaalverdeeld) in alle populaties histogram van de afhankelijke
variabele voor iedere groep.
- De spreiding in scores (of residuen) op de afhankelijke variabele is gelijk in
de onderscheiden populaties controle met Levene’s test en visueel met
boxplots.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller doriendeboer. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.60. You're not tied to anything after your purchase.