Multipele regressie is een regressiemodel
waarin er meerdere variabelen worden
betrokken. Er worden dan dus meerdere
variabelen onderzocht welke allemaal in een
model worden samengevoegd en dat is de
multipele regressie. Je neemt meerdere
predictoren mee in je onderzoek. Deze
predictoren/variabelen moet je van tevoren
operationaliseren. Pas daarna kun je
multipele regressie uitvoeren. Voorbeeld:
Padmodel voor mul-pele regressie:
- Een a6ankelijke variabele (Y)
- Een of meerdere ona6ankelijke variabelen (minimaal interval)
- Een of meerdere ona6ankelijke variabelen (dichotoom)
Y is de uitkomstmaat, dus bijvoorbeeld de
schoolpresta-es van het kind. De verklarende
factoren, zoals intelligen-e, uren werk, grooFe
gezin, SES, trekken we pijltjes toe naar die Y: dus
de X-en zijn voorspellend voor de Y. Er zijn
meerdere X-en dus meerdere dingen om Y te
kunnen verklaren. De X-en moeten minimaal van
interval meetniveau of dichotoom zijn. De E staat
voor de meeIouten. We proberen Y te
voorspellen aan de hand van alle X-en, maar dat
zal niet exact goed zijn. Een model past niet
perfect bij ieder individu. Daardoor krijgen we
meeIouten (Errors).
Voorbeeld onderzoek:
- Onderzoeksvraag: Kunnen we kennis van literatuur bij jongvolwassenen voorspellen
met persoons-, gezins- en schoolkenmerken?
- Popula-e: jongvolwassenen
- Variabelen:
o A6ankelijke variabele Y: kennis van literatuur
o Ona6ankelijke variabelen X (predictoren): persoonlijke kenmerken:
kenmerken ouderlijk huis, kenmerken school
- Doel: voor de popula-e beschrijven en toetsen van de rela-es tussen a6ankelijke
variabele Y en de predictoren X
Mul-pele regressie algemeen:
- Onderzoeksvraag: Kunnen we iemands waarde op een kenmerk voorspellen met
kennis over andere kenmerken?
- Doelen van de analyse:
1
, o Beschrijven lineaire rela-es tussen variabelen (regressiemodel)
o Toetsen hypothesen over rela-es (significan-e)
o Kwan-ficeren van rela-es (effectgrooFe)
o Kwalificeren van rela-es (klein, middelma-g, groot)
o Beoordelen relevan-e rela-es (subjec-ef)
o Voorspellen van iemands waarde met regressiemodel (puntschaXng en
interval schaXng)
- Waarschuwing: doe op basis van sta-sche samenhang geen uitspraken over
causaliteit. Je kunt niet zeggen A veroorzaakt B. Dat kan alleen in een experimentele
seXng. Nu onderzoek je alleen verbanden, maar voor causaliteit zijn experimenten
nodig.
Variabelen in voorbeeld:
- Read: kennis literatuur respondent (Y)
- Fath_rd: kennis literatuur vader (X1)
- Moth_rd: kennis literatuur moeder (X2)
- Par_book: aantal boeken in ouderlijk huis (X3)
- Sch_rd: aandacht voor literatuur school (X4)
- Hist_rd: lezen verleden (X5)
- Educ: opleidingsniveau (X6)
Meetniveau variabelen:
- Ra-o
- Interval
- Ordinaal
- Nominaal
Je kunt alleen ra-o of interval gebruiken, of dichotoom.
o A6ankelijke variabele Y moet minimaal interval meetniveau zijn
o Meetniveau ona6ankelijke variabelen X moeten ook minimaal interval
meetniveau zijn.
§ OF het moet een categorische kenmerk zijn met twee categorieën:
nominaal meetniveau met twee categorieën noemen we dichotoom.
§ OF categorisch kenmerk met meer dan twee categorieën:
nominaal/ordinaal meetniveau wordt omgezet in dummyvariabelen.
Regressiemodel (1):
De voorspellingsfout is de E (dus de meeIout).
DUS:
2
,Dus als je alleen gaat voorspellen heb je geen meeIouten en dus ook niet E. Zie onderstaand
voorbeeld:
Regressiemodel (2)
- Y zijn de uitkomsten (dus de kennis van de literatuur van jongvolwassenen). Dit is de
a6ankelijke variabele (dependent).
- X zijn de ona6ankelijke variabelen (predictors)
3
, - B0 (ookwel a) is de intercept of constante (dit is als alle X-en op 0 staan, wat is dan de
waarde die we zouden voorspellen?)
- B1X1 is hoe groot is de waarde van de eerste voorspellende waarde (dus in dit geval
de kennis van de literatuur van de vader). De B1 betekent dan: als ik 1 stapje hoger zit
in de kennis van de literatuur van de vader, wat voor invloed heei dat dan op de
verwachte kennis van de literatuur van de jongvolwassene (op de Y)?
o B1 is dan de regressiecoëfficiënt (slope)
- Ditzelfde gebeurt voor B2X2, B6X6 of voor hoeveel voorspellers we dan ook mogen
hebben.
- E is de voorspellingsfout (error of residual)
(Bij een voorspelling is E er dus niet en is Y een Y met een dakje.)
Histogram moet de normaalcurve volgen, anders voldoet het niet aan de normale verdeling,
Bij de spreidingsdiagram moet er een lijn zijn.
- B0 (intercept of constante) is het snijpunt met de Y-as
- B1 (regressiecoëfficiënt) is als we een stapje naar rechts gaan op de X-as, wat gebeurt
er dan met de Y?
Voorspelde waarde van Y:
Regressiecoëfficiënten:
Kleinste kwadraten criterium
We gaan een lijn tekenen. We gaan de best passende rechte lijn: dit is de lijn waarbij de
voorspellingsfout (error) zo klein mogelijk is. Dit kunnen we doen door het kleinste
kwadraten criterium te nemen.
Voor elke respondent j:
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Xannemuller. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,62. Je zit daarna nergens aan vast.