Het is voor het vak Verdieping in Onderzoeksmethoden en Statistiek (VOS). Ik heb dit vak gevolgd bij de premaster Clinical Child, Family and Education Studies.
Multipele Regressie
Multipele regressie
= er zijn meerdere voorspellers waarmee wij de uitkomstvariabele willen verklaren, de
spreiding. We proberen de uitkomst van Y te voorspellen aan de hand van X’en. We zien
allemaal verschillen op de afhankelijke variabele, hoe komt dat nou? Hoe scoort de ene
hoger dan de andere? Met de onafhankelijke variabelen willen we hierin inzicht geven.
In regressie worden de onafhankelijke variabelen predictoren genoemd.
De variabelen operationaliseren, voorbeeld:
Intelligentie
Leeftijd
Kind
Sekse
Gezondheid
Intelligentie
Opvoeding
Schoolprestaties
Uren werk
Grootte gezin
Gezin/ SES
leefomstandigheden
Woonplaats
Methoden
Opvoeding
Docenten
We zien variatie in de schoolprestaties en dat willen we verklaren aan de hand van andere
kenmerken. Als het kind een hogere intelligentie heeft, verwachten we dat in het zien bij de
schoolprestaties.
Voorbeeld van onderzoeksvraag:
Kunnen we kennis van literatuur bij jongvolwassenen voorspellen met persoon-, gezins- en
schoolkenmerken?
Variabelen:
Afhankelijke variabele Y:
- Kennis van literatuur
Onafhankelijke variabelen X (predictoren):
- Persoonskenmerken
,2
Verdieping in Onderzoeksmethoden en Statistiek
- Gezinskenmerken
- Schoolkenmerken
Doel: voor de populatie beschrijven en toetsen van de relatie tussen Y en X.
Padmodel van multipele regressie
Eén afhankelijke variabele (Y)
Eén of meerdere onafhankelijke variabelen (minimaal interval)
Eén of meer onafhankelijke variabelen (dichotoom)
X1 E Er is één afhankelijke variabele (Y)
en er is meer dan één predictor
… (X).
Y
X2
…
Y is de uitkomstmaat.
X zijn voorspellend voor Y. X worden ook wel de predictoren genoemd.
We willen hier maar één ding wat we willen verklaren (Y), maar we hebben meerdere dingen
waarmee we het willen verklaren (X).
Dichotoom (ja/nee, man/vrouw) of interval niveau.
E zijn de meetfouten. Er kan geen model zijn dat perfect voor iedereen past, daarom zijn er
meetfouten. Wat zegt ons model en wat zegt de geobserveerde data en hoeveel fouten
(errors) zitten daartussen, zijn de E’s. Bij voorspellen is de error niet nodig.
De strepen geven aan uit hoeveel categorieën de variabele bestaat.
Voorbeeld:
- Grootte van het gezin gaat met één omhoog, wat doet het met Y?
Daarom moet het van interval meetniveau zijn. De stapjes ertussen moeten hetzelfde
betekenen.
- Kunnen ook werken met dichotome variabelen, omdat het betekent wel of niet
aanwezig.
Zijn er huisdieren aanwezig? Ja of nee. Een 0 betekent ‘nee’ en 1 betekent ‘ja’.
Algemene onderzoeksvraag voor multipele regressie:
Kunnen we iemands waarde op een kenmerk voorspellen met kennis over andere
kenmerken?
- Wat is de relatie tussen de kenmerken;
- Wat lijkt er in de toekomst te gebeuren (voorspellen).
Doelen van de analyse:
Beschrijven van de lineaire relaties tussen de variabelen (regressiemodel).
Toetsen hypothesen over relaties (significantie).
Kwantificeren van relaties (effectgrootte).
Kwalificeren van de relaties (klein, middelmatig, groot).
,3
Verdieping in Onderzoeksmethoden en Statistiek
Beoordelen van de relevantie van de relaties (subjectief).
Voorspellen van iemand waarde met regressiemodel (puntschatting en intervalschatting).
Hier proberen we relaties, associaties en verbanden te vinden. Over causaliteit kan geen
uitspraak gedaan worden, dit is een experimenteel onderzoek.
Meetniveaus van de variabelen:
Afhankelijke variabele Y:
- Kenmerk gemeten op minimaal interval meetniveau.
NOIR:
Onafhankelijke variabelen X:
Ratio
- Kenmerk gemeten op minimaal interval meetniveau.
Interval
- Categorische kenmerk met twee categorieën: nominaal meetniveau met twee
Ordinaal
categorieën noemen we dichotoom.
Nominaal
- Categorisch kenmerk met meer dan twee categorieën: nominaal of ordinaal
meetniveau wordt omgezet in dummyvariabelen.
Regressiemodellen:
Vergelijking Y:
Voor geobserveerde variabele Y:
Uitkomst (Y) = model (X) + voorspellingsfout
Model = het lineaire regressiemodel.
Voorspellingsfout = residual of error
Voorbeeld:
Geobserveerde variabele is ‘ik weet de schoolprestaties’, ‘ik weet de kennis van literatuur’.
Als ik de geobserveerde variabele weet dan zijn er twee dingen nodig om tot dat getal te
komen: wat zegt mijn model en de voorspellingsfout (E).
Vergelijking Y^:
Voor voorspellen van waarde Y^:
Geschatte uitkomst Y^ = model (X)
Padmodellen van de regressiemodellen:
Geobserveerde: Voorspellen:
, 4
Verdieping in Onderzoeksmethoden en Statistiek
Regressievergelijking:
Hier gaat het om de geobserveerde data:
Y = B0 + B1X1 + … + B6X6 + E
Y zijn de uitkomsten afhankelijke variabelen.
B0 is de intercept/ constante. Als alle X’en op 0 staan, wat is dan de waarde die we kunnen
voorspellen.
B1 is richtingscoëfficiënt. Als ik 1 stapje hoger in X doe, wat voor invloed heeft dat dan op Y.
X zijn de predictoren onafhankelijke variabelen.
E is de voorspellingsfout (error of residual).
Hier gaat het om het voorspellen van de data:
Y^ = B0 + B1X1 + … + B6X6
Voorbeeld van een regressievergelijking:
Y^ = 0.25 + 0.46 * educ
Educ is het aantal jaren educatie.
Histogram; hier kijken we naar om te zien of er sprake van spreiding is. Als iedereen
hetzelfde scoort dan valt er niks te verklaren. Zien we dat er spreiding is, willen we ook zien
of het normaalverdeeld is:
De lijn wordt bellcurve genoemd.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper roosvandenbrinkx. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,09. Je zit daarna nergens aan vast.