Hoorcolleges Kwantitatief
COLLEGE 1 MULTIPELE REGRESSIE
We willen vandaag score op de ene variabele verklaren aan de hand van een andere variabele.
Deze factoren kunnen allemaal invloed hebben op de schoolprestaties. Het doel is om de schoolprestaties dan te verklaren
adhv de factoren.
Padmodel multipele regressie
Verschillende X-en verklaren de Y. E is het stukje wat onverklaard is. We proberen Y zoveel mogelijk te verklaren maar E is
het stukje wat dan nog niet verklaard is. We willen zo’n groot mogelijk stuk van E af, zodat E zo klein mogelijk is en zodat we
zoveel mogelijk voorspeld hebben.
• Eén afhankelijk variabele (Y)
• Eén of meerdere onafhankelijke variabelen (minimaal interval)
• Eén of meerdere onafhankelijke variabelen (dichotoom)
Let op: Kijk tijdens deze cursus dat we bezig zijn met het verklaren van Y scores! Hoe verklaren we dat niet iedereen precies
hetzelfde cijfer heeft gehaald voor een cursus, hoe verklaren we dat niet iedereen even depressief is.
Mededelingen
• Cursushandleiding
• Weekoverzicht
• Weekopdrachten via Grasple en toelichting in IC
• Voorbereidende opdrachten (voor werkgroepen)
• SPSS-practica via Grasple (vragen via Discussionboard)
• Persoonlijke vragen: Contactformulier
• Algemene en inhoudelijke vragen: Discussionboard
Aan het eind van de cursus een SPSS vaardigheden toets!
, • Toetsen B ’s (en β’s)
• Vergelijking van modellen (ΔR2)
Laatste twee vallen er een beetje buiten, maar:
• Categorische kenmerken in regressiemodel; dummy's
• Assumpties toepassing regressieanalyse
Voorbeeld
Onderzoeksvraag: Kunnen we kennis van literatuur bij jongvolwassenen voorspellen met persoons-, gezins- en
schoolkenmerken?
Populatie: Jongvolwassenen
We gaan eerst kijken wat er in de steekproef aan de hand is en dan kijken of we dat voor de populatie kunnen gebruiken.
Variabelen
Afhankelijke variabele Y
o Kennis van literatuur
Onafhankelijke variabelen X (predictoren) = op grond van deze voorspellen we Y
o Persoonlijke kenmerken
o Kenmerken ouderlijk huis
o Kenmerken school
Voor de populatie beschrijven en toetsen van de relaties tussen afhankelijke variabele Y en de predictoren X .
Multipele regressie algemeen
Onderzoeksvraag bij multipele regressie: Kunnen we iemands waarde op een kenmerk voorspellen met kennis over andere
kenmerken?
Dit gaat dus enigszins over verklaren, maar ook om te kijken of we de X-en kunnen gebruiken om een nieuwe Y te
voorspellen.
Doelen analyse
• Beschrijven lineaire relaties tussen variabelen (regressiemodel).
• Toetsen hypothesen over relaties (significantie).
• Kwantificeren van relaties (effectgrootte).
• Kwalificeren van relaties (klein, middelmatig, groot) (= dit kan obv de effectgrootte).
• Beoordelen relevantie relaties (subjectief).
• Voorspellen van iemands waarde met regressiemodel (puntschatting en intervalschatting).
Waarschuwing: Doe op basis van statistische samenhang geen uitspraken over causaliteit. (Dus we hebben het niet over
experimenteel onderzoek, waarmee we vervolgens kunnen zeggen dat X en effect heeft op Y waarbij X ook de oorzaak van
Y is!!) Het gaat dus alleen over samenhang bij multipele regressie, niet over causaliteit.
Variabelen in het huidige voorbeeld
Read: Kennis literatuur respondent (Y)
Fath_rd: Kennis literatuur vader (X1)
Moth_rd: Kennis literatuur moeder (X2)
Par_book: Aantal boeken in ouderlijk huis (X3)
Sch_rd: Aandacht voor literatuur school (X4)
Hist_rd: Lezen verleden (X5)
Educ: Opleidingsniveau (X6)
MAAR: zijn deze variabelen wel van het juiste meetniveau?
,Meetniveau variabelen
NOIR:
N: Nominaal
O: Ordinaal
I: Interval
R: Ratio
Afhankelijke variabele Y
• Kenmerk gemeten op minimaal interval meetniveau.
Meetniveau onafhankelijke variabelen X
• Kenmerk gemeten op minimaal interval meetniveau.
• Categorische kenmerk met twee categorieën; nominaal meetniveau met twee categorieën noemen we
dichotoom.
• Categorisch kenmerk met meer dan twee categorieën; nominaal/ordinaal meetniveau wordt omgezet in
dummyvariabelen.
Variabelen in voorbeeld
Wij gaan er voor nu vanuit dat onderstaande variabele allemaal van minimaal interval niveau zijn.
DUS we mogen multipele regressie uitvoeren.
Regressiemodel
Vergelijking Y: voor geobserveerde variabele: Y = model X (lineair
regressie model) + voorspellingsfout of E (residual of error)
Vergelijking Ydakje: voor voorspellen van waarde op Y: Y = model X :
voor iemand die we niet hadden in onze eigen data, dit is om te gaan
voorspellen. Model op grond van de data die we in onze steekproef
hebben verzameld.
Aan de hand van de data proberen we het model te bouwen
zodat we dus voorspellingen kunnen doen.
De dataset, heel abstract weergegeven ziet er zo uit:
Y = afhankelijke variabele (dependent)
X = onafhankelijke variabelen (predictor)
B0 = intercept (constant), ook wel a = startpunt van de lijn. Voorspelde score van individu als hij op alle Xen 0 scoort.
B1 = Regressiecoëfficiënt (slope) = toename van 1 score op X, wat is dan de toename in Y?
E = voorspellingsfout (error of residual)
, SPSS Datamatrix
Voorbeeld vanuit SPSS, voorbeeld van abstracte
plaatje wat we net zagen bij ‘Regressiemodel’.
Histogram 'read'
Histogram van de afhankelijke variabele. Je ziet hier
de spreiding in score die we willen verklaren adhv het
model.
Het gaat in dit histogram niet over het gemiddelde,
maar over de standaardeviatie of de
standaardafwijking. Deze geeft ons aan hoe ver alle
scores afstaan van het gemiddelde. De afwijkingen van
het gemiddelde.
Spreidingsdiagram
Op dit plaatje zie je de best passende lijn, deze wordt
geschat adhv de data.
Om dingen te visualiseren, is het makkelijker om te
kijken naar enkelvoudige regressie. In dit diagram zie
je de X en Y score van een bepaalde 2 variabele, we
gaan daarin een best passende lijn tekenen en adhv
die lijn, kan je straks voorspellingen doen. Het moet
dan dus wel een lijn zijn die voor alle scores het best
passend is. Best passende lijn wordt omschreven door
Ydakje = B0 + B1 * X
Regressiecoëfficiënten
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Jannyfromtheb. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.