Onderwerpen college
• Regressiemodel
• Predictoren /onafhankelijke variabelen en afhankelijke
variabele
• (Gestandaardiseerde) regressiecoëfficiënten
• Kleinste kwadraten criterium
• Goodness-of-fit
• Toetsen van R2
• Toetsen B ’s (en beta’s)
• Vergelijking van modellen (ΔR2)
ZIE WERKGROEP UITWERKINGEN: (BIJEENKOMST 2
Voorbeeld 1; paper NJI. Risicofactoren bij onderwijsachterstanden.
Waarom laat docent dit zien?
= het is vaak een startpunt, we willen eerst verheldering hebben ‘wat speelt er eigelijk in een
bepaalde context?” → Als ik niet weet wat er speelt, weet ik ook niet wat ik moet meten in
mijn kwantitatieve onderzoek.
In paper zijn risicofactoren: Kindfactoren, Gezinsfactoren, Opvoedingsprincipes,
Leefomstandigheden, Schoolfactoren. (deze thema’s lijken relevant te zijn voor
onderwijsachterstanden)
- Om onderwijsachterstand te meten, doen we dat aan de hand van bijvoorbeeld
‘schoolprestaties’. Als ze minder goed presteren, dan hebben ze misschien een
achterstand. Onderwijsachterstand wordt dus geoperationaliseerd naar
schoolprestaties.
- Overkoepelende thema’s moeten ook worden geoperationaliseerd:
- Bijvoorbeeld: Als een kind een hoger IQ heeft, dan heeft dat invloed op de
schoolprestaties. Of we dat zo causaal mogen bekijken, komt docent later op terug.
1
,Padmodel multipele regressie
Y= 1 afhankelijke variabele (schoolprestaties
bijvoorbeeld).
X2= 1 of meer onafhankelijke variabelen
(minimaal interval OF dichotoom)
Dichotoom= JA of NEE (of Man of Vrouw)
bijvoorbeeld. (0= ja / 1=nee)
E= meetfouten
‘Als ik 1 stapje meer zou hebben van X, wat gebeurt er dan met Y (de uitkomstmaat)’
Bijvoorbeeld; ‘gezinsgrootte stijgt met 1 stapje, wat doet dat dan met de schoolprestaties?’
→ Daarom moet het van interval meetniveau zijn, elk stapje moet hetzelfde zijn’.
→ We kunnen ook werken met dichotome variabele omdat dat betekent: “wel of niet
aanwezig’.
We proberen Y te voorspellen aan de hand van alle X’en, daar maken we een model mee.
Maar als we daadwerkelijk gaan observeren, en we vullen dat model in. Er komt dan een
waarde uit, dan zal dat niet precies goed zijn. Daarom staat er in het model ook een E voor de
meetfouten. E = Errors.
Als ik probeer te voorspellen zonder geobserveerde uitkomsten, dan heb ik die E niet nodig.
Maar als ik wil vergelijken wat mijn model deed met de geobserveerde data die ik had dan
heb ik E nodig om het model passend te maken.
Voorbeeld 2
Onderzoeksvraag: kunnen we kennis van literatuur bij jongvolwassenen voorspellen met
persoons-, gezins-, en schoolkenmerken?
Populatie: Jongvolwassenen
- Belangrijk om de populatie te weten, je moet weten uit welke groep de informatie is
gehaald om te weten naar wie je toe gaat generaliseren.
Generaliseren: observeren in kleine groepen om misschien iets te kunnen zeggen
over de gehele populatie. (we kunnen vaak niet iedereen observeren, vaak
steekproef en aan de hand daarvan een verklaringsmodel maken).
Doel:
Voor de populatie beschrijven en toetsen van de relaties tussen afhankelijke variabele Y en de
predictoren X.
Multipele regressie algemeen
- Onderzoeksvraag: Kunnen we iemands waarde op een kenmerk voorspellen met
kennis over andere kenmerken?
2
, Iets minder abstract:
Kunnen we iemands waarde op een kenmerk voorspellen (Wat is hun score op het
gene wat ik probeer te verklaren, bijvoorbeeld schoolprestatie) met kennis over andere
kenmerken (bijvoorbeeld; gezinssituatie, SES)?
Waarom willen we dat nou?
- Om inzicht te krijgen, zodat we kunnen voorkomen of hulp kunnen bieden.
- Soms kunnen we de uitkomstmaat niet goed observeren, dus dan willen we het
gebruiken om te voorspellen.
Doelen analyse:
- Beschrijven lineaire relaties tussen variabelen (regressiemodel)
- Toetsen hypothesen over relaties (significantie)
- Kwantificeren van relaties (klein, middelmatig, groot).
- Beoordelen relevantie relaties (subjectief)
- Voorspellen van iemands waarde met regressiemodel (puntschatting en
intervalschatting)
Waarschuwing: Je kunt niet zeggen, A veroorzaakt B.
Dus: Doe op basis van statistische samenhang geen uitspraken over causaliteit.
Variabelen in voorbeeld (alle zijn minimaal interval meetniveau)
Read: Kennis literatuur respondent. (Y)
Fath_rd: kennis literatuur vader (X1)
Moth_rd: kennis literatuur moeder (X2)
Par_book: aantal boeken ouderlijk huis (X3)
Sch_book: Aandacht voor literatuur school (X4)
Hist_rd : lezen verleden (X5)
Educ: opleidingsniveau (X6)
Meetniveau variabelen
Wat waren de meetniveaus ookalweer?
- Nominaal, Ordinaal, Interval, Ratio
Afhankelijke variabele Y
- Kenmerk gemeten op minimaal Interval meetniveau
Meetniveau onafhankelijke variabele (X)
- Kenmerk gemeten op minimaal interval meetniveau
- Categorische kenmerk met twee categorieën; nominaal meetniveau met twee
categorieën noemen we dichotoom
- Categorisch kenmerk met meer dan twee categorieën; nominaal/ordinaal meetniveau
wordt omgezet in dummyvariabelen.
We kunnen in het voorbeeld dus multipele lineaire regressie gebruiken.
3
, Regressiemodel (deel 1)
Vergelijking Y
Voor de geobserveerde variabele Y
Uitkomst (Y) = model (X) +
voorspellingsfout
Dus: Y= X + E
Vergelijking Y
Voor voorspellen van waarde op Y (= 𝒀^)
Geschatte uitkomst (Y^) = model (X)
Regressiemodel (2)
SPSS Datamatrix
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller floorpatist. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.60. You're not tied to anything after your purchase.