Dit document bevat alle aantekeningen van de colleges van het vak Quantitative Methods op de Radboud Universiteit. De colleges staan ingedeeld per thema, zodat het zo overzichtelijk mogelijk is. Het document is bijna geheel in het Nederlands met enkele Engelse stukjes.
Succes!
Thema 1 Correlation and Regression
HC1 - Data collection, variable types and methods of analysis, OLS (conditions, pragmatism and
justification) - Pascal Beckers – 4 september 2023
1
,Nadruk op toepassen en begrijpen.
Kwantitatief onderzoek, dus variabele moet in nummers zijn, meetbaar manifeste variabele.
Kwalitatief onderzoek, daarbij latente variabele (vager).
Lineaire regressie model
Variabele is metrisch: interval/ratio
Yi = B0 + B1Xi1 + B2Xi2 + …. + BmXim + Ei (error)
Lijn: least squares method
R-squared: verklaringskracht van het model, ‘goodness-of-fit’. Hoe goed wordt de afhankelijke
variabele verklaard door het model.
Loopt van 0 tot 1, bij 1 wordt 100% verklaard en liggen alle observaties op de lijn.
Modelassumpties:
Onafhankelijke observaties
Lineaire relatie
Homoscedasticiteit / constante variantie: variantie moet voor alle positieve waarden gelijk
zijn (probleem bij ongelijke variantie: data niet meer betrouwbaar)
Normale verdeling
Outliers: extremen, observaties buiten 3 standaarddeviaties van het gemiddelde.
Kunnen model beïnvloeden. Kun je verwijderen.
Multicollineairiteit = correlatie tussen twee of meer onafhankelijke variabelen is te hoog
- Als R > 0.8 of R > 0.9
- VIF > 10 of tolerantie < 0.1 serieus probleem
- VIF > 1 of tolerantie < 0.2 misschien probleem
- Probleem:
Vergroot standaarderror van regressiecoëfficiënten ongeloofwaardig
R wordt lager (minder verklaringskracht)
Interpretatie van relevantie van individuele onafhankelijke variabelen wordt
onmogelijk
2
,HC2 - Data collection, variable types and methods of analysis, OLS (conditions, pragmatism and
justification) vervolg - Pascal Beckers - 5 september 2023
Voordeel lineaire regressieanalyse:
- Je kunt individuele onafhankelijke variabelen isoleren en apart onderzoeken.
- Effecten van de onafhankelijke variabelen zijn additief.
Uitbreidingen model:
1. Dummyvariabelen: om kwalitatieve variabelen toe te voegen.
Bij dichotome / nominale / ordinale* variabelen: waarmee je niet kunt rekenen. Bijv.
geslacht, opleidingsniveau. Kijken of er verschil is. Altijd een basisdummy. Dus bij 3 opties heb
je 2 dummyvariabelen nodig, 1 is de referentiecategorie.
* als er ongelijke afstand tussen zit. Als er gelijke afstand tussen zit, of als dat wordt aangenomen, kan deze als
metrische variabele worden behandeld.
↓
Fixed effects model: bevat een set van dummyvariabelen die verschillende groepen
representeert.
o Om effecten te onderscheiden: binnen de groep of tussen de groepen.
o Om variatie binnen de groepen onder controle te houden, want kan interpretatie van
effecten vermoeilijken.
2. Interactievariabelen: als er een effect ontstaat door de combinatie van twee onafhankelijke
variabelen.
Y = B0 + B1X1 + B2X2 + B3X1*X2 + e
Wat te doen bij non-lineairiteit?
1. Toevoegen non-lineaire term: kwadratisch regressiemodel
Y = B0 + B1X1 + B2(X1)^2 + e (door testen erachter komen welke term je moet kwadrateren)
2. Transformatie variabelen: logaritmes, wortel, vermenigvuldiging
3. Andere modelspecificaties
Review: voorwaarden lineaire regressie met OLS:
1. Steekproef met onafhankelijke observaties
2. Lineair model mogelijk, relatie tussen variabelen is lineair.
3. Variantie van de residuen is gelijk voor alle mogelijke waarden van de onafhankelijke
variabelen (constante variantie van homoscedasticiteit) (anders probleem van
heteroscedasticiteit: bijv. hoe hoger de x-waarden, hoe verder de y-waarden van de lijn
afwijken)
4. Residuen zijn normaal verdeeld.
Om te voorspellen of een onafhankelijke variabele invloed heeft op de afhankelijke variabele: in dit
geval een nominale variabele: in welke groep valt een observatie?
Binair: tussen twee groepen
3
, Multinominaal: meer groepen, dan is 1 groep de referentiecategorie.
Discrete choice model
Regressiemodel die voorspelt wat de kans is dat een persoon, organisatie etc. kiest voor een
bepaald alternatief gebaseerd op zijn/haar kenmerken.
3 criteria alternatieven:
1. Set van alternatieven moeten uitputtend zijn (dus geen andere opties mogelijk)
2. De alternatieven moeten exclusief zijn (het is niet mogelijk om meerdere opties te kiezen)
3. Niet te veel verschillende alternatieven (max. 5).
Veel verschillende soorten, twee populaire:
1. Logistic regression (2 alternatives)
2. Multinominal logit regression (3 of meer alternatieven)
Binary choice models: chance that Y=1.
- Doordat de afhankelijke variabele niet-metrisch is, is het doel van de analyse om te
voorspellen wat de kans is dat de afhankelijke variabele de waarde 1 heeft (ipv 0) voor de
gegeven waarden van de onafhankelijke variabele
- Je voorspelt keuzes, dus niet scores.
- In grafische vorm: zinloos beeld, want maar twee keuzes. Residuen niet gelijk verspreid.
- Dus werken met kansen: wat is de kans dat Y=1? Berekenen per waarde van onafhankelijke
variabele: hoeveel residuen hebben Y=1 / totaal aantal residuen bij die waarde.
- Kans tussen 0 en 1.
Probleem: voorspelde kansen soms niet plausibel: onder de 0 en boven de 1. Lineaire lijn
loopt door.
Wat nu:
o Complexere algebra nodig om de relatie tussen de variabelen in een model weer te
geven
o Twee trucs
↓
Odds: kans dat iets gebeurt in relatie tot de kans dat iets niet gebeurt.
Problemen:
1. Voorspelde waarden <0
2. Lijn is niet lineair
Model voldoet niet aan de voorwaarden van lineaire regressie
Log-odds (logits)
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper rebeccavis. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,49. Je zit daarna nergens aan vast.