Dit document bevat alle aantekeningen van de colleges van het vak Quantitative Methods op de Radboud Universiteit. De colleges staan ingedeeld per thema, zodat het zo overzichtelijk mogelijk is. Het document is bijna geheel in het Nederlands met enkele Engelse stukjes.
Succes!
Thema 1 Correlation and Regression
HC1 - Data collection, variable types and methods of analysis, OLS (conditions, pragmatism and
justification) - Pascal Beckers – 4 september 2023
1
,Nadruk op toepassen en begrijpen.
Kwantitatief onderzoek, dus variabele moet in nummers zijn, meetbaar manifeste variabele.
Kwalitatief onderzoek, daarbij latente variabele (vager).
Lineaire regressie model
Variabele is metrisch: interval/ratio
Yi = B0 + B1Xi1 + B2Xi2 + …. + BmXim + Ei (error)
Lijn: least squares method
R-squared: verklaringskracht van het model, ‘goodness-of-fit’. Hoe goed wordt de afhankelijke
variabele verklaard door het model.
Loopt van 0 tot 1, bij 1 wordt 100% verklaard en liggen alle observaties op de lijn.
Modelassumpties:
Onafhankelijke observaties
Lineaire relatie
Homoscedasticiteit / constante variantie: variantie moet voor alle positieve waarden gelijk
zijn (probleem bij ongelijke variantie: data niet meer betrouwbaar)
Normale verdeling
Outliers: extremen, observaties buiten 3 standaarddeviaties van het gemiddelde.
Kunnen model beïnvloeden. Kun je verwijderen.
Multicollineairiteit = correlatie tussen twee of meer onafhankelijke variabelen is te hoog
- Als R > 0.8 of R > 0.9
- VIF > 10 of tolerantie < 0.1 serieus probleem
- VIF > 1 of tolerantie < 0.2 misschien probleem
- Probleem:
Vergroot standaarderror van regressiecoëfficiënten ongeloofwaardig
R wordt lager (minder verklaringskracht)
Interpretatie van relevantie van individuele onafhankelijke variabelen wordt
onmogelijk
2
,HC2 - Data collection, variable types and methods of analysis, OLS (conditions, pragmatism and
justification) vervolg - Pascal Beckers - 5 september 2023
Voordeel lineaire regressieanalyse:
- Je kunt individuele onafhankelijke variabelen isoleren en apart onderzoeken.
- Effecten van de onafhankelijke variabelen zijn additief.
Uitbreidingen model:
1. Dummyvariabelen: om kwalitatieve variabelen toe te voegen.
Bij dichotome / nominale / ordinale* variabelen: waarmee je niet kunt rekenen. Bijv.
geslacht, opleidingsniveau. Kijken of er verschil is. Altijd een basisdummy. Dus bij 3 opties heb
je 2 dummyvariabelen nodig, 1 is de referentiecategorie.
* als er ongelijke afstand tussen zit. Als er gelijke afstand tussen zit, of als dat wordt aangenomen, kan deze als
metrische variabele worden behandeld.
↓
Fixed effects model: bevat een set van dummyvariabelen die verschillende groepen
representeert.
o Om effecten te onderscheiden: binnen de groep of tussen de groepen.
o Om variatie binnen de groepen onder controle te houden, want kan interpretatie van
effecten vermoeilijken.
2. Interactievariabelen: als er een effect ontstaat door de combinatie van twee onafhankelijke
variabelen.
Y = B0 + B1X1 + B2X2 + B3X1*X2 + e
Wat te doen bij non-lineairiteit?
1. Toevoegen non-lineaire term: kwadratisch regressiemodel
Y = B0 + B1X1 + B2(X1)^2 + e (door testen erachter komen welke term je moet kwadrateren)
2. Transformatie variabelen: logaritmes, wortel, vermenigvuldiging
3. Andere modelspecificaties
Review: voorwaarden lineaire regressie met OLS:
1. Steekproef met onafhankelijke observaties
2. Lineair model mogelijk, relatie tussen variabelen is lineair.
3. Variantie van de residuen is gelijk voor alle mogelijke waarden van de onafhankelijke
variabelen (constante variantie van homoscedasticiteit) (anders probleem van
heteroscedasticiteit: bijv. hoe hoger de x-waarden, hoe verder de y-waarden van de lijn
afwijken)
4. Residuen zijn normaal verdeeld.
Om te voorspellen of een onafhankelijke variabele invloed heeft op de afhankelijke variabele: in dit
geval een nominale variabele: in welke groep valt een observatie?
Binair: tussen twee groepen
3
, Multinominaal: meer groepen, dan is 1 groep de referentiecategorie.
Discrete choice model
Regressiemodel die voorspelt wat de kans is dat een persoon, organisatie etc. kiest voor een
bepaald alternatief gebaseerd op zijn/haar kenmerken.
3 criteria alternatieven:
1. Set van alternatieven moeten uitputtend zijn (dus geen andere opties mogelijk)
2. De alternatieven moeten exclusief zijn (het is niet mogelijk om meerdere opties te kiezen)
3. Niet te veel verschillende alternatieven (max. 5).
Veel verschillende soorten, twee populaire:
1. Logistic regression (2 alternatives)
2. Multinominal logit regression (3 of meer alternatieven)
Binary choice models: chance that Y=1.
- Doordat de afhankelijke variabele niet-metrisch is, is het doel van de analyse om te
voorspellen wat de kans is dat de afhankelijke variabele de waarde 1 heeft (ipv 0) voor de
gegeven waarden van de onafhankelijke variabele
- Je voorspelt keuzes, dus niet scores.
- In grafische vorm: zinloos beeld, want maar twee keuzes. Residuen niet gelijk verspreid.
- Dus werken met kansen: wat is de kans dat Y=1? Berekenen per waarde van onafhankelijke
variabele: hoeveel residuen hebben Y=1 / totaal aantal residuen bij die waarde.
- Kans tussen 0 en 1.
Probleem: voorspelde kansen soms niet plausibel: onder de 0 en boven de 1. Lineaire lijn
loopt door.
Wat nu:
o Complexere algebra nodig om de relatie tussen de variabelen in een model weer te
geven
o Twee trucs
↓
Odds: kans dat iets gebeurt in relatie tot de kans dat iets niet gebeurt.
Problemen:
1. Voorspelde waarden <0
2. Lijn is niet lineair
Model voldoet niet aan de voorwaarden van lineaire regressie
Log-odds (logits)
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller rebeccavis. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.04. You're not tied to anything after your purchase.