Blok 5, Advanced Quantitative Methods
Samenvatting hoorcolleges en web colleges
Linn Luijerink
Inhoud
Interpretaties & conclusies ..................................................................................................................... 2
Web colleges ........................................................................................................................................... 5
Week 1, web college 0: herhaling ....................................................................................................... 5
Week 1, web college 1: schaalanalyse ................................................................................................ 7
Week 2, web college 2: conceptuele modellen & regressie ............................................................... 8
Week 3, web college 3: moderatie.................................................................................................... 12
Week 4, web college 4: dichotome afhankelijke variabelen ............................................................. 16
Informatie uit werkgroepen .................................................................................................................. 20
Werkgroep 16-2-2021 ....................................................................................................................... 20
Werkgroep 23-2-2021 ....................................................................................................................... 21
Werkgroep 2-3-2021 ......................................................................................................................... 22
Werkgroep 4-3-2021 ......................................................................................................................... 22
Vragen uur 4-3-2021 ......................................................................................................................... 23
Hoorcolleges .......................................................................................................................................... 24
Hoorcollege 1, 9-2-2021 .................................................................................................................... 24
Hoorcollege 2, 16-2-2021 .................................................................................................................. 26
Hoorcollege 3, 24-2-2021 .................................................................................................................. 30
Hoorcollege 4, 2-3-2021 .................................................................................................................... 33
Hoorcollege 5, 9-3-2021 .................................................................................................................... 37
Quizzen .................................................................................................................................................. 43
Quiz 1 ................................................................................................................................................. 43
Quiz 2 ................................................................................................................................................. 47
Quiz 3 ................................................................................................................................................. 53
Quiz 4 ................................................................................................................................................. 60
1
,Interpretaties & conclusies
Algemene interpretatie puntjes:
• Je kan de standaard deviatie van dummy variabelen niet interpreteren.
• Een andere formulering voor ‘gecontroleerd voor het percentage onder het armoedelevel’ is:
‘dit verband geldt als we het percentage onder het armoedelevel constant houden’.
Correlatie:
Voorbeeld: er is een zwakke, positieve en significante samenhang tussen jaren opleiding en
vertrouwen in de overheid (r=0,177, p<0,05). We kunnen de nulhypothese dat er geen verband
bestaat verwerpen en op basis van onze resultaten concluderen dat voor Nederlandse vrouwen geldt
dat hoe meer opleiding ze hebben genoten, hun vertrouwen in de overheid gemiddeld gezien hoger is.
• Je formuleert de sterkte of zwakte van het verband, of het negatief of positief is en of het
verband wel of niet significant is aan de hand van de p-waarde.
Bivariate regressieanalyse:
Voorbeeld: De regressiecoëfficiënt geeft aan wat de toename is van het voorspelde vertrouwen in de
overheid als jaren opleiding met één eenheid toenemen. Het voorspelde vertrouwen in de overheid
neemt met 0,126 toe als een respondent één jaar meer opleiding heeft genoten. De
regressiecoëfficiënt is positief en significant (b=0,126, p<0,05), het verband zal dus met grote
waarschijnlijkheid in de populatie ook te vinden zijn.
De constante geeft aan wat het voorspelde vertrouwen in de overheid is als X=0 is. In dit geval geeft
de constante het voorspelde vertrouwen in de overheid aan voor respondenten met nul jaar
opleiding. Voor deze mensen is het voorspelde vertrouwen in de overheid 3,270.
• Je formuleert of de regressiecoëfficiënt negatief of positief is en of deze wel of niet
significant is op basis van de p-waarde.
• Je kan ook de slope en de constante interpreteren.
• Je kan ook de verklaarde variantie (R^2) interpreteren. Voorbeeld: de verklaarde variantie (R
Square) van dit model is 9,1 procent. We kunnen dus met behulp van de jaren opleiding 9
procent in de variantie van het vertrouwen in de overheid verklaren.
• Je kan een bivariate regressie zowel doen wanneer de onafhankelijke variabele (X) continue
als dichotoom is. Is deze dichotoom/ categoriaal dan interpreteer je de dummy variabelen.
Multivariate regressieanalyse (simpele vorm):
Voorbeeld: Met behulp van opleidingsjaren en leeftijd verklaar ik maar 0,2 % van de variatie die
bestaat in het vertrouwen in de overheid. Er bestaat een positief en significant verband tussen
opleidingsjaren en het vertrouwen in de overheid (b=0,022, p<0,05). We kunnen de nulhypothese dus
afwijzen en concluderen dat met ieder jaar dat iemand meer opleiding geniet het vertrouwen in de
overheid voorspeld wordt met 0,022 toe te nemen, gecontroleerd voor leeftijd.
• Je formuleert de verklaarde variantie (R^2), of de regressiecoëfficiënt positief of negatief is,
of deze wel of niet significant is aan de hand van de p-waarden en je formuleert de controle
variabelen die zijn toegevoegd aan de analyse.
• Je kan ook de slope en de constante interpreteren.
• Je kan ook interpreteren of de confounder/ controle variabele positief of negatief is. Om te
zorgen dat we de juiste relatie tussen onze hoofd onafhankelijke variabele en onze
afhankelijke variabele voorspellen, is het heel belangrijk dat we op alle mogelijke
confounders controleren. Voorbeeld: Leeftijd heeft ook een relatie met hoeveel jaar voltijds
2
, onderwijs iemand heeft voltooid. Leeftijd is een positieve confounder– de coëfficiënt voor
opleidingsniveau is sterker (positief) (het “loopt weg van nul”) als ‘leeftijd’ niet in het model
zit. De relatie tussen jaar voltijds onderwijs en vertrouwen in de overheid is sterker zonder de
controle variabele (zonder leeftijd: b = 0.026, p<0.001; met leeftijd: b = 0.022, p<0.001).
• Als je meerdere controle variabelen toevoegt, dan moet je deze allemaal vergelijken met het
hoofdverband, interpreteren en concluderen.
Multivariate regressieanalyse (mediatie):
Voorbeeld: Criminaliteitscijfer = 0,473 * armoedecijfer + 0,688 * percentage in urbaan gebied
Het gestandaardiseerde regressiecoëfficiënt Zx1 (armoedecijfer) representeert de verandering in het
gemiddelde van Y (in y standaard deviaties) met een toename van 1 standaard afwijking,
gecontroleerd voor de Zx2 (en andersom).
We kunnen de gestandaardiseerde regressiecoëfficiënten als volgt interpreteren:
Het voorspelde criminaliteitscijfer neemt met 0,473 standaarddeviaties toe als het armoedecijfer met
één standaarddeviatie toeneemt en we controleren voor het percentage dat woont in een urbaan
gebied. Het voorspelde criminaliteitscijfer neemt met 0,688 standaarddeviaties toe als het percentage
dat woont in een urbaan gebied met één standaarddeviatie toeneemt en we controleren voor het
armoedecijfer.
• De gestandaardiseerde regressiecoëfficiënten worden gebruikt om het relatieve effect van
de twee onafhankelijke variabelen inzichtelijk te maken. Echter kunnen deze twee alleen met
elkaar worden vergeleken als ze op dezelfde schaal zijn gemeten.
• Je formuleert de gestandaardiseerde beta’s.
• Bij een regressievergelijking met gestandaardiseerde regressiecoëfficiënten wordt geen
constante gerapporteerd.
Multivariate regressieanalyse (moderatie):
Als er sprake is van een moderatie/ interactie, dan kan je op drie manieren interpreteren:
1. Interpretatie aan de hand van de coëfficiënten (cijfers). De interpretatie van het interactie-
regressie coëfficiënt altijd gezamenlijk met de andere coëfficiënt(en). Vooral als een of beide
van de interactie variabelen discreet zijn.
2. Interpretatie door regressievergelijking uit te schrijven voor verschillende groepen of niveaus
en dan met elkaar vergelijken.
3. Interpretatie aan de hand van grafieken.
Het is bij moderatie belangrijk dat je de verschillende niveaus/ groepen met elkaar vergelijkt.
Odds:
Voorbeeld: odds = 1,196 dan concludeer je: er zijn 1,196 werkende mannen voor elke niet-werkende
man. Of: opleidingsjaren, met elk jaar extra dat iemand heeft gestudeerd nemen de odds om
werkende te zijn met een factor 1,153 toe gecontroleerd voor geslacht en leeftijd.
• Odds groter dan 1 → meer mensen in de ja categorie dan in de nee categorie.
• Odds kleine dan 1 → minder mensen in de ja categorie dn in de nee categorie.
Odds ratio:
Voorbeeld: odds ratio = 1,665 dan concludeer je: de odds dat een man werkt zijn 1,665 keer de odds
dat een vrouw werkt. Of: de odds dat een man werkt zijn een factor 1,665 groter dan de odds dat een
vrouw werkt.
3
, Log-odds:
Voorbeeld: opleidingsjaren, met elk jaar extra dat iemand heeft gestudeerd neemt de log-odds om
werkende te zijn significant met 0,143 toe gecontroleerd door geslacht en leeftijd.
• Log-odds interpretatie op basis van coëfficiënten (b).
• Inhoudelijk zijn de log-odds niet heel goed te interpreteren, maar je kan wel wat dingen
concluderen op basis van de b in de logistische regressie:
❖ Je kan de richting van het verband interpreten (is de b positief of negatief).
❖ Kijken naar de p-waarde, is p<0,05 dan is er ook een verband in de populatie.
Logistische regressie:
Voorbeeld: regressievergelijking uitschrijven en interpreteren
Log[ P(y=1) / 1- P(y=1)] = -12,157 + 0,189 leeftijd
We vinden een positief en significant verband tussen leeftijd en de kans dat iemand met pensioen is.
Met elk jaar dat iemand ouder wordt nemen de log-odds dat diegene met pensioen is met 0,189 toe.
Of: met elk jaar dat iemand ouder wordt nemen de odds dat diegene met pensioen is met een factor
1,208 toe.
Kansen berekenen:
3 Stappen:
log-odds -> odds -> kans
Wat is de voorspelde kans dat iemand op 50-jarige leeftijd met pensioen is?
1) log-odds
Log[ P(y=1) / 1- P(y=1)] = -12,157 + 0,189 *50 = -2,71
2) odds
= exp(log-odds) = exp(-2,71) = 0,07
3) kans
= odds / (1+odds) = 0,07 / (1+0,07) = 0,06
De voorspelde kans dat iemand op 50-jarige leeftijd met pensioen is, is 0,06.
4