College 4
Dummy variabelen: wanneer je categoriale variabelen wil verwerken in een
regressieanalyse gebruik je dummy variabalen, bijvoorbeeld man en vrouw. Dummy
variabelen hebben maar 2 scores: 0 en 1. Aantal dummy variabelen is het aantal groepen -1.
Je hebt altijd één referentiegroep nodig (waarde 0 op beide variabelen). Je gebruikt geen
anova omdat je bij regressie ook andere variabelen kunt toevoegen.
Robust regression: wanneer assumpties van normaliteit van errors of homoskedasticiteit
geschonden zijn heeft dit effect op de parameters, CI van parameters en H0 testen. Je kan
hierbij bootstrapping gebruiken. Je gebruikt het bij erg kleine samples die niet makkelijk
vergroot kunnen worden, moderatie, mediatie en getelde variabelen.
Basis idee: data wordt gebruikt als een voorspeller van de populatie. Hier trekken we veel
samples uit en berekenen we de statistics van elke sample, net als het gemiddelde en de SD.
Moderatie: effect van een voorspeller X op een afhankelijke variabele Y hangt af van de
waarde van een derde varabele M, waarbij M de moderator is. Dit vertelt je niks over
causaliteit.
Je centreert data wanneer je geen betekenisvol 0-punt hebt. Ook omdat je bij continue
variabelen veel waardes met elkaar vermenigvuldigd en hierdoor correlaties kunt krijgen
tussen variabelen.
Mediatie: effect van een voorspeller variabele X op een uitkomst variabele Y wat deels
verklaard kan worden door een derde variabele M (mediator). Dat is wel een causaal effect
(X -> Y). Bij een perfecte mediatie zou de relatie tussen X en Y 0 zijn. We testen of de paden
Mx en My significant zijn. Dit doe je door bootstrapping (sobel test niet, die gaat uit van een
normale verdeling terwijl dit niet zo is).
Dummy variabelen: wanneer je categoriale variabelen wil verwerken in een
regressieanalyse gebruik je dummy variabalen, bijvoorbeeld man en vrouw. Dummy
variabelen hebben maar 2 scores: 0 en 1. Aantal dummy variabelen is het aantal groepen -1.
Je hebt altijd één referentiegroep nodig (waarde 0 op beide variabelen). Je gebruikt geen
anova omdat je bij regressie ook andere variabelen kunt toevoegen.
Robust regression: wanneer assumpties van normaliteit van errors of homoskedasticiteit
geschonden zijn heeft dit effect op de parameters, CI van parameters en H0 testen. Je kan
hierbij bootstrapping gebruiken. Je gebruikt het bij erg kleine samples die niet makkelijk
vergroot kunnen worden, moderatie, mediatie en getelde variabelen.
Basis idee: data wordt gebruikt als een voorspeller van de populatie. Hier trekken we veel
samples uit en berekenen we de statistics van elke sample, net als het gemiddelde en de SD.
Moderatie: effect van een voorspeller X op een afhankelijke variabele Y hangt af van de
waarde van een derde varabele M, waarbij M de moderator is. Dit vertelt je niks over
causaliteit.
Je centreert data wanneer je geen betekenisvol 0-punt hebt. Ook omdat je bij continue
variabelen veel waardes met elkaar vermenigvuldigd en hierdoor correlaties kunt krijgen
tussen variabelen.
Mediatie: effect van een voorspeller variabele X op een uitkomst variabele Y wat deels
verklaard kan worden door een derde variabele M (mediator). Dat is wel een causaal effect
(X -> Y). Bij een perfecte mediatie zou de relatie tussen X en Y 0 zijn. We testen of de paden
Mx en My significant zijn. Dit doe je door bootstrapping (sobel test niet, die gaat uit van een
normale verdeling terwijl dit niet zo is).