Dit is een samenvatting van verschillende regressie analyse methoden van MTB, 8,9 op het tentamen behaald.. Het is een hulpmiddel om de regressies beter te begrijpen. Het is een beknopte samenvatting waarin de stappen per analyse, in bulletpoints zijn weergegeven voor de overzichtelijkheid per stap...
Lineaire regressie
Assumpties lineaire regressie
Lineariteit: houdt de determinant rechtlijnig verband met de uitkomst?
Scatterplot: kan je een rechte lijn trekken/zien?
Onafhankelijke variabele opknippen in dummy’s > lopen de regC gelijk op/af?
Kwadraat van de determinant naast de oorspronkelijke in het model zetten, sig? Dan lineair
Homogeniteit: is de spreiding op de Y-as ongeveer gelijk verdeeld over de X-as?
Scatterplot: trek een regressielijn, is de spreiding eromheen ongeveer gelijk?
Via lineaire regressie commando een plot maken met gestandaardiseerde model voorspelling
tegen de gestandaardiseerde residuen (hiermee centreer je de regressielijn naar 0) en kan je
het beter zien
Multicollineariteit: hangen de onafhankelijke variabelen in het model onderling niet te sterk samen
met elkaar?
Correlatiematrix tussen onafhankelijke variabelen maken. >0,7, dan kan een van de twee het
best eruit dit is voor univariabel
Multivariabel: VIF
Normaliteit van de residuen: zijn de afstanden van de observaties tot de regressielijn ongeveer
normaal verdeeld?
Residuen histogram opvragen
Q-Q of P-P plot maken. Q-plot is handig voor de normaliteit van de staarten, P-plot is handig
voor het midden van de verdeling
Onafhankelijkheid van de observaties: willekeurig getrokken steekproef
Kan je niet checken alleen controleren door kritisch naar de wijze van de steekproeftrekking
te kijken
Belangrijke opmerkingen:
B0 = uitkomst wanneer alle variabelen 0 zijn
B1 = sterkte regressie coëfficiënt, gecorrigeerd voor … indien nodig
Interpreteren regressievergelijking altijd benoemen dat het gaat om een schatting
Overall effect =
BEGIN altijd met controleren van je data en maak filters aan indien nodig
o Extreme waarden wegfilteren of als missing value opgeven
o Nvalid voor je variabelen die je gaat gebruiken
De R2 is echt belangrijk voor kwaliteit van je model, verklaart een determinant de variantie?
Al helemaal relevant wanneer je bijv. in een block 2 EM/CF hebt gedaan, het verschil in R2?
1
, Uitvoeren bivariate lineaire regressie
Twee determinanten, waarbij de uitkomst kwantitatief is.
(Categoriale determinant)
Dummys maken (aantal categorieën -1)
Regressie draaien met dummys
Algemeen verder
Output lineaire regressie
Sterk/zwak verband aantonen
o Hoe is de B1
o Wat is de p-waarde van het overall effect?
o Wel/niet significant
o Hoe is het 95% BI?
Kwaliteit van je model aantonen
o R (correlatiecoefficient)= collineariteit R >0,8
o VIF = multicollineariteit >10
o R2/Rsquare? Verklaring van de variantie met je determinant (! Belangrijkst !)
o Adjusted Rsquare: rekening houdend met toegevoegde variabelen
ANOVA f-waarde geeft aan of de regressie in zijn totaal statistisch significant is, betere
voorspelling van de uitkomst door de determinant toe te voegen
Uitvoeren multipele lineaire regressie
Associatiemodel
Stel je krijgt een mogelijke interactie/effectmodificator
Check indien het moet de assumpties
Maak een grouped scatter/split file op je EM voor scatterplot
Compute variable > determinant * variabele Z (EM)
o Check wat is 0, wat is 1
o Als het een continue is, kan je uiteindelijk in je regressievergelijking verschillende
waarden invullen om te kijken hoe dat zich uit
Nieuwe lineaire regressie draaien > in BLOCK 2 zet je je originele Z én je interactieterm
Is er een effectmodificatie aangetoond?
o P-waarde van je interactieterm controleren
o Kijk naar het 95% BI
Heb je een EM met meer dan 2 categorieën? > dummys maken > interactieterm voor élke dummy >
alle dummys en alle producttermen in je regressie stoppen > kijk naar de p waardes
Stel je krijgt een mogelijke confounder
Check opnieuw indien nodig de assumpties
Je moet een ruw model hebben gedraaid waarin de ruwe B1 te zien is
Draai een nieuwe lineaire regressie > BLOCK 2 je mogelijke confounder variabele
Vergelijk B1 gecorrigeerd en B1 ruw
o (B1gecorrigeerd-B1ruw)/B1 ruw
o >10% verandering dan is het een confounder
Sprake van confounding?
o Met dummy’s: je schrijft je regressieanalyse uit inclusief alle regressie coëfficiënten
van je dummy’s
o Met een variabele deze erachter
Heb je een CF mer meer dan twee categorieën? > dummys maken > toevoegen in je model BLOCK 2 >
kijk naar de B1 regressie coëfficiënt van je determinant hoe deze veranderd.
2
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper nvpk. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.