TENTAMEN: Wat wordt bedoeld als de vraag is wat het effect is;
- Lineair regressiemodel: regressiecoëfficiënt zelf
- Logistische regressiemodel: OR
- Cox-regressiemodel: HR
Associatie- en Predictiemodellen
Methodologie II
Overzicht
Uitkomst continu: lineaire regressie
o Y = B0 + B1 × X1
o B1 geeft verschil van gemiddelden
Uitkomst dichotoom: logistische regressie
o LN(odds) = B0 + B1 × X1
o EXP(B1) geeft de Odds Ratio (OR)
Uitkomst dichotoom + tijd: Cox regressie
o LN(h(t)) = baseline hazard +B1×X1
o EXP(B1) geeft Hazard Ratio (HR)
o HR = incidentiedichtheden Ratio! BELANGRIJK OM TE WETEN
Associatiemodel
Het zo zuiver mogelijk schatten van de relatie tussen 1 centrale determinant en
een (in dit geval) continue uitkomstvariabele.
Confounding
Je wilt op de juiste manier corrigeren voor verstorende variabelen
(confounders)
Wat doen we als er meerdere mogelijke confounders en effect
modificatoren zijn?
Vraag: wat is de relatie tussen BMI en totaal cholesterol, rekening houdend met
sekse, leeftijd, roken, alcohol gebruik en lichamelijke activiteit?
Als je veel mogelijke confounders hebt, zal je een keuze moeten maken. Je moet
deze keuze ergens op baseren. Je moet onderscheid maken tussen sterkere en
minder sterkere confounders. Daar is die regel van 10% voor. Je neemt alleen
‘belangrijke’ confounders op in het model.
Voorwaarde confounders:
- Heeft zelf een relatie met de uitkomst
- Heeft zelf een relatie met de onafhankelijke variabele
- Maakt geen deel uit van het causale pad
Coefficientsa
Model 1:
Unstandardized Standardized 95% Confidence
- BMI is centrale Coefficients Coefficients Interval for B
determinant Lower Upper
B Std. Error Beta t Sig. Bound Bound
- We willen af van (Constant) 3,865 ,519 7,448 ,000 2,842 4,889
mogelijke confounders body mass index ,086 ,018 ,316 4,685 ,000 ,050 ,122
- Een voor een voegen we a. Dependent Variable: totaal cholesterol
de mogelijke confounders
toe
- Berekenen we de verandering (O-N/N)×100%
1
,HC6 Methodologie II woensdag 10-12-2014
- Je kiest de sterkste confounder (alcohol) en dat wordt je gecorrigeerde
model
- Nu ga je weer verder kijken of de andere variabele (die we dus al 1 keer
getest hadden) nog voor veel confounding zorgen
- De sterkste (mits meer dan 10%) pakken we, en daar corrigeren we ook
voor
- Leeftijd is nu een sterke confounder
- Het nieuwe model is dan BMI gecorrigeerd voor alcoholgebruik en leeftijd
- In een verslag moet je zowel je ongecorrigeerde als je gecorrigeerde
resultaten weergeven.
In het gecorrigeerde model: BMI is gecorrigeerd en dus onafhankelijk van alcohol
en leeftijd. Hij veranderd dus niet als de leeftijd of de mate van alcohol gebruik
veranderd.
Mogelijke tentamenvraag:
Is het nu (in het uiteindelijke model) nog zinnig om te kijken of er een lineair
verband is in alcoholgebruik?
Nee het is een categoriale variabele, dus dan hoef je dat niet te controleren.
Moet wel bij continue variabelen! Ook als het een confounder is!
Stel je hebt een continue variabele: je gaat onderzoeken of het een confounder
is:
Als deze wel lineair is: hou je hem als continue variabele
Als deze niet lineair is: doe je hem als dummy’s in je model (ook wanneer het een
confounder is)
LET OP: dummyvariabelen nooit APART opnemen in je model. Ze MOETEN altijd
bij elkaar blijven!
Effectmodificatie
Significant: opnemen in model
Doe je bij confounding niet, significantie beïnvloed dan niet of het wel
of geen confounder is. Bij effectmodificatie dus wel!
Alleen biologisch plausibele interacties
Stel je hebt twee mogelijke effectmodificatoren: je wilt met 1 toets weten of deze
twee effectmodificatoren zijn. Welke toets gebruik je?
-2LL-toets: je toetst dan meteen of er significante verschillen in het oude en
nieuwe model zitten.
Predictiemodel
Beste en meest eenvoudige model (combinatie van variabelen) om een bepaalde
uitkomstvariabele te voorspellen
GEEN confounding, maar het zijn voorspellers!
Verschillende procedures:
Forward selectieprocedure
Backward selectieprocedure
Combinatie
Forward:
2
, HC6 Methodologie II woensdag 10-12-2014
1. Alle mogelijke predictoren één voor één analyseren
2. De variabele met de laagste p-waarde selecteren.
3. Deze variabele toevoegen aan het nieuwe basismodel
4. Herhaal stap 1t/m3 totdat een vooraf aangegeven eindpunt is bereikt
- Determinant met hoogste wald waarde wordt als eerste in het model
geselcteerd
- Wordt vervolgens ook gedaan met de volgende variabele, met de eerste
variabele al opgenomen in het model.
- De determinanten moeten ALLEMAAL een significante relatie hebben met
de uitkomst
Backward
1. Begin met een zo groot mogelijk model
2. Verwijder de variabele met de hoogste p-waarde.
3. Herhaal stap 1 en 2 totdat een vooraf aangegeven eindpunt is bereikt
- De determinant met de hoogste p-waarde verwijder je eerst (deze heeft de
minste relatie met de uitkomst)
- Je stelt een grens p-waarde is. Bijvooreeld p=0,1 (10%).
- De determinatnen worden dan 1 voor 1 uit het model verwijderd.
Combinatie:
- Zullen we niet behandelen
Backward selectie: is de meest aanbevolen methode
- Sterkste correlatie met uitkomst blijven in je model.
Voordeel van een p-waarde van 5%: je houdt een kleiner model over.
Nadeel van p-waarde van 5%: je mist soms belangrijke variabele (vooral bij
forward selectie). Bij backward selectie heb je die variabele vaak wel
Vraag:
Welke van de variabele n leeftijd, sekse, BMI, rookgedrag, alcohol gebruik en
lichamelijke activiteit zijn (samen) in staat om totaal cholesterol concentratie te
voorspellen?
Vooraf bepalen welk eindpunt gebruikt wordt <0,05
Welke zal als eerste uit je model verdwijnen? (met backward selectie)
De determinant met de hoogste p-waarde moet uit het model. Model dan
opnieuw runnen en de determinant die dan de hoogste p-waarde heeft moet
eruit.
- Bij dummy’s moet je kijken naar de overall dummy, of (in het geval van
lineair) naar de dummy met de laagste p-waarde.
In het voorbeeld gaat eerst:
- Activiteit
- Dan alcohol
- Dan klaar, alles licht onder de 5%
Kwaliteit van een predictiemodel bij continue uitkomstvariabelen wordt meestal
aangegeven met de hoeveelheid verklaarde variantie
Bij lineaire regressiemodellen hebben we alleen de maat: verklaarde variantie.
Deze maat geeft aan hoeveel je in de spreiding van de uitkomst kunt verklaren
3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper EvaStruijf. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.