TENTAMEN: Wat wordt bedoeld als de vraag is wat het effect is;
- Lineair regressiemodel: regressiecoëfficiënt zelf
- Logistische regressiemodel: OR
- Cox-regressiemodel: HR
Associatie- en Predictiemodellen
Methodologie II
Overzicht
Uitkomst continu: lineaire regressie
o Y = B0 + B1 × X1
o B1 geeft verschil van gemiddelden
Uitkomst dichotoom: logistische regressie
o LN(odds) = B0 + B1 × X1
o EXP(B1) geeft de Odds Ratio (OR)
Uitkomst dichotoom + tijd: Cox regressie
o LN(h(t)) = baseline hazard +B1×X1
o EXP(B1) geeft Hazard Ratio (HR)
o HR = incidentiedichtheden Ratio! BELANGRIJK OM TE WETEN
Associatiemodel
Het zo zuiver mogelijk schatten van de relatie tussen 1 centrale determinant en
een (in dit geval) continue uitkomstvariabele.
Confounding
Je wilt op de juiste manier corrigeren voor verstorende variabelen
(confounders)
Wat doen we als er meerdere mogelijke confounders en effect
modificatoren zijn?
Vraag: wat is de relatie tussen BMI en totaal cholesterol, rekening houdend met
sekse, leeftijd, roken, alcohol gebruik en lichamelijke activiteit?
Als je veel mogelijke confounders hebt, zal je een keuze moeten maken. Je moet
deze keuze ergens op baseren. Je moet onderscheid maken tussen sterkere en
minder sterkere confounders. Daar is die regel van 10% voor. Je neemt alleen
‘belangrijke’ confounders op in het model.
Voorwaarde confounders:
- Heeft zelf een relatie met de uitkomst
- Heeft zelf een relatie met de onafhankelijke variabele
- Maakt geen deel uit van het causale pad
Coefficientsa
Model 1:
Unstandardized Standardized 95% Confidence
- BMI is centrale Coefficients Coefficients Interval for B
determinant Lower Upper
B Std. Error Beta t Sig. Bound Bound
- We willen af van (Constant) 3,865 ,519 7,448 ,000 2,842 4,889
mogelijke confounders body mass index ,086 ,018 ,316 4,685 ,000 ,050 ,122
- Een voor een voegen we a. Dependent Variable: totaal cholesterol
de mogelijke confounders
toe
- Berekenen we de verandering (O-N/N)×100%
1
,HC6 Methodologie II woensdag 10-12-2014
- Je kiest de sterkste confounder (alcohol) en dat wordt je gecorrigeerde
model
- Nu ga je weer verder kijken of de andere variabele (die we dus al 1 keer
getest hadden) nog voor veel confounding zorgen
- De sterkste (mits meer dan 10%) pakken we, en daar corrigeren we ook
voor
- Leeftijd is nu een sterke confounder
- Het nieuwe model is dan BMI gecorrigeerd voor alcoholgebruik en leeftijd
- In een verslag moet je zowel je ongecorrigeerde als je gecorrigeerde
resultaten weergeven.
In het gecorrigeerde model: BMI is gecorrigeerd en dus onafhankelijk van alcohol
en leeftijd. Hij veranderd dus niet als de leeftijd of de mate van alcohol gebruik
veranderd.
Mogelijke tentamenvraag:
Is het nu (in het uiteindelijke model) nog zinnig om te kijken of er een lineair
verband is in alcoholgebruik?
Nee het is een categoriale variabele, dus dan hoef je dat niet te controleren.
Moet wel bij continue variabelen! Ook als het een confounder is!
Stel je hebt een continue variabele: je gaat onderzoeken of het een confounder
is:
Als deze wel lineair is: hou je hem als continue variabele
Als deze niet lineair is: doe je hem als dummy’s in je model (ook wanneer het een
confounder is)
LET OP: dummyvariabelen nooit APART opnemen in je model. Ze MOETEN altijd
bij elkaar blijven!
Effectmodificatie
Significant: opnemen in model
Doe je bij confounding niet, significantie beïnvloed dan niet of het wel
of geen confounder is. Bij effectmodificatie dus wel!
Alleen biologisch plausibele interacties
Stel je hebt twee mogelijke effectmodificatoren: je wilt met 1 toets weten of deze
twee effectmodificatoren zijn. Welke toets gebruik je?
-2LL-toets: je toetst dan meteen of er significante verschillen in het oude en
nieuwe model zitten.
Predictiemodel
Beste en meest eenvoudige model (combinatie van variabelen) om een bepaalde
uitkomstvariabele te voorspellen
GEEN confounding, maar het zijn voorspellers!
Verschillende procedures:
Forward selectieprocedure
Backward selectieprocedure
Combinatie
Forward:
2
, HC6 Methodologie II woensdag 10-12-2014
1. Alle mogelijke predictoren één voor één analyseren
2. De variabele met de laagste p-waarde selecteren.
3. Deze variabele toevoegen aan het nieuwe basismodel
4. Herhaal stap 1t/m3 totdat een vooraf aangegeven eindpunt is bereikt
- Determinant met hoogste wald waarde wordt als eerste in het model
geselcteerd
- Wordt vervolgens ook gedaan met de volgende variabele, met de eerste
variabele al opgenomen in het model.
- De determinanten moeten ALLEMAAL een significante relatie hebben met
de uitkomst
Backward
1. Begin met een zo groot mogelijk model
2. Verwijder de variabele met de hoogste p-waarde.
3. Herhaal stap 1 en 2 totdat een vooraf aangegeven eindpunt is bereikt
- De determinant met de hoogste p-waarde verwijder je eerst (deze heeft de
minste relatie met de uitkomst)
- Je stelt een grens p-waarde is. Bijvooreeld p=0,1 (10%).
- De determinatnen worden dan 1 voor 1 uit het model verwijderd.
Combinatie:
- Zullen we niet behandelen
Backward selectie: is de meest aanbevolen methode
- Sterkste correlatie met uitkomst blijven in je model.
Voordeel van een p-waarde van 5%: je houdt een kleiner model over.
Nadeel van p-waarde van 5%: je mist soms belangrijke variabele (vooral bij
forward selectie). Bij backward selectie heb je die variabele vaak wel
Vraag:
Welke van de variabele n leeftijd, sekse, BMI, rookgedrag, alcohol gebruik en
lichamelijke activiteit zijn (samen) in staat om totaal cholesterol concentratie te
voorspellen?
Vooraf bepalen welk eindpunt gebruikt wordt <0,05
Welke zal als eerste uit je model verdwijnen? (met backward selectie)
De determinant met de hoogste p-waarde moet uit het model. Model dan
opnieuw runnen en de determinant die dan de hoogste p-waarde heeft moet
eruit.
- Bij dummy’s moet je kijken naar de overall dummy, of (in het geval van
lineair) naar de dummy met de laagste p-waarde.
In het voorbeeld gaat eerst:
- Activiteit
- Dan alcohol
- Dan klaar, alles licht onder de 5%
Kwaliteit van een predictiemodel bij continue uitkomstvariabelen wordt meestal
aangegeven met de hoeveelheid verklaarde variantie
Bij lineaire regressiemodellen hebben we alleen de maat: verklaarde variantie.
Deze maat geeft aan hoeveel je in de spreiding van de uitkomst kunt verklaren
3
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller EvaStruijf. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.17. You're not tied to anything after your purchase.