Het analyseren van de relate ttssen een dichotome titkomstvariabele en andere variabelen
Logistsche regressieanalyse
Een dichotome titkomstvariabele kan gerelateerd worden aan allerlei verschillende determinanten
via de logistsche regressietechniek. Er kan niet zomaar een lineaire regressievergelijking van een
dichotome titkomstvariabele opgesteld worden (want is niet normaal verdeeld) , voorafgaand dient
deze eerst getransformeerd te worden in een aantal stappen:
1) In plaats van de dichotome titkomstvariabele nemen als titkomst ,wordt de kans op de
dichotome titkomstvariabele als titkomst genomen
2) In plaats van de kans op de dichotome titkomst, wordt de relateve kans op de titkomst als
titkomst genomen. Dit is de odds.
3) Omdat de odds een scheef naar rechtse verdeling heef, wordt er een logtransformate
titgevoerd
1
Uiteindelijke formtle: P ( Y dichotoom =1 )= −(b0+b1 x 1 +…)
1+e
Maximtm likelihood schatngsmethode: methode om de waarde van de regressiecoëfciënten te
schaten, waarbij de likelihood (aannemelijkheid) van het model zo groot mogelijk is.
- Likelihood: voor iedere persoon in het onderzoek op basis van de regressiecoëfciënten de kans
op de titkomst te berekenen en vervolgens al deze kansen met elkaar te vermenigvtldigen.
1
o P ( Y =1 )=
1+e b +b ∗x
0 1
Vervolgens wordt deze waarde omgezet naar een -2 log likelihood. Deze waarde moet zo laag
mogelijk zijn voor een zo hoog mogelijke maximtm likelihood. De absoltte waarde is niet relevant,
omdat die afankelijk is van de steekproefgroote.
Logistsche regressieanalyse met een dichotome determinant
Regressiecoëfciënt: het verschil in de titkomstvariabele ttssen de blootgestelde en de niet-
blootgestelden, in de vorm van een natttrlijk logaritme van de odds (kans op de titkomst gedeeld
door één mints die kans).
- b 1=ln ¿
o Omgezet naar: b 1=ln ¿)
Regressiecoëfciënt is gelijk aan de natttrlijke logaritme van de odds
rato.
- Door de e-macht te nemen ontstaat de oddsrato
odds (Y =1)blootgesteld
o exp ( b 1 )=
odds ¿¿
Betrotwbaarheidsinterval rondom efectmaat constrteren:
1. Ntlhypothese en alternateve hypothese opstellen
2. Z-waarde opzoeken
3. Betrotwbaarheidsinterval constrteren
a. Formtle BI:b 1 ± z1− ∝ ∗se(b1)
2
4. E-macht van BI nemen om zo BI van OR te berekenen
Wald toets:
1. Ntlhypothese en alternateve hypothese opstellen
2. Wald toetsingsgrootheid berekenen
, a. Formtle: Wald=¿
3. P-waarde opzoeken in tabel met chikwadraatverdeling met één vrijheidsgraad
Likelihood rato toets:
In de likelihood-rato-toets worden twee -2-log-likelihoods met elkaar vergeleken. Bijvoorbeeld het
model waarmee geen rekening wordt gehotden met de determinant en het model waarmee wel
rekening wordt gehotden met de determinant. Het verschil ttssen de twee -2-log-likelihoods volgt
een chikwadraatverdeling waarvan het aantal vrijheidsgraden gelijk is aan het verschil in aantal
parameters ttssen beide modellen. Uit dit verschil kan een p-waarde berekend worden.
Logistsche regressieanalyse met een categoriale determinant
Om een categoriale variabele te analyseren in een regressie analyse moeten er
dtmmyvariabelen gemaakt worden. Vervolgens moet de logistsche regressieanalyse
worden titgevoerd met alle dtmmyvariabelen, behalve 1.
Algemeen model: ln(odds (Y=1)) = B0 + b1 * dtmmy 1 + b2 * dtmmy 2
- B0: de natttrlijke logaritme van de odds op het hebben van de titkomst voor de determinant die
beide dtmmyvariabelen als 0 gecodeerd heef
- B1: het verschil in natttrlijke logaritme van de odds op het hebben van titkomst ttssen de
determinant die de eerste dtmmyvariabele met 1 en de tweede met 0 gecodeerd heef en de
determinant die beide dtmmyvariabelen met 0 gecodeerd heef.
- B2: het verschil in natttrlijke logaritme van de odds op het hebben van titkomst ttssen de
determinant die de eerste dtmmyvariabele met 0 en de tweede met 1 gecodeerd heef en de
determinant die beide dtmmyvariabelen met 0 gecodeerd heef.
Toetsing via:
- Overall wald toets
- Likelihood rato toets
Logistsche regressieanalyse met een contnue determinant
Toetsing via:
- Wald toets
- Likelihood rato toets
Intepretate odds rato: als de determinant van een persoon met 1 eenheid omhoog gaat, is
de odds op het hebben van de titkomst *getal* keer zo groot. Hierbij is er dts wel
aangenomen dat er een lineair verband bestaat.
- Odds rato omzeten naar meerdere eenheden:
o ¿ aantaleenheden =exp ¿
o O R aantal eenheden=¿
o in de dataset de determinant door het gewenst aantal eenheden delen
- betrotwbaarheidsinterval omzeten naar meerdere eenheden:
o BI [ ¿aantal eenheden ] =exp ¿
Controleren op lineariteit bij logistsche regressieanalyse
Nodig bij:
- Een contnte determinant
- Een categoriale determinant die als contnte variabele in het model is gestopt