Output lineaire regressieanalyse
Lineaire regressieanalyse met een dichotome
determinant
Relatie tussen lichamelijke activiteit en BMI.
Codering:
- 0 = persoon voldoet niet aan de norm voor lichamelijke activiteit
- 1 = persoon voldoet wel aan de norm voor lichamelijke activiteit
B0 = 24,576 = dit is de waarde van BMI als de lichamelijke activiteit variabele gelijk is aan 0.
Oftewel, dit is de gemiddelde BMI voor personen die niet aan de norm voor lichamelijke
activiteit voldoen.
B1 = -0,139 = dit is het verschil in BMI als de lichamelijke activiteit variabele met 1 eenheid
verschilt. Oftewel, dit is het verschil in BMI tussen personen die wel en personen die niet
aan de norm voor lichamelijke activiteit voldoen.
Vervolgens zie je voor beide regressiecoefficienten de standaardfouten. Deze is eigenlijk
alleen interessant voor B1. En die wordt de Standard error of the mean genoemd.
Op basis van de b1 en de corresponderende standaardfout kan de t-waarde berekend
worden, door b1 / SE = t (=-0,800).
Op basis van de t-waarde kan de P-waarde worden bepaald.
Ook op basis van de B1 en de corresponderende SE kan het 95%BI berekend worden.
De standardized coefficient beta is de correlatiecoefficient tussen lichamelijke activiteit en
BMI. Deze waarde is zeker in het geval van een dichotome onafhankelijke variabele NIET
interessant.
,Lineaire regressieanalyse met een categoriale
determinant
De gemiddelde cholesterolconcentratie van de niet-drinkers is gelijk aan 4,863 (b0).
Het verschil tussen matige drinkers en de niet-drinkers is -0,575 (b1).
Het verschil tussen zware drinkers en niet-drinkers is 0,318 (b2).
Vervolgens kan je voor de verschillende groepen de gemiddelde cholesterolconcentraties
berekenen:
- Voor matige drinkers: 4,863-0,575 = 4,288 mmol/L
- Voor zware drinkers: 4,863+0,318 = 5,181 mmol/L
,Lineaire regressieanalyse met een continue
determinant
Er is een sterke significante relatie tussen cholesterol en leeftijd (p<0,001), de associatie is
positief en voor ieder leeftijdsverschil van 1 jaar verschilt de cholesterolconcentratie met
0,021 mmol/L. het 95%BI voor de relatie tussen leeftijd en cholesterol loopt van 0,010 tot
0,031 wat betekent dat de werkelijke relatie tussen cholesterol en leeftijd met 95%
zekerheid tussen de 0,010 en de 0,031 mmol/L ligt.
Controle lineariteit bij lineaire-regressieanalyse met een continue determinant
Categoriseer de continue determinant op basis van bijvoorbeeld kwartielen. Vervolgens
maak je op basis van deze nieuwe categoriale variabelen 3 dummyvariabelen en analyseer
je die met behulp van een lineaire regressieanalyse.
,De regressiecoefficienten geven de gemiddelde verschillen in cholesterolconcentratie tussen
de leeftijdskwartielen met dummyvariabelen ten op zichte van het eerste leeftijdskwartiel
(zonder dummyvariabele in het model/de b0).
De regressiecoefficient van de eerste dummyvariabele (0,531) geeft het verschil in
gemmiddelde cholesterolconcentratie tussen het eerste en het tweede leeftijdskwartiel.
Enz.
Vanwege de regressiecoefficient van de derde dummyvariabele, die weer lager is dan de
regressiecoefficient van de tweede dummyvariabele, kan je concluderen dat de relatie
tussen cholesterol en leeftijd niet lineair is.
regressiecoefficienten in lineaire regressieanalyse worden geschat met behulp van de
kleinstekwadratenmethode.
, Output logistische
regressieanalyse
Logistische regressieanalyse met een dichotome
determinant
Relatie tussen roken en het hebben van een hartinfarct.
Codering: niet roker = 0, wel roker = 1
B1 = 0,318 = dit getal zegt iets over de relatie tussen roken en het hebben van een
hartinfarct.
Een verschil van 1 eenheid in roken is geassocieerd met een verschil van 0,318 eenheden in
de uitkomstvariabelen. Oftewel rokers hebben een 0,318 hogere natuurlijke logaritme van
de odds op het hebben van een hartinfarct vergeleken met de niet-rokers.
Omdat het hier gaat over een logistisch regressiemodel, moeten we de regressiecoefficient
omzetten naar de oddsratio. Dit doen we door de e-macht te nemen van b1.
De oddsratio Exp(B) is in dit voorbeeld 1,374. Dit is de oddsratio voor roken ten opzichte van
niet roken om een hartinfarct te hebben.
De standaardfout (0,281) kan gebruikt worden om de Wald-statistic te berekenen.
De Wald-statistic is gedefinieerd als de regressiecoefficient gedeeld door de standaardfout
in het kwadraat. B1/standaardfout in het kwadraat = Wald-statistic.
(0,318/0,281)^2 = 1,282
Vervolgens kan je op basis van de Wald-statistic en de chikwadraatverdeling met 1
vrijheidsgraad de P-waarde van 0,258 bepalen.
Naast de OR voor roken vind je het 95%BI rond deze OR. Deze loopt van 0,792 tot 2,383.