STATISTIEK 3
LES 1: META-ANALYSES.............................................................................................2
LES 1: META-ANALYSES.............................................................................................2
LES 2: POWER AND SAMPLE SIZES..........................................................................5
LES 2: POWER AND SAMPLE SIZES..........................................................................5
LES 3: RELATIEF RISICO (RR) EN ODDS RATIO (OR)..............................................8
LES 3: RELATIEF RISICO (RR) EN ODDS RATIO (OR)..............................................8
LES 4: LINEAIRE REGRESSIE...................................................................................13
LES 4: LINEAIRE REGRESSIE...................................................................................13
LES 5: LOGISTISCHE REGRESSIE EN ROC............................................................23
LES 5: LOGISTISCHE REGRESSIE EN ROC............................................................23
LES 6: BETROUWBAARHEID....................................................................................31
LES 6: BETROUWBAARHEID....................................................................................31
LES 7: ANOVAS..........................................................................................................37
LES 7: ANOVAS..........................................................................................................37
,LES 1: META-ANALYSES
META-ANALYSES
Overload aan gelijkaardige wetenschappelijke artikels.
↳ vb: effect bepaalde therapie (experimentele groep) tov standaard therapie (controle groep)
Systematische review Meta-analyse
- om overzicht te krijgen van de - om globaal resultaat te vinden obv
literatuur in 1 vakgebied beschikbare artikels
- GEEN statistiek - WEL statistiek
Meta-analyse = statistische combinatie vd resultaten van 2 of meer onderzoeken/studies
Belangrijkste doeleinden van meta-analyse
● de sterkte van verbanden voor een reeks studies bepalen en, indien mogelijk, combineren
tot 1 enkele algemene indicator voor het verband
● de invloed bepalen van verschillende kenmerken van de desbetreffende studies (type steekproef,
soort methode, …) op de sterkte van de gevonden verbanden in die studies
Effect size (ES)
● alle resultaten teruggebracht naar eenzelfde statistische eenheid: ES
● ES drukt de in de studie gevonden verschillen tussen groepen uit in standaardscores, met de
spreiding van de controlegroep als eenheid
● de resultaten van de verschillende studies kunnen onder die vorm bewerkt worden naar
gemiddelde effecten toe, in soortgelijke studies, of naar verschillen in ES tussen studies met
onderling contrasterende groepen, en daartoe zelfs ingebracht in statistische toetsen
● ‘oude' data worden dus na weging samengebracht en samen gebruikt in nieuwe
bewerkingen
Voordelen en nadelen meta-analyse
Voordelen Nadelen
➔ om ‘power’ te verhogen (# participanten N ↗) ➔ “geen appelen met peren vergelijken”
➔ ↗ kans op significantie van echte effecten ➔ misleidende resultaten door bias
➔ nauwkeurigheid verhogen (versmallen CI)
➔ antwoorden te vinden op vragen die niet
gesteld zijn bij de individuele studies
➔ om tegenstrijdigheden tussen studies te
bestuderen
Resultaten kwantificeren, samenbrengen en vergelijken ⇒ ES = standaardscore ⇒ nieuwe globale
resultaten over meer elementen (N)!
,Een complete meta-analyse bestaat uit…
● probleemstelling
● literatuurverzameling
● screening aan de hand van welomschreven in- en exclusie regels (methodologie!!!)
● inhoudelijke studie van de weerhouden studies
● berekening van de effectgroottes (ES)
● statistische verwerking
● rapportering
Voorbeeld 1: Effect oefentherapie op pijnklachten bij artrose
Algemeen
● vierkant → gemiddelde
● lijn → 95% betrouwbaarheidsinterval
● groen → + effect oefentherapie
● rood → - effect oefentherapie
● 95% lijn overschrijdt grens → niet significant
● 95% lijn overschrijdt grens niet → significant verschil tussen oefentherapie en
conventionele therapie
● meta-analyse → ruit → mag niet overlappen met de te testen waarde
Individuele studie
● betrouwbaarheidsinterval (volle lijn) overlapt met de te testen waarde (p¿0,05)
➢ GEEN significant effect
● betrouwbaarheidsinterval (volle lijn) overlapt niet met de te testen waarde (p≤ 0,05)
➢ WEL significant effect
De te testen waarde
● 0: z-score, gemiddeld verschil
● 1: RR,OR
Meta-analyse
● betrouwbaarheidsinterval (uiteinden ruit) overlapt met de te testen waarde (p¿0,05)
➢ GEEN significant effect
● betrouwbaarheidsinterval (uiteinden ruit) overlapt niet met de te testen waarde (p≤ 0,05)
➢ WEL significant effect
,2: HETEROGENITEIT
2 types meta-analyses
1. fixed-effect methode
2. random effect methode
Homogeniteit = alle studies hebben een gelijkaardig effect en het verschil in variantie is te
verklaren door toeval/meetfouten
⇒ fixed-effect methode
Heterogeniteit = alle studies hebben verschillend effect en het verschil in variantie is niet te
verklaren door toeval/meetfouten
⇒ random-effect methode
heterogeniteit:
● statistisch model random-effect methode houdt er rekening mee dat het ware effect van de
individuele studies kan verschillen en zal een breder betrouwbaarheidsinterval opleveren en
dus minder snel een significant resultaat opleveren ivm fixed-effect model
● zeer moeilijk om te bepalen of studies homogeniteit of heterogeniteit vertonen
2 manieren om een indicatie van de mate van heterogeniteit te testen
Cochran's Q = een toetsingsgrootheid gebaseerd op een chi-kwadraat test
- H0-hypothese: alle studies hebben hetzelfde effect
- p > 0,05: eerder homogeniteit
- p ≤ 0,05: eerder heterogeniteit
I²-waarde = % effect dat niet door het toeval kan verklaard worden, de heterogeniteit
wordt gescoord tussen 0-100% met volgende interpretatie:
- <25% = lage heterogeniteit
- 25-50% = matige heterogeniteit
- > 75% = hoge heterogeniteit
In theorie: obv cochran's Q test
● p > 0,05 → homogeniteit → fixed-effect methode
● p ≤ 0,05 → heterogeniteit → random-effect methode
● bevestigen aan de hand van I²-waarde
In praktijk
● zowel Cochran’s Q en I2 vertonen weinig power en zullen dus in sommige gevallen geen
heterogeniteit aantonen wanneer die wel aanwezig is
● nooit “perfecte” (100%) homogeniteit of heterogeniteit
● afweging tussen fixed-effect en random-effect methode
● afweging tussen Cochran’s Q en I2-waarde
, ● bij een beperkt aantal ingesloten onderzoeken (veelal tot 10) kan de heterogeniteit
statistisch niet uitgesloten worden, daarom opteert men hiervoor random effect
FUNNEL PLOT
● gebruik: om te checken voor publicatiebias
● een funnel plot geeft de studies weer van de meta-analyse
in een grafiek van Mean difference vs standaardfout
● x-as: gemiddeld verschil / standaard mean difference
(algemeen gemiddelde volle lijn)
● y-as: standaardfout van de meting
● bij grote afwijking van het gemiddelde → grotere stdev
(spreiding)
● bij studies met grote steekproef → gemiddelde verschil dicht bij volle lijn en stdev is klein
● vorm van een piramide → indien niet: publicatiebias
● publicatie bias → als alle studies LI van lijn zeer verspreid zijn en RE dicht opeen
LES 2: POWER AND SAMPLE SIZES
INLEIDING
In medisch wetenschappelijk onderzoek:
⇒ Bepalen hoe groot de steekproef moet zijn alvorens te starten
● sample size berekeningen (steekproefgrootte berekeningen)
● experimenteel onderzoek
● voorwaarde publicatie wetenschappelijk tijdschrift (CONSORT-statement)
Sample size berekening:
● Hoeveel personen moet de interventiegroep en controlegroep bevatten om een vooraf
vastgesteld verschil (effect) tussen beide groepen statistisch significant te laten zijn
● formule afhankelijk van continue of dichotome uitkomstvariabele
● significantie α: meestal 5%
● power 1-ß: meestal tussen 80%-95%
● power niet lager dan 80% kiezen
● standaardafwijking: schatting uit de literatuur van een gelijkaardig onderzoek of uit een
eerder uitgevoerde pilot studie
CONTINUE UITKOMSTVARIABELEN
beide groepen even groot beide groepen niet even groot
Even grote groepen:
● n1 = grootte interventiegroep
,● n2 = grootte controlegroep
α α
● Z1 - = waarde van standaardnormale verdeling waarvoor geldt dat (1 - )% van de
2 2
verdeling ervoor ligt
ß ß
● Z1 - = waarde van de standaardnormale verdeling waarvoor geldt dat (1 - )% van de
2 2
verdeling ervoor ligt
● σ² = variantie van de continue uitkomstvariabele
● v = te verwachten verschil in de continue uitkomstvariabele tussen de interventiegroep en
controlegroep
v
● effect size =
σ
,Beide groepen niet even groot:
● n1 = grootte interventiegroep
● n2 = grootte controlegroep
● r = verhouding tussen de aantallen in de controlegroep tov de interventiegroep
α α
● Z1 - = waarde van standaardnormale verdeling waarvoor geldt dat (1 - )% van de
2 2
verdeling ervoor ligt
ß ß
● Z1 - = waarde van de standaardnormale verdeling waarvoor geldt dat (1 - )% van de
2 2
verdeling ervoor ligt
● σ² = variantie van de continue uitkomstvariabele
● v = te verwachten verschil in de continue uitkomstvariabele tussen de interventiegroep en
controlegroep
⇒ Evenveel patiënten in de interventiegroep als in de controlegroep is het meest effectief
DICHOTOME UITKOMSTVARIABELEN
beide groepen even groot beide groepen niet even groot
Even grote groepen:
● n1 = grootte interventiegroep
● n2 = grootte controlegroep
α α
● Z1 - = waarde van standaardnormale verdeling waarvoor geldt dat (1 - )% van de
2 2
verdeling ervoor ligt
ß ß
● Z1 - = waarde van de standaardnormale verdeling waarvoor geldt dat (1 - )% van de
2 2
verdeling ervoor ligt
● p1 - p2 = te verwachten verschil in percentage events in de interventie en controlegroep
● p = gemiddelde percentage events in de interventiegroep en de controlegroep
(dus p . (1- p ) is de variantie)
Beide groepen niet even groot:
● n1 = grootte interventiegroep
● n2 = grootte controlegroep
● r = verhouding tussen de aantallen in de controlegroep tov de interventiegroep
α α
● Z1 - = waarde van standaardnormale verdeling waarvoor geldt dat (1 - )% van de
2 2
verdeling ervoor ligt
, ß ß
● Z1 - = waarde van de standaardnormale verdeling waarvoor geldt dat (1 - )% van de
2 2
verdeling ervoor ligt
● p1 - p2 = te verwachten verschil in percentage events in de interventie en controlegroep
● p = gemiddelde percentage events in de interventiegroep en de controlegroep
(dus p . (1- p ) is de variantie) (let op: gewogen gemiddelde)
OPMERKINGEN
● in realiteit: sample size berekeningen aanpassen aan de mogelijkheden?
● hou rekening bij het vastleggen van je aantallen met eventuele uitvallers
● kleine verandering in de aannames (die men doet voor de berekening) kan leiden tot een
groot verschil in de benodigde sample size
● doel meta-analyse: sample size zo groot mogelijk maken om een zo betrouwbaar mogelijke
conclusie te trekken
● bij iedere onderzoek streven naar een zo groot mogelijke steekproef?
⇒ goed voor de statistiek, maar er spelen nog andere factoren
● sample size hangt dikwijls af van logistieke, financiële, ethische… aspecten
● vakgebied revaki: α = 5% en ß = 20% (power 1 - ß = 80%)
LES 3: RELATIEF RISICO (RR) EN ODDS RATIO (OR)
COHORTSTUDIE ⇒ RR
● meestal prospectief (kan ook retrospectief)
● observationele studie
● gezond-instap effect
● alle personen uit een bepaalde ‘groep’ (cohort) worden over een groot aantal jaren gevolgd
● cohort: zelfde kenmerk
● personen die al of niet een risicofactor hebben worden in de tijd gevolgd en er wordt
gekeken of ze al dan niet de ziekte of het probleem of een andere outcome ontwikkelen
● ‘Risico-analyse’
Voordelen Nadelen
➔ RR kan berekend worden ➔ hoge kosten door de lange opvolging
➔ verschillende factoren kunnen ➔ grote steekproefgrootte nodig bij
gedetailleerde info geven zeldzame ziekten
➔ verandering van blootstelling ifv de tijd ➔ # drop outs ↗ (door de lange opvolging)
kan gemeten worden ➔ proefpersonen kunnen gedrag
➔ geen recall bias of selectiebias aanpassen vd risicofactor → bias
➔ de ziekte kan veranderen ifv de tijd
,⇒ dichotome variabelen
⇒ 'risicofactor' is dus de kans
a
Risicoblootgesteld =
a+c
● kans dat je ziek wordt als je bent blootgesteld aan de risicofactor, voorwaardelijke kans
● Risicoblootgesteld =kans (ziek /blootgesteld)
¿ P(ziek /blootgesteld )
¿( ziek en blootgesteld)
¿
¿ blootgesteld
b
Risiconiet−blootgesteld =
b+d
● kans dat je ziek wordt als je niet bent blootgesteld aan de risicofactor
a
Risico blootgesteld a+ c a .(b+d )
Relatief risico=RR= = =
Risiconiet−blootgesteld ❑ b b .( a+c)
b+d
P(ziek /blootgesteld)
● stel RR ⇒ 2 =
P ( ziek / niet−blootgesteld )
● dus teller > noemer
● dus kans dat je ziek bent als blootgesteld > kans dat je ziek bent als niet blootgesteld
● 2 . P( ziek /niet−blootgesteld )=P(ziek /blootgesteld)
RR = 1 risico is hetzelfde in de 2 groepen (blootgesteld en niet-blootgesteld)
RR > 1 verhoogd risico in de blootgestelde groep tov de niet-blootgestelde groep om
ziekte/probleem/outcome te krijgen of te ontwikkelen
, RR < 1 verlaagd risico in de blootgestelde groep tov de niet-blootgestelde groep om
ziekte/probleem/outcome te krijgen of te ontwikkelen
Berekening RR in SPSS
● ja = 0
● nee = 1
● onafhankelijke variabele = rij
● afhankelijke variabele = kolom
Is het relatief risico significant verschillend van
1?
- H0 ⇒ RR = 1
- 1 ∉ 95% betrouwbaarheidsinterval
- 1 ∉ [1,602 ; 2,485]
DUS
- p ≤ 0,05
- H0 verwerpen - H1 aanvaarden
- RR ≠ 1 - RR = 2
Bvb. ⇒ Man die ooit gerookt heeft, heeft 2x zoveel risico op hartinfarct als iemand die nooit gerookt heeft.
Procent punt
0,3
● stel RR ⇒ 0,75 =
0,4
● tussen 0,3 en 0,4 zit 0,10 ⇒ 0,30 is 10 procentpunt kleiner dan 0,40
● 0,3 is ¾ van 0,4 (reductie 25%) ⇒ 0,30 is 25% kleiner dan 0,40
● van 40% naar 20% ⇒ 50% minder en 20 procentpunt minder
CASE CONTROL STUDIE ⇒ OR
● retrospectief
● observationeel
● bij personen die al of niet een ziekte hebben, wordt er gekeken of ze al dan niet aan een
risicofactor hebben blootgestaan
Voordelen Nadelen
➔ vlug, gemakkelijk, goedkoper ➔ recall bias
➔ zeldzame ziekten ➔ niet voor zeldzame blootstellingen
➔ brede waaier aan factoren kan worden ➔ ziekte mag niet aanwezig zijn voor de
onderzocht blootstelling aan de factor
➔ geen verlies van proefpersonen (bias)