Epidemiologie en biostatistiek II
College 1: Herhaling
Twee deeltentamens: 24 september en 23 oktober.
Case-control studie (ook wel patiënt-controle studie)
- Controles en cases komen uit één populatie.
- De controles en cases moeten vergelijkbaar zijn, andersom zou ook moeten kunnen
(dus een case moet een control kunnen zijn en andersom).
- In een case-control studie gebeurt de verdeling random.
Cohortstudie
- Je begint met een homogene groep menen waarbij de uitkomst nog moet optreden.
- Bij een cohortstudie mag je niet selecteren op uitkomst.
- Selectie bias = onderzoekers selecteren onderzoeksgroep op een hoog of laag risico.
Bij een prospectieve studie (in de toekomst volgen) relatief risico.
Bij geen prospectieve studie, maar één momentopname (zoals bij case-control) odds
ratio.
Confounding kun je controleren door stratificeren.
Stratificeren = verdelen van onderzoeksgroep in leeftijdsgroepen, per groep bekijk je de
relatie tussen uitkomstmaat en determinant. Wanneer het relatieve risico van iedere
leeftijdsgroep hetzelfde is, maar niet gelijk is aan de ruwe relatief risico, dan is er sprake van
confounding.
Dosis respons relatie = hoe meer van de variabele, hoe groter de uitkomst. Bij een grote
dosis respons, hoe groter de kans op een causaal verband.
Cohen’s kappa waarden:
1 = beide methoden doen precies hetzelfde.
-1 = beide methoden doen precies het tegenovergestelde.
0 = beide methoden hebben niets met elkaar te maken.
Positief voorspellende waarde = hoe groot is de kans dat de test positief is en de persoon
daadwerkelijk de ziekte/aandoening heeft.
Nulhypothese = H0 = ‘er is niets aan de hand’ = de oude en de nieuwe behandeling hebben
hetzelfde effect. De resultaten van de behandelingen zijn hetzelfde, niet één van de twee is
beter. De H0 wordt verworpen wanneer de p-waarde kleiner is dan alfa, dus wanneer de p-
waarde kleiner is dan 5% (0,05).
Alternatieve hypothese = H1 of Ha = de oude en de nieuwe behandeling hebben niet
hetzelfde effect. De ene behandeling is beter dan de andere behandeling.
,Tweezijdig testen = antwoord kan 2 kanten op; dit is eigenlijk altijd het geval. Wanneer je
onderzoek doet bij een groep en je wil weten wie er een HbA1c heeft boven de 5,5 mmol/L,
dan is het ook relevant om te weten wie eronder zit, dus dan toets je tweezijdig.
Eenzijdig testen = aantonen dat een methode altijd onder of juist boven een bepaald
resultaat zit. Bijv. je wil aantonen dat een dieet altijd leidt tot een HbA1c onder de 5,5
mmol/L.
Centrale limietstelling = bij grotere groepen, bij normale verdelingen (proporties van de
groepen).
Betrouwbaarheidsinterval = deze is meestal ongeveer 95%, dit betekent dat 95% van alle
intervallen, het werkelijke gemiddelde omvat. Als je een hogere kans wil, moet je het
interval breder maken. De betrouwbaarheid neemt namelijk toe (wordt groter) als het
interval breder is.
Continue verdeling = T-verdeling
Vrijheidsgraden = n – 1
Standaardfout = standaarddeviatie / wortel n (aantal waarnemingen)
Wanneer het aantal waarnemingen stijgt, daalt het aantal standaardfouten.
College 2: T-toets
Methodologie gaat over proces tussen wetenschappelijke vraag en antwoord daarop.
Methodologie is eenduidig (wil alternatieve verklaringen uitsluiten), objectief en praktisch.
Met een goed design optimaliseer je de afweging.
Met een goede analyse objectiveer je de conclusie.
Wetenschappelijke beslissingen maak je vaak op basis van statistische analyse, onder
statistische analyse vallen toetsen en betrouwbaarheidsintervallen:
Toets: ongenuanceerd (ja- of nee antwoord), is gebaseerd op tegenintuïtieve p-
waarden en een toets wordt gemaakt op basis van een H0.
Betrouwbaarheidsinterval: geeft plausibele waarden voor de populatieparameter
weer, heeft een vrij ingewikkelde interpretatie en is niet op basis van een H0, maar
wel bruikbaar voor toetsing.
Een statistische toets:
- Objectieve procedure
- Beperkt aantal gegevens
- Met behulp van modellen
- Door middel van kansuitspraken
- Met een statistische toets kun je beslissen of een hypothese over populatie wel of
niet door de gegevens wordt ondersteund.
Drie-eenheid van statistiek: het doel van een onderzoek is het doen van een uitspraak over
een populatie, je kunt echter niet de hele populatie onderzoeken, dus neem je een
steekproef uit de te onderzoeken populatie. Dit moet een realistische representatie zijn van
de populatie waar je een uitspraak over wil doen. Het onderzoek doe je m.b.v. een
wiskundig gereedschap, namelijk een model.
,Hypothese gaat over de populatie en niet over de steekproef! Want; wat er in een
steekproef gebeurt, is maar een representatie van de werkelijkheid. Steekproef en populatie
zijn dus niet direct vergelijkbaar.
Nulhypothese significantie toetsen (NHST)
- H0 = je verwacht dat er niets gebeurt (Bij Ha verwacht je dat er wel iets gebeurd).
- Toetsingsgrootheid = getal dat je uit je waarnemingen distilleert en waarop als
mogelijke uitkomst van het model onder H0 de (overschrijdings)kans kan worden
berekend.
- Overschrijdingskans = de p-waarde. Wat is de kans op je gevonden
toetsingsgrootheid of verder afwijkend van je verwachting onder H0? Onder een
bepaalde overschrijdingskans wordt de H0 verworpen, namelijk wanneer de
overschrijdingskans p < alfa.
Toetsingscriterium:
- De standaardkeuze voor overschrijdingskans is 5%.
- De grenswaarde noemen we alfa.
o De onbetrouwbaarheid
o De kans op een type I fout
o Het significatieniveau
- Gevonden p-waarde < a, dus verwerpen H0.
- Toets is een modus tollens met kanselement. Vb. A1 = als H0 klopt, dan bestaat er
een kleine kans op uitkomst X, A2 = ik heb desondanks uitkomst X gevonden, C = dan
klopt H0 niet.
- Een toetsstructuur forceert een statistische beslissing: maar een statistische
beslissing is nog geen wetenschappelijke beslissing, want daarvoor is een afweging
tegen andere informatie nodig (zoals natuurwetenschappelijke basis).
- P-waarde geeft alleen signaal:ruis-verhouding
- Een betrouwbaarheidsinterval zou inzicht geven in klinische relevantie van het
gevonden effect.
Betrouwbaarheidsinterval
, - Een interval van waarden voor een populatieparameter, gebaseerd op
steekproefuitkomsten, die op grond daarvan aannemelijk zijn.
- Daarbij gebruik je geen statistische hypothesen
o Het interval ligt rondom de steekproefparameter
o De standaardfout wordt gebruikt als schatting voor de variabiliteit van deze
parameter
o Het percentage betrouwbaarheid bepaalt de capture rate = het percentage
van alle mogelijk te verkrijgen intervallen dat de populatieverwachting
inderdaad omvat.
Vb. ik heb een 95% betrouwbaarheidsinterval voor de middelomtrek
van mannen tussen de 55 en 65 jaar. Als ik dit onderzoek eindeloos
herhaal bij steeds nieuwe steekproeven, dan zal 95% van alle
resulterende intervallen de werkelijke gemiddelde middelomtrek van
alle mannen tussen de 55 en 65 jaar omvatten.
Vb. je hebt een normale verdeling, u = 50 (steekproeven), o = 10 en n
= 10 (waarnemingen), 95% van de betrouwbaarheidsintervallen
overlapt u.
- Berekenen van betrouwbaarheidsinterval
o Voor numerieke variabelen: BI95% (µ) = x ± t95% * se
o Voor dichotome variabelen: BI95% (π) = p ± z95% * σp
o Let op! Altijd de t-verdeling bij numeriek en de z-verdeling bij dichotoom.
o Je ziet dat de formules steeds hetzelfde opgebouwd zijn, namelijk
puntschatting (gemiddelde) plus/min de toetsingsgrootheid (t-toets of z-
toets) * standaardfout.
o Het soort toetsingsgrootheid hangt af van het type variabele
Kwantitatieve variabelen: t-toets
Dichotome variabelen: z-toets
Procedures met de t-verdeling
(eenvoudige statistische technieken voor kwantitatieve gegevens)
Wanneer je voor een z- of een t-toets kiest, let je op:
- Het aantal steekproeven
- De afhankelijke en onafhankelijke variabelen
- Soort gegevens (nominaal-ordinaal-numeriek)
- Al dan niet herhaalde waarnemingen
- Vraagstelling
Je gebruikt de t-verdeling wanneer:
- Er een vergelijking wordt gemaakt met een normwaarde
- Je een analyse maakt van gepaarde waarnemingen
- Je een analyse maakt van twee groepen t.o.v. elkaar
- Je een analyse maakt van RCT-gegevens.
Voorwaarden voor het gebruik van de t-procedures:
1. Voorwaarde 1: gegevens zijn onafhankelijk.