SAMENVATTING KWO
HOORCOLLEGE 1. DIAGNOSTISCH ONDERZOEK
Onderzoek naar aan- of afwezigheid van een ziekte.
Start altijd met een patiënt met een klacht of symptoom.
Doel: efficiënt en snel stellen van de juiste diagnose
o Basis van medisch handelen: behandelingskeuze en prognose
We kijken bij diagnostisch onderzoek altijd naar de PREVALENTIE, anders gezegd VOORAF-KANS/A-PRIORI-KANS
Testuitslagen zeggen wat over de ACHTERAF-KANS/POSTERIOR-KANS, hoe groter de verschillen tussen vooraf- en
achterafkans, hoe beter de diagnostische waarde van de test.
Ideaal diagnostisch proces: eenvoudige test die posteriorkans naar 0% of 100% brengt.
De keuze bij voldoende zekerheid over aantonen/uitsluiten van een ziekte hangt af van de prognose indien de
ziekte onbehandeld blijft.
Niet alle mogelijke testen worden ingezet vanwege: belasting voor de pt, budget in de zorg en overbodigheid (veel
testen geven dezelfde info)
Je wilt weten welke testen werkelijk bijdragen aan de kansschatting. Een test moet de praktijk dienen
Standaard vraagstelling:
o Met welke eenvoudige, veilige en goedkope testen kunnen we de kans op aan- of afwezigheid van de
ziekte schatten?
Voorbeeld: Welke testen dragen bij aan kansschatting op aan- of afwezigheid van bacteriële
meningitis bij kinderen met nekstijfheid op de SEH?
o Uitkomst: kans op ziekte in %
Eindpunt: de werkelijke aanwezigheid of afwezigheid van ziekte (uitkomst)
De diagnostische uitkomst is altijd de uitslag van de referentietest. De referentietest is
niet onfeilbaar, maar altijd de beste beschikbare test in de praktijk op dat moment. Dus
naast alle te testen diagnostische testen, doe je altijd de gouden standaard.
o Determinanten: diagnostische testen, de te onderzoeken testen.
1 op 10 regel: 10 deelnemers nodig die de ziekte hebben per determinant. Dit relateer je aan
prevalentie.
Voorbeeld: prevalentie in de populatie is 10% en je slechts naar 1 determinant kijkt, heb
je 100 mensen nodig, waarvan 10 ziek zijn.
Determinant wordt gemeten zonder kennis op uitkomst, dus geblindeerd
o Domein: voor wie het onderzoek en de uitkomst van het onderzoek van toepassing is.
Genoemd moet worden:
Type patiënt
Bepaald symptoom of klacht
Bepaalde setting: sommige testen werken eerste-lijn heel goed maar in het ziekenhuis
bijvoorbeeld niet
Voorbeeld: Alle kinderen verdacht van bacteriële meningitis met nekstijfheid(kenmerk) in de
tweede lijn(setting)
Determinant-uitkomst relatie: de kans op ziekte als functie van testuitslagen
o Voorbeeld: BM% = f(leeftijd, geslacht, koorts, bloed leuco’s, bloed CRP, etc.)
, Onderzoekspopulatie: steekproef uit het domein. Het domein is vaak veel breder dan de specifieke
onderzoekspopulatie.
Onderzoeksontwerp
o Dwarsdoorsnede/ cross sectioneel onderzoek: de determinant en de uitkomst worden ongeveer op
hetzelfde tijdstip bepaald: is de ziekte aan- of afwezig?
o Observationeel: Geen manipulatie van de determinanten, je weet wat je meet;
o Descriptief: Geen causale relatie, zolang de determinant maar voorspelt: geen hypothese
werkingsmechanisme determinant-uitkomst;
o Meer dan een determinant
Data-analyse worden er 3 stappen doorlopen
o Stap 1: schatten van de a-prori kans(zonder test uitslagen), dus prevalentie in de groep
o Stap 2: vergelijken van elke testuitslag apart met de referentie = univariaat
Hoe minder foutpositieven en foutnegatieven hoe beter de test
o Stap 3: vergelijk combinatie van testuitslagen met referentie = multivariaat
Dit via een model: begin met de simpele test, bepaal de toegevoegde waarde testuitslag aan de
reeds verzamelde voorgaande testuitslagen (extra diagnostische informatie bij inzetten test)
Met behulp van “2 bij 2 tabellen” kunnen de verzamelde data tegen elkaar worden uitgezet
o Horizontaal aflezen voorspellende waarde van een test
o Verticaal aflezen sensitiviteit en specifiteit
o Positief voorspellende waarde: de kans dat de ziekte aanwezig is als de test positief is
VW+ = A[true positive]/totaal[horizontaal]
o Sensitiviteit: de kans dat de test positief is als de ziekte daadwerkelijk aanwezig is
A[True positive]/prevalentie
o Negatief voorspellende waarde: de kans dat de ziekte niet aanwezig is als de test negatief is.
VW- = D[true negative]/totaal [horizontaal]
o Specificiteit: de kans dat de test negatief is als de ziekte niet aanwezig is.
D[True negative]/ totaal[verticaal]
Ziekte + Ziekte - Totaal
Test + True positive [A] False positive [B]
Test - False negative [C] True negative [D]
Totaal prevalentie Totaal aantal
participanten
Sensitiviteit en Specificiteit zeggen iets over kwaliteit van de techniek. In de kliniek zijn vw+ en vw- meer
bruikbaar.
Geen enkele diagnose wordt gesteld aan de hand van 1 test in de praktijk. Een diagnostisch proces is
hiërarchisch, men begint dus met eenvoudig onderzoek en gaat stapsgewijs richting belastend en duur
onderzoek. Begin is dus altijd met de anamnese.
Het statische model is op te vatten als een samengestelde test. De diagnostische waarde van het model is
te kwantificeren met de oppervlakte onder de ROC-curve, ook wel AUC genoemd.
o Stippellijn = flipping coin line [HC geeft verder uitleg terugluisteren]
o Hoe groter de ROC-oppervlakte hoe beter het model. De AUC-range loopt van 0.5 tot 1.0,
hiervoor geldt:
AUC > 0,7 = redelijk;
AUC > 0,8 = goed;
AUC > 0,9 = uitstekend;
, AUC =1,0 = perfect (komt in de praktijk niet voor)
o Soms willen we weten wat de diagnostische toegevoegde waarde is van een nieuwe test. Het
bestaande model wordt uitgebreid en de verandering in AUV wordt gekwantificeerd. Wanneer de
ROC-waarde groters is voor het nieuwe model, dan heeft de nieuwe test een diagnostisch
toegevoegde waarde.
OEFENOPDRACHTEN DIAGNOSTISCH ONDERZOEK
WEEK 1. OEFENINGEN COLLEGE DIAGNOSTISCH ONDERZOEK
A. OEFENING 1
Deze oefening is gebaseerd op het volgende onderzoek:
Draaisma JMTh, Lemmen van RJ, Jong AAM de, Doesburg W. Temperatuurmeting bij kinderen: met de trommelvlies-
infraroodmeter en de rectale kwikthermometer even goede resultaten op de spoedeisendehulp-afdeling. Ned Tijdschr
Geneeskd 1997;141:938-941.
Dit is een goed voorbeeld van zogenaamd testonderzoek. In testonderzoek worden de testeigenschappen van twee
diagnostische testen vergeleken. Dit soort onderzoek geeft geen antwoord op de vraag wat de additionele waarde is van de
test voor het stellen van een diagnose.
De onderzoeksvraag was, of met behulp van een nieuwe trommelvlies-infraroodmeter accuraat de aanwezigheid van koorts
kan worden gesteld bij kinderen jonger dan 11 jaar. In dit onderzoek werden in totaal 213 kinderen jonger dan 11 jaar
gezien op een afdeling spoedeisende hulp van een algemeen ziekenhuis. Bij alle kinderen werd de temperatuur gemeten
met de conventionele rectale kwikthermometer (RKT) en de nieuwe trommelvlies-infraroodmeter (TIM). De RKT werd als
gouden standaard beschouwd en koorts werd voor beide methoden gedefinieerd als een afgelezen temperatuur hoger dan
38° C.
Het gemiddelde verschil tussen de temperatuur gemeten met de TIM en de RKT was nihil. Bij 96 kinderen werd volgens de
gouden standaard koorts geconstateerd. Volgens de TIM waren er 86 kinderen met koorts van wie 77 ook koorts hadden
volgens de RKT.
, 1. Formuleer de onderzoeksvraag in termen van determinant en uitkomst relatie. Wat is het domein?
2. Bereken de sensitiviteit en specificiteit van de TIM.
Referentie-test staat boven aan “als ziekte” in dit geval
3. Bereken de positief en negatief voorspellende waarde van de TIM.
4. Wat verwacht u van de voorspellende waarden als deze nieuwe thermometer in de
huisartsenpraktijk wordt toegepast?
5. Wat zijn de overwegingen in termen van voorspellende waarden voor toepassing van de TIM in de
huisartsenpraktijk? Wat vindt u belangrijker, de positief of de negatief voorspellende waarde?
A. OEFENING 2
Deze oefening is gebaseerd op het volgende onderzoek:
Barenys M, Abad A, Pons JM, Moreno V, Rota R, Granados A, Admetlla M, Pique JM. Scoring system has
better discriminative value than Helicobacter pylori testing in patients with dyspepsia in a setting with high
prevalence of infection. Eur J Gastroenterol Hepatol. 2000;12:1275-82 2
,Een internist verbonden aan een perifeer ziekenhuis krijgt een vrouw van 50 jaar op de polikliniek gastroenterologie
verwezen in verband met borende pijn in het epigastrium.
De klachten bestaan al enkele maanden, zijn vooral ’s nachts aanwezig en worden
tijdelijk minder na het eten. Haar moeder had iets dergelijks gehad maar details ontbreken.
De verdere anamnese vermeldt geen bijzonderheden. Alcoholgebruik: minimaal. Roken: neen. Medicatie: gemiddeld 3 maal
per week ibuprofen (een NSAID) voor haar knieklachten.
De internist denkt aan een zweer van de maag of de 12-vingerige darm (ulcus pepticum). Opgeleid in een moderne
‘Evidence-Based Medicine’ omgeving besluit de internist een diagnostische score te gebruiken om de patiënt als hoog of
laag ulcus risico te kunnen classificeren. Dit heeft immers de consequentie van respectievelijk wel of geen endoscopie. De
diagnostische score die de internist wil gebruiken is opgebouwd uit anamnestische gegevens en werd in de vorm van een
tabel gepresenteerd:
Indicator Punten
Leeftijd > 40 jaar 1
Mannelijk geslacht 1
Alcohol gebruik > 30 gram / dag 1
Roken > 10 sigaretten per dag 1
NSAID gebruik > 2 doses / week 2
Episodische pijn in epigastrium 1
Pijn neemt af na eten 2
Eerdere ulcus diagnose 2
De score is de som van de punten. De positief voorspellende waarde bij score 3 is 57% en de
negatief voorspellende waarde is 89% (score < 3 is 11% kans op peptisch ulcus). De voorafkans is
25%.
1. De bovenstaande tabel is het resultaat van een diagnostisch wetenschappelijk onderzoek. Hoe
zou dat onderzoek eruit hebben gezien (ontwerp, uitkomst, determinanten)?
2. De internist, die inmiddels een kopie van deze tabel uit de bureaulade heeft getrokken, merkt dat het
gegeven ‘episodische pijn’ van de patiënt nog ontbreekt. Hij vraagt hiernaar en krijgt een ontkennend
antwoord. Tot welk domein behoort deze patiënte?
3. Wat is de score van de patiënte en wat is haar risico op peptisch ulcus? Neem daarbij aan dat het domein
van de patiënte overeenkomt met dat van de patiënten waarvoor de anamnestische score bedoeld is.
4. Wat is uw bezwaar tegen deze wijze van presenteren van een gedichotomiseerde (= in tweeën
gedeelde) score?
, 5. De internist gebruikt deze score en handelt naar bevinden. Tijdens het golfen bespreekt hij de patiënte met
een collega die stelt dat een C-14-ureum-ademtest op H. Pylori veel informatiever is. Hij zegt dat de
sensitiviteit van deze test 80% en de specificiteit 85% is voor ulcuslijden. Bereken met behulp van een
kruistabel en een denkbeeldige populatie van 100 patiënten uit ovengenoemd domein de positief en
negatief voorspellende waarde van de ademtest. Neem hierbij aan dat de voorafkans op een ulcus in dit
domein ook 25% is.
H.pylori + H.pylori - totaal
C-14 + 20 11 31
C-14 - 5 64 69
totaal 25 75 100
Voorafkans = 25% = prevalentie
100 deelnemers dus 25 mensen die H.pylori+ zijn
H.pylori - te achterhalen door prevalentie 25 van 100 af te halen (100 - 25) = 75
Met sensitiviteit TP achterhalen 25 * 0,8 = 20
Met specificiteit TN achterhalen 75 * 0,85 = 64
Zo is de rest te achterhalen ivm met totale aantallen.
VW+ = 20/(20+11) * 100 = 64,5% 65%
VW- = 64/ (64+5) * 100 = 92,8% 93%
6. Wat vindt u van de diagnostische waarde van de ademtest op H. Pylori vergeleken met de aamnestische
score? Waarom is de vraag welke van de twee “testen” de voorkeur heeft niet de klinisch relevante
vraag? Welke is deze vraag dan wel?
7. Hoe zou u de ‘klinisch relevante vraag’ genoemd bij vraag 5 kunnen onderzoeken? Beschrijf kort het
onderzoeksopzet. Vermeld ook de determinant-uitkomst relatie(s).
8. In het onderzoek waarin de score werd beschreven is ook de toegevoegde waarde van de ademtest
onderzocht. De toegevoegde waarde bleek nihil. Hoe is dit te verklaren?
9. Is het in een onderzoek naar de toegevoegde waarde van de ademtest noodzakelijk (voor de
validiteit) dat de beoordelaar van de ademtest niet op de hoogte is van het resultaat van de
anamnestische score? Zo ja, waarom?