Analýza dat v neurologii
XXVI. Hodnocení diagnostických testů – věrohodnostní poměr a diagnostický poměr šancí
Autoři:
L. Dušek; T. Pavlík; J. Jarkovský
; J. Koptíková
Působiště autorů:
Institut biostatistiky a analýz, Masarykova univerzita, Brno
Vyšlo v časopise:
Cesk Slov Neurol N 2011; 74/107(2): 221-225
Kategorie:
Okénko statistika
V minulém díle seriálu jsme otevřeli novou kapitolu zaměřenou na hodnocení diagnostických testů. Představili jsme nové ukazatele správnosti a diagnostické síly testů, které produkují binární data (výstupy typu ano/ne; zdravý/nemocný apod.). Zároveň jsme doložili, že žádný jednotlivý ukazatel nepřináší zcela vyčerpávající informaci o kvalitě testu, a je tedy vysoce doporučeno je kombinovat. Krátce připomeňme hlavní ukazatele a jejich význam:
- Senzitivita: schopnost testu správně diagnostikovat nemocného člověka. Vyjadřuje pravděpodobnost, že test bude pozitivní u skutečně nemocných lidí. Počítáme ji jako podíl počtu pozitivních výsledků testu u nemocných a celkového počtu nemocných lidí.
- Specificita: schopnost testu negativně vyhodnotit zdravé pacienty. Vyjadřuje pravděpodobnost, že test bude negativní u zdravých lidí. Počítáme jako podíl počtu negativních výsledků testu u zdravých jedinců a celkového počtu zdravých lidí.
- Pozitivní prediktivní hodnota: podíl správně pozitivních výsledků ze všech pozitivních výsledků testu. Vyjadřuje pravděpodobnost, že člověk je skutečně nemocný při pozitivním testu.
- Negativní prediktivní hodnota: podíl správně negativních výsledků ze všech negativních výsledků testu. Vyjadřuje pravděpodobnost, že člověk je zdravý při negativním testu.
V tomto díle rozšíříme výše uvedenou sadu ukazatelů o tzv. věrohodnostní poměr („likelihood ratio“, LR). Věrohodnostní poměr je podílem pravděpodobnosti výskytu jevu 1 za platnosti určité podmínky (jev 2 nastal) a pravděpodobnosti výskytu jevu 1, pokud daná podmínka neplatí (jev 2 nenastal). Z diagnostického hlediska tak hodnotíme věrohodnost, že výskyt sledovaného klinického znaku (symptomu) je vázán na výskyt určitého onemocnění. V matematické statistice věrohodnostní poměr obecně znamená podíl dvou pravděpodobností, které jsou výsledkem dvou různých modelů.
Pro hodnocení diagnostických testů můžeme věrohodnostní poměr definovat následovně:
[pravděpodobnost, že test dosáhne daného
výsledku u nemocných pacientů]
LR = --------------------------------------------------
[pravděpodobnost, že test dosáhne
daného výsledku u zdravých osob]
V našem hodnocení může diagnostický test nabídnout pouze dva typy výstupů, pozitivní a negativní. Rozlišujeme tedy LR+ (LR pro pozitivní test) a LR– (LR pro negativní test):
- Pro pozitivní výstup testu vyjadřuje LR podíl pravděpodobnosti, že nemocný pacient je testem diagnostikován jako pozitivní, a pravděpodobnosti, že zdravý pacient je chybně diagnostikován jako pozitivní.
LR+ = senzitivita / (1 – specificita)
- Pro negativní výsledek testu LR vyjadřuje podíl pravděpodobnosti, že nemocný pacient je testem chybně diagnostikován jako negativní, a pravděpodobnosti, že zdravý pacient je diagnostikován jako negativní.
LR– = (1 – senzitivita) / specificita
Věrohodnostní poměr značený jako LR+ tedy vyjadřuje schopnost pozitivního výsledku testu odlišit nemocného a zdravého jedince. Naopak věrohodnostní poměr značený jako LR– vyjadřuje obrácenou situaci, kdy test mylně označí nemocného jedince za zdravého (viz příklad 1). Z definice tedy vyplývá, že u kvalitního testu je LR+ žádoucí co nejvyšší a naopak LR– co nejnižší. V literatuře lze najít zdůvodnění, že hodnoty LR+ > 10 a naopak hodnoty LR– < 0,1 umožňují věrohodné určení nebo vyloučení nemoci na základě daného testu (McGee, 2002). Vysoká hodnota LR+ jasně ukazuje na test, který poskytuje vysokou jistotu v určení nemoci, i přesto však není 100% zárukou, že osoba s pozitivním testem musí být vždy nemocná.
Výpočet věrohodnostního poměru pro různé výsledky diagnostického testu přibližují příklady 1 a 2. I věrohodnostní poměr je odhadem, a lze jej tedy doplnit výpočtem intervalu spolehlivosti, jak dokládá příklad 3. Ačkoli jsou vztahy v příkladu 3 na první pohled poněkud složité, lze do nich jednoduše dosadit hodnoty z tabulky četností a interval spolehlivosti tak vypočítat.
Věrohodnostní poměr je často používán pro srovnávání výstupů různých testů, přičemž je souhrnně kalkulován tzv. diagnostický poměr šancí („Diagnostic Odds Ratio“, DOR). DOR vyjadřuje šanci, že test bude pozitivní u nemocného člověka násobenou šancí, že test bude negativní u zdravého člověka.
DOR = LR+ / LR–
Hodnota DOR může růst od 0 do nekonečna, přičemž vyšší hodnoty znamenají lepší schopnost testu rozlišovat mezi nemocnými a zdravými jedinci, a tedy obecně větší schopnost dosahovat správného výsledku. Hodnoty menší nebo rovny 1 ukazují na test se slabou diagnostickou silou. Logicky požadujeme, aby diagnostický poměr šancí byl co nejvyšší a zejména hodnoty 1 a nižší nejsou pro klinickou praxi přijatelné.
Pojem šance (odds) je blízký pojmu věrohodnostní poměr a vztahuje se k pravděpodobnosti, že nějaký jev nastane. Ačkoli v českém jazyce možná slovo šance nezní příliš exaktně, jde o jasně definovaný pojem, který se i v medicíně velmi často používá. Šanci, že nějaký jev nastane, vyjadřujeme i v běžné řeči formou poměru, například šance výskytu jevu A je 1 ku 4. To znamená, že jev A nastává s pravděpodobností P(A) = 1 / 5 = 0,20. Šanci nastání jevu A označujeme O(A) (odds). Pro náhodný jev A potom obecně platí:
P(A)
O(A) = --------
1 – P(A)
Výše uvedený vztah také někdy čteme jako „šanci ve prospěch A“. Ze vztahu je patrné, že šance je podíl pravděpodobnosti nastání jevu A „ku“ pravděpodobnosti nenastání jevu A. Pokud pravděpodobnosti přímo odhadujeme z relativních četností jevů, např. z kontingenční tabulky, pak můžeme do vztahu dosadit přímo četnosti nastání jevu A a četnosti nenastání jevu A:
četnost jevu A
O(A) = ------------------------------
četnost nenastání jevu A
Šance dvou jevů lze dávat do poměru, hovoříme o poměru šancí („odds ratio“). Ten může nabývat nejnižší hodnoty 0, v maximu ale nijak ohraničen není.
Vedle věrohodnostního poměru a diagnostického poměru šancí lze v literatuře najít i další ukazatele kvality diagnostických testů, které ale povětšinou vycházejí z odhadu senzitivity a specificity. Zde se pouze krátce zmíníme o dvou ukazatelích, jejichž výpočet i interpretace jsou velmi jednoduché:
- Dosažená jistota („gain in certainty“) kalkulovaná jako prostý součet specificity a senzitivity (Connell a Koepsell, 1985). Součet může nabývat hodnot od 0 do 2, přičemž hodnoty blízké 1 indikují test, jehož výsledky odpovídají náhodnému tipování. Sčítání hodnot senzitivity a specificity je vhodné pro srovnávání různých testů, zvláště pokud byly testovány při různé prevalenci dané choroby.
- Jinou, podstatně starší mírou je tzv. Youdenův index (Youden, 1950), značený „J“ = senzitivita + specificita – 1. Tento výpočet lze alternativně vyjádřit jako 1 – (falešná pozitivita + falešná negativita)
Výpočty věrohodnostního poměru, diagnostického poměru šancí a dalších ukazatelů diagnostické hodnoty testu shrnuje pro různé datové soubory tab. 1.
Věrohodnostní poměr, jakož i další zmíněné míry nabízejí alternativní vyjádření hodnoty diagnostických testů k hodnocení senzitivity a specificity. Je samozřejmě na autorovi, zda využije všechny tyto míry souběžně či nikoli. Čtenáře jistě napadne zcela legitimní otázka, není-li ukazatelů kvality testu příliš mnoho a jestli skutečně přispívají k interpretaci. Pravdou je, že žádný ukazatel nedá svou hodnotou 100% záruku, že při pozitivním testu je pacient skutečně nemocný. Výsledek je ovlivňován řadou faktorů, mimo jiné i velikostí testovacích souborů dat a způsobem jejich získání. I tyto faktory jsou důvodem vývoje různých ukazatelů, které nabízejí různé interpretace hodnoty testů. V literatuře nalezneme i prospektivní randomizované studie, jež řeší, zda jsou lékaři v praxi schopni správně využívat ukazatele kvality diagnostických testů pro svá rozhodování. Například práce Puhana et al z roku 2005 takto srovnávala senzitivitu a specificitu s věrohodnostním poměrem a došla k závěru, že jsou ve svém vlivu na rozhodování lékařů srovnatelné. Nicméně věrohodnostní poměr je stále poměrně málo využíván při praktické validaci diagnostických testů (Steurer et al, 2002). Obdobně i diagnostický poměr šancí by si zasloužil častější aplikaci především pro svou jasnou interpretaci (Ingelfinger et al, 1987).
Tento díl seriálu jsme pojali více i jako rešerši relevantní literatury a výklad dokládáme větším počtem citací vědeckých prací. Udělali jsme to záměrně, abychom upozornili na překvapivý fakt, jak je svým způsobem velmi staré a jednoduché téma v současné literatuře živé. Důvodem je z velké části medicína sama. S nástupem personalizované medicíny přichází na trh velké množství nových biomarkerů a s nimi také roste heterogenita a cena diagnostických testů. Srovnávání různých testů je tedy velmi aktuální téma řešené z hlediska diagnostické síly i nákladové efektivity (Cornell et al, 2008; Hayen et al, 2010). Jde o trend, který bude s rozvojem genomiky a farmakogenomiky jistě pokračovat. Je stimulující vidět, že i v dnešním přetechnizovaném a složitém světě lze publikovat významnou vědeckou práci prostou diskuzí nad součtem dvou pravděpodobností :).
doc.
RNDr. Ladislav Dušek, Dr.
Institut
biostatistiky a analýz
Masarykova
univerzita, Brno
e-mail:
dusek@cba.muni.cz
Zdroje
Connell FA, Koepsell TD. Measures of gain in certainty from a diagnostic test. Am J Epidemiol 1985; 121(5): 744–753.
Cornell J, Mulrow CD, Localio AR. Diagnostic test accuracy and clinical decision making. Ann Intern Med 2008; 149 (12): 904–906.
Hayen A, Macaskill P, Irwig L, Bossuyt P. Appropriate statistical methods are required to assess diagnostic tests for replacement, add-on, and triage. J Clin Epidemiol 2010; DOI:10.1016/j.jclinepi.2009.08.024. PMID 20079607.
Ingelfinge, JA, Mosteller F, Thibodeau LA, Ware JH. Biostatistics in Clinical Medicíně. 2nd ed. New York: Macmillan 1987.
McGee S. Simplifying likelihood ratios. J Gen Intern Med 2002; 17(8): 646–649.
Puhan MA, Steurer J, Bachmann LM, ter Riet G. A randomized trial of ways to describe test accuracy: the effect on physicians‘ post-test probability estimates. Ann Intern Med 2005; 143(3): 184–189.
Sackett DL. Interpretation of diagnostic data: 5. How to do it with simple maths. Can Med Assoc J 1983; 129(9): 947–954.
Simel DL, Samsa GP, Matchar DB. Likelihood ratios with confidence: sample size estimation for diagnostic test studies. J Clin Epidemiol 1991; 44(8): 763–770.
Steurer J, Fischer JE, Bachmann LM, Koller M, ter Riet G. Communicating accuracy of tests to general practitioners: a controlled study. BMJ 2002; 324(7341): 824–826.
Youden WJ. Index for rating diagnostic tests. Cancer 1950; 3(1): 32–35.
Štítky
Dětská neurologie Neurochirurgie NeurologieČlánek vyšel v časopise
Česká a slovenská neurologie a neurochirurgie
2011 Číslo 2
Nejčtenější v tomto čísle
- Syndrom neklidných nohou
- Operační léčba poranění peroneálního nervu
- Náhle vzniklá dušnost jako příznak vedoucí k diagnóze amyotrofické laterální sklerózy – kazuistika
- Invazivní mykotické sinusitidy