Analýza dat v neurologii
LXI. Závěrečné příklady k analýzám trendů v kontingenčních tabulkách
Autoři:
L. Dušek; T. Pavlík; J. Jarkovský
; J. Koptíková
Působiště autorů:
Institut biostatistiky a analýz Masarykova univerzita, Brno
Vyšlo v časopise:
Cesk Slov Neurol N 2017; 80/113(1): 112-114
Kategorie:
Okénko statistika
Minulý díl jsme věnovali analýze tzv. trendové složky v tabulkách četností s cílem vysvětlit postupy užitečné při prokazování kauzality vztahu „expozice– účinek“. Pokud totiž prokážeme, že s rostoucí úrovní expozice roste i její efekt, půjde s vysokou pravděpodobností o vztah příčinný. Tímto dílem ukončíme téma analýzy složitějších kontingenčních tabulek několika příklady, které ukáží možnost analýzy trendů ještě z jiného pohledu.
Zvláštním typem testu pro hodnocení trendu v tabulkách četností je tzv. Cochranův-Armitageův test. Jeho základní výpočet přibližuje příklad 1. Test byl navržen pro situace, kdy experiment hodnotí binární proměnnou proti proměnné ordinální. Binární proměnná (např. výskyt nemoci ano/ ne) typicky představuje odpověď systému na expozici, vyjadřuje tedy následek expozice. Ordinální škála jako druhá dimenze tabulky četností naopak představuje různé úrovně studované expozice, např. dávky léku, dobu trvání působení nějakého faktoru apod. V podstatě zde studujeme, zda se vzájemný poměr hodnot binárního faktoru (poměr relativního výskytu hodnoty „ano“ k hodnotě „ne“) liší v závislosti na hodnotách dané ordinální škály. Jinými slovy, zda míra expozice ovlivňuje např. relativní riziko vzniku dané nemoci. Nulová hypotéza tohoto testu je neexistence takového trendu. To znamená, že pokud tuto hypotézu nezamítáme, pak jsou relativní četnosti hodnoty „ano“ u binární proměnné stejné přes všechny úrovně proměnné ordinální.
Příklad 1 dokládá, že tento test pracuje se systémem vah, jejichž nastavení umožňuje studovat různé hypotetické „lokální“ trendy v původní tabulce četností. Rozdělení výsledné testové statistiky se blíží ke standardizovanému normálnímu rozdělení N(0,1), a tudíž s jejími hodnotami lze přímo pracovat jako s kvantily tohoto modelového rozdělení. Možnost nastavení vah je velkou výhodou ve studiích „dávka– odpověď“, zejména pokud ordinální proměnná zahrnuje více než tři hodnoty; můžeme takto testovat hypotetické vzájemné relace těchto hodnot.
Cochranův-Armitageův test je velmi často využíván jako standard pro analýzy linearity trendu v genetických asociačních studiích (typicky studie případů a kontrol). Velmi jednoduchou ukázku těchto výpočtů přináší příklad 2, ze kterého je patrné, že možné kombinace alel genu a, A zde řadíme do ordinální škály aa– Aa– AA, která následně vstupuje do testu. I tady můžeme pracovat se systémem vah, které byly vysvětleny v příkladu 1 (váhy označeny jako ti, kde i nabývá hodnot od 1 do počtu kategorií ordinální škály). Například dominanci vlivu alely a na výskyt nemoci by jako dílčí test ověřila sada vah t = (1, 1, 0), která vyřadí z testování kombinaci AA. Naopak dominanci alely A by testovala sada vah t = (0, 1, 1), kodominanci obou alel potom optimálně sada t = (0, 1, 2). Tato možnost dílčích testování je i u genetických studií velmi vítaná, avšak u plánovaných a protokolárně vedených studií nesmí být aplikována dle volby nebo zdání analytika „ad hoc“. Testované hypotézy a odpovídající váhy musí být nastaveny předem v protokolu studie a vlastní hodnocení dat musí tomuto plánu odpovídat.
Cochranův-Armitageův test v našem seriálu představuje další ilustrativní příklad nestárnoucí historie biostatistiky. Ačkoli jde o test velmi starý (publikovaný v letech 1954– 1955), jeho význam nejenže neupadá, ale s rostoucí četností pozorovacích studií zahrnujících genetické markery dokonce narůstá. Autory testu také v našem seriálu neuvádíme poprvé. Jméno W. G. Cochrana (1909– 1980) nese řada významných biostatistických postupů, např. z oblasti analýz tabulek četností je to Cochranův Q test nebo Cochranova-Mantelova-Haenszelova statistika. Rovněž dosud žijící P. Armitage (nar. 1924) patří mezi významné biostatistiky minulého století; mimo jiné působil i jako prezident vlivné mezinárodní společnosti pro klinickou biostatistiku.
Posledním příkladem k problematice trendu v kontingenčních tabulkách dokumentujeme postup výpočtu využívající odhad poměru šancí (OR). Studie uvedená v příkladu 3 ověřuje, zda výskyt zkoumané nemoci trendově závisí na věku pacientů. Sbíraná data odpovídají běžné tabulce četností 2 × 3, věk zde vystupuje jako proměnná o třech kategoriích a výskyt nemoci je zaznamenáván v nejjednodušším módu, tedy binárně. Platí-li, že se riziko výskytu nemoci s věkem zvyšuje, pak bychom pro věkové kategorie měli pozorovat gradient hodnot OR vztažených k určité referenční kategorii (jako referenci příklad kalkuluje nejmladší zkoumanou věkovou kategorii). Existující gradient v hodnotách poměru šancí potom logicky potvrzuje statistický test trendové složky.
Tímto dílem uzavíráme výklad testů trendů v kontingenčních tabulkách a zároveň i problematiku asociačních studií. V následujících dílech se budeme krátce věnovat problematice tzv. ekologických (korelačních) studií a dále potom analýze korelací spojitých faktorů.
doc. RNDr. Ladislav Dušek, Ph.D.
Institut biostatistiky a analýz MU,
Brno
e‑mail: dusek@iba.muni.cz
Zdroje
1. Cochran WG. Some methods of strengthening the common c2 tests. Biometrics 1954;10:417– 51.
2. Armitage P. Tests for linear trends in proportions and frequencies. Biometrics 1955;11:375– 86.
3. Agresti A. Categorical Data Analysis. New York: John Wiley and Sons 2002.
Štítky
Dětská neurologie Neurochirurgie NeurologieČlánek vyšel v časopise
Česká a slovenská neurologie a neurochirurgie
2017 Číslo 1
Nejčtenější v tomto čísle
- Není třeba léčit motorické tiky
- Základní neurologické vyšetření – nastal čas pro změny?
- Současný pohled na kontraindikace a komplikace elektromyografie
- Endoskopická exstirpace koloidní cysty III. mozkové komory