М.Л. ЖМУДЯК, А.Н. ПОВАЛИХИН, А.В. СТРЕБУКОВ, А.В. ГАЙНЕР, А.Л. ЖМУДЯК, Г.Г. УСТИНОВ
ДИАГНОСТИКА ЗАБОЛЕВАНИЙ МЕТОДАМИ ТЕОРИИ ВЕРОЯТНОСТЕЙ
Издательство АлтГТУ БАРНАУЛ 2006
УДК 519.23/.25
ДИАГНОСТИКА ЗАБОЛЕВАНИЙ МЕТОДАМИ ТЕОРИИ ВЕРОЯТНОСТЕЙ/ М.Л. Жмудяк, А.Н. Повалихин, А.В. Стребуков, А.В. Гайнер, А.Л. Жмудяк, Г.Г. Устинов; Алт. гос. тех. ун-т им. И.И. Ползунова. – Барнаул: Изд-во АлтГТУ, 2006.–168с. ISBN 5-7568-0524-9 В книге поставлены и решены задачи: совмещения медицинского и математического подходов к диагностике; диагностики с учетом многократно определенных диагностических признаков (в частности, диагностики с учетом динамики заболеваний); оптимальной последовательности обследования, иными словами, нахождения диагностического признака, наиболее необходимого для дальнейшего уточнения диагноза, и др. В ходе исследований предложены и изучены: диагностика методом наибольшего правдоподобия, алгоритм, повышающий скорость и надежность определения вероятности болезни методом наибольшего правдоподобия; критерий эффективности диагностики, проведенной расчетными методами; использование многомерных распределений при диагностике; имитационные модели болезней для решения методических проблем диагностики и тестирования разрабатываемых методов. Содержание изложено на 168 страницах, включает 35 рисунков и 30 таблиц, список использованной литературы из 144 публикации.
ISBN 5-7568-0524-9
© М.Л. Жмудяк, А.Н. Повалихин, А.В. Стребуков, А.В. Гайнер, А.Л. Жмудяк, Г.Г. Устинов, 2006
Оглавление Предисловие......................................................................................................................... 5 Введение ............................................................................................................................... 5 Термины и обозначения...................................................................................................... 6 Глава 1 Диагностика с использованием искусственного интеллекта и медицинская диагностика желтух............................................................................................................. 9 1.1 Обзор методов диагностики с помощью искусственного интеллекта ................ 9 1.2 Медицинская диагностика желтух ........................................................................ 23 Глава 2 Теоретические разработки.................................................................................. 37 2.1 Совмещение медицинского и математического подходов к диагностике заболеваний.................................................................................................................... 37 2.1.1 Кратко о моделировании ................................................................................. 37 2.1.2 Использование условных вероятностей ........................................................ 38 2.1.3 Дополнение статистики и уточнение распределений .................................. 39 2.2 Использование многомерных распределений ...................................................... 40 2.3 Диагностика методом максимального (наибольшего) правдоподобия............. 43 2.3.1 Итерационный алгоритм диагностики заболеваний .................................... 43 2.3.2 Обобщение поперек траекторий..................................................................... 48 2.3.3 Обобщение по отдельным ДП ........................................................................ 49 2.3.4 Обобщение вдоль траекторий ......................................................................... 49 2.3.5 Диагностирование с использованием «чистого» критерия максимального правдоподобия ........................................................................................................... 50 2.4 Учет взаимозависимости диагностических признаков и динамики заболеваний в байесовском подходе к диагностике ........................................................................ 53 2.4.1 Использование формулы Байеса..................................................................... 53 2.4.2 Учет динамики заболеваний при байесовском подходе .............................. 54 2.4.3 О совмещении методов диагностики ............................................................. 56 2.5 Определение исследования (анализа), наиболее необходимого для диагностики.................................................................................................................... 56 2.6 Оценка результатов диагностики .......................................................................... 66 2.6.1 Уровень надежности и неопределенный диагноз ......................................... 66 2.6.2 Критерий эффективности диагностики ......................................................... 67 2.6.3 Влияние отдельного ДП на диагноз ............................................................... 70 2.7 Модельные болезни и исследование на них теоретических вопросов .............. 72 Глава 3 База данных, вероятности и плотности вероятностей диагностических признаков............................................................................................................................ 77 3.1 Характеристика статистических данных .............................................................. 77 3.2 Дискретные и непрерывные диагностические признаки, построение гистограмм ..................................................................................................................... 80 3.2.1 Дискретные и непрерывные диагностические признаки ............................. 80 3.2.2 Особенности построения гистограмм непрерывных диагностических признаков ................................................................................................................... 81 3.3 Построение искусственных распределений ......................................................... 87 3.4 Построение многомерных распределений............................................................ 90 3.5 Особенности работы со статистической базой данных ...................................... 94 3.6 Исследование взаимозависимости диагностических признаков........................ 97 3.6.1 Независимые и зависимые диагностические признаки в формуле Байеса 97 3
3.6.2 Экспертная оценка зависимости признаков ................................................ 100 3.6.3 Наборы (ядра) независимых признаков ....................................................... 100 Глава 4 Учет динамики заболеваний при диагностике ............................................... 103 4.1 Методика учета динамики и взаимозависимость диагностических признаков ....................................................................................................................................... 103 4.2 Диагностика при многократном определении признака................................... 107 4.3 Влияние лечения на динамику заболевания ....................................................... 111 Глава 5 Результаты диагностики с применением различных методических приемов ........................................................................................................................................... 115 5.1 Применение уровня надежности и коэффициента эффективности для оценки качества диагностики .................................................................................................. 115 5.2 Серия экспериментов при различных приемах формирований распределений ....................................................................................................................................... 118 5.3 Серия экспериментов при различных приемах формирования базы данных. 121 5.5 Серия экспериментов с учетом динамики заболеваний.................................... 132 5.6 Результаты байесовской диагностики с учетом динамики заболеваний......... 135 Глава 6 Сравнение результатов дифференциальных диагностик методами Байеса, дискриминантного анализа, классификационных деревьев и нейронных сетей...... 137 Заключение....................................................................................................................... 140 Литература........................................................................................................................ 142 Приложение 1 Сходимость итерационного алгоритма и его связь с методом максимального правдоподобия ..................................................................................... 156 Приложение 2 Примеры построения гистограмм по различным методикам ........... 161
4
Предисловие Настоящая работа дважды получала поддержку, за которую авторы благодарят проректора АлтГТУ д.ф.-м.н. профессора Б.В. Семкина и организаторов конкурса «Ползуновские гранты». Особую благодарность авторы выражают коллегам – научным сотрудникам Р.Х. Ицекзон и О.Н. Зацепиной, помогавшим на всех этапах работы, и О. В. Ловцкой за полезные научные советы. Раздел 2.3.5 и приложение 1 написаны в приятном сотрудничестве с Г.Ш. Львом. Адреса
для
замечаний
и
предложений:
[email protected];
[email protected] Введение Компьютерная (на математической основе) диагностика заболеваний является для врача таким же инструментом, как расчеты для инженера: расчетная диагностика не заменяет врача, но помогает ему. Поэтому актуально развивать методики диагностики и сравнивать их эффективность. Авторы старались посмотреть на математические методы диагностики как с математической, так и с медицинской точек зрения, что привело к постановке и решению новых задач. Например, в известных работах для диагностики используются диагностические признаки, определенные в один день, признаки в другие дни в расчетах не участвуют. То есть, не учитывается динамика болезни – важнейший при постановке диагноза фактор. Приведенный пример иллюстрирует актуальность создания методики учета динамики заболеваний, что и сделано в этой работе. В книге предложены пути совмещения врачебного и математического подходов, поставлены и решены задачи об оптимальной последовательности обследования пациента и др. Применяемые вероятностные и статистические методы с использованием базы данных о прошедших лечение больных, собственно, являются одной из форм обращения к накопленному опыту и, как показано в книге, обеспечивают высокий уровень диагностики.
5
Термины и обозначения Часто встречающиеся в тексте слова «диагностические признаки» будем записывать аббревиатурой «ДП». Под ДП понимаются симптомы заболевания, клинические анализы, данные инструментальных обследований пациента, а также его пол и возраст. Другие часто используемые обозначения: АЛАТ – ферменты аланинаминотрансфераза, АСАТ – ферменты аспартатаминотрансфераза, ММП – метод максимального правдоподобия. Индексы
j = 1,2 ,3,..., n – номер болезни; i = 1,2 ,3,..., m – номер ДП;
t = 1,2 ,3,..., τ(i ) – момент (день), отсчитываемый с начала болезни. Отсутствие индекса t говорит о том, что есть информация только за один день (момент) или о том, что рассматривается множество величин, относящихся к моментам t1 , t2 , t3 , ...,
τ . Обозначение τ (i ) использовано потому, что для разных
ДП число дней, в которые ДП определялись, разное. « o » – индекс, указывающий, что величина ДП получена обследованием диагностируемого пациента. Отсутствие этого индекса указывает на то, что величина симптома или анализа или другого ДП относится к данным о течении болезни, статистике вариантов течения болезни, статистике величин ДП при болезни
j
(т.е. отсутствие индекса « o » говорит о том, что величина не относится к
обследованию конкретного пациента, у которого диагностируется болезнь). Величины
π j – доля больных болезнью j среди больных диагностируемыми болезнями; P – распределение вероятностей диагностируемых болезней у пациента, например, P{p1, p2 } ;
a – величина анализа, рассматривается как переменная (как величина x ) и является общим обозначением любой из возможных величин ДП; 6
ai – величина i -го ДП, например, СОЭ=28 или «есть боль», т.е. « a » может быть непрерывной или дискретной величиной;
aoi – конкретное значение i -го ДП, полученное в результате обследования пациента;
aoit – то же, полученное в день t ;
q – распределение, то есть распределение вероятностей дискретного ДП; или плотность
распределения
вероятностей
непрерывного
ДП
(непрерывно
распределенного ДП). Аналогично q обозначает распределение сочетания ДП – распределение многомерного ДП. Под вероятностью будем понимать также выборочные оценки соответствующих величин. q обозначает распределение, полученное статистически или моделированием.
qijt (ai ) – распределение i -го ДП при болезни j в момент (день) t ; распределение определено сбором статистики или относится к модели, к траектории болезни и определяет вероятности или плотности вероятностей при всех значениях ДП. Такое обозначение подчеркивает, что плотность вероятности есть функция от величины a, от величины ДП. Два индекса
i
в одном обозначении можно не t
t
t
употреблять, а использовать более краткие обозначения q j(ai ) или qij(a) , или qij .
qijt (aoit ) – вероятность i -го ДП величиной aoit при болезни j в день t . Вообще говоря, два индекса
t в одном обозначении – излишняя
информативность, т.к. очевидно, что если ДП величиной aoi определен в день t , то для определения вероятности или плотности вероятностей разумно использовать t
распределение q j(ai ) только в этот же день t . То есть можно обойтись t
обозначением q j (aoi ) .
{
}
qij(ai ) = qijt1(ai ), qijt 2(ai ), qijt 3(ai ),..., qijτ(ai ) – совокупность распределений ДП
i
при болезни
j
во все моменты (дни) заболевания (или в один из дней, если
нет информации о других днях, или распределение ДП
7
i
при болезни
j,
когда
информация о моментах (днях) анализов или днях определения других ДП не рассматривается).
qijt (aoit ) – средняя ордината распределения вблизи величины aoit , полученной t
в результате обследования пациента. Когда интервал вблизи величины aoi мал,
qijt (aoit ) приближается к q tj(aoit ) .
8
Глава 1 Диагностика с использованием искусственного интеллекта и медицинская диагностика желтух 1.1 Обзор методов диагностики с помощью искусственного интеллекта Анализ литературы показал, что с первых лет применения информационных технологий в здравоохранении одним из ведущих направлений являлись системы поддержки процесса принятия клинических решений, развившиеся в технологии интеллектуальных систем. В начале восьмидесятых годов в исследованиях по искусственному интеллекту сформировалось самостоятельное направление, получившее название «экспертные системы» [1 – 4 и др.]. Экспертные системы используются для разработки программ, которые при решении задач, трудных для эксперта – человека, получают результаты, не уступающие по качеству и эффективности решениям, получаемым экспертом. Исследователи в области экспертных систем для названия своей дисциплины часто используют также термин «инженерия знаний», введенный Е. Фейгенбаумом как «привнесение принципов и инструментария исследований
из
области
искусственного
интеллекта
в
решение
трудных
прикладных проблем, требующих знаний экспертов» [7]. Вначале большинство экспертных систем базировалось на правиле продукций: «Если – то», [1 – 4 и др.]. С использованием правила продукций создано много диагностических экспертных систем для конкретных групп болезней [5, 6, 8 – 18 и др.]. Диагностические экспертные системы развивались в направлении их универсализации и расширения возможностей [11 – 18]. Созданы системы, самостоятельно строящие дерево вопросов [12] и т.п. Одним из популярных методов обнаружения знаний стали алгоритмы поиска ассоциативных правил [19], которые с успехом используются во многих областях, в том числе в задачах медицинского анализа и диагностики [20 – 22]. Использование подтверждающий,
что
ассоциативных развитие
правил
экспертных
приведено систем
идет
как в
пример,
ожидавшемся
направлении: универсализации (преодолевается свойственная ранним экспертным системам пригодность только для одной задачи и абсолютная зависимость от 9
эксперта) за счет алгоритмов высокого уровня. Среди найденных экспертных систем и реализующих их программ имеется и программа: “Дифференциальная диагностика желтух” [23], алгоритм которой, по утверждению авторов этой программы, может помочь развеять сомнения в диагнозе и сократить время диагностики. Точность определения правильного диагноза экспертными системами имеет большой разброс, а процент правильно определенных диагнозов – невысок. Так, экспертная система медицинской диагностики Diagnos.ru [12] выдает в среднем 70% диагнозов, которые соответствуют истине. Диагностические решения экспертной системы “Эсбад” в 87% случаев совпадают с клиническим диагнозом [16]. Экспертная система МУТАНТ, созданная сотрудниками ЭВЦ Московского университета, позволила получать эффективность только 56% [24]. Впрочем, в источнике
говорится
о
начальных
этапах
эксплуатации
этой
системы.
Автоматизированная система ранней диагностики наследственных болезней “ДИАГЕН“, позволяющая идентифицировать свыше 1200 форм, показывает эффективность 90% в сравнении с 60% у врачей медико-генетических консультаций [16]. По результатам обзора складывается впечатление, что заявляемая в публикациях эффективность диагностических программ, основанных на экспертных системах, по-прежнему (как и в годы начала наших исследований) недостаточно высока и изменяется в широких пределах, в основном, от 56 до 90% правильных диагнозов. Даже во времена, когда экспертные системы были очень распространены и модны, авторам эти системы казались не слишком привлекательными, так как правило продукций «Если – то», в общем-то, фельдшерский подход… Страшно сказать, но развившиеся в последние годы и действительно эффективные методы диагностики, включая нейронные сети, также в основе фельдшерские, конечно, суперфельдшерские, но все же … Авторам
представлялось,
что
диагностика
должна
базироваться
на
моделировании заболеваний, включая их динамику, и математической оценке близости смоделированных «траекторий» развития болезни у конкретного больного 10
и наблюдаемых у него диагностических признаков [25, 26]. Диагностика на основе моделирования с учетом патофизиологии процессов, к сожалению,
мало
распространена
по
сравнению
с
другими
подходами.
Математические же методы диагностики развиваются очень бурно, опережающими по сравнению с экспертными системами темпами [27 – 88 и др.]. Среди математических методов наиболее постепенно развивается байесовский подход, используемый для диагностики более полувека. Байесовский подход изложен в книгах Н. Бейли [29, 30], А. Вальда [36], Е.В. Гублера [42, 43], Е.В. Гублера и А.А. Генкина [44], Л. Ластеда [51], С.А. Айвазяна, В.М. Бухштабера, И.С. Енюкова и Л.Д. Мешалкина [55] и др. Применению байесовского подхода в диагностике посвящены многочисленные статьи [39, 40, 71 – 76, 87 и др.]. Болезни
описываются
не
одним,
а
несколькими
диагностическими
признаками. В связи с этим для диагностики широкое применение нашли многомерные статистические методы, такие как факторный, регрессионный, дисперсионный, кластерный, дискриминантный и другие методы анализа данных [31]. Дисперсионный анализ – метод статистического анализа, позволяющий определить достоверность гипотезы о различиях в средних значениях исследуемых величин на основании сравнения дисперсий распределений [32]. Регрессионный анализ – статистический метод для определения связи переменных.
Если
зависимая
переменная
является
дихотомической
или
категориальной, необходимо использовать логистическую регрессию. Факторный анализ – это совокупность методов, которые на основе реально существующих связей признаков (или объектов) позволят выявлять латентные обобщающие характеристики структуры и механизма развития изучаемых явлений и процессов [33]. Факторный анализ является методикой, которая в определенном смысле сама является
источником
возникновения
гипотез.
Остановимся
вначале
на
специфическом характере гипотез, порождаемых факторным анализом. Мы исходим из того, что несколько измеряемых переменных сильно коррелируют между собой. 11
Это означает, что-либо они взаимно определяют друг друга, либо связь между этими переменными
обусловливается
какой-то
третьей
величиной,
которую
непосредственно измерить нельзя. Модель факторного анализа всегда связана с последним предположением, т.е. измеряемая величина является лишь формой проявления
величины,
непосредственному
остающейся
измерению.
на
заднем
Возникает
плане
задача,
и
можно
не ли
поддающейся по
данным
переменным выделить величину, так называемый фактор, который объяснил бы наблюдаемые связи. Слово фактор используется в другом смысле, чем это принято обычно: речь идет о математической величине, получаемой на основе наблюдений. Факторный анализ заглядывает за кулисы того, что непосредственно измеряется, и стремится определить истинные функциональные величины, лежащие в основе данного явления. Основная цель факторного анализа состоит в выявлении гипотетических величин, или факторов, по небольшому числу экспериментальных данных. Факторы должны быть по возможности простыми и достаточно точно описывать и объяснять наблюдаемые величины. Число выделяемых факторов должно быть меньше набора исходных величин, структура этих факторов и их взаимосвязь должны быть возможно более простыми. Исходной предпосылкой анализа является наличие взаимосвязи между несколькими
одновременно
наблюдаемыми
переменными.
В
качестве
количественной меры связи между двумя переменными используется коэффициент корреляции. Он может принимать значения от − 1 до + 1. Если он при этом приближается к нулю, то это свидетельствует об отсутствии линейной связи, и чем более он близок k + 1 или k − 1, тем более тесная линейная связь существует между переменными.
Все
вычисленные
коэффициенты
корреляции
располагаются
соответствующим образом в корреляционной матрице. При анализе такой корреляционной матрицы получают гипотетические величины, так называемые факторы, которые находятся в определенных взаимоотношениях с переменными. Факторы
представляют
собой
влияющие
величины,
не
поддающиеся
непосредственному измерению, которые могут быть определены только в результате анализа. Примечательно то, что факторный анализ делает возможным выдвижение дифференцированных гипотез о структуре взаимосвязи переменных и 12
факторов, не задаваясь этой структурой заранее и не имея о ней никаких сведений. Эта структура находится по результатам наблюдений. Полученные гипотезы могут быть проверены в ходе дальнейших экспериментов. Как в любой прикладной науке, здесь следует обращать внимание на различие между математической моделью и реальным содержанием изучаемого явления. Вычислительная сторона метода, в которой речь идет только о решении системы уравнений и точности вычислений, является лишь одним аспектом проблемы. Для факторного анализа характерен также статистический подход, применяемый, например, при проверке гипотезы о числе факторов, подлежащих выделению. Наряду с этим существует еще проблема содержательной интерпретации выделенных факторов, что не имеет места при построении математикостатистической
модели.
Три
вышеназванных
аспекта
–
алгебраически-
вычислительную сторону, статистический подход и интерпретацию факторов – следует учитывать при проведении факторного анализа и разграничивать их [42]. Метод главных компонент. Разработан Хотеллингом [32]. Позволяет при заданной
m-мерной корреляционной
матрице найти новую ортогональную
m-мерную систему координат и именно так, чтобы максимум полной дисперсии лежал в направлении первой главной оси, а максимум оставшейся дисперсии – в направлении второй главной оси и т.д. Метод главных компонент заключается в нахождении последовательности ортогональных осей координат, вдоль которых каждый раз в убывающем порядке определяется максимум полной дисперсии. Кластерный
анализ
–
это
совокупность
методов,
позволяющих
классифицировать многомерные наблюдения, каждое из которых описывается некоторым набором переменных. Целью кластерного анализа является образование групп схожих между собой объектов, которые принято называть кластерами. В отличие от комбинационных группировок кластерный анализ приводит к разбиению на группы с учетом всех группировочных признаков одновременно. Кластерный анализ объединяет различные процедуры, используемые для проведения классификации. В результате применения этих процедур исходная совокупность объектов разделяется на кластеры или группы (классы) схожих между собой объектов. 13
Сложность задач кластерного анализа состоит в том, что объединение объектов в группы проводится в пространстве многих измерений. В целом методы кластеризации делятся на агломеративные (от слова агломерат – скопление) и итеративные дивизивные (от слова division – деление, разделение). В агломеративных или объединительных методах происходит последовательное объединение наиболее близких объектов в один кластер [40]. Исходными данными могут быть собственно объекты и их параметры. Данные для анализа могут быть так же представлены матрицей расстояний между объектами, в которой на пересечении строки с номером записано расстояние между i -м и
i
и столбца с номером
j
j -м объектами. Если расстояния не даны сразу,
то агломеративные алгоритмы начинают с вычисления расстояния между объектами. Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся в множестве X , разбить множество объектов I на m кластеров (подмножеств) π1 , π 2 ,..., π m так, чтобы каждый объект Ii принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время как объекты, принадлежащие разным кластерам, были разнородными (несходными). Дискриминантный анализ – статистический метод, используемый для прогнозирования
вероятности
какого-либо
события.
Относится
к
методам
классификации с обучением. Используется для разделения респондентов в различающиеся между собой группы на основе некоторых характеристик. Дискриминантный
анализ
является
одним
из
методов
многомерного
статистического анализа. Цель дискриминантного анализа состоит в том, чтобы на основе измерения различных характеристик (признаков, параметров) объекта классифицировать его, то есть отнести к одной из нескольких групп (классов) некоторым оптимальным способом. Под оптимальным способом понимается либо минимум математического ожидания потерь, либо минимум вероятности ложной классификации. Этот вид анализа является многомерным, так как измеряется несколько параметров объекта, по крайней мере, больше одного, например, температура, влажность в технологическом процессе, давление, состав крови, 14
температура больного и т.д. [43]. При применении дискриминантного анализа обычно имеются несколько переменных, и задача состоит в том, чтобы установить, какие из переменных вносят свой вклад в дискриминацию между совокупностями, определить, имеются ли значимые различия между группами (с точки зрения всех переменных). Современные
версии
дискриминантного
анализа
и
реализующих
его
компьютерных программ сделали технологию дискриминантного анализа доступной широкому кругу пользователей [85]. В
медицине
прогнозирования
дискриминантный
исхода
инсульта
при
анализ
успешно
различных
применяется
методах
его
для
лечения,
выживаемости больных, оперированных по поводу рака почки, и определения срока дожития больных раком почки, имеющих метастазы в различных органах. Искусственные нейронные сети (сокращенно ИНС) развиваются быстрее других математических методов. Теория нейронных сетей включает широкий круг вопросов из разных областей науки: биофизики, математики, информатики, схемотехники и технологии. Поэтому понятие «нейронные сети» детально определить сложно. «Искусственные нейронные сети – совокупность моделей биологических нейронных сетей, представляют собой сеть элементов — искусственных нейронов, — связанных между собой синаптическими соединениями. Сеть обрабатывает входную информацию и в процессе изменения своего состояния во времени формирует совокупность выходных сигналов». Также это набор математических и алгоритмических методов для решения широкого круга задач [41]. «Нейронная сеть – система, состоящая из множества работающих параллельно простых обрабатывающих элементов, функция которой определяется структурой сети, силой связей и обработкой, происходящей в вычислительных элементах или узлах» [52]. К. Гурни в своей книге, считающейся на западе одной из лучших по введению в теорию ИНС, определяет нейронную сеть как «связанный ансамбль единичных обрабатывающих элементов, функциональность которых в широком смысле базируется на работе биологических нейронов. Умение сети обрабатывать данные 15
хранится в силе ее внутренних соединений, или весах, полученных в процессе адаптации (или обучения) сети к набору обучающих данных». С
середины
«нейроинформатика»
80-х
годов
или
в
научном
лексиконе
«нейрокомпьютинг».
появились
термины
«Нейрокомпьютинг –
это
технология создания систем обработки информации (например, нейронных сетей), которые способны автономно генерировать методы, правила и алгоритмы обработки в виде адаптивного ответа в условиях функционирования в конкретной информационной среде. Нейрокомпьютинг представляет собой фундаментально новый подход, а рассматриваемые в рамках этого подхода системы обработки информации существенно отличаются от упомянутых ранее систем и методов». Искусственный
нейрон
имитирует
в
первом
приближении
свойства
биологического нейрона. На вход искусственного нейрона поступает некоторое множество сигналов, каждый из которых является выходом другого нейрона. Каждый вход умножается на соответствующий вес, аналогичный синаптической силе, и все произведения суммируются, определяя уровень активации нейрона. Среди всех интересных свойств искусственных нейронных сетей ни одно не захватывает так воображения, как их способность к обучению. Их обучение до такой степени напоминает процесс интеллектуального развития человеческой личности, что может показаться, что достигнуто глубокое понимание этого процесса. Возможности обучения искусственных нейронных сетей ограничены, и нужно решить много сложных задач. Тем не менее, уже получены убедительные достижения, такие как «говорящая сеть» Сейновского, и возникает много других практических применений. Цель обучения. Сеть обучается, чтобы для некоторого множества входов давать желаемое (или, по крайней мере, сообразное с ним) множество выходов. Каждое такое входное (или выходное) множество рассматривается как вектор. Обучение
осуществляется
путем
последовательного
предъявления
входных
векторов с одновременной подстройкой весов в соответствии с определенной процедурой. В процессе обучения веса сети постепенно становятся такими, чтобы каждый входной вектор вырабатывал выходной вектор. Обучение с учителем. Различают алгоритмы обучения с учителем и без 16
учителя. Обучение с учителем предполагает, что для каждого входного вектора существует целевой вектор, представляющий собой требуемый выход. Вместе они называются обучающей парой. Обычно сеть обучается на некотором числе таких обучающих пар. Предъявляется выходной вектор, вычисляется выход сети и сравнивается с соответствующим целевым вектором, разность (ошибка) с помощью обратной связи подается в сеть, и веса изменяются в соответствии с алгоритмом, стремящимся
минимизировать
ошибку.
Векторы
обучающего
множества
предъявляются последовательно, вычисляются ошибки и веса подстраиваются для каждого вектора до тех пор, пока ошибка по всему обучающему массиву не достигнет приемлемо низкого уровня. Обучение без учителя. Несмотря на многочисленные прикладные достижения, обучение с учителем критиковалось за свою биологическую неправдоподобность. Трудно вообразить обучающий механизм в мозге, который бы сравнивал желаемые и действительные значения выходов, выполняя коррекцию с помощью обратной связи. Обучение без учителя является намного более правдоподобной моделью обучения в биологической системе. Развитая Кохоненом и многими другими, она не нуждается в целевом векторе для выходов и, следовательно, не требует сравнения с предопределенными идеальными ответами. Обучающее множество состоит лишь из входных векторов. Обучающий алгоритм подстраивает веса сети так, чтобы получались согласованные выходные векторы, т.е. чтобы предъявление достаточно близких входных векторов давало одинаковые выходы. Процесс обучения, следовательно, выделяет статистические свойства обучающего множества и группирует сходные векторы в классы. Предъявление на вход вектора из данного класса даст определенный выходной вектор, но до обучения невозможно предсказать, какой выход будет производиться данным классом входных векторов. Практическое использование ИНС для медицинской диагностики (по литературным данным) приводит к исключительно высокому качеству диагностики [79, 82, 83 и др.] Приведенный обзор показывает, что использование методов статистического анализа в медицине результативно и должно развиваться. В настоящее время выдвигают следующие важнейшие медико-биологические проблемы, к которым 17
применимы
современные
статистические
методы: математическое
описание
поведения физиологической системы во времени; математическое описание процессов регулирования, например описание реакции живой системы в ответ на химическое воздействие; проблемы медицинской диагностики и лечения, имеющие целью как можно раньше обнаружить и как можно быстрее ликвидировать отклонение от равновесия в сложной системе; математическое изучение (в том числе и моделирование) проблем поведения центральной нервной системы и мозга, памяти и обучения и т.д. Так, например, в клинической практике для объединения признаков в группы идентичные понятию «синдром» заболевания, а также для иерархической классификации больных применяются факторный и кластерный анализы. В проанализированных публикациях, в основном, содержатся данные о диагностике одним методом. Нет сколько-нибудь значительной информации о сравнительной эффективности разных методов, нет сравнения разных методов в одинаковых условиях тестирования. Поэтому одна из задач настоящей работы – сравнить диагностику несколькими методами на одних и тех же данных – постановкой диагноза одним и тем же больным. Сравнение методов – это частная задача. Общим выводом обзора является сравнительно меньшее развитие моделирования и то, что в медицинской диагностике превалируют два подхода: А – использование экспертных систем; В – использование методов теории вероятностей и математической статистики, и/или формально-математические приемы. Не вдаваясь в тонкости классификации, подчеркнем принципиальное отличие подходов: А – базируется на знаниях и опыте врача, В – на формальной обработке данных (игнорируя мнение врача). Авторы полагают, что постановочна задача о совмещении подходов А и В. Действительно, подход А использует знания врача в области физиологии и патофизиологии и т.п., что очень ценно. Однако подход (А) не универсален и не в полной мере использует статистику. (Статистику включает на интуитивном уровне в виде личного опыта и знаний об опыте коллег.) Подход В инвариантен относительно диагностики болезни, позволяет достаточно полно использовать статистическую информацию, т.е. накопленный 18
опыт, но не обращается к знаниям о механизмах взаимосвязи процессов в организме и т.п. Постановка и варианты решения задачи совмещения подходов А и В являются одной из целей данной работы. Труды,
являющиеся
базой
для
теории
диагностики,
в
основном,
рассматривают многомерные распределения [28, 48, 53 – 56 и др.]. В прикладных работах многомерные распределения используются редко [38 и др.]. Поэтому нет ответа на ряд вопросов, связанных с многомерными распределениями при ограниченном
количестве
данных.
Например,
неясно,
какие
именно
диагностические признаки (ДП) нужно объединять, когда имеются данные для 2 – 3 – мерных распределений, но нет данных для формирования распределений большей размерности. Не ясно даже, какова эффективность использования многомерных распределений вместо одномерных. (Большинство практических работ по диагностике использует одномерные распределения). Перечисленные и другие вопросы говорят о необходимости исследования диагностики на базе многомерных распределений. Одномерные распределения используются и при байесовском подходе, данные о распространенности которого приведены выше. При расчете вероятностей болезней по формуле Байеса общепринята гипотеза о взаимонезависимости диагностических признаков между собой. На самом деле, в едином организме диагностические признаки взаимозависимы. Понимание этого присутствует в ряде публикаций.
Однако
при
рассмотрении
ДП
как
независимых
результаты
диагностики – хорошие. Возможно поэтому взаимозависимость ДП в изученных публикациях не учитывается. Вместе с тем, для повышения качества диагностики необходимо уделить внимание проблеме учета взаимозависимости ДП. В известных работах для диагностики и прогноза исхода лечения (операции) используются диагностические признаки, определенные в один день, признаки в другие дни в расчетах не участвуют. То есть, не учитывается динамика болезни – важнейший при постановке диагноза фактор. Такой (без учета динамики) подход используется во всех методах диагностики: от Байеса до искусственных нейронных сетей. 19
Авторам с самого начала работы над этой темой [25, 26] было ясно, что при диагностике необходимо учитывать динамику диагностических признаков [25, 26, 89 – 120], т.к. течение заболевания во времени является одним из основных источников дифференциальной диагностики. В силу изложенного, одной из целей исследования стала разработка методики учета динамики ДП при диагностике заболеваний. Разработанные методики и компьютерные программы диагностики с учетом динамики заболеваний обладали неплохими диагностическими способностями, то есть процент верных диагнозов был достаточно высок [94, 98]. Дальнейшие исследования показали, что предложенные методы являются нетрадиционной формой метода наибольшего правдоподобия, причем в наших разработках этот метод учитывает динамику заболеваний [90 – 101, 110]. В связи с полученными результатами, включая достаточную эффективность предложенных методов диагностики, был проведен анализ литературы. При анализе литературы авторов интересовали: применение метода наибольшего правдоподобия для диагностики, особенно, для дифференциальной диагностики заболеваний, учет динамики изменения анализов и симптомов пациента при диагностике заболеваний, эффективность и результаты диагностики, практическое использование компьютерной диагностики, особенно при диагностике желтух. Метод максимального правдоподобия является одним из широко известных методов, входящих в учебники по теории вероятностей. Этот метод широко применяется в разных областях науки и практической деятельности. Так, метод наибольшего правдоподобия применяется в эконометрии, биометрии, эвентологии, астрономии, компьютерной лингвистике [86, 88, 121]. Метод
максимального
правдоподобия
используется
также
при
автоматическом анализе биологических сигналов и во многих других исследованиях [122 – 129]. Используется метод максимального правдоподобия и в медицине: в 20
компьютерных методах обработки электрокардиограммы [130]; для улучшения прогностической значимости шкалы SAPS (Simplified Acute Physiology Score) в Институте хирургии им. А.В. Вишневского РАМН [131]; при исследовании фактора хронических болей программой Amos 4.0 (Arbuckle, 1999) в James A. Haley Veterans’ Hospital and the University of South Florida [132]. Хотя приведённый выше обзор говорит о значительном применении метода наибольшего правдоподобия в медицинских исследованиях, включая обработку данных, прямого применения этого метода для дифференциальной диагностики не было найдено. Видимо, для дифференциальной диагностики заболеваний метод максимального правдоподобия используется очень редко. Во всех найденных работах метод максимального правдоподобия реализуется в его классической форме, то есть проводится перебор параметров. Алгоритма решения, основанного на разработанном авторами итерационном процессе, не было найдено. Не удалось обнаружить и работ, в которых метод наибольшего правдоподобия учитывал бы динамику заболевания. Более того, удивительно, что вообще не найдено диагностических методов, учитывающих изменение симптомов, анализов, данных инструментальных исследований во времени. Разрабатываемые
в настоящем
исследовании
диагностические
методы
тестировались на диагностике желтух. При этом одним из результатов работ стала программа дифференциальной диагностики механической и паренхиматозной желтух. Данная программа в настоящее время используется в больницах. Востребованность программы связана с тем, что с больными желтухой приходится встречаться врачам различных специальностей (врач общей практики, инфекционист, хирург, детские врачи). Для этих врачей дифференциальная диагностика
механической
и
паренхиматозной
желтух
может
оказаться
затруднительной, и врач в ряде случаев хотел бы согласовать свой диагноз с расчетом вероятности болезни по программе. При механической желтухе нужна операция, часто срочная; паренхиматозная желтуха лечится терапевтически, и операция принесет вред. Выбор между операцией и консервативным лечением нередко нужно принимать срочно, в условиях неполного (незавершенного) обследования. Особенно программа полезна для тех пациентов, у которых 21
результаты анализов и инструментальных методов исследования противоречивы. Литературный поиск показал, что очень мало упоминаний о программах, ориентированных на дифференциальную диагностику желтух и, конкретно, на диагностику механической и паренхиматозной желтух. Одной из найденных программ является упоминавшаяся выше программа «Дифференциальная
диагностика
желтух»,
автор
которой
А.В.
Устинов,
заведующий общетерапевтическим отделением филиала Клинической больницы Управления делами Президента РФ, создал ее в 1997 году (по крайней мере, удалось найти версию, датируемую именно этим годом). В резюме к программе сказано: ”Широкое распространение заболеваний печени разной этиологии требует ежедневного обращения к данной программе врачей различных специальностей. Примененный алгоритм может помочь развеять сомнения и сократить время диагностики. В программе имеется большая и подробная программа помощи, содержащая информацию о типах желтух, обмене билирубина и т.п.” [23]. Также в сети Internet удалось найти еще одну программу дифференциальной диагностики желтух, условно называемую jaundice.arj (по названию файла архива). Эта программа: «… обладает возможностью распознавания, примерно, по 250 признакам 79 нозологий, в число которых входит и желтуха. Допускается неполнота и неточность входной информации». Автор Нечмиров, домашняя страница в Интернет не указана [133]. Найденные программы основаны на экспертных системах. Следовательно, ограничены субъективностью оценок эксперта. Нет информации об учете динамики заболевания этими экспертными системами, о реальной эксплуатации программ в лечебных учреждениях, о проценте верно поставленных диагнозов. В изученной литературе не обнаружено математической постановки задачи об оптимальной последовательности обследования пациента – о том, какой именно ДП нужно определить в первую очередь, чтобы наилучшим образом уточнить диагностику и лечение. Нет в публикациях и информации о модельных болезнях – искусственных болезнях,
придуманных
для
изучения
создаваемых методов. 22
задач
диагностики
и
тестирования
И, наконец, во всех встретившихся при поиске
работах эффективность
диагностики оценивалась как отношение числа правильно поставленных диагнозов к числу всех диагностируемых пациентов. Авторы считают, что возможен более тонкий анализ результатов, что будет показано ниже. Проведенный анализ литературы подтвердил актуальность и новизну теоретических и практических целей и задач настоящего исследования. Теоретически
задачи
математического распределений,
подходов диагностика
включают: к при
совмещение
диагностике,
медицинского
использование
взаимозависимых
симптомах
и
многомерных и
анализах,
диагностика с учетом динамики заболеваний, диагностика методом наибольшего правдоподобия, оптимальная последовательность обследования пациента и др. Практические диагностической
задачи:
программы
создание и
ее
универсальной
использование
для
компьютерной дифференциальной
диагностики механической и паренхиматозной желтух; сравнение различных методов диагностики и др. Разработанные авторами методы и компьютерные программы диагностики и прогноза абсолютно универсальны и пригодны для диагностики и прогноза исхода любых заболеваний, а также могут быть использованы в технике, геологии и других немедицинских областях деятельности. Тестирование и практическое использование предложенных методов и реализующей эти методы программы проводилось на диагностике желтух. Ниже приведен краткий обзор распространенности и медицинской диагностики болезней, сопровождающихся желтухой, и причин появления этого синдрома. 1.2 Медицинская диагностика желтух Болезни печени и внепеченочных желчных путей занимают значительное место в структуре заболеваний человека. Так, вирусные гепатиты А, В, С, D, G, TT и др. – самое распространенное заболевание в мире. Гепатитом болеют 0,5 – 1% всего населения в Европе, 4 – 10% – и в Африке, Азии, Ближнем Востоке (Т.И. Лопаткина, 1997). Заболеваемость вирусным гепатитом B в России за период 1992 – 1996 годы увеличилась в 2 раза и достигла 35,8 больных на 100 тыс. населения. В мире длительное время было 350 млн. человек – носителей вируса гепатита, к 2000 году 23
число их достигло 400 млн. (В.Э.Де Клерк, 2000; А.А. Ильянкова и соавт., 2001; Д.Т. Абдурохманов, 2002). В целом в странах СНГ ежегодно регистрируется около 100 тысяч случаев острого гепатита, а фактическая заболеваемость в них, по крайне мере, вдвое выше (Д.К. Львов, 1996). Ежегодно на планете от вирусного гепатита и его исходов умирает около 2 млн. человек. Каждые 15 – 20 лет от вирусного гепатита и его исходов гибнет больше людей, чем за всю Вторую мировую войну. Из них ежегодно 100 тысяч – от молниеносной формы, еще полмиллиона – в течение острой инфекции, около 700 тысяч – от цирроза печени и 300 тысяч от карциномы печени. Желчнокаменная болезнь в развитых странах относится к числу наиболее часто встречающихся заболеваний – у 10 – 15% населения. Вирусные гепатиты и желчнокаменная болезнь – основные (но не единственные) причины желтух. Желтуха – это один из наиболее ярких синдромов, которые часто сопровождают заболевания печени. Основными проявлениями его являются: пожелтение
склер
и
кожных
покровов,
кожный
зуд,
потемнение
мочи,
обесцвеченный кал. Иктеричность склер и желтушность кожных покровов заметны при уровне сывороточного билирубина 35 – 45 мкмоль/л, т.е. когда нормальные показатели превышены в 2 и более раз. В основе желтухи лежит нарушение обмена билирубина, приводящее к появлению избыточного его количества в крови. Таким образом, маркером любой желтухи
является
билирубин
(общий,
конъюгированный
–
прямой,
неконъюгированный – непрямой). Диагноз желтухи поставить достаточно просто. Как говорили старые клиницисты, – диагноз написан на лице. Однако врачу недостаточно видеть желтуху, важнейшим является определить причину (вид) желтухи, ибо от этого зависит выбор лечения – оперировать больного или лечить его консервативно. Процент диагностических ошибок в определении вида желтух достаточно велик и колеблется в широких пределах – от 8 до 30. Кроме того, по данным Алтайского гепатологического центра более 90% пациентов с механической желтухой, нуждающихся в хирургическом лечении, поступают на 15-й день и позднее (рис. 1.2.1). Они лечатся в различных стационарах совершенно с другим диагнозом. 24
До 5 дн. 8% До 15 дн. 33%
Более 15 59%
Рис. 1.2.1 Длительность желтухи при поступлении в гепатологический центр Хорошо известно, что послеоперационная летальность находится в прямой зависимости от продолжительности желтухи (табл. 1.1). Таблица 1.1 Зависимость летальности от продолжительности желтухи Длительность желтухи до 5 дней до 15 дней более 15 дней
Летальность, % до 1 2,3 7,9
Современные методы диагностики многочисленны и не всегда достаточно информативны, порой занимают продолжительное время, что ведет к утяжелению состояния больного и позднему проведению операции. Сложность в диагностике состоит еще и в том, что желтуха появляется не только при заболеваниях печени, но и при поражении других органов и систем: поджелудочной железы, желчного пузыря, системы крови и т.д. Это и создает определенные трудности и ошибки в постановке правильного диагноза и назначения соответствующего лечения. Отсюда видно, что желтуха – один из синдромов, требующих дифференциальнодиагностического поиска. Метаболизм билирубина Для того, чтобы понять причины (патогенез) желтух, необходимо иметь представление об обмене билирубина. Билирубин – основной продукт распада гемоглобина, высвобождающегося из стареющих эритроцитов. В организме здорового человека эритроцит, прожив 120 дней, распадается с 25
образованием гема (белковая часть гемоглобина крови), который попадает в органы ретикулоэндотелиальной системы и в результате трех последовательно идущих реакций превращается в билирубин. В сутки у человека распадается, примерно, 1% циркулирующих эритроцитов: содержание гемоглобина в них равно 6 – 8 г. Учитывая, что из 1 г гемоглобина образуется 35 – 36 мг билирубина, суточная продукция его теоретически должна составлять 220 – 290 мг. Однако в сутки билирубина
образуется
несколько
больше
250
мг
за
счет
билирубина,
образующегося на других путях обмена, – распад миоглобина, свободный тканевой гем, ферменты цитохромы, содержащие гем (цитохром, каталаза, перексидаза и др.). Это так называемый шунтовой билирубин. Образующийся на этом этапе неконъюгированный билирубин, будучи высокотоксичным и плохо растворимым веществом, связывается с альбумином плазмы крови. Только очень небольшая часть билирубина способна подвергаться диализу, однако под влиянием веществ, конкурирующих с билирубином за связывание с альбумином, она может увеличиваться. В комплексе альбумин – билирубин неконъюгированный билирубин попадает в систему воротной вены печени. Печень выполняет три функции в обмене билирубина (рис. 1.2.2): - захват билирубина печеночной клеткой из крови; - процесс
конъюгации,
присоединение
глюкуроновой
кислоты
в
эндоплазмотической сети (ретикулуме); - экскреция водорастворимого конъюгата билирубина в желчные капилляры. Реакция конъюгации пигмента, протекающая в печени, имеет огромный биологический смысл, превращая высокотоксичный билирубин в малотоксичное, хорошо
растворимое
соединение
билирубин-глюкуронид
(конъюгированный
билирубин). Процесс конъюгации и внутриклеточной транспортировки происходит в гепатоците однонаправленно – от капиллярного полюса к билиарному. Таким образом, конъюгированный билирубин через билиарный полюс гепатоцита выделяется в желчные ходы, а затем в кишечник.
26
Сосудистый полюс 2. Конъюгация 1. Захват
Билиарный полюс
3. Экскреция
Рис. 1.2.2 Захват, конъюгация и экскреция гемоглобина в печеночной клетке Функция захвата билирубина гепатоцитом в физиологических условиях высокоэффективна и имеет «запас прочности», благодаря чему уровень билирубина в плазме постоянен и не превышает 20 – 22 мкмоль/л. Повышение уровня билирубина в крови (гипербилирубинемия) возникает в результате: избыточной продукции билирубина; уменьшения поглощения билирубина печенью; уменьшения конъюгации в печени (конъюгации, необходимой для экскреции); уменьшения экскреции с желчью. Отсюда
желтуху
подразделяют
на
надпеченочную
(гемолитическую),
печеночную (паренхиматозную) и подпеченочную (обтурационную, механическую). Гемолитическая развивается при избыточном распаде эритроцитов. Например, при гемолитической желтухе, внутрисосудистом распаде (гемолизе) эритроцитов, 27
при всасывании из обширных тканевых гематом. Образуется настолько много билирубина, что печень становится не способной весь его конъюгировать и выводить. При этом увеличивается уровень неконъюгированного билирубина в крови и накопление его в тканях. Клиническими проявлениями гемолитической желтухи является умеренная желтушность кожных покровов и склер, цвет желтухи лимонно-желтый, отмечается умеренная бледность. При обследовании находят увеличение селезенки при нормальных размерах печени, отсутствие потемнения мочи и обесцвеченного кала. Лабораторные критерии представлены в таблице 1.2. Таблица 1.2 Лабораторные критерии гемолитической желтухи Лабораторные тесты Число ретикулоцитов Форма и величина эритроцитов Продолжительность жизни эритроцитов Осмотическая резистентность эритроцитов Гемоглобин крови Свободный гемоглобин плазмы крови Содержание билирубина в крови Активность ферментов АЛАТ, АСАТ Щелочная фосфатаза
Их характеристика Увеличено Микросфероцитоз, макроцитоз, серповидные и др. изменения Укорочена Снижена Снижен Присутствует Увеличено за счет непрямого (неконъюгированного) Не изменена Показатели в норме
Паренхиматозная желтуха возникает при поражении самой печени при таких заболеваниях как острые и хронические вирусные гепатиты, циррозы печени, токсическом поражении печени алкоголем, медикаментами, другими токсинами. При этом печеночная клетка (гепатоцит) не способна конъюгировать билирубин и в крови
накапливается
неконъюгированный
билирубин.
Кроме
того,
через
пораженную мембрану гепатоцита в кровь попадают различные ферменты и другие компоненты клетки. Клинические
проявления
паренхиматозной
желтухи
зависят
от
вида
заболевания. Однако лабораторные тесты имеют общую направленность. Для паренхиматозной желтухи характерны гипербилирубинемия за счет увеличения неконъюгированного
(непрямого)
билирубина 28
и
увеличение
активности
ферментов – АЛАТ и АСАТ, в то же время активность щелочной фосфатазы остается в пределах нормы. Причиной механической желтухи является нарушение оттока желчи на различных уровнях: от печеночной клетки до двенадцатиперстной кишки. Заболеваний, приводящих к обтурации желчных путей, достаточно много. Их можно подразделить на заболевания, создающие препятствие току желчи по желчным путям, – камни, опухоли, рубцовые стриктуры, врожденные аномалии и т.д. и патологические состояния, приводящие к сдавливанию извне: опухоль, воспалительный инфильтрат, хронический панкреатит и т.д. Выраженная желтуха, кожный зуд, темная моча и обесцвеченный стул – основные клинические критерии нарушения оттока желчи. При механической желтухе
в
крови
накапливается
конъюгированный
(прямой)
билирубин,
увеличивается активность щелочной фосфатазы при нормальном уровне активности аминотрансфераз – АСАТ, АЛАТ. Дифференциальная диагностика желтух строится на анализе и оценке лабораторных и инструментальных данных (табл. 1.3) Таблица 1.3 Дифференциальная диагностика желтух Тип желтухи
Надпеченочная. Гемолитическая Печеночная. Паренхиматозная
Характер основного патологического процесса Усиленный распад эритроцитов
Поражение гепатоцитов
ПодпеченоНарушение чная. проходимост Механическая и желчных путей
Ведущий механизм развития желтухи Увеличение образования билирубина. Недостаточная функция захвата Нарушение захвата, конъюгации, экскреции Нарушение экскреции, регургитация
Нозологические формы Лабораторные показатели и синдромы Гемолитическая анемия. Неконъюгированный Обширная гематома билирубин, увеличена осмотическая резистентность эритроцитов, свободный гемоглобин плазмы Острые и хронические Увеличен гепатиты, цирроз неконъюгированный печени, токсические билирубин и активность поражения, ПБЦ, АЛАТ, АСАТ, пигментные гепатозы Опухоли, кисты, Увеличены паразиты, камни конъюгированный билирубин и активность щелочной фосфатазы. Не изменена активность АЛАТ, АСАТ
Таким образом, казалось бы, нет каких-то трудностей по лабораторным 29
показателям определить вид желтухи. При паренхиматозной и гемолитической желтухе
повышается
уровень
неконъюгированного
билирубина,
а
при
механической – конъюгированный – прямой (рис. 1.2.3). Активность ферментов также характерна при каждом виде желтух. Так, при гемолитической желтухе нет повышения активности АЛАТ, АСАТ и щелочной фосфотазы (ЩФ). В то же время, при паренхиматозной желтухе наблюдается высокая активность АЛАТ, АСАТ и незначительно повышается щелочная фосфотаза. Для механической желтухи характерны, наоборот, высокая активность щелочной фосфатазы и незначительное повышение активности АЛАТ и АСАТ (рис. 1.2.4) 250
200
Общий
150
Прямой 100
Непрямой
50
0 Паренхим
Гемолит.
Механич.
Рис. 1.2.3 Уровень билирубина в зависимости от вида желтухи 10 9 8 7 6
АЛАТ АСАТ ЩФ
5 4 3 2 1 0 Паренхим.
Гемолит.
Механич.
Рис. 1.2.4 Активность ферментов в сыворотке крови в зависимости от вида желтух 30
Однако, данные показатели характерны для желтух первых 10 – 15 дней. В последующем при механической желтухе в процесс вовлекается печеночная клетка. Функция ее нарушается и в крови, как при паренхиматозной желтухе, увеличивается содержание неконъюгированного (непрямого) билирубина и нарастает активность аминотрансфераз – АЛАТ и АСАТ. Исходя из этого, исследование билирубина крови и его фракций, определение активности ферментов (АЛАТ, АСАТ, ЩФ) при желтухах являются скрининговым методом. Наиболее достоверным признаком паренхиматозной желтухи является определение маркеров вируса гепатита. Число выявленных возбудителей гепатита постоянно растет. Если на протяжении почти ста лет, а первое описание «катаральной желтухи» было дано в 1883 году, медицине было известно всего три вида вирусного гепатита – гепатит А, гепатит В и гепатит ни А ни В, в настоящее время известны 7 этиологически самостоятельных вирусных гепатитов, которые принято обозначать буквами латинского алфавита: A, B, C, D, E, G, TTV. Выделены вирусы гепатита А, В, С, D, Е - соответственно HAV, HBV, HCV, HDV, HEV. Антигены вирусов обозначаются символом Ag, антитела к этим антигенам – символом Ab. Маркеры гепатита A. Острый гепатит А диагностируется на основании обнаружения в сыворотке крови HAV-IgMAb. При этом важно учитывать, что синтез анти-HAV IgM начинается еще до появления первых клинических симптомов и нарастает в острой фазе болезни, а затем содержание антител постепенно снижается, и они исчезают из циркуляции через 3-6 недель болезни. Маркеры гепатита В. Они наиболее многочисленны. Антигены вируса: HBsAg – поверхностный антиген гепатита В; HBsAgIgM – поверхностный антиген гепатита В класса иммуноглобулина М (IgM); HBeAg – субъединица поверхностного антигена гепатита В; HBcAg – ядерный антиген гепатита В; HBV-DNA – ДНК вируса гепатита В; DNA-p – ДНК-полимераза гепатита В. 31
Соответствующие антитела к антигенам гепатита В: HBsAb, HBcAb, HBeAb, HBcIgMAb. Острый вирусный гепатит В диагностируется при выявлении в сыворотке крови HBsAg и высоких титров HBcAb, являющегося основным маркером заболевания, регистрируемым еще задолго до появления клинических признаков болезни и в течение всего преджелтушного и желтушного периодов. При этом важно учитывать, что при остром течении болезни HBsAg исчезает из крови к концу первого месяца от начала желтухи. Дальнейшее выявление HBsAg указывает на затяжное или хроническое течение болезни. На активную репликацию вируса гепатита B указывает обнаружение в крови HBeAg и ДНК HBV. Маркеры гепатита С. HCVAb – антитела к вирусу гепатита С, наличие их указывает на хронический гепатит С при определенной клинике. HCV-RNA – маркер стадии репликации вируса гепатита С. Маркеры гепатита D. HDVAb – антитела к вирусу гепатита D. Они свидетельствуют об активности D-инфекции, которая сопровождает и утяжеляет гепатит В. Выявленные маркеры могут отражать коинфекцию с вирусным гепатитом B или суперинфекцию вируса D на хроническую HBV-инфекцию в стадии репликации или стадии интеграции вируса гепатита B. Клинически диагностировать гепатиты G и TTV практически невозможно. Мысль о возможности этих форм вирусных гепатитов должна возникать в том случае, когда у пациента с признаками гепатита получены отрицательные результаты обследования на вирусные гепатиты A, B, C, и в случае, если у таких больных бывает положительный результат на РНК HGV (вирусный гепатит G) или ДНК TTV (вирусный гепатит TTV). Определение у пациента тех или иных маркеров указывает на то, что он либо болен гепатитом, либо перенес вирусный гепатит, либо является носителем. Для
дифференциальной
инструментальные
методы
диагностики
наиболее
исследования:
рентгенологические, компьютерная томография и др. 32
важными
являются
ультразвуковые
(УЗИ),
Часто используемым и достаточно информативным методом является УЗИ. Во время ультразвукового исследования обращают внимание на состояние ткани печени, ее трубчатых структур (внутрипеченочных сосудов, внутрипеченочных желчных ходов), размеры печени, селезенки, желчного пузыря, внепеченочных желчных путей (табл. 1.4). Таблица 1.4 УЗИ в дифференциальной диагностике желтух УЗИ признаки
Вид желтухи Паренхиматозная
Гемолитическая
Размер печени Несколько увеличена Размеры Увеличение селезенки
Обтурационная
Увеличена
Редко увеличена
Может быть увеличена
Не увеличена
Эхоструктура Обычная или слегка Акустически неоднородная акустически неоднородна Трубчатые Сужение диаметра печеночных структуры Нормальные вен. Увеличение размеров портальной и селезеночных вен Состояние капсулы Не изменена Утолщена печени Другие УЗИ Пигментные камни Дистальное затихание звука признаки в желчном пузыре
Ультразвуковыми
признаками
Акустически неоднородная Расширение внутрипеченочных желчных ходов, холедоха и желчного пузыря Не изменена Камни в желчном пузыре и холедохе, увеличение головки поджелудочной железы
паренхиматозной
желтухи
могут
быть
увеличение pазмеpов печени, повышение эхогенности паренхимы, ее акустическая неоднородность,
появление
ярких
эхосигналов
интенсивности и pаспpостpаненности, pасшиpение
большей
или
меньшей
диаметра воротной вены и
сужение печеночных вен. Как правило, изменений со стороны желчевыводящих путей нет (рис. 1.2.5). Наиболее частым ультразвуковым симптомом гемолитической желтухи было увеличение pазмеpов селезенки. Пpи
механической
желтухе
на
ультpасоногpаммах
отчетливо
видны
pасшиpенные мелкие внутpипеченочные желчные ходы (рис. 1.2.6 А). Величина диллятации внутрипеченочных желчных протоков зависела от продолжительности желтухи. При длительности желтухи свыше 10 – 15 дней отмечено более 33
значительное их расширение – от 4 до 8 мм.
А Б Рис. 1.2.5 Ультрасонограммы печени при паренхиматозной желтухе А. Акустическая неоднородность печени и утолщение капсулы. Б. Увеличение диаметра портальных вен Желчные протоки в отличие от расширенных печеночных вен имеют неправильный ход, звездчатое строение при их слиянии и прослеживаются до периферии. Желчный
пузырь пpи механической желтухе, вызванной обтуpацией
дистального отдела холедоха, увеличен в pазмеpах, имеет сфеpическую фоpму, при УЗИ наблюдается выраженное усиление эхосигнала за ним (рис. 1.2.6 Б).
А Б Рис. 1.2.6 Ультрасонограммы печени (А) и желчного пузыря (Б) при механической желтухе Особое внимание при проведении дифференциальной диагностики желтухи уделяется исследованию внепеченочных желчных ходов. Диаметр общего желчного протока, в зависимости от длительности обтурации желчных путей, колеблется от 9 до 26 мм (рис. 1.2.7 А). Наиболее частыми пpичинами непроходимости желчных 34
путей является наличие камней в желчных путях (рис. 1.2.7 Б) и опухоли головки поджелудочной железы.
А Б Рис. 1.2.7 Ультрасонограмма общего желчного протока А. Расширенный, извитой общий желчный проток. Б. Расширенный общий желчный проток, в просвете которого желчный камень Следует отметить, что УЗИ является скрининговым методом. У большинства больных с помощью УЗИ не удается определить патологию внепеченочных желчных путей – камни в холедохе, опухоли. Поэтому при подозрении на механический характер желтухи применяется прямое введение контрастного вещества в желчные ходы с помощью эндоскопической техники, – метод называется эндоскопическая
ретроградная
холангиопанкреатография
(ЭРХПГ).
Метод
позволяет определить камни в желчном пузыре, желчных ходах (рис. 1.2.8 А), выявить расширение внутри- и внепеченочных желчных ходов (рис. 1.2.8 Б).
А Б Рис. 1.2.8 Контрастное рентгенологическое исследование желчных путей А. Механическая желтуха, камень в общем желчном протоке и желчном пузыре. Б. Механическая желтуха, расширение внутрипеченочных желчных ходов 35
В диагностике опухоли головки поджелудочной железы как причины механической желтухи важное место принадлежит компьютерной томографии (рис. 1.2.9).
Рис. 1.2.9. Компьютерная томограмма. Рак поджелудочной железы. Увеличен размер головки поджелудочной железы. Увеличен желчный пузырь. Расширены внутрипеченочные желчные ходы Следует отметить огромный поток информации, получаемый врачом при клиническом,
лабораторных
и
инструментальных
методах
исследования,
являющихся базой для постановки правильного диагноза. Использование всех результатов обследования для диагностики требует запоминания и анализа очень большого по объему информационного материала, что не всегда под силу врачу, особенно молодому. Парадоксально то, что увеличение числа методов исследования не уменьшает частоту диагностических ошибок при желтухах. Выход из создавшейся ситуации можно видеть в разработке и использовании методов и компьютерных программ, которые будут решать дифференциальнодиагностические задачи с учетом вариабельности, неопределенности результата, обусловленной изменчивостью биологических систем, в случаях как избытка, так и недостаточности клинических, лабораторных, инструментальных данных.
36
Глава 2 Теоретические разработки Диагностируя, считаем сочетание заболеваний отдельной, «самостоятельной» болезнью. Если для последней имеются распределения ДП, то «суммарная» болезнь диагностируется так же, как другие, если данных о ДП нет, сочетание заболеваний исключается
из
рассмотрения.
Возможность
описания
распределения
ДП
совокупности болезней по распределениям ДП составляющих болезней – предмет отдельного исследования, выходящего за рамки настоящей монографии. 2.1 Совмещение медицинского и математического подходов к диагностике заболеваний 2.1.1 Кратко о моделировании Выше отмечалось, что диагностика на основе предложенного метода траекторий является и одной из форм совмещения медицинского и математического подходов: медицинский подход используется при моделировании траекторий ДП, а математический
–
при
сравнении
траекторий
ДП
реального
больного
с
траекториями диагностируемых болезней [25, 26, 90, 91, 92, 104]. Когда нет моделей, основанных на медицинских знаниях, на физиологии и патофизиологии, примитивную модель можно построить на основе статистики. При построении основанной на базе данных модели для каждого признака заболевания изучается траектория математического ожидания (т.е. зависимость средних в каждый день заболевания величин признака от времени, прошедшего с начала заболевания). Затем на основании медицинских знаний решается: какими параметрами траектории допустимо варьировать, чтобы описать индивидуальное (у конкретного больного) течение данной ( j -й) болезни. Или, шире, как допустимо изменять траекторию, чтобы отразить индивидуальное течение болезни. При этом в простой форме учитываются и взаимосвязи признаков. Например, повышение траектории одного признака может быть только при повышении другого; или превышение одного признака над средним уровнем связано с уменьшением другого признака и т.п. Таким образом, получаем модели динамики признаков, и их совокупность можно рассматривать как упрощенную модель болезни. Далее, найденные у больного величины диагностических признаков аппроксимируются 37
траекториями с учетом ограничений, наложенных на форму (течение) траекторий. Затем
постулируется
форма
распределения
признаков
(величин
анализов)
относительно индивидуальных траекторий. За неимением данных о распределении признаков вокруг индивидуальных траекторий во многих случаях допустимо принять, что распределение относительно индивидуальных траекторий такое же, как относительно математических ожиданий – относительно основной траектории болезни. Подчеркнем, что изложенная аппроксимация проводится для каждой ( j -й) болезни. После этого тем или иным методом рассчитывается вероятность болезни. Очень краткое изложение диагностики с использованием моделей болезней выше приведено, скорее, для сведения о том, что такое направление было предложено [25, 26, 90, 91, 97, 117]. 2.1.2 Использование условных вероятностей Другой путь использования знаний физиологии, патофизиологии и т.п. состоит в том, чтобы задать степень взаимозависимости между симптомами и анализами, исходя из медицинских знаний. Этот путь включения медицинских знаний рассмотрим применительно к использованию формулы Байеса. В обзоре (глава 1) отмечалось, что при расчете вероятностей по формуле Байеса признаки заболеваний необоснованно считаются независимыми. Учет зависимости симптомов не проводится из-за недостаточного объема статистики. В этой ситуации степень зависимости одних симптомов от других могла бы задаваться
на
основании
знаний
медиков.
Этим
медицинские
знания
компенсировали бы недостаточный объем статистики. Аналогично на основании медицинских опыта и знаний можно задать условные вероятности одних диагностических признаков относительно других. Задание условных вероятностей и степеней зависимости эквивалентны, так как условные вероятности однозначно пересчитываются в степени зависимости диагностических признаков между собой. Задание условных вероятностей может быть развито в метод диагностики, суть которого в следующем. Кроме условной вероятности задается допустимый диапазон ее изменения. При заданных условных вероятностях ставятся (вычисляются) компьютерные 38
диагнозы больным из базы данных. (Напомним, что в базе данных собраны больные с
точно
установленными
диагнозами.)
Затем
методами
нелинейного
программирования, например, методами параметрической оптимизации внутри заданного допустимого диапазона изменения условных вероятностей находятся такие величины условных вероятностей, при которых диагностика – наилучшая, – наибольшее количество компьютерных диагнозов верно. Полученный оптимальный набор условных вероятностей используется для диагностики больных [104]. 2.1.3 Дополнение статистики и уточнение распределений Поставленная задача совмещения медицинского и математического подходов имеет общий характер как проблема совмещения знаний в предметной области и расчетов на основе статистики, но здесь излагается только отображение указанной задачи на медицинскую диагностику. В медицинской диагностике превалируют два подхода: А – использование экспертных систем; В – использование методов теории вероятностей и математической статистики, и/или формально-математические приемы. Не вдаваясь в тонкости классификации, подчеркнем принципиальное отличие подходов: А – базируется на знаниях и опыте врача, В – на формальной обработке данных (игнорируя мнение врача). Очевидно, что постановочна задача о совмещении подходов А и В. Действительно, подход А использует знания врача в области физиологии и патофизиологии и т.п., что очень ценно. Однако этот (А) подход не универсален и не в полной мере использует статистику. (Статистику включает на интуитивном уровне в виде личного опыта и знаний об опыте коллег.) Подход В позволяет достаточно полно использовать статистическую информацию, т.е. накопленный опыт, но не обращается к знаниям о механизмах взаимосвязи процессов в организме и т.п. Выше
отмечена
возможность
совмещения
подходов
А
и
В
путем
моделирования болезней. Когда модели болезни нет, предлагается включить медицинские знания в чисто математический подход В через уточнение и дополнение используемой статистики (собранной и используемой базы данных). Имеющиеся распределения ДП всегда получены (построены) по ограниченным выборкам. Медицинские знания позволяют эти распределения уточнить и 39
дополнить. Таким уточнением и дополнением статистики в математический подход включаются знания врача о физиологии и патофизиологии, течении болезни, воздействии лекарств и т.п. Предлагаемое уточнение распределений за счет медицинской информации можно дополнить вариационным подходом. Можно задать интервал вероятных кривых распределения каждого ДП. Затем, используя имеющуюся (тестовую) базу данных, внутри интервала выбрать те кривые, при которых диагностика наилучшая. Расчет вероятностей болезней в известных нам публикациях проводится по одномерным распределениям. Переход к многомерным распределениям снял бы многие проблемы. Но сбор данных, достаточных для построения многомерных распределений, в большинстве случаев непосилен. Вместе с тем, используя доступную статистику, в ряде случаев можно по одномерным распределениям «построить» многомерные распределения за счет медицинских знаний – вследствие понимания взаимосвязи симптомов и анализов. Многомерные распределения являются неограниченным «потребителем» дополнения распределений: если богатая статистика и медицинские знания позволили построить двумерные распределения, более обширные знания позволят построить трехмерные распределения и т.д. Выше изложены методы совмещения медицинского и математического подходов к диагностике. Начать реализацию предложенных методов рационально с самого простого из них: с дополнения одномерных и двумерных распределений данных (ДП) на основе медицинских знаний. 2.2 Использование многомерных распределений Переход к многомерным распределениям повышает уровень диагностики за счет органического учета взаимозависимости ДП. Этот переход важен, как минимум, для диагностики с расчетом вероятностей болезней по формуле Байеса. Диагностические
признаки
заболевания
взаимозависимы.
Но
выявить
эти
зависимости, опираясь на статистику, трудно, в основном, из-за того, что нужен огромный
объем
приближение:
при
статистических расчетах
по
данных.
Поэтому
формуле
Байеса
распространено ДП
болезни
грубое
считаются
независимыми, хотя в общем случае в едином организме независимость признаков 40
исключена. Многомерное распределение органически содержит в себе взаимосвязь признаков заболевания, поэтому построение таких распределений избавляет от необходимости учета взаимозависимости признаков. Предельный случай – многомерное распределение всех признаков заболевания
g j(a1, a2 , a3 , … , am ) , где j – номер болезни, ai ( i = 1,2 ,3,..., m ) – признак заболевания. Если бы такое распределение удалось построить, то отпала бы необходимость в расчете вероятности болезни по формуле Байеса. Действительно, определив у больного конкретные величины признаков ai : a1 = ao1 , a2 = ao 2 и т.п., сразу (по зависимости g j(a1, a2 , a3 , … , am ) получаем плотность вероятности g j . Сравнение g j у распознаваемых болезней
j = 1,2,3,...n является достаточной
информацией для вывода о диагнозе. Вышеприведенное рассуждение представляется тривиальным, но после того, как оно высказано. На самом деле, данное рассуждение – общий подход к использованию многомерных распределений. Плотность распределения непрерывно распределенных ДП наглядна и ее вычисление однозначно. При сочетании дискретных и непрерывных ДП возникает проблема, которая возникла перед авторами с начала исследований [89, 93]: допустимо ли «на равных» рассматривать плотности вероятностей непрерывных ДП и вероятности дискретных ДП? То есть, допустимо ли эти, отличающиеся не только по сути, но в большинстве случаев даже по порядку, величины использовать в одной формуле. В данном случае проанализирована представительность многомерного распределения, включающего и вероятности дискретных ДП и плотности распределения
непрерывных
ДП.
Был
рассмотрен
академический
вариант
аппроксимации дискретного распределения непрерывным с помощью кривых плотности вероятности, подобных дельта-функции. Прорабатывались дискретизация непрерывных ДП и проблемы выбора интервалов дискретизации, а также оценки возникающих при дискретизации погрешностей и т. п. В результате было выяснено, что для многомерных распределений проблемы совмещения дискретных и непрерывных ДП вообще нет. Проиллюстрируем это на примере двумерного 41
распределения, в котором один ДП дискретный, а второй непрерывный. Если строить одномерное распределение непрерывного ДП только по величинам этого ДП у тех больных, у которых найдено определенное значение дискретного диагностического признака, то плотность этого «выборочного» распределения и будет
плотностью
двумерного
распределения.
И
нет
необходимости
в
дискретизации. Ордината многомерного распределения зависит от масштабов входящих в него непрерывных распределений. Может быть, эти масштабы нужно связывать со средними квадратическими отклонениями диагностических признаков, по которым построено распределение. Один из вариантов определения вероятности болезни или комплексного многомерного ДП состоит в вычислении вероятности попадания совокупности определенных признаков заболевания aoi = ( ao1, ao 2 , ao 3 , … , aom ) в заданный гиперпараллелепипед. При этом трудности переходят на задачу задания длины граней параллелепипеда. Не исключено, что длина i -й грани может быть связана с погрешностью измерения i -го ДП [99, 104, 110]. Кроме обычных методов вычисления погрешностей определения дискретных ДП можно предложить следующее. Для дискретного признака вместо его погрешности можно использовать погрешность распределения. Например, пусть у признака (симптома) «боль» распределение при болезни
j : 0,8 – есть боль, 0,2 – нет
боли. Величины 0,8 и 0,2 имеют погрешность определения. Эта погрешность может играть роль погрешности признака (данную погрешность предлагается использовать как погрешность дискретного признака). Заметим, однако, что определенные таким образом погрешности могут оказаться разными у разных болезней. Представляется, что нужно использовать одинаковую погрешность у всех болезней. В качестве одинаковой погрешности можно взять наибольшую погрешность данного признака (среди погрешностей при всех болезнях) [99]. На практике в общем случае нет возможности построить многомерное распределение, включающее все ДП. Обычно статистики хватает для построения двух и трехмерных распределений, которые являются распределениями нового 42
многомерного ДП. В простейшем и практически наиболее значимом случае образуются двумерные признаки: из двух одномерных признаков образуется пара. Возникает вопрос: стоит ли один и тот же ДП включать в несколько пар. (При объединении диагностических признаков в пары можно предложить разные принципы объединения. C одной стороны, не стоит с одним диагностическим признаком образовывать много пар, чтобы избежать неадекватного повышения его роли. С другой стороны, чем больше пар можно образовать, тем больше связей между диагностическими признаками можно учесть. Конечно, «образовывать пары», т.е. переходить к двумерным диагностическим признакам, имеет смысл только тогда, когда эти пары можно образовать у всех диагностируемых болезней.) Если рациональна минимизация числа образуемых многомерных диагностических признаков, то в конкуренции ДП на вхождение в многомерный признак очевидно только одно: чем более взаимозависимы ДП, тем рациональнее объединять их в многомерный ДП. Остальные вопросы требуют исследования. 2.3 Диагностика методом максимального (наибольшего) правдоподобия 2.3.1 Итерационный алгоритм диагностики заболеваний В самом начале исследований формула, предложенная авторами для расчета вероятности болезни [90 – 95, 97, 98, 100], считалась оригинальной и имела название «формула обобщенных вероятностей» [90 – 95, 99]. Позднее был сделан подтвержденный математически вывод, что варианты «формулы обобщенных вероятностей» являются иной формой метода максимального (наибольшего) правдоподобия (сокращенно ММП) [96, 99, 101, 110]. Метод максимума правдоподобия (термин был впервые использован в работе Фишера, 1922) введен в теорию вероятностей как общий метод оценивания параметров генеральной совокупности с помощью максимизации правдоподобия выборки, обозначенного ниже буквой L [56 и др.]. Покажем, как были получены нетрадиционные формы ММП. Основная цель настоящего исследования – разработка методов диагностики. Диагнозом считается наиболее вероятная болезнь, а вероятность болезней рассчитывается по диагностическим признакам, определенным у пациента. Для 43
нахождения вероятностей конкретных величин ДП при каждой болезни была собрана база данных и по ней определены распределения каждого ДП при каждой болезни. Так что распределения дискретных ДП и плотности распределений непрерывных ДП при болезнях известны. Более того, база данных собиралась так, что позволила определить распределения вероятностей (для дискретных ДП) и плотности вероятностей (для непрерывно распределенных ДП) в каждый день болезни. Итак, известны распределения
{
}
qij (ai ) = qijt1 (ai ), qijt 2 (ai ), qijt 3 (ai ),..., qijτ (ai )
и диагностические признаки пациента aoi , i = 1,2 ,3,..., n , следовательно, по этим t
t
данным для каждого диагностического признака может быть определена qij ( aoi ) – вероятность или плотность вероятности ДП. Для одного и один раз определенного ДП выпишем формулу Байеса
pj =
( ), ∑ p q (a ) p j qijt aoit
j
где
∑
– краткая запись суммирования
j
t j ij
(2.3.1)
t oi
n
∑ по всем n диагностируемым болезням.
j =1
В выписанной формуле Байеса p j – вероятность болезни в правой части уравнения трактуется так же, как и в левой части. Данная трактовка отличается от широко принятой трактовки, согласно которой (Н. Бейли [29, 30]) p j в правой части является не вероятностью, а распространенностью болезни. Широко принятая трактовка
обоснована
и
используется
в
других
разделах.
Соглашаясь
с
общепринятой трактовкой, все же нельзя исключать из исследования иных трактовок. Поэтому в настоящей части публикации исследуется вид формулы Байеса, отвечающий, на наш взгляд, концентрации внимания на вероятности болезни для данного конкретного больного. Учет распространенности болезней может быть сделан дополнительными членами формулы. Однако, до учета распространенности, предлагается завершить исследования диагностики на базе 44
формулы (2.3.1). Формула (2.3.1) разрешается относительно p j . Для более наглядного анализа этой формулы запишем ее для двух болезней: j = 1 и j = 2 . Тогда вероятность первой болезни
( )
p1qit1 aoit . p1 = p1qit1 aoit + p2 qit2 aoit
( )
( )
(2.3.1а)
Учтем, что в полной группе из двух болезней p1 + p2 = 1 . Как видно, уравнение (2.3.1а) имеет только два решения:
p1 = 0 , p2 = 1 и p1 = 1 , p2 = 0 . И задача состоит в отыскании решения, верного с позиций диагностики. В качестве решения предлагается итерационный процесс. Этот же итерационный процесс был использован для практической диагностики, которая осуществлялась по уравнению (2.3.1), переписанному в виде
p kj +1
=
( ). ∑ p q (a ) p kj qijt aoit
j
k t j ij
t oi
(2.3.2)
На практике предложенный итерационный алгоритм расчета всегда сходился и качество диагностики желтух: механической, паренхиматозной и гемолитической, а также здорового состояния пациента – было высоким [94, 98, 109]. Возник вопрос: «Всегда ли сходится предложенный итерационный процесс?» Математически доказана сходимость предложенного итерационного алгоритма. Одновременно показано, что метод траекторий эквивалентен (является иной математической формой) методу максимального правдоподобия [100, 110]. Строгое доказательство сходимости итерационного процесса и его связи с ММП приведены в приложении 1. Авторы надеются, что обнаруженная связь байесовского подхода, метода траекторий и ММП позволит глубже понять суть ММП. С позиций расчета вероятностей гипотез (в данном случае – вероятностей болезней) предложенный итерационный алгоритм имеет преимущества перед известными алгоритмами расчетов вероятностей гипотез по ММП. Преимущество состоит в том, что итерационный алгоритм гарантированно сходится и позволяет 45
найти искомые вероятности при меньшем объеме вычислений [96, 100, 110]. Как ясно из обзора литературы, имеется много публикаций, посвященных расчету вероятностей болезней по известным ДП с помощью формулы Байеса. Во всех найденных публикациях при расчете вероятности болезни используется только одна величина каждого ДП, т.е. для симптома или анализа или инструментального обследования используется только одно его значение. Вместе с тем, в течение болезни и лечения ДП изменяются и определяются не один раз, так что симптом или анализ принимают ряд значений, как бы движутся по характерной для каждой болезни траектории. В отличие от известных работ, авторам болезнь представлялась не как совокупность определенных один раз ДП, а как совокупность траекторий ДП. Такое представление изображено на рис. 2.1.1. При этом возникла задача: отразить в формуле Байеса не одну, а все измеренные в течение болезни величины ДП.
12
Значения ДП
10 8 6 ДП1 ДП2 ДП3
4 2 дни, t 0 1
2
3
4
5
6
7
8
9 10 11 12 13 14 15
Рис. 2.1.1 Совокупность траекторий ДП Например, пусть в течение болезни один из анализов – билирубин определялся 5 раз: в день поступления в больницу, а также на 3, 5, 8 и 15-й дни болезни.
Для
распределениям
каждой
определенной
билирубина
в
величины
каждый
день
билирубина болезни,
по
при
известным каждой
из
диагностируемых болезней ( j ) находится вероятность появления билирубина 46
данной величины. Задачей является использование всех найденных величин билирубина (при расчете вероятностей по формуле Байеса). В качестве метода ввода в формулу Байеса всех измерений каждого ДП было предложено обобщение. Обобщение самой величины ДП имеет смысл только тогда, когда данный ДП в течение болезни не меняется. Форма такого обобщения – усреднение. Вероятностные характеристики изменяющихся ДП можно обобщать как минимум двумя путями. Во-первых, можно обобщать вероятности появления (при
( )
болезни j ) диагностических признаков данной величины qij aoi . Во-вторых, можно обобщать вероятности болезней, рассчитанные по каждому конкретному определению (измерению) диагностического признака, – по формуле (2.3.1). Последний тип обобщения и рассмотрен в настоящем (2.3) разделе. В
процессе
последовательностью
работы
проверено
обобщений
несколько
вероятностей
методов,
болезней,
отличающихся
определенных
по
значениям ДП, полученных в результате обследования. Под обобщением понимается усреднение вероятностей болезней, рассчитанных по какому-либо параметру. Например, обобщение по дням, – это усреднение вероятностей, найденных по каждому из значений ДП, определенных в разные дни, – во все дни, в которые данный ДП определялся. Аналогично, обобщение по диагностическим признакам – это усреднение вероятностей болезней, вычисленных по значениям различных ДП, определенных в один день. Перечислим указанные методы в зависимости от последовательности обобщений: 1) обобщение сначала по диагностическим признакам, затем по дням; 2) предварительное обобщение не проводится, каждое обследование считается определением величины нового симптома; затем проводится усреднение всех найденных вероятностей; 3) обобщение сначала по дням, затем по диагностическим признакам. Рассмотрим все эти методы и формы обобщения подробнее.
47
2.3.2 Обобщение поперек траекторий В данном варианте методики вычисление значений вероятностей болезней осуществлялось сначала во внутреннем цикле по ДП, а затем во внешнем – по дням. При этом обобщение по ДП происходит по числу представленных ДП в данный день, а после этого по дням - по числу представленных дней. Вычисления производятся по всем m ДП, определенным в данный день, и по всем
τ дням, в
которые существует хоть одно значение анализа или симптома обследования пациента или имеется данное инструментального обследования.
p kj +1
( ) ( )
p kj qijt aoit 1 1 , = ∑ ∑ τ t mt i ∑ p kj qijt aoit j
(2.3.3)
где
i – номер ДП среди m рассматриваемых ДП; j – номер болезни (в рассматриваемой полной группе из n болезней); t – момент времени (день), в который рассматриваются ДП болезней и пациента;
qijt (aoit ) – вероятность дискретного ДП или плотность вероятности непрерывно распределенного ДП в день t , причем имеется в виду ДП, полученный обследованием пациента, а вероятность может трактоваться как вероятность принадлежности ДП определенной категории или величины к болезни
j;
∑ – суммирование по ДП; поскольку под знаком суммы стоят величины, i
относящиеся к конкретному дню, то суммирование проводится по всем ДП, определенным в этот день (но только в этот день и в рассматриваемом внутреннем цикле суммирование идет по данным одного дня t ). Принятое обозначение представляется понятным, хотя при желании можно подчеркнуть, что используются только ДП, определенные в день t , введением индекса t у индекса i : « it », а
также конкретизировать суммирование
подразумевая перенумерацию ДП в каждый день.
48
it = mt
∑ ,
it =1
p kj – вероятность болезни j , полученная в k -м итерационном цикле; p kj +1 – вероятность болезни j , полученная в k + 1 -м итерационном цикле;
mt – суммарное число ДП, определенных в день t ;
∑ – суммирование по моментам времени (дням), в которые имеются ДП; t
τ – (суммарное) число дней, в которые определялись ДП (в которые был определен хотя бы один ДП). Изложенная методика получила название «диагностика поперек траекторий». 2.3.3 Обобщение по отдельным ДП В
данной
методике
все
значения
ДП
обследования
пациентов
рассматривались по отдельности. Из этого следует специфика определения вероятности болезни – нет возможности что-либо вычислять первым: вероятность болезни по одному дню или по одному ДП. В процессе вычисления все данные обрабатываются вместе, независимо от ДП и дня, которым они принадлежат. Обобщение происходит по числу существующих значений. В отличие от других методик, здесь порядок вычислений не важен:
p kj +1
p kj qijt (aoit ) 1 = . ∑∑ τm t i ∑ p kj qijt (aoit )
(2.3.4)
j
Данная методика получила название «диагностика по отдельным симптомам». 2.3.4 Обобщение вдоль траекторий В этой методике реализована следующая последовательность вычислений: значения вероятностей обобщаются «по дням» – по числу дней, в которые определялись ДП пациента. Обобщение «по дням» выполняется отдельно для каждого ДП, а затем проводится обобщение по всем ДП.
p kj +1
p kj qijt (aoit ) 1 1 = ∑ ∑ . m i τi t ∑ p kj qijt (aoit )
(2.3.5)
j
Обобщение проводится «по дням», в которые были определены ДП. 49
Поскольку каждый ДП определялся в разное количество дней, более строгой является запись числа дней
τ с индексом i : τ i . Это указывает на разное число
дней, в которые определялись разные ДП, например камень «находился» двумя обследованиями (рентгеновским и ультразвуковым) в два разных дня, а увеличение печени определялось на каждом обходе – всего 10 раз. Так как последовательность вычислений включает обобщение по дням для каждого симптома, данная методика получила название «диагностика вдоль траекторий». 2.3.5 Диагностирование с использованием «чистого» критерия максимального правдоподобия Под использованием «чистого» критерия максимального правдоподобия подразумевается использование критерия в его классическом варианте, изложенном в учебниках. Критерий имел условное название – CMT 1 и вычислялся по отдельным ДП:
CMT1 = ∏ ∑ p j qijt (aoit ) ,
(2.3.6)
iτ j
где
∏ – произведение (по всем i -м ДП и всем τ дням) полных вероятностей iτ
(сумм по всем n болезням вышеописанных величин). Возможно вычисление критерия максимального правдоподобия также для диагностик – «поперек траекторий» и «вдоль траекторий». Авторами проработаны и другие варианты критерия максимального правдоподобия [99 и др.]. При
любой
форме
записи
критерия
максимального
правдоподобия
вероятность болезни можно найти методами нелинейного программирования. Т.е. этими методами находится сочетание вероятностей болезней, при которых критерий максимален. Среди упомянутых методов эффективны методы: Пауэлла, НелдераМида, Гаусса-Зейделя, аппроксимаций и др. В качестве еще одного метода рационально использовать метод прямого перебора. Прямой перебор в простейшем случае состоит в том, что в уравнение, функцию, обсуждаемый критерий подставляются с небольшим шагом все сочетания варьируемых параметров. В данном случае – сочетания компонент 50
вектора
Pj : p j =1, p j = 2 , p j = 3 , … , p j = n . Начиная с некоторого числа болезней, этот метод по скорости решения задачи уступает большинству методов оптимизации. Но по надежности отыскания оптимума он, пожалуй, лучший. Прямой перебор наиболее информативен для выяснения типа гиперповерхности функции цели – вида критерия наибольшего правдоподобия как функции. По сравнению с другими методами прямой перебор позволяет наиболее наглядно продемонстрировать теоретическое доказательство того, что задача имеет одно решение: критерий наибольшего правдоподобия как функция имеет один максимум. Для реализации прямого перебора нужен алгоритм генерации сочетаний варьируемых
параметров.
На
перебираемые,
варьируемые
(независимые)
переменные, которыми являются вероятности болезней, имеются естественные ограничения: вероятности болезней неотрицательны и их сумма равна единице. Отсюда следуют варианты алгоритмов перебора, выбора сочетаний вероятностей. Вероятность одной из болезней, например n -й, можно определить как разность j = n −1
p j =n = 1 − ∑ p j , j =1
(2.3.7)
где p j – вероятность j -й болезни, n – число болезней, p j = n – вероятность n -й болезни. Условия p j = n ≥ 0 или
j = n −1
∑ p j ≤ 1 позволяют ограничить массив сочетаний
j =1
перебираемых вероятностей. Существуют и другие варианты алгоритма набора (генерации) сочетаний вероятностей болезней. В полученной области сочетаний вероятностей определяются величины критерия наибольшего правдоподобия и находится оптимальное сочетание вероятностей, т.е. сочетание, при котором критерий наибольшего правдоподобия максимален. Такое сочетание обозначим
Pmax = { p j =1, p j = 2 , p j = 3 , … , p j = n } . 51
(2.3.8)
Прямой перебор можно усовершенствовать: сначала его стоит проводить с крупным шагом по p j , а затем в районе Pmax повторить с уменьшенным шагом и т.д. до нужной точности. Ограничение района Pmax проводится так, чтобы была гарантия нахождения максимума в этом районе. Сочетание максимального
величин
вероятностей
правдоподобия
болезней,
достигает
при
наибольшего
котором
критерий
значения,
считается
вероятностями болезней. На наш взгляд, основание считать найденные по этому условию вероятности наиболее правдоподобными – в следующем: при этом сочетании вероятностей болезней – наибольшая вероятность наблюдать имеющиеся у больного ДП вместе (наибольшая вероятность наблюдать имеющийся набор ДП). В случае прямого перебора
вероятностей
двух болезней допускается
существование (формальное) двухмерного пространства наборов вероятностей, измерениями которого являются вероятности болезней
p j =1 и p j = 2 . Это
пространство сочетаний вероятностей можно представить двухмерной плоскостью с теми же измерениями. Проводится перебор всех сочетаний вероятностей с целью нахождения их оптимального сочетания (набора). Критерием оценки «качества» набора (правильности, близости к реальному) служит критерий максимального правдоподобия. Его наибольшее значение
для конкретного набора из всех
сочетаний (наборов) и будет свидетельствовать о наиболее правдоподобном выборе вероятностей. Вышеописанные действия, необходимые для получения достоверных сочетаний вероятностей, мы называли «поиск максимального СМТ», или, более полно, поиск максимального значения критерия максимального
правдоподобия
методом перебора вероятностей на плоскости наборов вероятностей. Естественно, перебор всех возможных наборов вероятностей неосуществим. Реально перебираются вероятности с определенным шагом (нами использованы последовательные шаги – 2%, 1%, 0,5%). Поиск
максимального
значения
критерия
оптимизации пока не реализован.
52
с
использованием
методов
2.4 Учет взаимозависимости диагностических признаков и динамики заболеваний в байесовском подходе к диагностике 2.4.1 Использование формулы Байеса В данной работе исследуется байесовский подход к диагностике заболеваний, вероятность болезни каждого пациента рассчитывается по классической формуле Байеса
pj =
π j ∏ qij(aoi ) i
∑ π j ∏ qij(aoi ) j
j
(2.4.1)
i
Левая часть равенства – вероятность доля больных болезнью
.
j -й болезни пациента. В числителе: π j
–
среди больных диагностируемыми болезнями; qij(aoi ) –
плотность распределения (или вероятность)
i -го
j -й
ДП величиной aoi при
болезни. (Имеется в виду плотность распределения вероятности непрерывно распределенного ДП или вероятность ДП, принимающего только дискретные значения, так сказать, дискретного ДП). То есть, если при обследовании пациента величина
i -го
распределения
ДП равна aoi , то по распределению находится плотность непрерывного
соответствующая величине aoi .
ДП
(или
вероятность
дискретного
qij ,
ДП)
∏ – произведение всех i -х признаков от 1 до m . i
В знаменателе сумма таких произведений для всех диагностируемых болезней
j
(от
j = 1 до j = n ). Если плотность (вероятность) признака при первой болезни больше плотности (вероятности) признака при второй болезни ( qi1 > qi 2 ), то очевидно, что этот признак более характерен для первой болезни. Формула (2.4.1) рассчитывает вероятности
болезней,
исходя
из
соотношения
плотностей
(вероятностей)
распределения всех признаков в совокупности. При диагностике заболеваний по формуле Байеса в качестве априорной вероятности используется π j – относительная частота (доля) больных болезнью
j
среди больных диагностируемыми болезнями. В начале исследований возникал 53
вопрос: «Нужно ли учитывать распространенность болезни при диагностике конкретного больного?» Высказывались соображения типа: «Для диагностируемого пациента важны его ДП, а не то, как часто больные подозреваемой болезнью доставляются в данную больницу». Развеять сомнения помог анализ предельных случаев. Представим, что больной живет на севере типа Земли Франца-Иосифа, и что диагноз ему ставит другой полярник, имеющий все приборы для определения диагностических признаков и компьютерную программу диагностики. Пусть оба участника мысленного эксперимента вообще северные жители, никогда не бывавшие на юге и даже не встречавшиеся с людьми и товарами из южных стран, пусть даже последний корабль с материка приходил год назад. В этих условиях у больного оказались ДП, более свидетельствующие о диагнозе «Денге лихорадка», чем о пневмонии. «Денге лихорадка» распространена только в тропиках и субтропиках, переносчик комар определенного вида, инкубационный период 3 – 3,5 дня. Представляется очевидным, что для получения правильного диагноза в расчете нужно использовать относительную частоту тропической болезни, приняв эту частоту небольшой. Приведенный пример говорит о необходимости учитывать « π j ». 2.4.2 Учет динамики заболеваний при байесовском подходе Простой смысл формулы Байеса (2.4.1): вероятность при болезни
j
наблюдать у больного ДП i = 1,2 ,3,..., m вместе, отнесенная к сумме таких вероятностей у всех диагностируемых болезней (у полной группы болезней) [103]. Формула (2.4.1) выписана для независимых ДП. Пусть в формулу входят два взаимозависимых признака, тогда вместо вероятности второго ДП нужно указать условную вероятность второго ДП относительно первого. (Основываясь на условных вероятностях или на степени взаимозависимостей, начальные и предельные значения которых укажет врач, можно проработать методику диагностики, которая совместит математические методы со знаниями врача и будет «обучаться» на базе данных с известными диагнозами.) Если два ДП абсолютно 54
зависимы, условная вероятность равна единице, и нужно указывать только вероятность первого ДП. Отсюда сразу следует, что не изменяющиеся в какой-либо период ДП, например, камни в желчном протоке нужно (в этот период) вводить в формулу Байеса один раз, независимо от того, сколько раз его определяли (наблюдали) и в какие дни это было. Для двух изменяющихся ДП в грубом приближении второй признак можно «округлить» или до «сильно зависимого», или «независимого» от первого. Степень зависимости второго ДП от первого можно определить методами математической статистики по базе данных. Сильно зависимые ДП рационально усреднять в один признак. В главе 4 будет приведено исследование взаимозависимости последовательно определенных (в разные дни болезни) величин одного и того же диагностического признака. Данное исследование количественно подтверждает очевидное: ДП, повторно определенный в ближайшие дни, сильно зависит от определенного в первый день. В последующие дни эта зависимость быстро ослабевает. В настоящей работе для признака, измеренного (определенного) многократно, и для механической и паренхиматозной желтух использовано следующее допущение: считаются сильно взаимозависимыми значения анализов и симптомов первых двух дней. Эти значения усредняются и представляются как 1-й ДП, анализы и симптомы за следующие 3 дня усредняются во 2-й ДП, за следующие 5 дней усредняются в 3-й признак. Образованные вышеуказанным усреднением 1, 2, 3-й (и так далее) ДП в формуле (2.4.1) отражаются как независимые признаки. Таким
образом,
учитывается
динамика
заболевания.
Не
повторно
определенные, а разные ДП считаются, как и в других работах, независимыми, хотя это неверно. Вышеизложенную методику будем называть 2-м приближением, чтобы отличать от 1-го приближения (см. предыдущий раздел), согласно которому все повторно определенные ДП (за исключением неизменных) считаются отдельными, независимыми признаками. В этом перечислении за нулевое приближение взята общепринятая методика, согласно которой все ДП считаются независимыми, а 55
повторные определения (динамика) признаков игнорируются. Основа предложенной методики учета динамики в том, что повторно определенные величины одного и того же ДП рассматриваются как разные ДП и учитывается их (этих разных ДП) взаимозависимость [97, 99, 103]. В настоящей работе учет взаимозависимости приближенный, но переход к точному учету – дело техники. Важно, что найдена принципиальная основа учета динамики. 2.4.3 О совмещении методов диагностики Некоторые из перечисленных выше и в обзоре методов диагностики совместимы. Например, нейронные сети в качестве исходной информации могут использовать не сами ДП, а их вероятности и плотности вероятностей. Не менее перспективным представляется вместо ДП использовать вероятности болезней, рассчитанные по каждому ДП. (Прежде всего, стоит изучить использование байесовской
вероятности,
так
как
формула
Байеса
позволяет
объективно
использовать в одной формуле и вероятности и плотности вероятностей.) Аналогично кластерные методы могут базироваться на вероятностных оценках [97]. 2.5 Определение исследования (анализа), наиболее необходимого для диагностики Задача оптимальной последовательности обследования пациента была поставлена и решалась авторами в 1995 году [25, 26], а в 2000 году получен и опубликован [101] приводимый ниже алгоритм нахождения ДП, который необходимо определить в первую очередь для уточнения диагноза. Решение состоит в
нахождении
конкретного
типа
следующего
ДП
(анализа,
симптома,
инструментального обследования) на основе имеющейся базы данных (сделанных анализов и уже определенных симптомов). Иными словами, основная цель - найти какой именно следующий анализ нужно сделать или какой симптом нужно определить. Для решения задачи предложена [25, 26] функция цели (жизнеспособность)
Z – количество и качество оставшейся (для пациента) продолжительности жизни. Постулируется, что максимум этого параметра – Z max для каждого пациента достигается при правильном определении его болезни j = j( truth ) и дальнейшем 56
лечении по существующим методам лечения. Здесь j = j( truth ) – номер болезни или сочетания болезней или набора болезней, в зависимости от задачи. Любые другие неверно определенные значения j ′ ≠ j( truth ) приведут к другому курсу лечения и к не большему, т.е. к меньшему или такому же значению. Решение состоит в поиске оптимального (наиболее необходимого) ДП, назовем его « X », т.е. ДП (анализа), при котором функция цели Z максимальна. Таким образом, целью оптимизации является Z max , а варьируемым параметром номер ДП. Эквивалентной функцией цели является ∆Z , а эквивалентной целью оптимизации max ∆Z , где ∆Z - увеличение Z вследствие проведения следующего анализа. Полезно вычислять обе функции цели Z и ∆Z . ДП (анализ) X максимизирует не вероятность истинной болезни Pj = j( truth ) , а функцию Z . При этом оптимален x , не только увеличивающий вероятность
j( truth ) – истинной болезни, но и выявляющий наличие или отсутствие наиболее опасных из нераспознанных болезней, следовательно, болезней, лечение которых не проводится. Как отмечалось в [25, 26], для оптимизации могут быть использованы и иные, чем Z , функции цели. Например, для дифференциации между двумя болезнями функция цели равна ∆P – разности вероятностей этих болезней. Эта же функция позволяет найти X , в наибольшей мере решающий вопрос о выборе между двумя диагнозами. Для определения Z и других функций цели используется методика расчета вероятностей Pj возможных болезней. Расчет вероятностей болезней может быть выполнен, как показано в предыдущем разделе, по Байесу или иным методом и здесь используется как известная стандартная операция. Перейдем к определению
max Z и X . Пусть проводится диагностика j = 1,2,3,..., n болезней и известны вероятности этих болезней Pj . Болезнью j = 1 будем считать норму, отсутствие болезней.
57
∑ p j = 1,
(2.5.1)
j
здесь
n
∑ =∑ . j
j =1
Указанное выше начальное распределение болезней получено по результатам диагностики на базе
m определенных ранее анализов, инструментальных
обследований и симптомов. Номера этих ДП обозначим буквой i 1 ≤ i ≤ m . В принципе, p j , j = 1,2 ,3,...,n могут быть взяты и из других источников, например, по мнению врачей. Пусть также осталось y ДП, еще не использованных для диагностики:
am +1 , am + 2 ,..., am + k ,..., am + y .
(2.5.2)
Номера еще не использованных ДП здесь и далее обозначены буквой k. Для каждого из этих ДП 1 ≤ k ≤ y (также как и для каждого из m ДП) известны условные функции распределения вероятностей для дискретных симптомов и анализов и плотности распределения вероятностей для непрерывно распределенных симптомов и анализов. Т.е. известны, например, из статистических данных
q j ( ai ) и q j ( a k ) ,
(2.5.3)
где i = 1,2,3,...,m; k = m + 1, m + 2, m + 3,..., y . min
Пусть также известен интервал изменения ∀ak , т.е. ak
max
и ak
.
Предположим, что сделан дополнительный k-й анализ и получена величина
ak = ako . (Это только предположение, анализ еще не сделан.) После того как (гипотетически) сделан k-й анализ и получена величина ako , вычислим (уже на основе m + 1 анализов!) новые вероятности болезней.
{ai (i = 1,2,3,..., m ) + ako }
→
p new j (ako )( j = 1,2 ,3,..., n ) .
(2.5.4)
Еще раз отметим, что процедура (2.5.4) выполняется при конкретном значении new
предполагаемой величины aok , например, при aok =5. Найденные величины p j 58
не зависят от начальных или определенных на предыдущей итерации вероятностей болезней. Теперь по формуле полной вероятности найдем вероятность того, что в результате гипотетического анализа «k» будет получена величина aok (например,
aok =5). Qk ( aok ) = ∑ p j ( aok )q j ( ak ) .
(2.5.5)
j
Для непрерывных симптомов и анализов также используем формулу (2.5.5), подставляя справа плотности вероятности q j ( ak ) и получая (слева) плотность вероятности k-го ДП для величины этого ДП, равной aok . Теперь повторим вычисления по формулам (2.5.4) и (2.5.5) для всех (дискретных или непрерывных) значений aok . В результате получим функции
Qk ( ak ) и p new j ( ak )
(2.5.6)
для всех ak ∈ [ak min , ak max ]. Подчеркнем, что для каждого значения ak = aok имеется распределение new new new new p new j ( a ko ) , т.е. p j =1 ( a ko ), p j = 2 ( a ko ), p j = 3 ( a ko ),..., p j = n ( a ko ) . Аналогично по
формуле (2.5.5) и методике расчета вероятностей болезней получим распределения new
или плотности вероятности и распределения p j
в виде (2.5.6) для всех y
симптомов ( 1 ≤ k ≤ y ). Далее перейдем к вычислению функции цели Z . Возможны три принципа вычисления Z . Для их иллюстрации представим, что имеется три болезни, вероятности которых равны p1 , p2 , p3 , причем p2 > p1 и p2 > p3 . Согласно принятому
выше,
введем
диагноз
D
как
наиболее
вероятную
болезнь
D = j{max( p j j = 1,2,3,...,n )}. В данном примере D это болезнь № 2. Теперь
представим, что имеется три группы больных. Первая группа с относительным количеством больных p1 , вторая с относительным количеством больных p2 , третья с относительным количеством больных p3 . Первый принцип вычисления Z состоит 59
в следующем. Полагаем, что все три группы больных лечатся согласно диагнозу D . Т.е. правильно лечится группа p2 и неправильно группы p1 и p3 . Величина Z для всех групп разная (группы считаются состоящими из одинаковых пациентов).
Z для всех больных при результате анализа ao вычисляется как
Z ( ao ) = ∑ p j ( ao )Z D , j ,
(2.5.7)
j
где, за исключением аномальных случаев, Z D , j = 2 > Z D , j =1 Z D , j = 2 > Z D , j = 3 . Это принцип наиболее близок к практике: больного лечат по диагнозу понимаемому как наиболее вероятная болезнь (хотя, впрочем, не исключается и комбинированное лечение, но это отдельная тема). Второй принцип отражает известные методики теории вероятностей. А именно группы составляют из наугад взятых больных. Относительное количество больных в группах p1 , p2 , p3 . Первую группу лечат от болезни 1, вторую – от болезни 2, третью – от болезни 3. Третий принцип целиком теоретический. Его можно представить так. Пусть, например, случайно в первую группу попали именно больные болезнью 1, во вторую – болезнью 2, тогда третью группу составят больные болезнью 3. Напомним, что все больные, из которых формируются группы, имеют абсолютно одинаковые анализы. Поэтому, сознательно сформировать группы, в каждой из которых больные одной болезнью, невозможно. Третий принцип лечения состоит в том, что больные каждой группы лечатся от той болезни, которой они больны, т.е. проводится лечение по 3м диагнозам. Обсуждаемый принцип лечения может быть использован как теоретический эталон, как база для сравнения эффективности лечения, диагностики и т.п. Выпишем формулы расчета Z при лечении по первому принципу. Будем использовать матрицу-столбец B с элементами Z j , D , которые представляют собой величины Z для пациента (данного возраста, состояния здоровья и других особенностей) больного болезнью j( j = 1,2 ,3,...,n ) при лечении в соответствии с диагнозом D . До проведения k-го анализа диагноз D определялся по наиболее
60
{
}
вероятной болезни p j max = max p j , j = 1,2 ,3,...,n , с учетом этого, до проведения kго анализа
Z = ∑ p new j Z j ,D .
(2.5.8)
j
new
В формуле (2.5.8) использованы вероятности p j new
истинным считается распределение p j
, а не p j потому, что
, и именно так распределенных больных до
анализа k лечили неверно – по диагнозу D . Обратим внимание, что в формуле (2.5.8) Z вычислена именно по старому диагнозу D . То есть исходим из того, что до проведения k-го анализа и распределение p j и лечение, в общем случае, неверны. После проведения анализа k диагнозом D которой вероятность максимальна.
{
new
будем считать болезнь, у
}
max p new j ( aok ), j = 1,2 ,3,...,n . Величина Z
new
для дискретного симптома или анализа aok найдется как
Z knew new
Здесь: Z k
(2.5.9)
cok max
= ∑ Qk ( aok )∑ p new j ( aok )Z j , D new .
(2.5.10)
j
cok min
– значение Z после проведения k-го анализа (после определения k-го
ДП);
Z j ,D new – элементы матрицы B , точнее, столбец B , номер которого соответствует наиболее вероятной болезни – диагнозу D
new
. В формуле (2.5.10)
подразумевается, что aok пробегает все свои дискретные значения от минимального
aok min до максимального aok max . Для непрерывных ДП
Z knew
=
aok max
new ∫ Qk ( aok )∑ p j ( aok )Z j ,D new daok .
aok min
j
61
(2.5.10а)
После вычисления
Z knew по вышеприведенным формулам1 вычислим
эффективность проведения анализа k как разность:
∆Z ( k ) = Z knew − Z = f ( k ) .
(2.5.11)
Далее аналогичные вычисления выполняются для всех k анализов, симптомов, данных инструментальных обследований. И, наконец, искомые симптом или анализ или инструментальное обследование x определяется как номер ДП, при котором
∆Z k максимальна. x = k {max[∆Z k k = 1,2,3,..., y ]}.
(2.5.12)
(Напомним, что номер x получен при лечении по первому принципу2) Анализ x является рекомендуемым. После его выполнения он переходит в число известных анализов i ,1 ≤ i ≤ m
new
, где m
new
= m + 1.
Вместе с тем, кроме рекомендуемого анализа стоит рассмотреть и остальные анализы k. Как минимум, стоит о них сообщить врачу – выдать результаты расчета – список анализов k в порядке уменьшения ∆Z k с указанием величины ∆Z k . Напомним, что согласно [25, 26], травматичность анализа входит в величину Z .
1
В формуле (2.5.10а)
p j , j = 1,2 ,3 ,...,n
удобно также представить как вектор
максимальной, являющейся диагнозом. Новый вектор назовем
new Zk где
G E
=
B
d
Gо
G PДo ( aok ) . С учетом этих обозначений формула (2.5.10а) запишется в виде G
∫ Qk ( aok )B × PД ( aok ) ⋅ E daok ,
(2.5.10б)
a ok min
- единичный вектор размерностью
new Zk
Здесь
a ok max
G P( aok ) . Обнулим в этом векторе все координаты, кроме
a ok max
=
n . Аналогично перепишется формула (2.5.10). Идеальное лечение по 3-му принципу запишется в виде
∫ Qk ( aok )B
a ok min
d
G G × P( aok ) ⋅ E daok .
- диагональная матрица, полученная из матрицы
B
(2.5.10в)
обнулением недиагональных элементов, т.е. элементов, у которых
i ≠ j.
2
Отметим, что алгоритм определения эффекта идеального лечения (по третьему принципу) сложнее, чем алгоритм эффекта от лечения по наиболее вероятному диагнозу. Это видно на примере. Пусть 100 пациентов больны тремя болезнями с распределением: Номер болезни j=1 j=2 j=3 Число больных 10 50 40 (По третьему принципу каждый больной лечится от той болезни, которой он болен. По первому принципу все лечатся по диагнозу, в данном случае диагноз D определяется по наиболее вероятной, 2-й, болезни.) После проведения следующего анализа распределение приобрело вид: Номер болезни j=1 j=2 j=3 Число больных 20 15 65 Как видно по приведенным таблицам, 10 больных болезнью j=1 ранее лечились неверно. Для определения эффекта диагностики нужно указать (нужно знать) как ранее лечились эти пациенты. В данном примере они могли лечиться от болезни j=2 или j=3. Рационально считать, что
они лечились по варианту с наибольшим Z . Т.е. расчет идет по варианту (принципу) наименьшего эффекта, наименьшего δZ . Перейдем к болезни j=2. До искомого уточняющего анализа лечение 35 пациентов от этой болезни было ошибочным. От какой болезни эти пациенты лечатся после уточняющего анализа? На этот вопрос, в общем случае, нет единственного ответа. Чтобы ответ был единственным, нужно опять привлечь дополнительные предположения, например, принцип наименьшего эффекта уточняющего анализа.
62
Однако, возможны и иные аргументы по выбору не оптимального, а близкого к нему анализа или по выбору не одного, а группы анализов [25, 26]. В работах [25, 26] поставлены и рассмотрены задачи о выявлении неверного анализа (о проверке анализа) и о повторении анализа. В рамках изложенного выше варианта методики задача о выявлении неверного анализа решается так. Из уже выполненных анализов по очереди исключаются анализы или их группы, и для них выполняется описанная выше процедура поиска наиболее необходимого анализа. В частном случае, при конкретных подозрениях о возможной ошибочности анализа, последний удаляется из выполненных анализов. По формуле полной вероятности находится его ожидаемая величина.
acoii = pl
a i max
= ∫ ai q( ai )dai ,
(2.5.13)
a i min
где
q( ai ) = ∑ p j q j ( ai ) .
(2.5.14)
j
pl
new
При данном aoi находится p j
по Байесу или другому методу.
aoii = pl + aoi i = 1,2,3,..., m , m − 1, i ≠ pl → p new j . new
После этого переобозначаем p j = p j
(2.5.15)
и циклически повторяем вычисления pl
по формулам (2.5.13) – (2.5.15) до установления aoi и p j . pl
Найденные aoi и p j 3 наглядно иллюстрируют причины и необходимость перепроверки
анализа
i = pl . Саму же перепроверку осуществляют при
рекомендации, основанной на изменении критерия Z . Например, если после исключения подозрительного анализа величина Z (полученная по описанной выше методике) изменилась существенно, стоит перепроверить анализ. Вопрос о повторении анализа решается аналогично выявлению анализа, который наиболее нужно сделать. Отличие состоит только в следующем. Вероятность повторного анализа i вычисляется с учетом предыдущих анализов i . 3
Точнее, сравнение этих величин с проверяемыми величинами анализов и с получавшимися вероятностями болезней.
63
Для одних обследований вероятности повторных анализов не отличаются от первичных, для других – отличаются. Повторим здесь пример, приведенный в предыдущих публикациях [2.5.1, 2.5.2]. Если в организме есть глисты (или простейшие, или патогенная флора), то при повторных анализах вероятность их обнаружения повышается. Повышается надежность (т.е. вероятность) обнаружения и не обнаружения патологических изменений в биопсии и т.п. Таким
образом,
при
выяснении,
какой
следующий
анализ
сделать,
рассматриваются: еще не сделанные анализы и уже сделанные. Для последних выясняется необходимость их повторения как для контроля (для исключения случайных ошибок), так и для повышения надежности. Возникает естественный вопрос о продолжении или остановке процесса определения следующего анализа. Если число анализов не исчерпано, то разумно сформулировать критерии прекращения процесса поиска анализа x . (Кстати, если число анализов исчерпано, а упомянутые критерии не выполнены, то это заставляет задуматься о полноте набора используемых анализов или болезней). Для ветеринарии в некоторых случаях критерии могут быть разработаны, исходя из стоимости анализов и прибыли от излечения. Критерии, предлагаемые ниже, не связаны с ценами. В качестве необходимых условий остановки поиска следующего анализа предложим соотношения
∑ j
p new − pj j
≤ εp,
pj ∆Z ≤ ε ∆Z .
(2.5.16), (2.5.16а).
Неравенство (2.5.16) отражает стабилизацию процесса уточнения диагноза, (2.5.16а) показывает, что эффективность дополнительных анализов стала низкой. Поскольку Z имеет размерность времени, можно подумать о рациональных значениях ∆Z . Эти значения не стоит выбирать меньше нескольких дней. Другим ограничением минимального значения ∆Z и других критериев является точность вычислений Z , p j и других величин. Достаточные условия окончания расчетов могут быть получены сравнением со здоровым человеком: 64
Z new − Z11 ≤ εz . Z11
(2.5.16б)
Здесь Z11 – величина Z для здорового человека, т.к. первый индекс 1 матрицы B относится к отсутствию болезней, а второй индекс 1 – к лечению в случае нормального здоровья. Другое достаточное условие - высокая точность диагностики
( 1 − max p j ) < ε p .
(2.5.16в).
Ряд критериев может быть получен сравнением с оптимальным лечением по предложенным выше 2-му и, главное, 3-му принципам лечения. Более жестким и точным является требование выполнить условия (2.5.16) (2.5.16в) в нескольких, например, трех последовательных расчетах x , причем анализ x , найденный в части этих расчетов, например в двух расчетах, должен быть реализован. Данная стратегия выбора следующего анализа уменьшает не только число проводимых (выполняемых) анализов, но и сокращает время обследования, время постановки диагноза, что иногда принципиально важно. Приведенный выше алгоритм сводит к минимуму субъективный фактор как при назначении следующего анализа, так и при диагностике. После небольшой модификации данная методика может быть использована и в других областях медицины, а также в управлении, экономике и др. Например, может быть решена задача оптимального распределения дотаций на лечение. Дотации
могут
быть
распределены
по
болезням
так,
чтобы
общая
жизнеспособность – количество и качество жизни населения выросли наибольшим образом. При этом для заразных болезней нужно учесть не только влияние лечения на больного, но и следствия заражения окружающих. Один
из
вариантов
решения
состоит
в
следующем.
Варьируемыми
параметрами выбрать суммы, отпускаемые на лечение одного больного каждой болезнью. Функцией цели – max ∆Z ′ , где ∆Z ′ увеличение вследствие лечения количества и качества жизни больного и людей, находящихся в контакте с ним. При решении необходимо учесть ограничение на общую сумму финансирования. 65
Методами нелинейного программирования (параметрической оптимизации) эту задачу можно решить. 2.6 Оценка результатов диагностики 2.6.1 Уровень надежности и неопределенный диагноз Результатом
байесовской
диагностики
каждого
пациента
являются
вероятности каждой болезни (формула 2.4.1). Сумма вероятностей равна единице. По рассчитанным вероятностям ставится диагноз. Если вероятность 1-й болезни ( p1 ) не ниже вероятности 2-й болезни ( p2 ), то диагнозом может считаться 1-я болезнь. (Формально более точное определение дано ниже и включает случай равенства вероятностей, но на практике равенства вероятностей в реальных расчетах не бывает.)
pj - вероятность j-й болезни pj, %
- 1-я болезнь
- 2-я болезнь
80
94%
85%
40
90%
60 51%
20 0
6%
Диаграмма А
49%
Диаграмма В
15%
Уровень надежности
100
Диаграмма С
Рис. 2.6.1. Примеры результатов диагностики трех пациентов Рассмотрим гипотетический случай (пример В на рис. 2.6.1): p1 = 51% ,
p2 = 49% . Здесь вероятности болезней практически не различимы и делать категорический вывод, по нашему мнению, нельзя. В другом случае (пример А):
p1 = 94% , p2 = 6% , можно более уверенно дать ответ. Если вероятность одной из болезней не только не ниже вероятностей других болезней, но и превышает установленный заранее «уровень надежности диагноза», 66
то выбор делается в пользу этой болезни. Установим уровень надежности, равный 90%. Для примера А мы получаем диагноз – болезнь 1, для примеров В и С – диагноз неопределенный, то есть программа отказывается сделать выбор в пользу 1-й болезни и требует больше данных. Такой подход к оценке вероятностей позволяет перевести часть неправильно поставленных диагнозов в область неопределенных ответов. Одновременно часть правильных диагнозов также становятся неопределенными (как в примере С). Представляется, что важнее сделать меньше ошибок в диагнозе, чем большему числу пациентов поставить верный диагноз. 2.6.2 Критерий эффективности диагностики Методы, алгоритмы и программы математической диагностики, в частности, диагностики заболеваний тестируются на базах данных, например, на группе (G ) больных с точно установленными заболеваниями.
G = {1,2 ,3,...,k,... ,g }. В известных авторам работах в качестве критерия эффективности диагностики используется процент верных диагнозов. Под верным диагнозом понимается математически (компьютерно) поставленный диагноз, совпадающий с диагнозом, поставленным данному больному медиками. Вместе с тем, по тем же самым результатам математической диагностики можно
более
объективно
оценить
эффективность
используемого
метода
диагностики. Пусть в результате расчета найдены вероятности болезней k -го больного из группы G : Pkj = 1,2 ,3,..., n , где
j
– номер болезни, n – число
диагностируемых болезней. Считаем, что каждый больной болен только одной болезнью и что применяемый метод диагностики рассчитывает вероятности всех болезней, которые имеются у больных данной группы G. Например, в группе G имеются больные двумя болезнями ( n = 2 ) j = 1 и
j = 2 . Тогда для k -го больного вычисляются pk1 (т.е. вероятность первой болезни pkj =1 ) и pk 2 (т.е. вероятность второй болезни pkj = 2 ); в иных обозначениях,
67
вычисляется вектор вероятностей болезней p k = ( pk1 , pk 2 )∑ pkj = 1. (Как и ранее, j
суммирование j =n
по
параметру
обозначается
одним
нижним
индексом:
k =n
∑ = ∑ , ∑ = ∑ .)
j =1
j
k =1
k
Номер болезни, которой каждый пациент действительно болен, обозначим
jtr( k ) . Вероятность (расчетная) этой болезни для k -го больного соответственно имеет обозначение
p jtr ( k ) . Критерием эффективности предлагается выбрать
величину
CE =
1 ∑ pkjtr , g k
(2.6.1)
где g – число больных в группе G . Приведем
условный
пример
оценки
эффективности
двух
методов
диагностики. Эти методы обозначим как M 1 и M 2 , а применение этих методов к больным группы (базы) G как M ( G ) . То есть M ( G ) – это расчет вектора вероятностей болезней для каждого из пациентов группы G . Пусть G состоит из двух больных k = 1 и k = 2 , которые на самом деле больны болезнью j = 1 , т.е.
jtr = 1 . G = {1,2 | jtr = 1} . Пусть также M 1( G ) , т.е. применение первого метода диагностики для группы больных G, привело к следующим результатам: для больного k =1: pkj = p11 = 0,49; pkj = p12 = 0,51; для больного k =2: pkj = p21 = 0,99; pkj = p22 = 0,01. Очевидно, что расчетным диагнозом считаем болезнь, вероятность которой не меньше, чем у других болезней. Если таких болезней - диагнозов не одна, то среди них диагноз определяется случайным образом. В приведенном выше расчете метод M 1 диагностировал у больного 1 болезнь
j =2, поскольку расчетная вероятность 2-ой болезни больше, чем 1-ой: p12 =
0,51 >
p11 = 0,49. Этот диагноз неверен, т.к. в действительности больной страдает болезнью 1:
jtr ( 1 ) = 1. У больного 2 вероятность 1-й болезни выше, чем
68
вероятность 2-й: p21 = 0,99 > p22 = 0,01, т.е. расчетом диагностируется 1-я болезнь. Это верно, т.к. принято jtr( 2 ) = 1. При обычном подходе эффективность диагностики 50%: у одного больного правильный диагноз, у второго - неправильный. Критерий CE по формуле (2.6.1)
1 CE( М1 ) = ( 0,49 + 0,99 ) = 0,74 , или 74%. 2 Примем теперь, что по методу M 2 ( G ) : для больного k =1: pkj = p11 = 0,01; pkj = p12 = 0,99; для больного k =2: pkj = p21 = 0,99; pkj = p22 = 0,01. Метод M 2 , так же как метод M 1 , неверно диагностировал больного 1 и верно больного 2. При обычном подходе эффективность диагностики 50% - такая же, как у
M 1 . Критерий CE по формуле (2.6.1) 1 CE( М 2 ) = ( 0,01 + 0,99 ) = 0,5 , или 50%. 2
Для удобства рассматриваемые вероятности болезней выражены в процентах и сведены в таблицу. Вероятность болезней, % больной k =1 k j (болезнь) 1 2 0 медицинский диагноз (jtr) 100* ( jtr ) 51 49 ( jtr ) M 1( G )
больной k =2 1 2 100* ( jtr ) 0 1 99* ( jtr )
1 0,74
Таблица 2.1 Обычная оценка диагностики 1 0,50
99
99* ( jtr )
1
0,50
0,50
M 2( G )
1 ( jtr )
CE
* - отмечены вероятности болезни, считающейся диагнозом ( p > 50%); обозначение ( jtr ) - напоминает, что больной на самом деле болен этой болезнью. Сравнивая эффективность методов M 1 и
M 2 , видим, что CE (M 2 )
существенно меньше, чем CE (M 1 ) . Разберемся почему. Оба метода неверно ставят диагноз больному 1. Первый метод вероятность правильной болезни указывает 49%. Это неверно, но до правильного диагноза «не хватает» чуть более 1%. M 2 вероятность правильной болезни определил как 1%, что очень далеко от
69
действительности. Т.е. M 2 хуже, чем M 1 . CE учитывает разницу в диагностике:
CE (M 1 ) > CE (M 2 ) . Обычный подход указанной разницы «не чувствует». Для полноты анализа можно конкретизировать CE . Так, кроме общего CE можно
вычислить
CE
для
каждой
болезни
отдельно.
Поясним
это.
В
рассмотренном примере группа G состоит из больных одной болезнью. Но группа может состоять и из больных разными болезнями G ⊃ G j , где
j = 1,2,3,..., n ;
G j – подгруппа из больных одной болезнью. G j = {1,2,3,..., k ,..., g j }, ∑ G j = G , j
∑ g j = g . Для каждой подгруппы можно вычислить CE j , который будет j
характеризовать
эффективность
метода
при
диагностике
одной
болезни.
Собственно, в приведенном примере рассматривался CE диагностики одной болезни
j =1.
Аналогично можно выделить подгруппу, имеющую определенный набор симптомов, и вычислить CE для этой подгруппы. Из последней подгруппы можно выделить ее часть, относящуюся к одной болезни, и вычислить CE для этой части. 2.6.3 Влияние отдельного ДП на диагноз Интересно проанализировать, как отдельные ДП или их группы влияют на диагноз. Говоря нестрого, диагноз – это наиболее вероятная болезнь, и ставится диагноз
сравнением
вероятностей
рассматриваемых
болезней.
Расчетные
вероятности болезней зависят от всех ДП, и весьма интересно выяснить, как на расчетную
вероятность
каждой
болезни
повлияло
наличие
каждого
диагностического признака, какой вклад в повышение или уменьшение вероятности болезни внес анализируемый ДП. Оценку влияния ДП на вероятность можно провести множеством способов. Приведем один из способов оценки, согласно которому кроме вероятности болезни
p j вычисляется pij− . pij− – вероятность болезни, рассчитанная при отсутствии i -го i−
ДП, влияние которого анализируется. Комбинации p j и p j могут быть базой для многих оценок влияния ДП. Например, отношение 70
Eijm =
pj
(2.6.2)
p ij−
характеризует роль i -го ДП среди m других признаков в величине p j – величине вероятности j -й болезни. Можно рассчитать вероятность j -й болезни, используя только тот i -й ДП, влияние которого анализируется. (Т.е. использован только один ДП!) Найденная i
таким расчетом вероятность, которую обозначим p j , характеризует роль i -го ДП (в вычисленной вероятности болезни) отдельно, вне влияния других ДП. i
Соотнесем p j со средней вероятностью остальных болезней, определенной по тому же (по анализируемому) ДП:
Eij =
pij
1 n −1 i ∑ pj n − 1 k =1
для k ≠ j.
(2.6.3)
Для двух болезней оценка (2.6.3) роли отдельного ДП вырождается в отношение
p1i π1q1( aoit ) t t Ei1 = i = при p1( aoi ) ≥ p2 ( aoi ) , t p2 π 2 q2 ( aoi )
(2.6.4а)
p2i π 2 q2 ( aoit ) t t Ei 2 = i = при p1( aoi ) < p2 ( aoi ) . t p1 π1q1( aoi )
(2.6.4б)
Еще более простой оценкой является отношение вероятностей или плотностей вероятностей ДП при двух рассматриваемых болезнях:
p1i q1( aoit ) t t Ei1 = i = при q1( aoi ) ≥ q2 ( aoi ) , t p2 q2 ( aoi )
(2.6.5а)
p2i q2 ( aoit ) t t при q1( aoi ) < q2 ( aoi ) . Ei 2 = i = t p1 q1( aoi )
(2.6.5б)
Последняя оценка реализована в диагностической компьютерной программе, разработанной авторами. (Хотя оценка (2.6.2) более представительна.) Примеры оценки по соотношениям (2.6.5a,b) приведены в разделе 4.2 и в приложении 2, в рубрике «степень влияния анализа». Для каждой болезни указываются только те 71
величины Eij , которые больше единицы. Это довольно удобно для анализа причин проведенной
диагностики,
поскольку,
так
сказать,
аргументы
в
пользу
конкурирующих болезней удалены из информации о данной болезни и размещены в информации о болезнях – конкурентах. 2.7 Модельные болезни и исследование на них теоретических вопросов Создать, придумать искусственные, модельные болезни авторы предлагают [115, 120], как минимум, с тремя целями. Первая – выяснить влияние на диагностику различных факторов, так сказать, в чистом виде и в различных вариантах.
Имеется
в
виду,
что
реально
наблюдаемые
факторы:
набор
(соотношение) в базе данных больных различными болезнями, собранные для реальных больных и болезней анализы и другие диагностические признаки и т.п. – содержат естественные шум и конкретность, что затрудняет и ограничивает анализ. Вторая цель – получить тестовые примеры для проверки эффективности различных методов диагностики. Модельные тестовые примеры в отличие от реальных данных не имеют ограничений на объём данных, т.е. можно смоделировать любое число больных, и не содержат ошибок диагностики и ошибок сбора данных. Третья цель – выяснить ряд теоретических вопросов, поскольку характер факторов, ДП и число и вид модельных болезней при моделировании последних можно выбрать так, чтобы прояснить возникающие при диагностике вопросы. Например, на модельных болезнях можно выяснить принципы объединения непрерывных и дискретных ДП в многомерный ДП и эффективность диагностики с помощью многомерных ДП. При этом необходимо обратить внимание на то, как смоделировать независимые и зависимые диагностические признаки, чтобы исследовать проблемы учета взаимозависимости признаков при диагностике. Среди вопросов, которые можно прояснить на моделях, – вопрос о том, начиная с какого количества данных (объема базы данных) объединение диагностических
признаков
использованием
одномерных
в
многомерные
диагностических
имеет
преимущество
признаков
как
перед
независимых.
Планируется выяснить, какие именно диагностические признаки рациональнее объединять в многомерный ДП и т.д. 72
Учитывая это и другие перечисленные выше цели, были предложены модели болезней. Одна из самых простых моделей – однопризнаковая, т.е. такая, при которой
состояние
пациентов
при
всех
болезнях
характеризуется
одним
диагностическим признаком. Будем рассматривать однопризнаковые болезни. Диагностические признаки считаем функционально связанными со временем, отсчитываемым от начала заболевания. Модель болезни задаем зависимостью математического ожидания диагностического
признака
от
времени.
Под
независимым
понимаем
диагностический признак, значение которого (при заданных математическом ожидании и распределении) находится как случайная величина. В качестве модели нулевого уровня сложности можно предложить модель одной болезни с независимым диагностическим признаком, математическое ожидание которого постоянно или изменяется линейно. Такая модель интересна только для контроля правильности реализации. Модель следующего (первого) уровня сложности – это модель с двумя болезнями. Значение (единственного) диагностического признака при каждой болезни
постоянно
и
индивидуально
для
данной
болезни,
т.е.
значения
диагностического признака при болезнях – разные. Протекание таких болезней (зависимость математического ожидания величины диагностического признака от времени) изображено на рисунке 2.7.1 линиями. По оси абсцисс – оси времени – могут быть отложены дни от начала заболевания. Болезнь 1 можно для удобства
1 величина признака
называть
«большое
диагностического
значение
признака»,
или
«большая температура», а болезнь 2 – 2
«маленькое значение диагностического признака», или «маленькая температура». Для
t (дни)
Рис. 2.7.1
страдающего
конкретного болезнью
диагностического
пациента, 1,
признака
величину можно
находить по известному (изображенному на рисунке линией 1) математическому 73
ожиданию диагностического признака и какому-либо, например, нормальному распределению. Таким образом, значение диагностического признака определяется в
первый
день
диагностического
заболевания. признака,
Согласно
в
принятой
модели
дни
заболевания
остальные
постоянного значение
диагностического признака у этого пациента такое же, как в первый день. Величина диагностического признака для конкретного пациента в рассматриваемом варианте модельной болезни изображена на рис. 2.7.1 пунктиром. Определение значения диагностического признака для пациента, страдающего второй
болезнью,
отличается
только
использованием
другой
величины
математического ожидания диагностического признака. (За исключением случаев специального исследования разных распределений для болезней.) В рассмотренных болезнях – болезнях «постоянного диагностического признака» - диагностические признаки являются зависимыми. Это следует из предсказуемости
значений
диагностических
признаков:
зная
величину
диагностического признака в один из дней, можно предсказать величину диагностического признака в любой день. Модели постоянных диагностических признаков предложены, в основном, для выяснения эффективности усреднения диагностических признаков по сравнению с использованием их как независимых. Следующий по сложности случай, - когда при одной из болезней диагностический признак линейно изменяется, а при другой – постоянен. Такой случай, точнее, изменение математического ожидания диагностического признака в функции времени (дней с начала заболевания), изображен на рис. 2.7. 2. Первую величина признака
рис. 2.7.2 1
из
болезней
«изменяющийся
изображенных можно
на
называть
диагностический
признак» (пациент болен изменяющимся диагностическим признаком), вторую – 2
Рис. 2.7.2
постоянный диагностический признак. Величины
t (дни)
диагностического 74
переменного признака
для
конкретного
пациента
находятся
так.
В
первый
день
болезни
значение
диагностического признака получается случайным образом при выбранных распределении и математическом ожидании диагностического признака в первый день. Это математическое ожидание изображено на рисунке как ордината в первый день. Значения диагностического признака в остальные дни получим как ординаты линии, проходящей через ординату первого дня и параллельной изображенной на рисунке 2.7.2 линии математических ожиданий величины диагностического признака. Полученное указанным образом изменение величины диагностического признака для конкретного пациента изображено на рис. 2.7.2 пунктиром. Пересечение (линий математического ожидания) диагностических признаков сделано
специально
диагностических
для
исследований
признаков.
Ожидается,
допустимости что
у
усреднения
больного
величин
изменяющимся
диагностическим признаком (болезнь 1) мы совершим диагностическую ошибку, если будем брать пары диагностических признаков, равноудаленных от места пересечения линий диагностических признаков (пунктирной линии и линии математического ожидания болезни 2), усреднять значения диагностических признаков в этих парах и использовать усредненные значения при диагностике. Ошибка
ожидается
потому,
что
усредненные
значения
переменного
диагностического признака будут в точности равны диагностическому признаку при второй болезни – болезни «постоянный диагностический признак». Заметим, что величины диагностических признаков у пациента в два любых дня – достаточная информация для диагностики заболевания: если величины диагностических признаков разные, – болезнь переменный ДП, если величины одинаковые, – болезнь постоянный ДП. До того, как у пациента определены две величины диагностического признака, диагностические признаки являются независимыми. То есть по значению диагностического признака в один из дней нельзя найти значение диагностического признака в другой день, поскольку неясно, какой болезнью пациент болен. Вместе с тем, при каждой болезни диагностические признаки зависимы: если известна болезнь (известна линия математического ожидания диагностического признака), то по одному значению диагностического признака можно предсказать его значения в 75
любой день. Планируется провести исследования диагностики на однопризнаковых моделях, а затем перейти к двухпризнаковым моделям. На последних, в числе прочего, планируется исследовать случай, когда диагностические признаки по отдельности свидетельствуют о разных болезнях.
76
Глава 3 База данных, вероятности и плотности вероятностей диагностических признаков 3.1 Характеристика статистических данных 3.1.1 Относительная частота механической и паренхиматозной желтух Были
приблизительно
оценены
доли
больных
механической
и
паренхиматозной желтухами в общем количестве больных этими желтухами. Имеется
в
виду
общее
количество
поступивших
в
больницу
больных
паренхиматозной и механической желтухами. Оценка проведена по данным терапевтического отделения краевого гепатологического центра (больница №5). Принято, что доля больных: паренхиматозной желтухой π1 = 0 ,7 ; механической желтухой π 2 = 0 ,3 . 3.1.2 Диагностические признаки Методом случайной выборки были взяты 613 историй болезней обычных больных с точно установленными диагнозами (механическая или паренхиматозная желтуха) и выписаны диагностические признаки с указанием дней их определения. Напомним,
что
под
диагностическими
признаками
понимаются
симптомы
заболевания, клинические анализы, данные инструментальных обследований пациента; как и ранее, в тексте употребляется сокращение ДП – «диагностический признак». Всего использовалось девятнадцать диагностических признаков, в которые были включены пол и возраст пациента: 1) пол пациента; 2) возраст пациента; 3) боль; 4) кожный зуд; 5) расширение холедоха; 6) расширение внутрипеченочных ходов; 7) увеличение печени; 8) увеличение селезенки; 9) зеленый цвет печени; 77
10) маркеры вирусных гепатитов; 11) обтурация желчных путей (наличие опухоли, желчных камней, стриктур и т.д.); 12) наличие эффекта от предыдущего лечения; 13) билирубин непрямой (неконъюгированный); 14) билирубин прямой (конъюгированный); 15) ферменты АСАТ (аспартатаминотрансфераза); 16) ферменты АЛАТ (аланинаминотрансфераза); 17) щелочная фосфатаза; 18) сулемовая проба; 19) альбумин. Данные выписывались в динамике, то есть симптомы, клинические анализы и данные обследований брались не только в день поступления пациента в больницу, но и в другие дни: с 1-го дня (день поступления пациента в больницу) по 50-й день (максимальный период лечения больных). Заметим, что база данных – реальная, ДП каждого пациента определены не в каждый день болезни. То есть это результаты обычных обследований, далеких от идеальности. Отсутствие анализа для любого признака в один из дней говорит лишь о том, что анализ в этот день не был проведен. Например, некоторые анализы не сделаны, так как были сделаны недавно, а другие анализы не сделаны из-за отсутствия реактивов и т.п. Разработанные нами алгоритм и методика диагностики функционируют и в том случае, когда ДП определены не в каждый день, и когда определены не все ДП. Все истории болезней были подняты из архива больницы №5 (больница РТП г. Барнаула; данные выписывались под руководством одного из авторов профессора Г.Г. Устинова). Ниже приведена история болезни одного из пациентов. Это обычный больной с типичными диагностическими признаками, на основании которых рассчитывается диагноз (рассчитываются вероятности болезней и ставится диагноз). № истории болезни: 25 ФИО: П.А.Ю. Возраст: 20
78
Дата поступления: 12.01.01 День выписки: 1.02.01 Начало болезни: 2 Начало лечения: 0 Комментарий: наркомания, на 20-й УЗИ проводилось в следующие дни: Маркеры в 8-й день: +B Признак/день 1 4 Боль + Кожный зуд Расширение холедоха Увеличение печени + Увеличение селезенки Маркеры Билирубин непрямой 26.00 Билирубин прямой 48.00 Ферменты АСАТ 2.00 Ферменты АЛАТ 5.50
– состояние удовлетворительное 5 5
8
14
15
20
+
28.00 16.00 1.00 2.20
22.00 18.00 1.10 2.30
18.00 6.00 0.30 0.70
Дадим краткий комментарий приведенным данным. Больной
П.
поступил
в
терапевтическое
отделение
краевого
гепатологического центра (больница №5) 12 января 2001 года. Желтуха появилась за 2 дня до поступления. В день поступления больной отмечал боли в правом подреберье (знак «+» – ДП положительный). Во время обследования врач определил увеличение печени. При лабораторном исследовании (данные анализов поступили на 4-й день) отмечено повышение содержания в крови билирубина за счет прямой фракции, значительное увеличение активности ферментов АЛAT и ACAT. На пятый день произведено ультразвуковое исследование. Установлено, что холедох не расширен, печень и селезенка не увеличены. Проведение УЗИ в динамике показало сокращение печени до нормы. Это не противоречит результатам проведенных ранее исследований, а указывает на положительную динамику течения заболевания под воздействием лечения. У больного обнаружен HBS-антиген-маркер вирусного гепатита В. Из 19 используемых при компьютерной диагностике ДП в представленных данных содержатся 11 диагностических признаков. Следует отметить, что в истории болезни имеются и другие диагностические признаки, такие, например, как внутривенное употребление наркотиков, некоторые данные УЗИ, показатели анализов крови. С накоплением статистики планируется ввести в диагностику все имеющиеся 79
данные, что уточнит конечный результат - диагноз. Выписанные данные 613 больных ниже используются для статистических характеристик ДП. Для диагностики используются только 564 истории болезни. Дело в том, у остальных 49 больных в истории болезни приведено недостаточно ДП для постановки диагноза. У этих больных диагноз был поставлен не только по ДП, но и по другим данным, например, по результатам операции или вскрытия. Поэтому такие больные из базы для контроля диагностики исключены, но оставлены в базе данных для построения гистограмм. 3.2 Дискретные и непрерывные диагностические признаки, построение гистограмм 3.2.1 Дискретные и непрерывные диагностические признаки Признаки разделяются на два класса: дискретные и непрерывные. Дискретные признаки (боль, кожный зуд, увеличение печени, потеря веса, пол и
т.д.)
принимают
одно
из
четко
определенных
значений.
В
рамках
диагностируемых состояний – одно из двух значений: наличие патогенного признака или его отсутствие, норма или не норма. Например, наличие или отсутствие боли, печень нормальная или увеличенная, наблюдалась или нет потеря веса. Состоянию «нет» (отсутствие) ставилось в соответствие число 0, состоянию «да» (наличие) – число 1. (Для признака «пол»: 0 – мужской пол, 1 – женский пол.) Медицинские данные иногда позволяют разделять дискретные признаки на 3 и более категории. Например, боль: сильная, слабая, отсутствует. Цвет печени: розовый, коричневый, фиолетовый, зеленый. Размеры печени: уменьшена, не увеличена, увеличена на 1 см, увеличена на 2 см и т.п. Однако анализ многих историй болезней пациентов показал, что даже при двух взаимоисключающих категориях возможны различные оценки одного и тоже состояния разными врачами. Например, врач-интерн записывает, что печень не увеличена, а заведующий отделением – напротив – печень увеличена. Так как увеличение возможных состояний дискретных признаков может привести к увеличению ошибок (в силу субъективности обследования лечащим врачом), пока принято, что дискретный признак может иметь только два значения. При этом (в ущерб детальности) повышается надежность исходных данных. 80
Непрерывный признак (ферменты АЛАТ, ферменты АСАТ, билирубин прямой, билирубин непрямой, щелочная фосфатаза, сулемовая проба, альбумин, возраст) характеризуется вещественным числом в определенном интервале: от минимального до максимального значений признака. Анализ величин непрерывных признаков врачом связан с медицинскими интервалами – нормами для каждого признака (кроме возраста). Каждое значение признака любого пациента, чаще всего, характеризуется так: норма, выше нормы, ниже нормы. Иногда используются дополнительные категории: много выше нормы, много ниже нормы и т.п. относительная частота
1
паренхиматозная желтуха 0,76
0,8
механическая желтуха
0,6 0,4 0,24 0,2 0
+
–
0,51
0,49
–
+
"–" = печень не увеличена "+" = печень Рис. 3.2.1 Распределения ДП «увеличение печени»
Входящие в формулу Байеса вероятностные характеристики признаков рассчитываются после построения соответствующих гистограмм признаков для каждой болезни. Для дискретных признаков каждый интервал гистограммы – одно из возможных состояний признака. Первый интервал дискретного признака – отсутствие патологического признака, второй интервал – его наличие. После построения гистограммы вычисляется вероятность попадания нового данного в каждый интервал. Таким образом, для каждого конкретного больного находятся вероятности ДП (положительного или отрицательного состояния) для каждой болезни. Именно эти вероятности используются в расчетах по формуле Байеса (2.4.1). 3.2.2 Особенности построения гистограмм непрерывных диагностических признаков
81
Математически формула Байеса позволяет использовать и вероятности и плотности вероятностей одновременно. Для использования вероятностей можно дискретизировать
непрерывные
признаки.
То
есть,
разделить
признак
на
ограниченное число интервалов (например, по медицинскому принципу: норма, ниже нормы, выше нормы) и
поставить в соответствие каждому интервалу
вычисляемую вероятность (а не плотность). информации,
поэтому
распределенных
лучше
признаков,
а
Дискретизация связана с потерей
использовать их
не
плотности
вероятности
вероятностей.
непрерывно
Вероятностные
характеристики признаков зависят от выбранных длин интервалов гистограмм, поэтому ниже изложены методики определения указанных интервалов. Для построения гистограммы с равными интервалами находятся минимально и максимально возможные значения признака. Полученная разность – размах гистограммы делится на определенное количество равных интервалов. На основании статистической базы данных рассчитывается количество пациентов, попадающих в каждый интервал (интервал значений каждого признака). Существуют
различные
рекомендации
по
определению
количества
интервалов. Число интервалов является функцией объема выборки, по которой строится гистограмма. Другим условием, ограничивающим количество интервалов, является требование к минимальной высоте столбца гистограммы на каждом интервале (к минимальному числу попаданий в интервал). В настоящей работе количество интервалов ограничено следующими условиями: 1. Количество интервалов должно быть максимально возможным, тем самым достигается наибольшая точность, приближенность к истинному распределению; 2. Высота интервала, в который попало значение признака, для которого вычисляется плотность, должна быть не меньше определенной заданной величины (при этом достигается приемлемая надежность распределений); 3. Высота каждого интервала должна быть не меньше определенной заданной величины (минимальная высота гистограммы); 4. Унимодальность
гистограммы
распределению с одним экстремумом; 82
–
приближение
гистограммы
к
5. Количество интервалов непрерывного признака должно быть не меньше трех. Сначала количество интервалов берется максимально возможным. Если при таких интервалах указанные условия не выполняются, то интервалы укрупняются, их количество уменьшается на 1, гистограмма рассчитывается заново. Это повторяется до соблюдения условий. Требование унимодальности объясняется тем, что анализ распределений признаков не проводится и даже не предполагается. Приводимая методика диагностики изначально разрабатывалась как универсальная, применимая для диагностики любых болезней с любыми наборами признаков. Аналитический разбор всех признаков не представляется возможным, поэтому распределения признаков принимают наиболее простую форму с одной модой. Таким образом, исключается ошибка построения неистинного мультимодального распределения, особенно в условиях малой выборки. Недостатком такого подхода является то, что при принудительном унимодальном распределении гистограмма становится более грубой, менее точно повторяющей функцию плотности распределения. Минимально возможное количество интервалов гистограммы – два интервала. При этом варианте автоматически достигается условие унимодальности. Но одновременно теряется прогностическая ценность распределения. n
n
90
100
100
80 30 1
2
x
x
3
1
2
Рис. 3.2.2, 3.2.3 Примеры разбиения на интервалы гистограмм непрерывных ДП На рис. 3.2.2 гистограмма состоит из 3-х интервалов, однако условие унимодальности не сохраняется. Поэтому интервалы укрупняются, их количество уменьшается до двух (рис. 3.2.3). Если для крайних значений признака (интервалы 1 и 3-й для рис. 3.2.2, интервалы 1 и 2-й для рис. 3.2.3) вероятности изменяются не 83
значительно, то для средних значений вероятность изменяется от 3/20 до 1/2 и становится неотличимой от других значений. Чтобы оградить метод от подобных ошибок, когда количество интервалов уменьшается до 2, разработан следующий алгоритм. Количество интервалов принудительно увеличивается до 3, при этом интервалы гистограммы приводятся в соответствие с медицинскими интервалами признака. Обычно, это интервалы: норма (средние нормальные значения признака для человека), ниже нормы, выше нормы (рис. 3.2.4). n
120 60
20
x
нн н
вн
Рис. 3.2.4 Пример построения гистограммы с медицинскими интервалами Медицинские интервалы не являются равными, но при таком разбиении признак имеет большую прогностическую ценность для врача. Предположительно и в представляемой методике диагностики качество деления на медицинские (экспертные) нормы будет лучшим, чем для двухинтервальной гистограммы. Очевидно, что чем больше интервалов в гистограмме, тем больше она повторяет функцию плотности распределения. Однако, условие унимодальности, выполняемое безусловно, может намного сократить число интервалов и ухудшить точность вычисления плотностей. На рис. 3.2.5 условие унимодальности не выполняется полностью. ni n
1
2
3
4
5
6
7 84
8
9
10
11
12
13
x
Рис. 3.2.5 Пример построения гистограммы непрерывного ДП Причиной не унимодальности распределения является, прежде всего, нерепрезентативность выборки на пограничных значениях признака (интервалы 11, 12, 13), а не истинная бимодальность. В этом случае, укрупнение интервалов приведет только к ухудшению точности вычисления плотностей для интервалов 2– 10, хотя для интервалов 1, 11, 12, 13 укрупнение интервалов может дать совершенно иные результаты, в отличие от имеющейся гистограммы. На основании этих данных сделано следующее предположение. Если значение признака попало в интервал, свыше высоты которого выполняется условие унимодальности (интервалы 2–10), а ниже нет, то вычисляемая плотность вероятности соответствует истинной. Считается,
что
унимодальность
относительно
данного
значения
признака
выполняется. В противном случае (значение попало в интервал 1, 11, 12, 13) интервалы необходимо укрупнять. После того, как гистограмма построена, можно приближенно вычислить плотность вероятностей для каждого конкретного значения признака. Это отношение высоты относительных частот к длине соответствующих интервалов. Причем в пределах одного интервала эта величина неизменна (рис. 3.2.6). ni n
x1 1
x2
x3
x 2
3
Рис. 3.2.6 Пример построения гистограммы непрерывного ДП Гистограмма очень грубо отражает ход графика функции плотности распределения, поэтому рассчитанные плотности для значений х1, х2, х3 из интервалы 1 будут равными. Хотя в действительности, как мы видим из рисунка, они могут отличаются в разы. Поэтому построение общей для всех значений признака гистограммы не удовлетворяет необходимой точности вычисления 85
плотностей. Это же соображение не позволяет дискретизировать признаки. В пределах одной категории дискретизированной гистограммы истинные вероятности в середине и на концах интервала могут сильно отличаться. Из рисунка 3.2.7 видно, что плотность вычисляется достаточно достоверно для значений признака, лежащих в центрах интервалов. Исходя из этого, разработан алгоритм, когда для каждого значения признака, для которого необходимо вычислить плотность, строится собственная отличная гистограмма. При этом, значение попадает в центр одного из интервалов. Гистограмма строится как бы вокруг значения признака (рис. 3.2.7). ni n
1
x1
x2 2
x3
x1
x2
x3 2
3
x
4
ni n
1
3
4
x
Рис. 3.2.7а, 3.2.7б Примеры построения гистограммы непрерывного ДП На рис. 3.2.7а гистограмма построена вокруг значения x1, на рис. 3.2.7б вокруг значения x3. Таким образом, плотность вероятностей для значений признака, попадающих в центр интервала, вычисляется более точно. Недостатком такого подхода является увеличение времени расчета диагноза. Предложенные в настоящем разделе алгоритмы обладают очень важным свойством: сформированные по алгоритмам гистограммы не имеют «пустых» 86
интервалов, т.е. интервалов, в которые не попал ни один больной из базы данных. (Наличие пустых интервалов губит качество диагностики.) Гистограмма без пустых интервалов получается увеличением длины интервалов на гистограммы,
где
распространяется гистограммы),
данных
мало.
на области
где
интервалы,
Но
данное
увеличение
богатой статистики примерно,
участках (на краях)
(в
интервалов
не
основном, в центре
соответствуют
задаче
отражения
истинного распределения. 3.3 Построение искусственных распределений Часто для построения распределений недостаточно статистических данных. Эта проблема, в ряде случаев, решается введением данных из врачебного опыта (раздел 2.1.3). Определенный
у
пациента
диагностический
признак
используется
в
диагностике только тогда, когда для этого признака имеются достоверные гистограммы при каждой из диагностируемых болезней. Гистограмма же достоверна, если для ее построения (для вычисления плотности вероятностей) имеется не менее определенного количества данных, то есть числа больных каждой болезнью, у которых был определен именно этот признак (например, сделаны анализы «билирубин прямой»). Иначе говоря, объем выборки должен быть не меньше заданной величины. В противном случае согласно алгоритму признак в диагностике не участвует, так как вычисленная по малой выборке плотность не является достоверной. Такая ситуация может иметь место и для некоторых ДП, представляющих большую ценность для диагностики. Игнорирование таких признаков ухудшает диагностику, а в отдельных случаях приводит к неверным результатам. В рамках статистической базы это относится к признакам: зеленый цвет печени, маркеры, обтурация желчных путей, отсутствие эффекта лечения от паренхиматозной желтухи. Рассмотрим гистограммы признака «зеленый цвет печени».
87
n
n
3 –
0
21
x
+
–
31
x
+
а б Рис. 3.3.1 Гистограммы дискретного ДП «зеленый цвет печени»: а) паренхиматозная желтуха; б) механическая желтуха. На каждом столбце гистограммы написано число больных На рис. 3.3.1а гистограмма признака «зеленый цвет печени»
для
паренхиматозной желтухи, на рис. 3.3.1б – для механической желтухи. По гистограмме видно, что положительное значение признака «зеленый цвет печени» не встречается у больных паренхиматозной желтухой. Напротив, при механической желтухе ДП «зеленый цвет печени» наблюдается часто. Нулевое количество больных механической желтухой с ДП «зеленый цвет печени» – с позиций теории вероятностей мало похоже на реальность и, скорее, говорит о малой выборке. Диагностика по формуле Байеса с использованием этого распределения приведет к нулевому числителю и соответственно нулевой вероятности одной из болезней, что также мало реально. Вопрос нулевых вероятностей поднимался с самого начала исследований. Было принято решение: не допускать нулевых данных в распределении (не допускать нулевых столбцов диаграмм). Реализация этого принципа для непрерывно распределенных ДП изложена в предыдущем разделе. Для дискретных ДП вместо нулевого значения указывается какое-либо очень малое число больных. Ввиду
перечисленных
обстоятельств,
были
применены
выработанные
принципы: вместо нулевого значения указать малое число больных и использовать медицинские знания для дополнения статистики. Согласно многолетним врачебным наблюдениям одного из авторов – профессора Г.Г. Устинова, примерно, у одного из ста больных паренхиматозной желтухой бывает зеленый цвет печени. Это больные с холестатическим вариантом течения паренхиматозной желтухи. На основании этого врачебного опыта сформировано более реальное распределение, изображенное 88
гистограммой рисунка 3.3.2, которая (гистограмма) отличается от гистограммы, изображенной на рис. 3.3.1а. n
100
1
–
x
+
Рис. 3.3.2 Гистограмма ДП «зеленый цвет печени» для паренхиматозной желтухи, построенная с учетом медицинских рекомендаций Для
настоящей
методики
применение
построенных с учетом мнения
искусственных
распределений,
специалиста, позволило достичь лучшей
диагностики, чем применение эмпирических гистограмм, полученных на основе малой выборки. Так и должно было случиться: имеющихся данных для паренхиматозной желтухи было недостаточно, следовательно, не было оснований использовать важный диагностический признак. Искусственное распределение позволило этот признак использовать, что и повысило качество диагностики. Заметим, что важность признака для дифференциальной диагностики – это его уникальность – близость к нулю вероятности одного из значений ДП [89]. Коррекция распределений проводилась только для тех признаков, которые являются крайне информативными в диагностике и часто оказываются решающими для диагноза. Другие, не столь диагностически ценные признаки, без нулевых вероятностей, с малой выборкой для построения гистограмм, предпочтительнее игнорировать. Достоверность искусственных распределений так же небезупречна, как и гистограмм
с
малой
выборкой.
Однако
использование
искусственных
распределений позволяет свести к минимуму грубые ошибки. В приведенном примере вероятность зеленого цвета печени у больных паренхиматозной желтухой действительно не нулевая, в отличие от вероятностей эмпирического распределения, и, соответственно, сохраняется возможность постановки диагноза «паренхиматозная желтуха» у больного с зеленым цветом печени. 89
Не составляет труда построить искусственные распределения для дискретных признаков (на основании экспертных оценок). Но и для непрерывных признаков возможно
построение
искусственных
гистограмм,
например,
в
пределах
медицинских интервалов: норма, ниже нормы, выше нормы. 3.4 Построение многомерных распределений Целесообразность использования многомерных распределений изложена в разделе 2.2. В условиях реальной статистической базы удавалось построить многомерные признаки, включающие 2, 3, изредка 4 и 5 признаков. Построение многомерного распределения рассмотрим на примере построения двумерного ДП «АЛАТ-АСАТ» . 1. Независимо друг от друга строятся гистограммы анализов АЛАТ и АСАТ по приведенным выше правилам построения одномерных распределений. 2. а) Определяется тот интервал гистограммы для АЛАТ, к которому относится значение АЛАТ пациента N. б) Так же находится интервал для АСАТ. 3. Далее определяются все пациенты, значения признаков которых попадают в найденные интервалы. 4. Проверяется условие: число таких пациентов (высота интервала) должно быть не меньше определенной заданной величины (по крайней мере, не быть нулевым): а) если условие не выполняется, тогда количество интервалов гистограмм для АЛАТ и АСАТ уменьшается, гистограммы строятся заново и происходит возврат к пункту 2; б)
если
условие
выполняется,
тогда
рассчитывается
вероятность
(плотность вероятности) двумерного признака. Для иллюстрации приведем одномерные гистограммы признаков АЛАТ и АСАТ пациента N.
90
70 60 50 40 30 20 10 0
1
2
3
4
5
6
7
8
Интервалы
9
Рис. 3.4.1 Гистограмма ДП «ферменты АСАТ» для паренхиматозной желтухи Размер выборки (количество больных паренхиматозной желтухой, у которых есть анализ АСАТ) – 248. Признак пациента N попал во 2-й интервал. Высота интервала (число пациентов, у которых признаки попадают в этот же интервал) – 28. Длина интервала 0.52. Плотность вероятности 0.22. 80 70 60 50 40 30 20 10 0
1
2
3
4
5
6
7
8
9
10
11
Интервалы
Рис. 3.4.2 Гистограмма ДП «ферменты АЛАТ» для паренхиматозной желтухи Выборка 257. Признак пациента попал во 2-й интервал. Высота интервала 4. Длина интервала 0.62. Плотность вероятности 0.025. 60 50 40 30 20 10 0
1
2
3
4
5
6
91
7
8
9
10
Интервалы
Рис. 3.4.3 Гистограмма ДП «ферменты АСАТ» для механической желтухи Выборка 160. Признак пациента попал в 4-й интервал. Высота интервала 21. Длина интервала 0.32. Плотность вероятности 0.41.
100 80 60 40 20 0
1
2
3
4
5
6
Интервалы
Рис. 3.4.4 Гистограмма ДП «ферменты АЛАТ» для механической желтухи Выборка 159. Признак пациента попал во 2-й интервал. Высота интервала 87. Длина интервала 1.22. Плотность вероятности 0.45. Ниже приведены гистограммы двумерного ДП «АЛАТ-АСАТ».
60 50 40 30 20 10 0 Интервалы по АСАТ
Р7
Р6
Р5
Р4
Р3
Р2
Р1 1
2
3
4
5
7 6 Интервалы по АЛАТ
Рис. 3.4.5 Гистограмма двумерного ДП «АСАТ-АЛАТ» для паренхиматозной желтухи Размер выборки (количество больных паренхиматозной желтухой, у которых есть анализы и АЛАТ и АСАТ) – 248. Признаки пациента N попали во 2-й интервал по АСАТ и во 2-й интервал по АЛАТ. Высота интервала 3. Длина интервала 0.78 92
по АСАТ и 1.0 по АЛАТ. Плотность вероятности 0.015.
40 35 30 25 20 15 10 5
Р2 Р1
Р5 Р4 Р3
Интервалы по АСАТ
Р8 Р7 Р6
Р10 Р9
0
1
2
3
4
5
Интервалы по АЛАТ
6
Рис. 3.4.6 Гистограмма двумерного ДП «АСАТ-АЛАТ» для механической желтухи Выборка 159. Признаки пациента N попали в 4-й интервал по АСАТ и во 2-й интервал по АЛАТ. Высота интервала 9. Длина интервала 0.32 по АСАТ и 1.22 по АЛАТ. Плотность вероятности 0.144. Гистограммы рассчитываются отдельно для всех признаков (включая многомерные) каждого пациента при каждой из болезней. Для построения двумерной гистограммы для паренхиматозной желтухи использовалось 7 интервалов для АСАТ и 7 интервалов для АЛАТ. Только при таком делении размаха признаков данный пациент попадает в интервал с минимальной высотой (не менее определенной величины, согласно правилу 4). Только
при
таком
разбиении
мы
считаем
двумерное
распределение
представительным и отражающим реальность. Для одномерных гистограмм признаков АСАТ и АЛАТ количество интервалов – 9 и 11 соответственно. Таким образом, гистограммы признаков АЛАТ и АСАТ, не объединенных в двумерный признак, могут быть отличны от одномерных сечений гистограммы тех же признаков, объединенных в двумерный признак. Как правило, количество интервалов в гистограммах многомерного признака меньше, чем количество интервалов гистограмм одномерных признаков. Отметим, что для построения 93
«надежного» n-мерного распределения требуется большее количество данных, в n-1 порядков
превышающее
количество
данных
при
построении
«надежного»
одномерного распределения. Рассчитанные вероятности (плотности вероятностей) многомерных признаков получаются менее точными, чем вероятности одномерных. Погрешности, возникающие при расчетах, снижают эффект от использования многомерных распределений. При расчете вероятностей заболеваний используются данные обычных обследований больных, т.е. не полные комплексы признаков и анализов, определенных не в каждый день болезни. Часто возникает ситуация, когда можно построить отдельные гистограммы двух признаков, но статистическая база данных не позволяет построить двумерную гистограмму этих же признаков. Это ограничивает возможность использования многомерных распределений. На данный момент база, собранная из 613 пациентов, позволяет строить многомерные распределения из 2-3 признаков, в редких случаях, из 4-5 признаков. Неполная, ограниченная база данных приводит к тому, что для построения одномерных гистограмм каждого из двух признаков имеется значительно больше данных, чем для построения двумерной гистограммы тех же признаков. То есть снижается точность вычисления вероятностей двумерного ДП. 3.5 Особенности работы со статистической базой данных В собранной базе данных для каждого ДП (анализа) указан день, в который ДП определен (день, когда взят анализ). Дни, в которые определены ДП, должны отсчитываться от дня начала заболевания. К сожалению, этот день по истории болезни,
в основном, не удается установить, и за день начала заболевания
принимается день поступления в больницу. Каждый признак может быть определен (анализ может быть сделан) один или несколько раз, а может быть не сделан вообще в течение всей болезни. Отсутствие признака (анализа) в один из дней говорит лишь о том, что он в этот день не определялся. Предложенная методика работоспособна и при отсутствии ДП в некоторые дни и, практически, при любой имеющейся в наличии информации. Но, предполагается, что каждый дополнительный признак, любая новая информация уточняют конечный результат – диагноз. 94
Несмотря на солидный объем собранных данных, остро стоит проблема нехватки
или
отсутствия
статистики
для
диагностики,
для
построения
распределений. Учет динамики с помощью формулы Байеса требует построения распределения i -го признака для
j -й болезни в каждый из дней заболевания. Но,
практически, из-за малого числа анализов приходилось объединять признаки за несколько (2 – 5) дней. При этом определяемое данное может усредняться, а может принимать ближайшее значение к указанному дню. Здесь очень полезно использовать «распространяемость» признаков. Дело в том, что часть ДП в некоторый период не меняется и, определив ДП, можно использовать его не только в день определения, но и в некоторые другие дни. Так, маркеры, появившись, не меняют свое значение до смерти. Обтурацию желчных путей, расширение холедоха и расширение внутрипеченочных ходов можно распространить на ближайшие пару дней до и после дня определения, а чаще – до операции. Зеленый цвет печени наблюдается как минимум 2 – 3 дня до и после определения. Также можно распространить и многие другие дискретные признаки. Но признаки «боль», «зуд», «увеличение печени» могут меняться ежедневно, поэтому они не распространяются. Предположить состояние признаков «боль», «зуд» можно и по отсутствию данных. Обычно лечащий врач, записывая историю болезни, регистрирует жалобы больного. Если больной не жалуется на боль или зуд, врач эти данные не записывает. Очевидно, что отсутствие данных – это синоним отсутствия боли и зуда. В диагностирующей программе можно учесть подобные особенности медицинских данных и увеличить размер выборки. «Хорошим», годным для диагностики, считалось распределение, для которого имелось не менее определенного количества данных статистики. В ином случае существует два варианта. 1) Не использовать при диагностике это распределение и сам признак. 2) Использовать искусственное распределение, построенное не по данным статистики, а в результате опроса эксперта – врача. На основании мнения специалиста, можно создать не очень точные, но весьма полезные распределения признаков (см. раздел 3.3 «Искусственные распределения»). 95
Другой вопрос, который возникает в связи с нехваткой данных: что делать с признаком, значение которого попало в такую «малонаселенную» область статистики, где, согласно гистограмме, вероятность или плотность вероятности равна нулю. Использование нулей в формуле Байеса может привести к абсолютно неверной диагностике. Вероятность болезни, для которой имеет место такое распределение, была бы также равна нулю. Даже, несмотря на то, что другие признаки могли говорить «ЗА» эту болезнь. Изложенное показывает, что плотность вероятности любого признака не должна быть нулевой. Это должно быть какое-то малое число. Про конкретный выбор малого числа можно сказать, что он (выбор) субъективен,
слабо
влияет
на
результат,
может
быть
осуществлен
экспериментально. В настоящей работе, чтобы избежать проблем с интервалами гистограммы, в которых количество больных нулевое, используются алгоритмы раздела 3.2.2. Без этих алгоритмов для выбора обсуждаемых малых чисел рекомендуется следующее. Во-первых, должны быть проанализированы распределения признака при разных болезнях. Для одной болезни может отмечаться отсутствие приближенных к значению признака данных, тогда как для другой таких данных может быть достаточно. В этом случае значение признака более характерно для второй болезни, чем для первой. Это отражает реальное состояние в природе. Тогда плотность вероятности первой болезни устанавливается в зависимости от соседнего ненулевого значения плотности. Если данных статистики недостаточно для обеих болезней, то делается вывод, что значение признака не характерно ни для одной из болезней, такого значения признака
«в природе не бывает», и признак в
диагностике не участвует. Предусмотрен еще один подход к обработке дискретных признаков. Это переход от рассмотрения признака во множестве дней к одному признаку, для которого динамика не учитывается. Например, переход от признака «боль в разные дни» к признаку «была ли боль». То есть рассматриваются те пациенты, у которых за время болезни хотя бы единожды регистрировалась боль, и вычисляется доля таких пациентов среди всех пациентов. Данный подход уменьшает погрешности распределения, оно становится менее зависимым от лабораторных ошибок, ошибок 96
осмотра пациента (но, конечно, динамика теряется). 3.6 Исследование взаимозависимости диагностических признаков 3.6.1 Независимые и зависимые диагностические признаки в формуле Байеса При диагностических расчетах по формуле Байеса распространено грубое приближение: ДП болезни считаются независимыми, хотя в общем случае в едином организме независимость признаков исключена. Независимые ДП это, видимо, слабо зависимые признаки. Не исключена зависимость каждого из этих признаков от какого-либо ДП или зависимость третьего признака от совокупности указанных двух. Два признака можно считать независимыми, если их линейная корреляция (оцениваемая коэффициентом Пирсона) близка к нулю или подтверждается гипотеза
χ 2 (хи-квадрат) о независимости признаков. Оценить взаимозависимость всего набора признаков не представляется возможным из-за ограниченности статистической базы. В рамках имеющихся данных
по
механической
и
паренхиматозной
желтухам
допустим
учет
взаимозависимостей трех, редко четырех признаков. Причем для различных видов желтухи (диагностируемых состояний) будут различны степени зависимости одних и тех же диагностических признаков. Далее рассчитывается взаимозависимость различных признаков в первый день болезни без учета динамики болезней. (То есть рассматриваются признаки «АЛАТ в 1-й день», «АСАТ в 1-й день», «боль в 1-й день», … Остальные дни не рассматриваются). Были проанализированы все пары признаков для обеих болезней с помощью метода
χ 2 (хи-квадрат) и определения корреляции. Полученные
результаты сведены в таблицы взаимозависимостей признаков.
97
Таблица 3.1 Результаты анализа методом
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
1 # + + + – + ? + + ? + + + + ? + + + +
2 + # + + + + ? + ? ? + + + + ? + ? + +
3 + + # – + + ? + + ? + + + + ? + ? – +
4 + + – # + – ? + ? ? – – + + ? + ? – ?
5 – + + + # + ? + + ? + + + + ? + + + +
6 + + + – + # ? + ? ? + + + + ? + ? + ?
χ 2 независимости пар ДП при паренхиматозной
7 ? ? ? ? ? ? # ? ? ? ? ? ? ? ? ? ? ? ?
8 + + + + + + ? # + ? + + + + ? + ? + –
желтухе 9 10 11 12 13 14 15 16 17 18 19 + ? + + + + ? + + + + ? ? + + + + ? + ? + + + ? + + + + ? + ? – + ? ? – – + + ? + ? – ? + ? + + + + ? + + + + ? ? + + + + ? + ? + ? ? ? ? ? ? ? ? ? ? ? ? + ? + + + + ? + ? + – # ? – – + – ? ? ? + ? ? # ? ? ? ? ? ? ? ? ? – ? # – – + ? – + + + – ? – # + + ? – + + + + ? – + # – ? + – + + – ? + + – # ? + + + + ? ? ? ? ? ? # ? ? ? ? ? ? – – + + ? # + + ? ? ? + + – + ? + # + ? + ? + + + + ? + + # + ? ? + + + + ? ? ? + # Таблица 3.2
2
Результаты анализа методом χ независимости пар ДП при механической желтухе 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 1 # + + + + + + ? – ? + + + + + + + + ? 2 + # + + – + + ? ? ? + – + + – – ? + ? 3 + + # – + + + ? – ? + + + + + + + + ? 4 + + – # + + + ? – ? + – + + + + + + ? 5 + – + + # + – – + ? – – + + + + + – ? 6 + + + + + # + ? ? ? + + + – + + + + ? 7 + + + + – + # ? ? ? + + – + ? + + + ? 8 ? ? ? ? – ? ? # ? ? ? ? ? ? ? ? ? ? ? 9 – ? – – + ? ? ? # ? + + + + ? ? ? + ? 10 ? ? ? ? ? ? ? ? ? # ? ? ? ? ? ? ? ? ? 11 + + + + – + + ? + ? # – – + + + + + ? 12 + – + – – + + ? + ? – # – – + + + + ? 13 + + + + + + – ? + ? – – # – + + + + ? 14 + + + + + – + ? + ? + – – # + + + + ? 15 + – + + + + ? ? ? ? + + + + # + ? + ? 16 + – + + + + + ? ? ? + + + + + # + – ? 17 + ? + + + + + ? ? ? + + + + ? + # + ? 18 + + + + – + + ? + ? + + + + + – + # ? 98
Номера строк и столбцов соответствуют нумерации ДП в разделе 3.1. «+» означает, что два признака независимы, «–» означает, что признаки зависимы, знак «?» говорит о том, что характер зависимости определить не удалось. Корреляция двух признаков позволяет количественно определить степень зависимости. Таблица. 3.3 Корреляции ДП при паренхиматозной желтухе
Таблица. 3.4 Корреляции ДП при механической желтухе
Вычисление корреляции возможно уже при наличии трех значений ДП, но надежность выводов, основанных на малой выборке, недостаточна. Статистически значимые, надежные корреляции ( p