Анализы, лабораторная диагностика

Обзор методов диагностики с помощью искусственного интеллекта

М.Л. ЖМУДЯК, А.Н. ПОВАЛИХИН, А.В. СТРЕБУКОВ, А.В. ГАЙНЕР, А.Л. ЖМУДЯК, Г.Г. УСТИНОВ

Анализ литературы показал, что с первых лет применения информационных технологий в здравоохранении одним из ведущих направлений являлись системы поддержки процесса принятия клинических решений, развившиеся в технологии интеллектуальных систем.

В начале восьмидесятых годов в исследованиях по искусственному интеллекту сформировалось самостоятельное направление, получившее название «экспертные системы» [1 - 4 и др.]. Экспертные системы используются для разработки программ, которые при решении задач, трудных для эксперта -человека, получают результаты, не уступающие по качеству и эффективности решениям, получаемым экспертом. Исследователи в области экспертных систем для названия своей дисциплины часто используют также термин «инженерия знаний», введенный Е. Фейгенбаумом как «привнесение принципов и инструментария исследований из области искусственного интеллекта в решение трудных прикладных проблем, требующих знаний экспертов» [7].

Вначале большинство экспертных систем базировалось на правиле продукций: «Если - то», [1 - 4 и др.]. С использованием правила продукций создано много диагностических экспертных систем для конкретных групп болезней [5, 6, 8 - 18 и др.]. Диагностические экспертные системы развивались в направлении их универсализации и расширения возможностей [11 - 18]. Созданы системы, самостоятельно строящие дерево вопросов [12] и т.п.

Одним из популярных методов обнаружения знаний стали алгоритмы поиска ассоциативных правил [19], которые с успехом используются во многих областях, в том числе в задачах медицинского анализа и диагностики [20 - 22].

Использование ассоциативных правил приведено как пример, подтверждающий, что развитие экспертных систем идет в ожидавшемся направлении: универсализации (преодолевается свойственная ранним экспертным системам пригодность только для одной задачи и абсолютная зависимость от эксперта) за счет алгоритмов высокого уровня.

Среди найденных экспертных систем и реализующих их программ имеется и программа: "Дифференциальная диагностика желтух" [23], алгоритм которой, по утверждению авторов этой программы, может помочь развеять сомнения в диагнозе и сократить время диагностики.

Точность определения правильного диагноза экспертными системами имеет большой разброс, а процент правильно определенных диагнозов - невысок. Так, экспертная система медицинской диагностики Diagnos.ru [12] выдает в среднем 70% диагнозов, которые соответствуют истине. Диагностические решения экспертной системы "Эсбад" в 87% случаев совпадают с клиническим диагнозом [16]. Экспертная система МУТАНТ, созданная сотрудниками ЭВЦ Московского университета, позволила получать эффективность только 56% [24]. Впрочем, в источнике говорится о начальных этапах эксплуатации этой системы. Автоматизированная система ранней диагностики наследственных болезней "ДИАГЕН", позволяющая идентифицировать свыше 1200 форм, показывает эффективность 90% в сравнении с 60% у врачей медико-генетических консультаций [16].

По результатам обзора складывается впечатление, что заявляемая в публикациях эффективность диагностических программ, основанных на экспертных системах, по-прежнему (как и в годы начала наших исследований) недостаточно высока и изменяется в широких пределах, в основном, от 56 до 90% правильных диагнозов.

Даже во времена, когда экспертные системы были очень распространены и модны, авторам эти системы казались не слишком привлекательными, так как правило продукций «Если - то», в общем-то, фельдшерский подход... Страшно сказать, но развившиеся в последние годы и действительно эффективные методы диагностики, включая нейронные сети, также в основе фельдшерские, конечно, суперфельдшерские, но все же.

Авторам представлялось, что диагностика должна базироваться на моделировании заболеваний, включая их динамику, и математической оценке близости смоделированных «траекторий» развития болезни у конкретного больного и наблюдаемых у него диагностических признаков [25, 26].

Диагностика на основе моделирования с учетом патофизиологии процессов, к сожалению, мало распространена по сравнению с другими подходами. Математические же методы диагностики развиваются очень бурно, опережающими по сравнению с экспертными системами темпами [27 - 88 и др.]. Среди математических методов наиболее постепенно развивается байесовский подход, используемый для диагностики более полувека.

Байесовский подход изложен в книгах Н. Бейли [29, 30], А. Вальда [36], Е.В. Гублера [42, 43], Е.В. Гублера и А.А. Генкина [44], Л. Ластеда [51], С.А. Айвазяна, В.М. Бухштабера, И.С. Енюкова и Л.Д. Мешалкина [55] и др. Применению байесовского подхода в диагностике посвящены многочисленные статьи [39, 40, 71 - 76, 87 и др.].

Болезни описываются не одним, а несколькими диагностическими признаками. В связи с этим для диагностики широкое применение нашли многомерные статистические методы, такие как факторный, регрессионный, дисперсионный, кластерный, дискриминантный и другие методы анализа данных [31].

Дисперсионный анализ - метод статистического анализа, позволяющий определить достоверность гипотезы о различиях в средних значениях исследуемых величин на основании сравнения дисперсий распределений [32].

Регрессионный анализ - статистический метод для определения связи переменных. Если зависимая переменная является дихотомической или категориальной, необходимо использовать логистическую регрессию.

Факторный анализ - это совокупность методов, которые на основе реально существующих связей признаков (или объектов) позволят выявлять латентные обобщающие характеристики структуры и механизма развития изучаемых явлений и процессов [33].

Факторный анализ является методикой, которая в определенном смысле сама является источником возникновения гипотез. Остановимся вначале на специфическом характере гипотез, порождаемых факторным анализом. Мы исходим из того, что несколько измеряемых переменных сильно коррелируют между собой.

Это означает, что-либо они взаимно определяют друг друга, либо связь между этими переменными обусловливается какой-то третьей величиной, которую непосредственно измерить нельзя. Модель факторного анализа всегда связана с последним предположением, т.е. измеряемая величина является лишь формой проявления величины, остающейся на заднем плане и не поддающейся непосредственному измерению. Возникает задача, можно ли по данным переменным выделить величину, так называемый фактор, который объяснил бы наблюдаемые связи. Слово фактор используется в другом смысле, чем это принято обычно: речь идет о математической величине, получаемой на основе наблюдений.

Факторный анализ заглядывает за кулисы того, что непосредственно измеряется, и стремится определить истинные функциональные величины, лежащие в основе данного явления. Основная цель факторного анализа состоит в выявлении гипотетических величин, или факторов, по небольшому числу экспериментальных данных. Факторы должны быть по возможности простыми и достаточно точно описывать и объяснять наблюдаемые величины. Число выделяемых факторов должно быть меньше набора исходных величин, структура этих факторов и их взаимосвязь должны быть возможно более простыми.

Исходной предпосылкой анализа является наличие взаимосвязи между несколькими одновременно наблюдаемыми переменными. В качестве количественной меры связи между двумя переменными используется коэффициент корреляции. Он может принимать значения от - 1 до +1. Если он при этом приближается к нулю, то это свидетельствует об отсутствии линейной связи, и чем более он близок к +1 или к - 1, тем более тесная линейная связь существует между переменными. Все вычисленные коэффициенты корреляции располагаются соответствующим образом в корреляционной матрице. При анализе такой корреляционной матрицы получают гипотетические величины, так называемые факторы, которые находятся в определенных взаимоотношениях с переменными. Факторы представляют собой влияющие величины, не поддающиеся непосредственному измерению, которые могут быть определены только в результате анализа. Примечательно то, что факторный анализ делает возможным выдвижение дифференцированных гипотез о структуре взаимосвязи переменных и факторов, не задаваясь этой структурой заранее и не имея о ней никаких сведений. Эта структура находится по результатам наблюдений. Полученные гипотезы могут быть проверены в ходе дальнейших экспериментов.

Как в любой прикладной науке, здесь следует обращать внимание на различие между математической моделью и реальным содержанием изучаемого явления. Вычислительная сторона метода, в которой речь идет только о решении системы уравнений и точности вычислений, является лишь одним аспектом проблемы. Для факторного анализа характерен также статистический подход, применяемый, например, при проверке гипотезы о числе факторов, подлежащих выделению. Наряду с этим существует еще проблема содержательной интерпретации выделенных факторов, что не имеет места при построении математико-статистической модели. Три вышеназванных аспекта - алгебраически-вычислительную сторону, статистический подход и интерпретацию факторов следует учитывать при проведении факторного анализа и разграничивать их [42].

Метод главных компонент. Разработан Хотеллингом [32]. Позволяет при заданной m-мерной корреляционной матрице найти новую ортогональную m-мерную систему координат и именно так, чтобы максимум полной дисперсии лежал в направлении первой главной оси, а максимум оставшейся дисперсии - в направлении второй главной оси и т. д. Метод главных компонент заключается в нахождении последовательности ортогональных осей координат, вдоль которых каждый раз в убывающем порядке определяется максимум полной дисперсии.

Кластерный анализ - это совокупность методов, позволяющих классифицировать многомерные наблюдения, каждое из которых описывается некоторым набором переменных. Целью кластерного анализа является образование групп схожих между собой объектов, которые принято называть кластерами. В отличие от комбинационных группировок кластерный анализ приводит к разбиению на группы с учетом всех группировочных признаков одновременно.

Кластерный анализ объединяет различные процедуры, используемые для проведения классификации. В результате применения этих процедур исходная совокупность объектов разделяется на кластеры или группы (классы) схожих между собой объектов.

Сложность задач кластерного анализа состоит в том, что объединение объектов в группы проводится в пространстве многих измерений.

В целом методы кластеризации делятся на агломеративные (от слова агломерат - скопление) и итеративные дивизивные (от слова division - деление, разделение). В агломеративных или объединительных методах происходит последовательное объединение наиболее близких объектов в один кластер [40].

Исходными данными могут быть собственно объекты и их параметры. Данные для анализа могут быть так же представлены матрицей расстояний между объектами, в которой на пересечении строки с номером i и столбца с номером j записано расстояние между i -м и j -м объектами. Если расстояния не даны сразу, то агломеративные алгоритмы начинают с вычисления расстояния между объектами.

Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся в множестве X, разбить множество объектов I на m кластеров (подмножеств) п,п2пт так, чтобы каждый объект Ii принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время как объекты, принадлежащие разным кластерам, были разнородными (несходными).

Дискриминантный анализ - статистический метод, используемый для прогнозирования вероятности какого-либо события. Относится к методам классификации с обучением. Используется для разделения респондентов в различающиеся между собой группы на основе некоторых характеристик.

Дискриминантный анализ является одним из методов многомерного статистического анализа. Цель дискриминантного анализа состоит в том, чтобы на основе измерения различных характеристик (признаков, параметров) объекта классифицировать его, то есть отнести к одной из нескольких групп (классов) некоторым оптимальным способом. Под оптимальным способом понимается либо минимум математического ожидания потерь, либо минимум вероятности ложной классификации. Этот вид анализа является многомерным, так как измеряется несколько параметров объекта, по крайней мере, больше одного, например, температура, влажность в технологическом процессе, давление, состав крови, температура больного и т.д. [43].

При применении дискриминантного анализа обычно имеются несколько переменных, и задача состоит в том, чтобы установить, какие из переменных вносят свой вклад в дискриминацию между совокупностями, определить, имеются ли значимые различия между группами (с точки зрения всех переменных).

Современные версии дискриминантного анализа и реализующих его компьютерных программ сделали технологию дискриминантного анализа доступной широкому кругу пользователей [85].

В медицине дискриминантный анализ успешно применяется для прогнозирования исхода инсульта при различных методах его лечения, выживаемости больных, оперированных по поводу рака почки, и определения срока дожития больных раком почки, имеющих метастазы в различных органах.

Искусственные нейронные сети (сокращенно ИНС) развиваются быстрее других математических методов.

Теория нейронных сетей включает широкий круг вопросов из разных областей науки: биофизики, математики, информатики, схемотехники и технологии. Поэтому понятие «нейронные сети» детально определить сложно.

«Искусственные нейронные сети - совокупность моделей биологических нейронных сетей, представляют собой сеть элементов - искусственных нейронов, - связанных между собой синаптическими соединениями. Сеть обрабатывает входную информацию и в процессе изменения своего состояния во времени формирует совокупность выходных сигналов». Также это набор математических и алгоритмических методов для решения широкого круга задач [41].

«Нейронная сеть - система, состоящая из множества работающих параллельно простых обрабатывающих элементов, функция которой определяется структурой сети, силой связей и обработкой, происходящей в вычислительных элементах или узлах» [52].

К. Гурни в своей книге, считающейся на западе одной из лучших по введению в теорию ИНС, определяет нейронную сеть как «связанный ансамбль единичных обрабатывающих элементов, функциональность которых в широком смысле базируется на работе биологических нейронов. Умение сети обрабатывать данные хранится в силе ее внутренних соединений, или весах, полученных в процессе адаптации (или обучения) сети к набору обучающих данных».

С середины 80-х годов в научном лексиконе появились термины «нейроинформатика» или «нейрокомпьютинг». «Нейрокомпьютинг - это технология создания систем обработки информации (например, нейронных сетей), которые способны автономно генерировать методы, правила и алгоритмы обработки в виде адаптивного ответа в условиях функционирования в конкретной информационной среде. Нейрокомпьютинг представляет собой фундаментально новый подход, а рассматриваемые в рамках этого подхода системы обработки информации существенно отличаются от упомянутых ранее систем и методов».

Искусственный нейрон имитирует в первом приближении свойства биологического нейрона. На вход искусственного нейрона поступает некоторое множество сигналов, каждый из которых является выходом другого нейрона. Каждый вход умножается на соответствующий вес, аналогичный синаптической силе, и все произведения суммируются, определяя уровень активации нейрона.

Среди всех интересных свойств искусственных нейронных сетей ни одно не захватывает так воображения, как их способность к обучению. Их обучение до такой степени напоминает процесс интеллектуального развития человеческой личности, что может показаться, что достигнуто глубокое понимание этого процесса. Возможности обучения искусственных нейронных сетей ограничены, и нужно решить много сложных задач. Тем не менее, уже получены убедительные достижения, такие как «говорящая сеть» Сейновского, и возникает много других практических применений.

Цель обучения. Сеть обучается, чтобы для некоторого множества входов давать желаемое (или, по крайней мере, сообразное с ним) множество выходов. Каждое такое входное (или выходное) множество рассматривается как вектор. Обучение осуществляется путем последовательного предъявления входных векторов с одновременной подстройкой весов в соответствии с определенной процедурой. В процессе обучения веса сети постепенно становятся такими, чтобы каждый входной вектор вырабатывал выходной вектор.

Обучение с учителем. Различают алгоритмы обучения с учителем и без учителя. Обучение с учителем предполагает, что для каждого входного вектора существует целевой вектор, представляющий собой требуемый выход. Вместе они называются обучающей парой. Обычно сеть обучается на некотором числе таких обучающих пар. Предъявляется выходной вектор, вычисляется выход сети и сравнивается с соответствующим целевым вектором, разность (ошибка) с помощью обратной связи подается в сеть, и веса изменяются в соответствии с алгоритмом, стремящимся минимизировать ошибку. Векторы обучающего множества предъявляются последовательно, вычисляются ошибки и веса подстраиваются для каждого вектора до тех пор, пока ошибка по всему обучающему массиву не достигнет приемлемо низкого уровня.

Обучение без учителя. Несмотря на многочисленные прикладные достижения, обучение с учителем критиковалось за свою биологическую неправдоподобность. Трудно вообразить обучающий механизм в мозге, который бы сравнивал желаемые и действительные значения выходов, выполняя коррекцию с помощью обратной связи. Обучение без учителя является намного более правдоподобной моделью обучения в биологической системе. Развитая Кохоненом и многими другими, она не нуждается в целевом векторе для выходов и, следовательно, не требует сравнения с предопределенными идеальными ответами. Обучающее множество состоит лишь из входных векторов. Обучающий алгоритм подстраивает веса сети так, чтобы получались согласованные выходные векторы, т. е. чтобы предъявление достаточно близких входных векторов давало одинаковые выходы. Процесс обучения, следовательно, выделяет статистические свойства обучающего множества и группирует сходные векторы в классы. Предъявление на вход вектора из данного класса даст определенный выходной вектор, но до обучения невозможно предсказать, какой выход будет производиться данным классом входных векторов.

Практическое использование ИНС для медицинской диагностики (по литературным данным) приводит к исключительно высокому качеству диагностики [79, 82, 83 и др.]

Приведенный обзор показывает, что использование методов статистического анализа в медицине результативно и должно развиваться. В настоящее время выдвигают следующие важнейшие медико-биологические проблемы, к которым применимы современные статистические методы: математическое описание поведения физиологической системы во времени; математическое описание процессов регулирования, например описание реакции живой системы в ответ на химическое воздействие; проблемы медицинской диагностики и лечения, имеющие целью как можно раньше обнаружить и как можно быстрее ликвидировать отклонение от равновесия в сложной системе; математическое изучение (в том числе и моделирование) проблем поведения центральной нервной системы и мозга, памяти и обучения и т.д.

Так, например, в клинической практике для объединения признаков в группы идентичные понятию «синдром» заболевания, а также для иерархической классификации больных применяются факторный и кластерный анализы.

В проанализированных публикациях, в основном, содержатся данные о диагностике одним методом. Нет сколько-нибудь значительной информации о сравнительной эффективности разных методов, нет сравнения разных методов в одинаковых условиях тестирования. Поэтому одна из задач настоящей работы сравнить диагностику несколькими методами на одних и тех же данных постановкой диагноза одним и тем же больным.

Сравнение методов - это частная задача. Общим выводом обзора является сравнительно меньшее развитие моделирования и то, что в медицинской диагностике превалируют два подхода: А - использование экспертных систем; В - использование методов теории вероятностей и математической статистики, и/или формально-математические приемы. Не вдаваясь в тонкости классификации, подчеркнем принципиальное отличие подходов: А - базируется на знаниях и опыте врача, В - на формальной обработке данных (игнорируя мнение врача).

Авторы полагают, что постановочна задача о совмещении подходов А и В. Действительно, подход А использует знания врача в области физиологии и патофизиологии и т. п., что очень ценно. Однако подход (А) не универсален и не в полной мере использует статистику. (Статистику включает на интуитивном уровне в виде личного опыта и знаний об опыте коллег.)

Подход В инвариантен относительно диагностики болезни, позволяет достаточно полно использовать статистическую информацию, т.е. накопленный опыт, но не обращается к знаниям о механизмах взаимосвязи процессов в организме и т. п.

Постановка и варианты решения задачи совмещения подходов А и В являются одной из целей данной работы.

Труды, являющиеся базой для теории диагностики, в основном, рассматривают многомерные распределения [28, 48, 53 - 56 и др.]. В прикладных работах многомерные распределения используются редко [38 и др.]. Поэтому нет ответа на ряд вопросов, связанных с многомерными распределениями при ограниченном количестве данных. Например, неясно, какие именно диагностические признаки (ДП) нужно объединять, когда имеются данные для 2 - 3 - мерных распределений, но нет данных для формирования распределений большей размерности. Не ясно даже, какова эффективность использования многомерных распределений вместо одномерных. (Большинство практических работ по диагностике использует одномерные распределения). Перечисленные и другие вопросы говорят о необходимости исследования диагностики на базе многомерных распределений.

Одномерные распределения используются и при байесовском подходе, данные о распространенности которого приведены выше. При расчете вероятностей болезней по формуле Байеса общепринята гипотеза о взаимонезависимости диагностических признаков между собой. На самом деле, в едином организме диагностические признаки взаимозависимы. Понимание этого присутствует в ряде публикаций. Однако при рассмотрении ДП как независимых результаты диагностики - хорошие. Возможно поэтому взаимозависимость ДП в изученных публикациях не учитывается. Вместе с тем, для повышения качества диагностики необходимо уделить внимание проблеме учета взаимозависимости ДП.

В известных работах для диагностики и прогноза исхода лечения (операции) используются диагностические признаки, определенные в один день, признаки в другие дни в расчетах не участвуют. То есть, не учитывается динамика болезни -важнейший при постановке диагноза фактор. Такой (без учета динамики) подход используется во всех методах диагностики: от Байеса до искусственных нейронных сетей.

Авторам с самого начала работы над этой темой [25, 26] было ясно, что при диагностике необходимо учитывать динамику диагностических признаков [25, 26, 89 - 120], т.к. течение заболевания во времени является одним из основных источников дифференциальной диагностики. В силу изложенного, одной из целей исследования стала разработка методики учета динамики ДП при диагностике заболеваний.

Разработанные методики и компьютерные программы диагностики с учетом динамики заболеваний обладали неплохими диагностическими способностями, то есть процент верных диагнозов был достаточно высок [94, 98]. Дальнейшие исследования показали, что предложенные методы являются нетрадиционной формой метода наибольшего правдоподобия, причем в наших разработках этот метод учитывает динамику заболеваний [90 - 101, 110].

В связи с полученными результатами, включая достаточную эффективность предложенных методов диагностики, был проведен анализ литературы. При анализе литературы авторов интересовали:

применение метода наибольшего правдоподобия для диагностики, особенно, для дифференциальной диагностики заболеваний,

учет динамики изменения анализов и симптомов пациента при диагностике заболеваний,

эффективность и результаты диагностики,

практическое использование компьютерной диагностики, особенно при диагностике желтух.

Метод максимального правдоподобия является одним из широко известных методов, входящих в учебники по теории вероятностей. Этот метод широко применяется в разных областях науки и практической деятельности. Так, метод наибольшего правдоподобия применяется в эконометрии, биометрии, эвентологии, астрономии, компьютерной лингвистике [86, 88, 121].

Метод максимального правдоподобия используется также при автоматическом анализе биологических сигналов и во многих других исследованиях [122 - 129].

Используется метод максимального правдоподобия и в медицине: в компьютерных методах обработки электрокардиограммы [130]; для улучшения прогностической значимости шкалы SAPS (Simplified Acute Physiology Score) в Институте хирургии им. А.В. Вишневского РАМН [131]; при исследовании фактора хронических болей программой Amos 4.0 (Arbuckle, 1999) в James A. Haley Veterans' Hospital and the University of South Florida [132].

Хотя приведённый выше обзор говорит о значительном применении метода наибольшего правдоподобия в медицинских исследованиях, включая обработку данных, прямого применения этого метода для дифференциальной диагностики не было найдено. Видимо, для дифференциальной диагностики заболеваний метод максимального правдоподобия используется очень редко. Во всех найденных работах метод максимального правдоподобия реализуется в его классической форме, то есть проводится перебор параметров. Алгоритма решения, основанного на разработанном авторами итерационном процессе, не было найдено.

Не удалось обнаружить и работ, в которых метод наибольшего правдоподобия учитывал бы динамику заболевания. Более того, удивительно, что вообще не найдено диагностических методов, учитывающих изменение симптомов, анализов, данных инструментальных исследований во времени.

Разрабатываемые в настоящем исследовании диагностические методы тестировались на диагностике желтух. При этом одним из результатов работ стала программа дифференциальной диагностики механической и паренхиматозной желтух. Данная программа в настоящее время используется в больницах.

Востребованность программы связана с тем, что с больными желтухой приходится встречаться врачам различных специальностей (врач общей практики, инфекционист, хирург, детские врачи). Для этих врачей дифференциальная диагностика механической и паренхиматозной желтух может оказаться затруднительной, и врач в ряде случаев хотел бы согласовать свой диагноз с расчетом вероятности болезни по программе. При механической желтухе нужна операция, часто срочная; паренхиматозная желтуха лечится терапевтически, и операция принесет вред. Выбор между операцией и консервативным лечением нередко нужно принимать срочно, в условиях неполного (незавершенного) обследования. Особенно программа полезна для тех пациентов, у которых результаты анализов и инструментальных методов исследования противоречивы.

Литературный поиск показал, что очень мало упоминаний о программах, ориентированных на дифференциальную диагностику желтух и, конкретно, на диагностику механической и паренхиматозной желтух.

Одной из найденных программ является упоминавшаяся выше программа «Дифференциальная диагностика желтух», автор которой А.В. Устинов, заведующий общетерапевтическим отделением филиала Клинической больницы Управления делами Президента РФ, создал ее в 1997 году (по крайней мере, удалось найти версию, датируемую именно этим годом). В резюме к программе сказано: "Широкое распространение заболеваний печени разной этиологии требует ежедневного обращения к данной программе врачей различных специальностей. Примененный алгоритм может помочь развеять сомнения и сократить время диагностики. В программе имеется большая и подробная программа помощи, содержащая информацию о типах желтух, обмене билирубина и т.п." [23]. Также в сети Internet удалось найти еще одну программу дифференциальной диагностики желтух, условно называемую jaundice.arj (по названию файла архива). Эта программа: «... обладает возможностью распознавания, примерно, по 250 признакам 79 нозологий, в число которых входит и желтуха. Допускается неполнота и неточность входной информации». Автор Нечмиров, домашняя страница в Интернет не указана [133].

Найденные программы основаны на экспертных системах. Следовательно, ограничены субъективностью оценок эксперта. Нет информации об учете динамики заболевания этими экспертными системами, о реальной эксплуатации программ в лечебных учреждениях, о проценте верно поставленных диагнозов.

В изученной литературе не обнаружено математической постановки задачи об оптимальной последовательности обследования пациента - о том, какой именно ДП нужно определить в первую очередь, чтобы наилучшим образом уточнить диагностику и лечение.

Нет в публикациях и информации о модельных болезнях - искусственных болезнях, придуманных для изучения задач диагностики и тестирования создаваемых методов.

И, наконец, во всех встретившихся при поиске работах эффективность диагностики оценивалась как отношение числа правильно поставленных диагнозов к числу всех диагностируемых пациентов. Авторы считают, что возможен более тонкий анализ результатов, что будет показано ниже.

Проведенный анализ литературы подтвердил актуальность и новизну теоретических и практических целей и задач настоящего исследования.

Теоретически задачи включают: совмещение медицинского и математического подходов к диагностике, использование многомерных распределений, диагностика при взаимозависимых симптомах и анализах, диагностика с учетом динамики заболеваний, диагностика методом наибольшего правдоподобия, оптимальная последовательность обследования пациента и др.

Практические задачи: создание универсальной компьютерной диагностической программы и ее использование для дифференциальной диагностики механической и паренхиматозной желтух; сравнение различных методов диагностики и др.

Разработанные авторами методы и компьютерные программы диагностики и прогноза абсолютно универсальны и пригодны для диагностики и прогноза исхода любых заболеваний, а также могут быть использованы в технике, геологии и других немедицинских областях деятельности. Тестирование и практическое использование предложенных методов и реализующей эти методы программы проводилось на диагностике желтух. Ниже приведен краткий обзор распространенности и медицинской диагностики болезней, сопровождающихся желтухой, и причин появления этого синдрома.

Диагностика заболеваний методами теории вероятностей

Марина Леонидовна Жмудяк, Антон Николаевич Повалихин, Андрей Васильевич Стребуков, Александр Викторович Гайнер, Александра Леонидовна Жмудяк, Геннадий Георгиевич Устинов