СИСТЕМА ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ

advertisement
СИСТЕМА ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ
ДЛЯ ПРОГНОЗИРОВАНИЯ РЕЗУЛЬТАТОВ
ХИРУРГИЧЕСКОГО ЛЕЧЕНИЯ АТЕРОСКЛЕРОЗА
Рудаков К. В., Воронцов К. В.
Кузнецов М. Р., Туркин П. Ю.
Гуз И. С., Цурко В. В.
Москва, Вычислительный центр РАН, voron@ccas.ru
Москва, Российский государственный медицинский
университет, pavelturkin@km.ru
Москва, ЗАО «Форексис», iguz@forecsys.ru
Проект направлен на создание системы прогнозирования результатов хирургических
операций. Разрабатываемая в настоящее время система позволит врачам вводить данные о
больных, получать прогнозы возможного исхода операции и рекомендации по предоперационной
подготовке и послеоперационному лечению. Система будет работать через Интернет, не требуя ни
инсталляции, ни специальных компьютерных или математических знаний. Централизованное
хранилище данных позволит со временем накопить большой объём информации, полученной из
разных клиник и представленной в едином формате.
Актуальность проблемы
Проблема атеросклероза артерий считается одной из наиболее важных в современной
медицинской науке. Проявлениями данной патологии является целый ряд социально значимых
заболеваний: ишемическая болезнь сердца, острый инфаркт миокарда, нарушение мозгового
кровообращения и другие. В структуре смертности атеросклероз и его проявления занимают
основное место, являясь причиной 80% летальных исходов. В возрасте 50 лет ими в той или иной
форме страдают до 90%, а в возрасте свыше 60 лет — 100% населения.
Атеросклероз артерий нижних конечностей наблюдается у 20% людей в возрасте свыше 60
лет, в 4% случаев данное заболевание становится причиной смерти. Реконструктивные сосудистые
операции позволяют избежать потери конечности и продлить жизнь. Однако спустя год или более
может развиться рестеноз — сужение имплантированных шунтов с повторным нарушением
проходимости сосуда, что вызывает резкое ухудшение кровоснабжения, требует выполнения
повторной операции, а в ряде случаев приводит к потере конечности. Современные представления
о механизмах развития таких осложнений, известные методы диагностики и лечения не позволяют
решить эту проблему. Из-за высокого процента послеоперационных осложнений в России
ежегодно до 10 000 человек теряют трудоспособность.
Диагностическая методика
Авторами проекта в целом завершена разработка комплексной диагностической методики,
позволяющая до проведения операции прогнозировать развитие стенозов в послеоперационном
периоде [1]. Разработка методики проходила в два этапа.
Первый этап — сбор данных. Лечение и обследование больных проводилось на базе
кафедры факультетской хирургии РГМУ (ГКБ №1 им. Н. И. Пирогова и ЦКБ МП Св. Алексия) и
ГНЦ института иммунологии МЗ РФ. Клинические данные включали: скорости кровотока в зоне
анастомоза и степень сужения линии анастомоза, измеренные по разработанным авторами
методикам [2], характеристики венозного оттока из пораженной конечности, а также
свёртываемость и вязкость крови и плазмы, агрегация тромбоцитов и эритроцитов, и др. — всего
22 признака, измеряемых до операции и спустя различные промежутки времени после операции.
Данные иммунологического обследования включали: показатели местного иммунного статуса в
поражённой зоне, показатели гуморального иммунитета, цитокинового статуса и т. д. — всего 17
признаков, измеряемых до и после операции. На данном этапе исследований были собраны
данные по 102 больным. Совместный анализ клинических и иммунологических данных позволил
впервые в практике изучения атеросклероза оценить, какие иммунные факторы и особенности
клеточных реакций оказывают значимое влияние на течение атеросклероза [1].
Второй этап — анализ данных и построение алгоритма, классифицирующего больных на
два класса — вероятный положительный либо вероятный отрицательный исход. Данная задача
классификации характеризуется большой размерностью (число признаков сопоставимо с числом
прецедентов), разнотипностью признаков, наличием пропусков в данных, низкой точностью
измерения признаков. Для её решения сначала были применены стандартные методы
распознавания образов: нейронные сети различных видов, метод опорных векторов, решающие
деревья, логистическая регрессия. Наилучшие по точности результаты показал метод решающих
деревьев (около 12% ошибок), главным образом за счёт совмещения клинических и
иммунологических данных [3]. Применение новых логических алгоритмов классификации,
разработанных научной школой академика РАН Ю. И. Журавлёва в ВЦ РАН и реализованных
специалистами ЗАО «Форексис», позволило снизить уровень ошибок ещё на несколько процентов.
Чтобы говорить о дальнейшем достоверном снижении уровня ошибок, достаточном для широкого
клинического применения системы прогнозирования, необходимо увеличивать объём выборки.
Преимущества
логических
алгоритмов
классификации
в
задачах
медицинской
дифференциальной диагностики хорошо известны: они обладают достаточно высокой точностью,
строятся из понятных врачу правил, позволяют оценивать вероятности исходов, а также выдавать
рекомендации по предоперационной подготовке в случае отрицательного прогноза. Однако
построение таких алгоритмов требует высокой квалификации в области анализа многомерных
данных.
Система прогнозирования
Разрабатываемая в настоящий момент система прогнозирования предназначена для
использования
в
государственных
медицинских
учреждениях
и
частных
клиниках.
Рассматриваемый тип хирургических операций является широко распространённым; только
в Российской Федерации они проводятся более чем в сотне клиник. Врачи этих клиник и являются
потенциальными пользователями системы.
Цели создания системы — повышение качества лечения, сокращение числа осложнений, а
также накопление эмпирического материала для научных исследований атеросклероза и
дальнейшего совершенствования диагностической методики.
Система позволит пользователям вводить данные о своих больных; получать прогнозы
отдалённого исхода операции в любой момент времени — как до операции, так и после; получать
рекомендации по предоперационной подготовке и послеоперационному лечению для каждого
больного индивидуально.
Система не будет требовать от пользователей ни инсталляции, ни администрирования, ни
специальных компьютерных знаний. Это достигается за счёт применения технологий удалённого
доступа к приложениям (Application Service Provider, ASP). Хранилище данных и модуль
прогнозирования находятся на одном или нескольких серверах, которые доступны через Интернет
в любое время суток. Пользователи работают с системой через привычный для них web-браузер.
Дополнительным преимуществом является то, что данные из разных клиник накапливаются
централизованно, в едином формате. Это позволит совершенствовать и обновлять прогнозный
алгоритм по мере поступления новых данных.
От степени достоверности данных будет существенным образом зависеть качество
прогнозов. Поэтому в системе предусмотрен ряд мер по верификации вводимых данных. Вопервых, для пользователей вводится три уровня доступа: врач, ответственный от учреждения,
администратор. В обязанности ответственного входит проверка данных, вводимых врачами в
данном учреждении, и организация работ по своевременному исправлению и наполнению данных.
Во-вторых, для совершенствования прогнозного алгоритма крайне важно отслеживать и заносить
в систему данные об отдалённых результатах проведённых операций. Для этого спустя
определённый срок после операции (около 9 месяцев) ответственному от организации и врачу,
вводившему данные, приходит по электронной почте уведомление о необходимости сообщить
системе окончательный исход операции. В-третьих, для предотвращения возможных ошибок при
вводе данных предусматривается дружественный интерфейс и система подсказок. При заполнении
каждого поля ввода пользователь может получить справку по данному показателю. Рядом
выводятся среднее значение и разброс данного показателя отдельно по положительным и
отрицательным исходам. Это помогает врачу на этапе ввода данных уточнить своё мнение о
возможном исходе для конкретного пациента и внимательнее отнестись к «аномальным» данным,
если таковые будут зафиксированы. Кроме того, рядом с полем ввода отображается вес
соответствующего показателя, показывающий, сколько раз он встречается в правилах прогнозного
алгоритма. Это позволит врачу вводить минимально необходимый объем данных и быстрее
получать прогноз.
Перспективы применения и развития системы
Проблема эффективного прогнозирования в лечении социально значимых заболеваний
считается одной из наиболее важных в современной медицинской науке. В настоящий момент не
существует высокоэффективных систем для прогнозирования степени успешности лечения
синдромных заболеваний, таких как облитерирующий атеросклероз и его осложнений. К
сожалению, до сих пор не удалось решить даже ряд базовых фундаментальных проблем, в том
числе и выявить ключевые механизмы регуляции пролиферации клеток эндотелия и гладких
миоцитов артериальной стенки у больных облитерирующим атеросклерозом. Есть основания
полагать, что в результате широкого внедрения данной системы удастся накопить значительный
объём эмпирических данных, достаточный для выявления и исследования нетривиальных
взаимосвязей между различными показателями иммунитета и развитием атеросклероза.
На данном этапе проекта уже очевидно, что опыт разработки и внедрения данной системы
допускает тиражирование, и может быть распространён на другие области медицины и другие
задачи медицинской диагностики и прогнозирования.
Работа поддержана грантами РФФИ №№ 06-07-08102, 07-01-00734, 07-07-00380, 08-0112029, 08-07-00354.
Список литературы
[1] Кузнецов М. Р., Б. В. Болдин, Кошкин В. М., Родионов С.В., Туркин П. Ю., Хаитов М. Р.,
Воронцов К. В., Пинегин Б. В. Прогнозирование отдалённых результатов оперативного лечения
больных с облитерирующим атеросклерозом артерий нижних конечностей // Ангиология и
сосудистая хирургия. — Т. 14, № 1. — 2008.
[2] Кузнецов М. Р., Вирганский А. О., Капранов С. А., Москаленко Е. П., Туркин П. Ю. и др. Способ
диагностики функциональной полноценности сосудистого анастомоза после реконструктивных
хирургических вмешательств. Патент РФ №2266711 от 27.12.2005.
[3] Воронцов К. В., Кузнецов М. Р., Туркин П. Ю., Дьяконов А. Г., Ивахненко А. А., Сиваченко Е. А.
Прогнозирование результатов хирургического лечения атеросклероза на основе анализа
клинических и иммунологических данных // Математические методы распознавания образов: 13-ая
Всеросс. конф.: Докл. М.: МАКС Пресс, 2007. С. 537–540.
Download