Разработка методов и программных средств поддержки принятия

advertisement
Форум «Большие Данные в медицине: лучшие практики»
Разработка методов и программных средств
поддержки принятия решений в медицине на
основе прецедентного подхода,
унифицированной модели лечебнодиагностического процесса и банка
клинических данных»
Работа поддерживается Министерством образования и науки Российской
Федерации (проект RFMEFI60714X0089) и грантом РФФИ 13-07-12012
В.Л.Малых, к.т.н., зав. лаб. ИПС им. А.К.Айламазяна РАН
14 мая 2015 года, Технопарк Новосибирского Академгородка
Обзор докладов 5го Medinfo 1986




Новые системы поддержки принятия решений в
медицине за рубежом / С. Н. Бутко, В. К. Ольшанский
// АиТ. — 1990. — №6.
Медицинские знания подразделяются на научные и
эмпирические
Модели, основанные на медицинских научных
знаниях, имеют обобщенный и ограниченный
характер
Эмпирические знания могут быть недостаточно
репрезентативны и неадекватны популяции в целом
Два направления развития СППР


Формализация научных медицинских знаний
из научных теорий и медицинского опыта,
перенос формализованных знаний в базы
данных и базы знаний. СППР МЦ БР
«Сакрал».
Медицинские информационные системы
позволили усилить значение эмпирической
компоненты медицинских знаний. Проект
ИПС им. А.К.Айламазяна РАН
Большие Данные в медицине –
эмпирическая компонента
медицинских знаний






В национальном масштабе 10^9 – 10^10 клинических случаев
Число характеристик состояния человека 10^3 -10^4
В БД МИС Интерин 3*10^6 ЭМК
11*10^3 случаев первичной гипертензии в БД РКНПК.
Около 40*10^3 записей в МКБ 10
Более 3*10^3 различных кодов диагнозов в отдельном клиническом
учреждении
Основные проблемы Больших
Данных
Формализация. Представление данных.
Методы обработки данных.
Идеи использования
эмпирической компоненты





Для разработки нового класса СППР.
Для распространения передового
клинического опыта.
Для обучения, повышения квалификации.
В научных целях. Поиск закономерностей,
выделение новых знаний.
Использование пациентами?
СППР в медицине



Проблема устаревания заложенного в СППР знания и
необходимость постоянной формализации и пополнения БЗ.
Эмпирическая компонента медицинских знаний включает в себя
как современные передовые медицинские знания, так и знания
в ретроспективе.
Передовые медицинские знания, передовой опыт ведущих
медицинских учреждений России может распространяться и
пропагандироваться с помощью эмпирической компоненты
непосредственно путем предоставления специалистам
широкого доступа к описаниям деперсонифицированных
клинических случаев.
Идея СППР на основе
эмпирической компоненты


На поддержание эмпирической компоненты
медицинских знаний в МИС требуются
меньшие усилия, чем на формализацию и
поддержание в МИС научной компоненты.
Прецедентный характер управления и
принятия решений в медицине.
Апробация идеи СППР на
основе эмпирической
компоненты (1)


Управляемый стохастический прецедентный
процесс с памятью как математическая модель
лечебно-диагностического процесса / В. Л. Малых,
Я. И. Гулиев // Информационные технологии и
вычислительные системы. — 2014. — № 2.
Управление и принятие решений в лечебнодиагностическом процессе / В. Л. Малых [и др.] //
XII Всероссийское совещание по проблемам
управления ВСПУ-2014, Москва: 16-19 июня, 2014 г.
Апробация идеи СППР на
основе эмпирической
компоненты (2)




Your submission «Precedent approach to decision making in
clinical processes (V Malykh, Y Guliev)» has been accepted as
Poster
Reviewer 1: This is an interesting topic and an interesting idea.
Reviewer 2: The submission is devoted to actual topic.
Эксперт ФЦП 1: Первый этап. Полученные в ходе
реализации данного этапа проекта результаты не имеют
новизны в исследуемой отрасли.
Гранты и субсидии


РФФИ. Прогнозирование и управление лечебнодиагностическим процессом с помощью
прецедентной модели процесса - технологической
карты, реализуемой в классе марковских
управляемых процессов
ФЦП. «Разработка новых методов и программных
средств поддержки принятия решений в медицине
на основе прецедентного подхода, онтологической
модели предметной области, унифицированной
модели лечебно-диагностического процесса и
банка клинических данных».
Прецедентный подход
Особенности прецедентного
подхода (Case-Based Reasoning)


«В последнее время обозначилось еще большее отдаление методов анализа
данных от традиционных методов вычислительной математики. …модели
изучаемых систем строятся не всегда. Все чаще стали использовать такие
алгоритмы анализа данных, которые опираются не на общие модели
«черного ящика», а на конкретные факты его поведения, зафиксированные в
протоколах «вход-выход», или на «прецеденты». При этом используется
простая, но фундаментальная гипотеза о монотонности пространства
решений, которую можно выразить так: «Похожие входные ситуации приводят
к похожим выходным реакциям системы»… Если иметь в виду только «Что?»модели, то методы принятия решений с опорой на отдельные прецеденты
или их обобщенное (модельное) описание имеют примерно равные
методологические права. Более того, при построении модели, как и при
всяком обобщении, теряются некоторые особенности поведения системы в
каждой конкретной точке пространства решений. При опоре же на прецедент,
как показывает опыт, удается учесть эти локальные особенности, что часто
позволяет получать более точные решения». Н.Г.Загоруйко
«Хороший врач – это всегда опытный врач»
«Разработка новых методов и программных средств
поддержки принятия решений в медицине на основе
прецедентного подхода, онтологической модели
предметной области, унифицированной модели
лечебно-диагностического процесса и банка
клинических данных»




Соглашение № 14.607.21.0089 от 24.11.2014
Получатель субсидии – ИПС им.
А.К.Айламазяна РАН
Индустриальный партнёр – ООО «Интерин
сервис»
Докладчик: Малых В.Л., зав. лаб., отв.
исполнитель.
Цель проекта

Создание комплекса научнотехнических решений в области
разработки моделей и аналитических
инструментов поддержки принятия
врачебных решений для персональной
медицины и контроля лекарственных
назначений
Научные направления
Извлечение знаний из медицинских БД
 Data Mining
 Knowledge Discovery in Databases (KDD)
 Методы рассуждения и принятия
решений на основе прецедентов
 Case-Based Reasoning (CBR)
 Анализ мед.текстов в свободной форме

Методология интеллектуального
извлечения и анализа информации
Планируемые результаты (1)



Принципы формализации и извлечения
знаний в предметной области
«Персональная медицина» и «Лекарственные
назначения»
Онтологические модели предметных
областей
Процессная модель лечебнодиагностического процесса (ЛДП) из класса
управляемых стохастических процессов с
памятью
Персональная медицина?
Лечить не болезнь, но больного
 «Гораздо важнее знать, что собой
представляет заболевший человек, чем
какой именно болезнью он заболел»
 Преемственность лечения, важность
сохранения информации о предыдущих
клинических случаях (ЕЭМК)

Персональная медицина +
«медицина под заказчика» (tailored medicine)
 «предсказательная медицина» (predictive medicine)
 «геномная медицина» (genomic medicine)
 «точная медицина» (precision medicine)
 «стратифицированная медицина» (stratified medicine)
Основная идея – выделение и расшифровка генома
человека, использование генетической информации
для персонализации лечения.

Персональная медицина!


Наиболее «сбалансированное» понятие о
персонализированной медицине, как о такой
практике принятия клинических решений, которая
максимизирует клинический результат (исход) для
пациента при уменьшении затрат на основе всего
доступного знания о состоянии пациента
«… personalized medicine is the practice of clinical
decision-making such that the decisions made maximize
the outcomes that the patient most cares about and
minimizes those that the patient fears the most, on the
basis of as much knowledge about the individual's state
as is available»). I.S. Kohane, The twin questions of
personalized medicine: who are you and whom do you
most resemble? Genome Med, (2009) 1(1): 4.
Планируемые результаты (2)



Алгоритмы интеллектуального извлечения
данных в сфере медицинской и
сопутствующей информации, основанные на
применении методов машинного обучения и
других областей искусственного интеллекта
Алгоритмы диагностирования по паттернам
(ситуации и картины течения болезни)
Алгоритмы анализа критических ситуаций и
выдачи рекомендаций по предупреждению и
уменьшению риска критических ситуаций
Планируемые результаты (3)
Алгоритмы выявления скрытых
закономерностей
 Алгоритмы логического вывода на
основе многозначных логикоматематических моделей с
возможностью множественных
интерпретаций

Планируемые результаты (4)


Рекомендации по использованию результатов
проведенных ПНИ в реальном секторе экономики с
учетом технологических возможностей̆
индустриального партнера, а также в дальнейших
исследованиях и разработках
Проект ТЗ на проведение ОКР по теме: «Разработка
программного комплекса поддержки принятия
решений в медицине на основе онтологического и
прецедентного подходов, унифицированной модели
лечебно-диагностического процесса и банка
клинических данных»
Публикации Scopus и WoS в
российских журналах
Современные технологии в медицине
 Военно-медицинский журнал
 Автоматика и телемеханика

Публикации Scopus и WoS за
рубежом
International journal of medical informatics
 BMC Medical Informatics and Decision
Making
 Artificial Intelligence in Medicine

Прецедентный подход к
моделированию ЛДП и принятию
врачебных решений


Процессная (динамическая) модель
клинического прецедента, основанная на
понятии состояния пациента
Стандарты на ЭМК (Open EHR), стандарты на
документы (CDA) не подходят для решения
задачи поиска релевантных прецедентов.
Предшественники



Гельфанд И.М., Розенфельд Б.И., Шифрин
М.А. Очерки о совместной работе
математиков и врачей. 2005.
Назаренко Г.И., Осипов Г.С. Основы теории
медицинских технологических процессов.
2005.
Bennett, CC and K Hauser (2013). Artificial
Intelligence Framework for Simulating Clinical
Decision-Making: A Markov Decision Process
Approach // Artificial Intelligence in Medicine. —
2013. —Volume 57. — Issue 1. — Pages 9–19.
Особенности проблемы




В ходе ведения лечебно-диагностического процесса врач
преследует определенные цели, предпринимает активные
лечебно-диагностические действия, влияющие на состояние
пациента. Активные действия, направленные на достижение
цели, принято называть управлением.
«Неклассический» характер рассматриваемой задачи
управления.
Врач на каждом шаге ЛДП выбирает в качестве управления
некоторое подмножество элементов ЛДП (диагностические
исследования, лабораторные тесты, назначения лекарственных
средств). Выбор осуществляется на основании накопленных
медициной знаний о том, как надо лечить данное заболевание,
на основании собственного опыта врача.
Управление носит ярко выраженный прецедентный характер
f ( x, u )
Особенности проблемы

x  f ( x, u ), x  X , u U .
Множество U можно считать заданным, но функция
f ( x, u )
известна только лишь прецедентно, известна только для
наблюдавшихся ранее ситуаций
( x, u )
Дискретная модель ЛДП
t
t+1
x(t)
x(t + 1)
Su(i), i<t
Su(i), i<t+1
A
A
...
t+n
x(t + n)
...
Su(i), i<t+n
A
Особенности проблемы





Управление хорошо формализовано в МИС! Это –
лечебно-диагностические назначения.
Наблюдения (характеристики состояния пациента)
формализованы лишь частично – данные ЛИС,
температурного листа, демография.
Существенные наблюдения представлены
свободным частично структурированным текстом:
Жалобы, Анамнезы, Заключения
Наблюдение характеристик состояния с различным
темпом
Информация о состоянии неполна
Построение динамической
модели ЛДП





Универсальность, независимость от нозологий.
Равномерное темперирование процесса, его приведение к
дискретному процессу с постоянным шагом по времени.
Интегральные характеристики управления включаются в
состояние объекта управления и «ослабляют» эффект памяти.
Сборка состояния процесса. Генерализация характеристик
состояния.
Отказ от детерминизма, явное постулирование стохастического
характера ЛДП. Человеческий организм, как систему, следует
относить к сложным системам и, согласно классификации
систем Р.Эшби, сложные системы и протекающие в них
процессы должны иметь стохастическую природу.
Построение модели ЛДП
1. Дискретный процесс с переменным темпом наблюдения.
( xi , u i )
- это ситуация на i-ом шаге процесса.
2. Управляемый процесс с памятью. Интегрирование управления
для ослабления эффекта памяти – приблизиться к ситуации,
когда управление есть функция текущего состояния.
u  {( c , u j1 ), (c , u j 2 ), ..., (c , u jm ) }
i
i
j1
i
jk
- это интегральная характеристика элемента управления
на i-ом шаге процесса.
c
i
j2
i
jm
Построение модели ЛДП
3. На интегральных характеристиках естественно вводятся
операции вычитания (дифференцирования) и сложения
(интегрирования).
u i1  u i  u i1  {( cij1  cij11, u j1 ), (cij 2  cij21, u j 2 ), ..., (cijm  cijm1, u jm ) }.
u i 1
- это перечень с интегральными характеристиками
лечебно-диагностических мероприятий оказанных
пациенту на i-1 шаге процесса – это управление на i-1
шаге.
4. Время – лечит. Время является управлением данным природой.
t
i
- это время, прошедшее от начала процесса к i-му шагу процесса .
Генерализация состояния ЛДП
5. На множестве значений каждой характеристики в рамках данной
нозологии можно ввести отношение эквивалентности, которое
разобьет множество значений характеристики на классы
эквивалентности.
Возраст 33 года, 49 лет -> «Взрослый»
Температура тела 38,5 град.С, 37,0 град.С -> «Повышенная»
х A  ( x1A , x2A , ..., xnA ) и х B  ( x1B , x2B , ..., xnB ) эквивалентны по j
если
x Aj  x Bj .
x Aj  x Bj ,
Состояния A и B эквивалентны, если
j {1, 2, ..., n}
Генерализация ансамбля ЛДП
6. Введение отношения эквивалентности состояний, позволяет
разбивать состояния, для рассматриваемого ансамбля ЛДП, на
классы эквивалентности. Вместо множества отдельных, не
связанных или слабо связанных, в общем случае, реализаций
ЛДП, мы можем получить сеть связанных, разделяющих одни и
те же эквивалентные состояния, реализаций!
7. Ансамбль реализаций ЛДП после кластеризации состояний
начинает моделироваться случайным дискретным Марковским
процессом.
fi ( x)
Интерпретация состояний ЛДП
8. Результаты интерпретации состояния должны быть включены в
предлагаемую модель ЛДП, но не в виде независимых
характеристик состояния, а в виде функций состояния.
Постановка диагноза, отнесение состояния к различным
классам критических состояний.
9. Машинная интерпретация состояния на основе многозначных
логик или бесконечнозначных логик.
Этапы построения модели
ЛДП как есть
Базис нормализации процесса
Нормализованный ЛДП
Временная модельная шкала
Темперированный ЛДП
Генерализация состояний – Классы эквивалентности
Обобщенный ЛДП
Марковская модель ЛДП
Ансамбль
обобщенных до
классов
эквивалентности
ЛДП
Построение Марковской модели
Модель ЛДП
Стрела времени
1
n
 ( A, B)  1   ( S AB ),
Метрика, близость состояний
Параметризованное мерой расстояние
1
 ( A, B)  1   ( S AB ), где
n
S
AB
N
n
- это множество индексов компонент состояний A и B, по которым
A и B эквивалентны
x x  j  S
A
j

B
j
AB
и x  x  к  S , k {1, 2, ..., n}.
A
к
B
к
AB
- мера на множестве всех подмножеств конечного
множества натуральных чисел {1,2, …n}
1
n
 ( A, B)  1   ( S AB ),
Метрика, близость состояний
1 n AB
 ( A, B)  1   g i .
n i1
g  ( g1, g2 , ..., gn )
где
- это числовой вектор с компонентами 0 или 1.
Компонента вектора равна 1, если индекс этой компоненты входит
в множество
S AB
Взвешенная относительно характеристик мера
1 n AB
 ( A, B)  1   g i  ci ,
m i1
n
m   ci
i 1
Словарь характеристик для нозологии
«Пневмония, вызванная Streptococcus
pneumoniae».
Рейтинг характеристики (число процессов, в
которых эта характеристика фиксировалась)
№
Название характеристики
1
2938
Возраст
2
2938
Пол
3
2688
ЭКГ
4
2667
Фибриноген
5
2623
Креатинин в сыворотке крови
6
2612
Индивидуальные занятия ЛГ при заболевании легких
7
2588
Глюкоза крови
8
2540
Мочи анализ общий
9
2504
АCT активность
10
2496
АЛT активность
11
2350
Крови анализ развернутый
Необходимость нормализации данных
Наименование исследования
Магнитно-резонансная томография головного мозга
Магнитно-резонансная томография головного мозга с внутривенным контрастированием
МР-ангиография артерий головного мозга (магнит 1,5 Т)
МРТ
головного мозга
(магнит до 1,5 Т)
МРТ
головного мозга
(магнит до 1,5Т)
МРТ
головного мозга с контрастированием (магнит до 1,5 Т)
МРТ головного мозга
МРТ головного мозга (магнит 1,5Т)
МРТ головного мозга с внутривенным контрастированием
МРТ головного мозга с контрастированием (без стоимости контрастного вещества) (магнит
МРТ исследование без контрастного усиления
МРТ исследование с контрастным усилением
МСКТ головы
МСКТ головы с ангиографией магистральных артерий и вен
1,5 Т)
Результаты численного
моделирования
Код
нозол
огии
№
Название нозологии
Число
реализа
ций
процесс
ов
Число состояний/
Число
обобщенных
состояний
Сжатие числа
состояний
после их
обобщени
я
Мощность
словаря
до
нормализ
ации/
после
нормализ
ации
166
2938/2921
<1%
828/128
1
J13
Пневмония, вызванная Streptococcus
pneumoniae
2
H26.2
Осложненная катаракта
1255
5778/2308
60%
328/249
3
I20.8
Другие формы стенокардии
3069
48909/48513
<3%
871/99
4
I10
Эссенциальная [первичная]
гипертензия
8734
98389/82542
16%
3223/1278
Проблемы Марковской модели

При большом числе плохо
нормализованных характеристик
состояния даже при максимальном
обобщении каждой характеристики
Марковская модель практически
исчезает
Прецедентный подход к
моделированию ЛДП и принятию
врачебных решений
Событийная модель клинического
прецедента
 Попытка не вводить в модель и не
использовать понятие состояния

T A  {t1A , t2A , ... tsA }
- упорядоченная последовательность моментов времени, в которые
происходили события ЛДП
X Aj  {x Aj (tiA1 ), x Aj (tiA2 ), ... , x Aj (tinA ) }, x Aj  X j , j 1, l .
- упорядоченная по времени последовательность значений j-ой
характеристики, наблюдаемой (измеряемой) в моменты времени
{ tiA1 , tiA2 , ... , tinA }, tipA  T A , p 1, n .
A
A
A
A
A
A
A
UA
k  {uk (tk1 ), uk (tk 2 ), ... , uk (tkm ) }, uk  Uk , k 1, h .
- упорядоченная по времени последовательность значений k-ой
компоненты управления в моменты времени
A
{ tkA1, tkA2 , ... , tkm
}, tkrA  TA , r 1, m.
Определение метрики
d j : X j  X j  [0,1] , j 1, n
Xj
– множество значений j-ой характеристики и
d j ( x Aj , x Bj )  [0,1] , d j ( x Aj , x Bj )  d j ( x Bj , x Aj ) ,
x j  X j , d j ( x j , x j )  0, x Aj , x Bj  X j , j 1, n .
Желательно также выполнение следующего свойства
x Aj , x Bj , xCj  X j d j ( x Aj , x Bj )  d j ( x Aj , xCj )  d j ( x Bj , xCj ) , j 1, n .
1 n
 ( A, B)  1   d i ( xiA , xiB )  ci ,
m i 1
n
m   ci
i 1
Концепт «Боль»







локализация (загрудинная, головная и т.д.);
иррадиация (в левую лопатку, шею, левую руку,
нижнюю челюсть и т.д.);
характер (давящая, колющая, ноющая, тянущая,
волнообразная и т.д.);
сила (небольшая, умеренная, интенсивная и т.д.);
длительность (кратковременная, длительная и т.д.);
частота (непостоянная, периодическая, постоянная,
частая и т.д.);
типичность (типичная);
Метрические методы поиска
прецедентов


Malkov Y., Ponomarenko A., Logvinov A.,
Krylov V. Approximate nearest neighbor
algoritm based on navigable small world
graphs (2014) Information Systems, 45 pp. 6168.
Бритвина Е., Крылов В. Графовые модели
данных и алгоритмы для рекомендательных
систем (2015) LAP Lambert Academic
Publishing.
Интеллектуальное извлечение
данных

Предложен подход к выявлению в
неструктурированных медицинских
текстах языковых единиц,
описывающих сопутствующие
заболевания и факторы риска (источник
электронные медицинские карты) и
перечень противопоказаний (описание
лекарственных препаратов).
Противопоказания к применению
лекарственных средств
В части лекарственных средств было решено проанализировать около
1000 статей по противопоказаниям к применению лекарственных средств
из фармсправочника РЛС. Методами искусственного интеллекта с
участием “экспертов” (наши сотрудники) из этих статей выделяются
именные группы и ключевые слова. Аналогичный анализ будет выполнен
для свободных текстов из клинических документов (жалобы, анамнез).
Конечная цель – при назначении лекарственного средства контролировать
наличие у пациента противопоказаний к данному средству.
Поиск содержательных классов
для персонализации ЛДП
При фиксированном основном диагнозе (нозологии) попытка выделить
классы пациентов с учетом имеющихся у них сопутствующих заболеваний
(осложнений). Возможно, удастся найти значимые отличия в лечебнодиагностических процессах для различных классов. Тогда можно будет
говорить о “персонализации” лечения для данных классов пациентов.
Изучаем это на реальных данных из различных источников (различных
ЛПУ).
Апробация результатов



Medinfo 2015, The 15th World Congress on Health and Biomedical
Informatics São Paulo city, Brazil, from 19th to 23rd August, 2015.
V.Malykh and Y.Guliev, Precedent approach to decision making in
clinical processes. (Принят постер)
DAMDID/RCDL'2015' Data Analytics and Management in Data
Intensive Domains, Обнинск 13-16 октября. В.Л.Малых,
Я.И.Гулиев, Д.В.Белышев, Построение банка клинических
данных на основе унифицированной модели лечебнодиагностического процесса. (Подан доклад)
EMNLP 2015 Workshop, Lisbon, Portugal, September 17–21, 2015.
The Sixth International Workshop on Health Text Mining and
Information Analysis. (???)
Вопросы?
Download