ISSA_MIS_2015-04

advertisement
Доказательная медицина и
интеллектуальный анализ данных в
клинической информатике
с помощью системы FCART
А.А. Незнанов, к.т.н., доц.
© А.А. Незнанов, 2015
Доказательная медицина

Доказательная медицина или медицина, основанная на
доказательствах [evidence-based medicine] – совокупность
методологических подходов к медицинской практике,
опирающихся на проверку эффективности любых клинических
действий, причём эффективность обосновывается
рандомизированными клиническими исследованиями
В узком смысле это подразумевает, что решение о применении лечебных
или профилактических мер по отношению к пациенту принимается только
исходя из существующих доказательств эффективности и безопасности
этих мероприятий
 В современном смысле термин введён в 1990 году введен группой ученых
из Канады
 Крупнейшая организация, специализирующаяся на доказательной
медицине – The Cochrane Collaboration (http://www.cochrane.org) с лозунгом
«Trusted evidence. Informed Decisions. Better health»

© А.А. Незнанов, 2015
2
Клинические исследования
Клиническое исследование/испытание [Clinical study/trial] –
исследование воздействия медицинских препаратов, приборов и
методов лечения на человека (пациента) с целью выявления
любых положительных или отрицательных результатов и оценки
эффективности и безопасности предлагаемого средства
 Клиническое исследование (КИ) должно быть как минимум
рандомизированным двойным слепым, но также очень
желательно – с проверкой плацебо-эффекта

Такое КИ называется контролируемым или рандомизированным
(по главной процедуре )
 Главная аббревиатура – РКИ


 РКИ – статистический эксперимент специального вида!
© А.А. Незнанов, 2015
3
Свойства РКИ
 Основные свойства:
 Ослепление (Слепое исследование [Blind Study]) – одна или несколько
участвующих сторон не знают, как распределены пациенты и/или средства
по группам лечения и контроля
 Одинарное, двойное, тройное, полное
Рандомизация (Рандомизированное исследование [Randomized Study/Trial])
– пациенты распределяются по группам лечения на основе процедур
рандомизации (для повышения равновероятности получения каждого из
средств)
 Стратификация [Stratification] – повышение равномерности распределения
факторов риска (возраст, пол, избыточный вес, генетический маркер и др.) в
группах лечения
 Критерии включения/исключения [inclusion/exclusion criteria] –
характеристики, которые позволяют / не позволяют пациенту принять
участие в КИ

© А.А. Незнанов, 2015
4
Медицинская статистика
Медицинская статистика – отрасль статистики, изучающая
явления и процессы в области здоровья населения и
здравоохранения
 Задачи медицинской статистики:

Разработка специальных методов исследования массовых процессов и
явлений в медицине и здравоохранении
 Выявление наиболее существенных тенденций в здоровье населения во
взаимосвязи с конкретными условиями и образом жизни


Особенности
Акцент на анализе временных рядов, анализе выживаемости и и
специальных методах подготовки данных
 Развивалась ещё до формулировки термина «доказательная медицина» и
дала много результатов, обогативших другие отрасли

© А.А. Незнанов, 2015
5
Цензурирование наблюдений

Цензурированные наблюдения – наблюдения, которые содержат
неполную информацию
Пример: «пациент A был жив, по крайней мере, 4 месяца с момента начала
наблюдений до момента перевода в другую клинику, когда контакт с ним
был потерян»
 Наблюдения формализуются в виде «событий» разных типов
на временной оси


Механизмы цензурирования:
Фиксированное цензурирование
 Случайное цензурирование


Направления цензурирования
Правостороннее цензурирование
 Левостороннее цензурирование

© А.А. Незнанов, 2015
6
Пример на цензурирование наблюдений

Графики жизни при левостороннем и правостороннем
цензурировании
© А.А. Незнанов, 2015
7
Анализ выживаемости
Анализ выживаемости [Survival analysis] – область медицинской
статистики, занимающаяся оценкой вероятности наступления
события некоторого типа на основе истории аналогичных событий
 В методах анализа выживаемости вместо функции
распределения удобнее использовать функцию выживания –
вероятность того, что объект проживет время большее t
 Описательные методы исследования цензурированных данных:

Построение таблиц времен жизни
 Подгонка распределения выживаемости
 Оценивание функции выживания с помощью процедуры Каплана-Мейера
 Введение в рассмотрение факторов риска и оценивание кумулятивных
конкурирующих рисков

 Разнообразие моделей
© А.А. Незнанов, 2015
8
Пример дискретной функции выживаемости
© А.А. Незнанов, 2015
9
Постановки проблем при сравнении

Superiority


Equivalence


Обоснование
превосходства
Обоснование
эквивалентности
Non-inferiority

Обоснование
не меньшей
эффективности
© А.А. Незнанов, 2015
10
© А.А. Незнанов, 2015
11
Технологии РКИ
Проведение и использование результатов РКИ – огромная
высокотехнологичная отрасль!
 Регистры РКИ



Пример одного из наиболее важных регистров РКИ – ClinicalTrials.gov
(http://clinicaltrial.gov)
Клинические регистры и службы сопровождения [Clinical Trial
Management Software]
Пример веб-службы – Sealed envelop: Randomisation and online databases for
clinical trials (https://www.sealedenvelope.com)
 Пример интегрированной среды – Bio-Optronics Clinical Conductor (http://biooptronics.com/clinical-conductor)


Средства планирования и анализа результатов

Универсальные R, SAS, SPSS, XLSTAT и др.



Создаются многочисленные расширения для нужд медицинской статистики
Специальные средства, например Aptiv Solutions ADDPLAN
(http://www.aptivsolutions.com/addplan-software)
Интеграционные средства

Пример – средства, поддерживающие стандарт HL7 (http://www.hl7.org)
© А.А. Незнанов, 2015
12
ClinicalTrials.gov UI sample
© А.А. Незнанов, 2015
13
Sealed envelop UI samples
© А.А. Незнанов, 2015
14
Проблемы РКИ
Весьма ограниченное понимание статистики другими
специалистам
 Сложность разработки «дизайна РКИ»



Вопросы интерпретации результатов


Top Five Mistakes in Clinical Protocol Design (http://www.askcato.com/2014/10/top-five-mistakes-clinical-protocol-design)
Ten Most Common Mistakes in Clinical Trial Interpretation
(http://www.slideshare.net/clinicaltrialist/intellectual-optical-illusions-in-clinicaltrials-slidecast-version)
Подлоги

The vaccine-autism connection: a public health crisis caused by unethical medical
practices and fraudulent science, Dennis K Flaherty, Annals of Pharmacotherapy,
45(10):1302-4, 2011 (http://www.ncbi.nlm.nih.gov/pubmed/21917556)
© А.А. Незнанов, 2015
15
R Packages

ClinicalTrials catalog (http://cran.rproject.org/web/views/ClinicalTrials.html)


Например, Package Survival (http://cran.rproject.org/web/packages/survival/survival.pdf)
Пример вызова (на основе тестовых данных, входящих в Surv):
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
library(survival);
library(KMsurv);
library(OIsurv);
data(psych);
attach(psych);
my.surv <- Surv(age, age+time, death);
my.surv;
detach(psych);
survfit(my.surv ~ 1);
my.fit <- survfit(my.surv ~ 1);
plot(my.fit, main="Kaplan-Meier estimate with 95% confidence bounds",
xlab="time", ylab="survival function")
© А.А. Незнанов, 2015
16
Промежуточные выводы
Доказательная медицина – магистральный путь развития
здравоохранения
 Без РКИ не было бы не только вполне понятного повышения
эффективности ранее известных методов, но и столь бурного
развития высокотехнологичной медицинской помощи (ВМП)
 Более того – не было бы даже намёка на персонализированную
медицину
 В России – всё очень печально, но есть надежда


Ассоциация организаций по клиническим исследованиям (http://actorussia.org)


Перевод международной нормативной базы
Продвижение стандартов и «лучших практик»
© А.А. Незнанов, 2015
17
Медицинская информатика

Медицинская информатика (МИ) [Medical informatics]
Наиболее общее определение: the discipline, dedicated to the systematic
processing of data, information and knowledge in medicine and health care
 Включает также: Клиническая информатика [Clinical Informatics],
Оптимизация ухода за пациентами [Nursing Informatics]
 Примыкает к: Биоинформатика [Bioinformatics]

Официальная история начинается в 1967 году с создания
International Medical Informatics Association (IMIA)
 С конца 1990-х годов – специализации в ведущих университетах
(например, Гарвардской медицинской школе)



В соответствии с новыми стандартами и сертификационными программами
(например, Board Certified in Clinical Informatics)
Число публикаций за последние пять лет – более 12000 статей
только по базам Springer Link и Elsevier Science Direct!
© А.А. Незнанов, 2015
18
Основные драйверы развития МИ
Программируемые электронно-вычислительные машины
(компьютеры)
 Телекоммуникационные технологии
 Базы данных
 Онтологическое моделирование и базы знаний
 Робототехника


(телеприсутствие, робо-хирурги, роботизированные аптеки, …)
Молекулярная биология и фармацевтика
 Средства объективной диагностики пациентов с выдачей
показателей в цифровом виде
 Доказательная медицина
 Формализация стандартов медицинской помощи
 Генетика и персонализированная медицина

© А.А. Незнанов, 2015
19
Цель и примеры задач МИ
Основная цель МИ – повышение качества здравоохранения за
счет применения современных алгоритмов анализа и обработки
данных
 Задачи

Повышение качества медицинских данных (без дополнительной нагрузки на
пациента)
 Менеджмент и управление операциями в клинике
 Принятие решений
 Факторный анализ результатов клинического исследования
 Компьютерная диагностика
 Математическое моделирование
 Интеграция и стандартизация
 Конфиденциальность и обмен данными
 ...

© А.А. Незнанов, 2015
20
Основные проблемы
Многоуровневое регулирование сферы здравоохранения =>
непроизводительные затраты и время
 Жесткие требования надёжности и информационной
безопасности => повышение стоимости и понижение удобства
 Трудность пилотного развёртывания решений
 Огромная косность мышления и кадровые проблемы
 Отсутствие ясно выраженных плюсов к дальнейшему развитию
большинства методов для большинства врачей и медперсонала
после решения локальных критических проблем
 Интеграция большого числа разнородных компонентов МИС


НО! Наличие явных плюсов и синергетический эффект от
комплексного внедрения решений!
© А.А. Незнанов, 2015
21
© А.А. Незнанов, 2015
22
Медицинские информационные системы









Базовые медицинские системы (МИС) – управление историями
болезни и карточками пациентов (Electronic Healthcare Records)
Лабораторные информационные системы – автоматизация
лабораторных исследований
Системы диагностики реального времени – поддержка
реанимационных мероприятий и др.
Системы поддержки принятия врачебных решений – экспертные
системы в клинической практике
Системы трансфузиологии – управление донациями и компонентами
крови
PACS-системы – накопление и анализ мультимедийных
диагностических данных
Клинические регистры – сопровождение рандомизированных
клинических исследований
Телемедицинские системы – организация удалённой коллективной
работы, телеконференций, телеприсутствия
И многие другие …
© А.А. Незнанов, 2015
23
История развития МИС
До 1990 г. – исследования + EHR
 С 1990 гг. – резкое удешевление персоналок – локальные и
клиент-серверные системы, повсеместное внедрение в США
Европе
 С 2000 гг. – новое поколение МИС, интероперабельность, вебинтерфейсы, интеграция с диагностическими системами
 С 2010 гг. – резкое удешевление обработки больших данных,
реальное внедрение крупномасштабной аналитики, начало
поддержки персонализированной медицины
 С 2012 г. – появление полноценных интерфейсов для пациентов и
методология постоянного сопровождения, носимое медицинское
оборудование

© А.А. Незнанов, 2015
24
Что даёт интеллектуальный анализ данных?

В первую очередь – новые возможности систем поддержки
принятия врачебных решений (CDSS)
Майнинг данных
 Выявление знаний в неструктурированных данных (тексты, изображения)
 Визуализация


Согласование знаний: как в рамках предметных областей, так и
междисциплинарных
Онтологическое моделирование: формализация и уточнение понятий и
связей между ними, интеграция онтологий
 Стандарты на обмен знаниями


Новые методы обработки и интерпретации результатов РКИ

Новый уровень метаанализа (анализа результатов нескольких РКИ в одной
области за многие годы)
© А.А. Незнанов, 2015
25
Онтологическое моделирование в медицине
Важнейшее направление – базис нового поколения баз знаний и
систем анализа медицинских данных
 Развивается во всех предметных областях – от общей
терминологии и связи базовых понятий медицины
(метаонтологии) до заболеваний, симптомов, возбудителей,
лекарственных препаратов и их компонентов, методов лечения,
геномных маркеров и т.д.
 Многие онтологии свободны и доступны для непосредственного
использования через web-сервисы или пользовательские webинтерфейсы


Приведём лишь несколько примеров
© А.А. Незнанов, 2015
26
Базовые метаонтологии

Unified Medical Language System (UMLS) Metathesaurus
(http://www.nlm.nih.gov/research/umls/quickstart.html)
 Интегратор источников данных, предметных онтологий и метаонтологий
SNOMED Clinical Terms (http://www.ihtsdo.org/snomed-ct)
 Medical Subject Headings (MeSH)

(http://www.nlm.nih.gov/mesh/meshhome.html)
MedDRA текущая версия 17.1 (http://www.meddra.org)
 HL7 Reference Information Model

(http://www.hl7.org/implement/standards/rim.cfm)
…
 Инструменты группы Medical Ontology Research

(http://mor.nlm.nih.gov)
© А.А. Незнанов, 2015
27
Классификаторы и онтологии заболеваний

Болезни (Diseases) – важнейшая область онтологического
моделирования,с точки зрения классификации – класс проблем
со здоровьем, который можно выделить с точки зрения причин,
симптоматики, последствий и способов лечения

International Classification of Diseases and Related Health Problems,
ICD – 10 пересмотр, сейчас готовится 11 пересмотр
(http://www.who.int/classifications/icd)

ICD-O (Oncology) – 3 пересмотр
(http://www.who.int/classifications/icd/adaptations/oncology)

Международная классификация болезней, МКБ

Перевод ICD с некоторыми странными несоответствиями
The Disease Ontology (http://disease-ontology.org)
…

© А.А. Незнанов, 2015
28
Другие предметные онтологии

FDA Substance Registration System – Unique Ingredient Identifier
(http://fdasis.nlm.nih.gov/srs/srs.jsp)

RxNorm – нормализованные названия лекарственных препаратов
(http://www.nlm.nih.gov/research/umls/rxnorm/index.html)

Anatomical Therapeutic Chemical (ATC) classification system
(http://www.whocc.no/atc_ddd_methodology)

Drug Interactions Checker (http://www.drugs.com/drug_interactions.php)

Gene Ontology Consortium (http://geneontology.org/)

…
© А.А. Незнанов, 2015
29
Проекты ДАДиИИ НИУ ВШЭ

Департамент анализа данных и искусственного интеллекта
факультета компьютерных наук НИУ ВШЭ (http://cs.hse.ru/ai)
Направление подготовки «Прикладная математика и информатика»
 Магистерская программа «Науки о данных» [Data Science]

 Дисциплины «Введение в медицинскую информатику», «Практикум по анализу
данных в медицине»

Проекты по анализу данных в медицины
Структурированных данных диагностики и назначений
 Текстов на естественном языке – историй болезни, осмотров и т.п.
 Мультимедийных данных

Проекты по оптимизации бизнес-процессов в медицине
 Проекты по развитию медицинской статистики и поддержке
рандомизированных клинических исследований

© А.А. Незнанов, 2015
30
Образовательные аспекты МИ: области знания
Математика (медицинская статистика, методы оптимизации,
анализ временных рядов, …)
 Анализ данных и методы искусственного интеллекта (майнинг
данных, визуализация данных, машинное обучение,
компьютерная лингвистика, рекомендательные системы,
онтологичекое моделирование)
 Программная инженерия (МИС)
 Робототехника
 Менеджмент и оптимизация бизнес-процессов

© А.А. Незнанов, 2015
31
Проект 1: Улучшение качества изображений

Улучшение качества включает в себя:
Минимизацию побочных эффектов для пациента
 Создание алгоритмов для повышения «веса» наиболее диагностическиважных факторов в снимке
 Анализ факторов восприятия качества снимка человеком

© А.А. Незнанов, 2015
32
Проект 1: Улучшение качества изображений

Удаление шума для понижения дозы радиации при сканировании
пациента:
Удаление шума на сканере
© А.А. Незнанов, 2015
Сравнимое
качество
33
Проект 1: Улучшение качества изображений

Улучшение диагностического качества изображений
Улучшение
качества
© А.А. Незнанов, 2015
34
Проект 2: Управление операциями
Современная клиника – это сложная «фабрика» по оказанию
медицинских услуг
 МИ помогает анализировать и оптимально управлять различными
процессами в клинике
 Одно из направление – моделирование различных этапов
обслуживания

Line1
Line2
Service
Line3
Основной разработчик: О.С. Пьяных
© А.А. Незнанов, 2015
35
Проект 2: Управление операциями
Пример – моделирование потока пациентов. Например, можем
ли мы предсказать время ожидания пациента?
 Сложная, нелинейная задача:

Поток пациентов в
клинике
Максимальное кол-во
пациентов в единицу
времени
Среднее кол-во
пациентов в
единицу времени
© А.А. Незнанов, 2015
36
Проект 2: Управление операциями

Построенная модель и предсказанное ею время ожидания
пациента:
40
Реальное
время
35
Предсказание времени ожидания
W
30
Предсказанное
время (модель)
25
20
15
10
5
0
1
51
© А.А. Незнанов, 2015
101
151
201
251
301
351
401
451
501
37
Оптимизация выделения ресурсов
Fixed supply
Optimal supply
Задачи целочисленного
линейного/нелинейного
программирования
See:
Brunner JO, Bard JF, Kolisch R., “Flexible shift scheduling of physicians”, Health Care Manag Sci. 2009 Sep;12(3):285-305.
© А.А. Незнанов, 2015
38
Проект 3: Сегментация изображений
Большой объем медицинских данных требует автоматических
алгоритмов сегментации – разделения данных на области и
анатомические органы
 Задача должна решаться в реальном времени, устойчиво к шуму
и артефактам

© А.А. Незнанов, 2015
39
Проект 3: Сегментация изображений

Интерактивные алгоритмы сегментации помогают врачу быстро и
надежно определить 3D-границы интересующей области:
Сегментация
почек
© А.А. Незнанов, 2015
40
Проект 4. Оптимизация госпитализаций
Существует много процессов, которые
могут быть оптимизированы только при
участии эксперта
 Эксперт заинтересован в моделях анализа,
которые:

Просто интерпретируются
 Уточняются (детализируются) на нескольких
уровнях
 На верхнем уровне имеют небольшой размер
(обозримы)
 Строятся за разумное время


Пример – модель траекторий
госпитализаций пациентов

Большое число параметров и скрытого знания
© А.А. Незнанов, 2015
Основные разработчики: А.В. Бузмаков, С.О. Кузнецов
41
Проект 4. Оптимизация госпитализаций

Траектории госпитализаций изучаются с помощью «узорных
структур» [Pattern Structures] – формализма теории анализа
формальных понятий
© А.А. Незнанов, 2015
42
Проект 5. Математическое сопровождение
рандомизированных клинических исследований
Основа доказательной медицины и значимый раздел
клинической информатики
 Базируются на медицинской статистике и различных регистрах
 Стандартизованы и обладают развитой методологией (http://acto
russia.org)

Поддерживаются развитыми базами данных и знаний


Например: http://www.controlled-trials.com, http://www.clinicaltrials.gov
Актуальные задачи
Эффективное сопровождение мультицентровых исследований
 Оптимизация дизайна исследования
 Повышение эффективности анонимизации и ослепления
 Новые методы анализа результатов
 Мета-анализ

© А.А. Незнанов, 2015
43
Выводы

Медицинская информатика всё более востребована в
здравоохранении как прикладная дисциплина, ориентирующая
на достижение реального результата


Интересные приложения математики, информатики, менеджмента, …
Новые технологии открывают новые возможности

Изменения методологии, методов и инструментов
© А.А. Незнанов, 2015
44
Вопросы?

Контакты

Доцент департамента анализа данных и искусственного интеллекта ФКН
НИУ ВШЭ, заведующий информационно-аналитическим отделом ФНКЦ
ДГОИ им. Д. Рогачева, к.т.н., доц. Незнанов Алексей Андреевич
 E-Mail: aneznanov@hse.ru, alexey.neznanov@fnkc.ru
© А.А. Незнанов, 2015
45
Что такое ФНКЦ ДГОИ им. Дмитрия
Рогачева?

Федеральный научно-клинический
центр детской
ГЕМАТОЛОГИИ, ОНКОЛОГИИ И
ИММУНОЛОГИИ им. Д. Рогачева



Крупнейший в Европе центр по
лечению и исследованию
онкологических заболеваний детей и
подростков
Под руководством ведущих
специалистов ФНКЦ ДГОИ ведётся
разработка и внедрение эффективных
протоколов терапии заболеваний
крови, злокачественных
новообразований, патологий иммунной
системы и других тяжелых заболеваний
детского возраста
Для повышения эффективности лечения
и организации научных исследований в
ФНКЦ ДГОИ активно разрабатываются и
внедряются современные
информационные системы и
технологии
© А.А. Незнанов, 2015
46
Что такое ФНКЦ для специалиста в ИТ?

Исключительно сложные больные с
опасными заболеваниями



С точки зрения информатизации,
оптимизации и анализа данных





© А.А. Незнанов, 2015
Их судьба зависит от согласованности и
эффективности работы всех врачей и
сотрудников разных подразделений
Необходимость адекватного
сопровождения больных и грамотной
организации работы персонала
(оптимизация основных и
вспомогательных бизнес-процессов)
Сложность структуры (> 100
подразделений, > 1200 сотрудников)
Уникальность многих элементов для
России
Совершенно новые информационные
системы и пилотные проекты
Участие в федеральных проектах в
области здравоохранения
Активная научно-исследовательская и
образовательная деятельность
47
Download