К.А. МИЛОВА НЕЙРОСЕТЕВОЕ ПРОГНОЗИРОВАНИЕ АНЕМИЧЕСКОГО СИНДРОМА

advertisement
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
К.А. МИЛОВА
Пензенский государственный педагогический университет
им. В.Г. Белинского
heidin@mail.ru
НЕЙРОСЕТЕВОЕ ПРОГНОЗИРОВАНИЕ
АНЕМИЧЕСКОГО СИНДРОМА
Аннотация
Основной задачей, которая выдвигалась в данном исследовании, является прогнозирование состояние больного после хирургической операции.
Одним из основных показателей, характеризующих состояние больного
после операции, является факт наличия или отсутствия анемического
синдрома (малокровия) у больного. Основным признаком наличия анемии
у больного, как известно, является низкий уровень гемоглобина, поэтому
мы прогнозируем именно уровень гемоглобина у хирургических больных.
Задача прогнозирования анемии является на сегодня весьма актуальной,
поскольку не существует однозначной системы оценки возможного состояния больного после операции.
Прогнозирование риска осложнений в послеоперационном периоде в
настоящее время является актуальной задачей, поскольку ее решение, вопервых, позволит снизить длительность пребывания в стационарных и
реанимационных условиях, что особенно важно в условиях страховой
медицины в связи с высокими затратами на оказание этого вида медицинской помощи; во-вторых, способствует снижению риска тяжелых осложнений, приводящих к инвалидности пациентов, и летальных исходов, возникающих в результате хирургических вмешательств; в-третьих, позволит
рационально (т.е. с учетом индивидуальных особенностей и показаний)
назначать антибиотиковую терапию. Кроме того, прогнозирование риска
осложнений позволяет планировать нагрузку на реанимационное отделение в клинике с высокой хирургической активностью, оптимизируя тем
самым его деятельность. В экономически развитых странах доля затрат на
оказание этого вида медицинской помощи в сравнении с другими заметно
выше (например, в США две трети умерших регистрируется в отделениях
реанимации).
Возможность прогнозирования риска представляет интерес и для экспертов медицинских страховых компаний, нуждающихся в объективных
оценках качества выполненных хирургических операций в целом и выУДК 004.032.26(06) Нейронные сети
67
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
полнения предоперационных мероприятий в каждом конкретном случае.
В более широком смысле знание закономерностей позволяет изучить причины возникновения риска послеоперационных осложнений и разработать
меры, направленные на его снижение [1].
Основной задачей, которая выдвигалась в данном проекте, является
прогнозирование состояние больного после хирургической операции. Одним из основных показателей, характеризующих состояние больного после операции является факт наличия или отсутствия анемического синдрома (малокровия) у больного. Основным признаком наличия анемии у
больного, как известно, является низкий уровень гемоглобина, поэтому
мы прогнозируем именно уровень гемоглобина у хирургических больных.
Задача прогнозирования анемии является на сегодня весьма актуальной,
поскольку не существует однозначной системы оценки возможного состояния больного после операции и врач принимает решение основываясь
преимущественно на личном опыте и интуиции [2]. Анемический синдром в послеоперационном периоде может привести к осложнениям,
ухудшить заживление оперированных органов и, как следствие, увеличить срок пребывания больного в стационаре.
Для нейросетевого анализа в Пензенской областной клинической
больнице им. Н.Н. Бурденко были отобраны 84 истории болезни пациентов, которым проводились операции на легких. Затем истории болезней
были переведены в электронный вид для последующей работы с ними. В
нашей работе мы рассматривали данные пациентов, которым проводилась
только одна операция, для того, чтобы четко выделить до- и послеоперационный периоды.
На первом этапе для входа нейронной сети эмпирически были отобраны следующие переменные: гемоглобин, количество эритроцитов, цветовой показатель, скорость оседания эритроцитов, длительность операции,
возраст, пол, сложность операции, количество перелитых компонентов в
литрах, наличие анемии как осложнения. Однако, в дальнейшем пришлось
отказаться от использования переменной пол, поскольку для анализа использовались в основном данные пациентов-мужчин.
Был выбран ряд показателей, необходимых для решения поставленной
задачи. А именно: для обозначения влияния оперативного вмешательства
была введена переменная длительность операции, для собственно прогнозирования анемического синдрома были введены несколько переменных –
показателей клинического анализа крови: гемоглобин (НВ), количество
эритроцитов, цветовой показатель (ЦП), лейкоциты (Л) и скорость оседа-
УДК 004.032.26(06) Нейронные сети
68
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
ния эритроцитов (СОЭ). Кроме того, были введены также переменные
возраст и пол.
После выбора переменных для входа нейронной сети из данных историй болезни были сформированы обучающая и тестирующая выборки.
Далее, данные, вошедшие в выборки, были подвергнуты предпроцессорной обработке. Для каждой переменной были вычислены исходные
статистические величины, а именно среднее значение, минимальное и
максимальное значения. Данные статистические величины представлены
в табл. 1.
Таблица 1
Исходные статистические величины переменных
HB
среднее
min
max
Среднеквадратическое отклонение
111,49
57,90
175,80
19,80
ЦП
0,88
0,79
0,98
0,03
Л
10,69
3,00
31,20
4,58
Длительность
операции
142,19
30,00
370,00
91,43
Возраст
48,06
35,00
67,00
8,90
Далее из выборок были удалены выбросы – нетипичные значения, которые слишком далеки от среднего значения. Для выборок была применена
гипотеза о нормальном распределении. Согласно этой гипотезе, 95 % данных будут располагаться вокруг среднего значения на расстоянии двух
среднеквадратических отклонений. Те значения, которые отклоняются более чем на три среднеквадратических отклонения, удалялись из выборки.
Пары элементов с большим значением коэффициента парной корреляции (около 1) являются зависимыми и затем одна из переменных в каждой
паре должна быть удалена из входных данных. Рассчитанные коэффициенты парной корреляции приведены в табл. 2.
Из табл. 2 видно, что переменные уровень гемоглобина и количество
эритроцитов сильно коррелированны. Исходя из этого было принято решение удалить переменную количество эритроцитов в связи с тем, что
традиционно для медицинских работников большее значение имеет гемоглобин.
УДК 004.032.26(06) Нейронные сети
69
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
Таблица 2
Коэффициенты парной корреляции
Время
операции
Возраст
Время операции
1
Возраст
HB
Э
ЦП
Л
СОЭ
0,17
1
HB
Э
-0,17
-0,16
0,07
0,08
1
0,94
1
ЦП
Л
-0,05
0,15
0,05
-0,13
0,53
-0,18
0,38
-0,17
1
-0,05
1
СОЭ
0,02
-0,18
-0,43
-0,34
-0,32
0,36
1
Все входные данные были приведены к диапазону [-1; 1]. Выбор именно
этого диапазона обусловлен тем, что в качестве функции активации использовался гиперболический тангенс, диапазоном чувствительности которого
является отрезок [-1; 1]. Приведение выполняется по формуле:
pn 
2( p  pmin )
1.
pmax  pmin
Восстановление данных, масштабированных к диапазону [-1; 1], выполняется по формуле
p  0,5( pn  1)( pmax  pmin )  pmin .
Для решения поставленной задачи был использован многослойный
персептрон. Такую сеть можно легко интерпретировать как модель входвыход, в которой свободными параметрами являются веса и пороговые
значения (смещения). Сеть подобной структуры может моделировать
функцию практически любой степени сложности, причем число слоев и
число элементов в каждом слое определяют сложность функции. Определение числа промежуточных слоев и числа элементов в них является важным вопросом при конструировании многослойного перcептрона. Количество входных и выходных элементов определялось условиями задачи и
равняется количеству входных и выходных переменных соответственно.
В качестве функция активации использовалась гиперболическая тангенциальная функция. Данная функция и ее производная определяются
следующими соотношениями:
УДК 004.032.26(06) Нейронные сети
70
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
tan sig (n) 
2
1 ;
1  e 2 n
d tan sig (n)  1  tan sig 2 (n) .
С помощью экспериментов в пакете Matlab подбиралась оптимальная
сеть для прогнозирования. Эксперименты проводились на многослойной
сети. Сеть учились прогнозировать средний гемоглобин в послеоперационном периоде по 6 показателям. В результате проведенных экспериментов были выбрана оптимальная для прогнозирования архитектура сети. На
первом этапе для поиска наиболее удачной архитектуры сети использовался «быстрый» алгоритм Левенберга-Марквардта. Затем на выбранной
архитектуре проводились эксперименты с использованием алгоритма обратного распространения ошибки. Испытания проводились на трехслойной сети (входной, скрытый и выходной). Количество нейронов входного
и выходного слоев определялось количеством входных и выходных переменных, и равняется соответственно шести и одному.
В ходе экспериментов подбиралось количество нейронов в скрытом
слое.
Эксперименты были начаты с архитектуры 6-4-1, т.е. шесть нейронов
во входном слое, четыре нейрона в скрытом слое и один нейрон в выходном слое. Выбор именно такого количества нейронов в скрытом слое связан с гипотезой о том, что количество нейронов в скрытом слое равно полусумме числа входных и выходных элементов [3].
Для каждого варианта архитектуры рассчитывалась ошибка в процентах. Для каждого варианта архитектуры сети проводилось по 3 эксперимента. Это связано с тем, что при инициализации сети веса и смещения
устанавливаются случайным образом, и это может влиять на конечный
результат.
Ввиду того, что архитектура 6-4-1 оказалась неудачной, стала использоваться другая гипотеза [4] о количестве нейронов в скрытом слое. Согласно гипотезе, количество нейронов в скрытом слое определяется формулой
K = 2n + 1,
где K – количество нейронов, n – количество входов.
Оказалось, что лучшие результаты достигаются на трехслойной
нейронной сети с девятнадцатью нейронами в скрытом слое (средняя
ошибка равна 13,3 %, а минимальная ошибка равна 6,7 %) и с восемнадцатью нейронами в скрытом слое (средняя ошибка равна 20 %, а минимальная ошибка равна 6,7 %).
Во избежание эффекта переобучения нейронной сети мы использовали
также алгоритм обучения с использованием тестового множества.
УДК 004.032.26(06) Нейронные сети
71
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
При обучении нейронной сети с использованием тестового множества
выяснилось, что наименьшие ошибки дают сеть с пятнадцатью нейронами
в скрытом слое (средняя ошибка 17,8 %, минимальная ошибка 6,7 %) и
сеть с девятнадцатью нейронами в скрытом слое (средняя ошибка 15,6 %,
минимальная ошибка 6,7 %).
Очевидно, что по итогам всех экспериментов наименьшую ошибку
при прогнозировании среднего уровня гемоглобина в послеоперационном
периоде дает сеть с архитектурой 6-19-1, т.е. шесть нейронов во входном
слое, девятнадцать в скрытом слое и один в выходном.
Список литературы
1. Щетинин В.Г. Применение компьютерных «нейронных сетей» в клинической лабораторной диагностике / В.Г. Щетинин, А.А. Соломаха // Клиническая лабораторная диагностика. 1998. №10. С. 21 – 33.
2. Шевченко Ю.Л., Хубулава Г.Г., Кривцов В.А. и др. Диагностика и лечение ранних
кровотечений после операций на открытом сердце // Хирургия. 1999. №8, с.28-36.
3. Нейронные сети.STATISTICA Neural Networks: Пер. с англ. – М.: Горячая линия –
Телеком. 2001. – 182 с. – ил.
4. Медведев В. С. Нейронные сети Matlab 6 / В.С. Медведев, В.Г. Потёмкин. – М.:
ДИАЛОГ-МИФИ, 2002. – 496 с.
УДК 004.032.26(06) Нейронные сети
72
Download