Карцинома Герена - Материалы для студентов МИРЭА

advertisement
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ
РАДИОТЕХНИКИ, ЭЛЕКТРОНИКИ И АВТОМАТИКИ (ТУ)
Факультет: Кибернетики
Кафедра: Биомедицинская Электроника
КУРСОВАЯ РАБОТА
“Моделирование развития карциномы Герена”
Дисциплина: “Моделирование в медицине”
Работу выполнил студент группы КМ-1-хх:
ФИО _______________________
Проверила преподаватель:
Бабушкина Нина Александровна ______________________
МОСКВА 200х
2
Содержание
Титульный лист…………………………………………………………….…………1
Содержание………………………………………………………………….…….......2
Введение…………………………………………………………………….…………3
1. Описание опухоли…………………………………………………………….…….3
2. Аппроксимация исходных данных………………………………………….……..3
2.1. Выбор функции…………………………………………………………....3
2.2. Аппроксимация в MathCAD………………………………………….…..3
2.3. Выбор оптимальной функции…………………………………………....4
2.4. Метод наименьших квадратов……………………………………………5
2.5. Расчёт коэффициентов с помощью МНК…………………………….....7
2.6. Итерационный метод наискорейшего спуска…………………………...7
2.7. Программа расчёта коэффициентов методом наискорейшего спуска…8
2.8. Расчёт коэффициентов методом наискорейшего спуска…………..……9
2.9. Результаты……………………………………………………………..….10
3. Расчёт биологических параметров………………………………………………...11
3.1. Время жизни организма без лечения и запас жизненных сил…….…...11
3.2. Дозовая зависимость…………………………………………………..….11
3.3. Расчёт времени жизни организма после курса лечения……………......12
Заключение…………………………………………………………………………….16
Список литературы………………………………………………………………..…..17
3
ВВЕДЕНИЕ
Задание: смоделировать развитие карциномы Герена после перевивки различных
объёмов 50%-ной взвеси опухолевых клеток. Рассчитать время жизни при введении
химиотерапии в дозе D = 0.5 МПД. Количество введений – 8 раз с интервалом
 t  5 суток
Исходные данные: N(t) – объём опухоли, t – дни измерения размера опухоли.
t, суток
11
13
14
15
16
17
18
20
21
22
23
24
N(t), у.е.
0,2
0,7
1
1,5
2
3
4,5
6
7,5
9,5
12
15
1. Описание опухоли
Герена карцинома (M.E. Guérin, р. 1897 Г., франц. онколог; син. опухоль T-8) — штамм
перевиваемого малодифференцированного рака крыс, полученный из спонтанной
аденокарциномы матки крыс.[4]
2. Аппроксимация исходных данных
2.1. Выбор функции
Визуальный анализ кинетики роста опухоли позволяет предположить, что
экспериментальные данные можно аппроксимировать экспоненциальной или степенной
функцией.
t
Экспоненциальная функция: N ( t )  N 0e
Степенная функция: N( t )  t

(2.1)
(2.2)
2.2. Аппроксимация в MathCAD
Подбор коэффициентов производился в пакете Mathcad 11 Pro с помощью функции
minimize(), реализующая минимизацию суммы квадратов отклонений (СКО)
численным итерационным методом градиентного спуска.
Экспоненциальная:
N 0  0.052
  0.237
N ( t )  0.052e
(2.3)
0.237 t
Степенная функция:
  3.610 6
  4.788
N( t )  3.610 6  t .4.788
(2.4)
4
Рис. 2.1. Аппроксимация исходных данных экспоненциальной и степенной функциями
2.3. Выбор оптимальной функции
Чтобы выбрать функцию, наиболее точно аппроксимирующую исходные данные,
необходимо просчитать сумму квадратов отклонений (СКО) между эспериментальными
точками и расчётными значениями, аппроксимированными аналитической функцией
для каждой точки ti момента измерения роста опухоли.
n
СКО  [ N( t i )  N( t i ,,)]2
(2.5)
i 1
Экспонциальная функция:
n
СКО1  [ N( t i )  N 0 e t i  )] 2
i 1
(2.6)
СКО1 1.532
N 0 0.052
при
 0.237
Степенная функция:
n
СКО2  [ N( t i ) t i )]2
i 1
СКО2 0.918
при
 3.6106
 4.788
(2.7)
5
Т.к. СКО2 < СКО1, степенная функция лучше аппроксимирует исходные данные.
Итак, функция N( t ) 3.610 6  t .4.788 обеспечивает наилучшую аппроксимацию
исходных данных.
2.4. Метод наименьших квадратов
Рассмотрим задачу оценки коэффициентов парной линейной регрессии.
Предположим, что связь между х и у линейна: у = +х. Здесь имеется в виду связь
между всеми возможными значениями величин х и у, то есть для генеральной
совокупности. Наличие случайных отклонений, вызванных воздействием на
переменную у множества других, неучтенных в нашем уравнении факторов и ошибок
измерения, приведет к тому, что связь наблюдаемых величин x i и yi приобретет вид
уi=+хi+єi,. Здесь єi. - случайные ошибки (отклонения, возмущения). Задача состоит
в следующем: по имеющимся данным наблюдений {xi}, {уi} оценить значения
n
2
параметров  и , обеспечивающие минимум величины СКО [ y i  y] . Если бы
i 1
были известны точные значения отклонений єi, то можно было бы (в случае
правильности предполагаемой линейной формулы) рассчитать значения параметров
 и . Однако значения случайных отклонений в выборке неизвестны, и по
наблюдениям xi и уi можно получить оценки параметров a и b, которые сами
являются случайными величинами, поскольку соответствуют случайной выборке.
Пусть а - оценка параметра , b - оценка параметра . Тогда оцененное уравнение
регрессии будет иметь вид:
yi=а+bxi+еi,
(2.8)
где еi - наблюдаемые значения ошибок єi.
Для оценки параметров  и  воспользуемся МНК, который минимизирует СКО
фактических значений уi от расчетных. Минимум ищется по переменным а и b.
Для того, чтобы полученные МНК оценки а и b обладали желательными свойствами,
сделаем следующие предпосылки об отклонениях єi:
1.
2.
3.
4.
величина єi является случайной переменной;
математическое ожидание єi равно нулю: М (єi) = 0;
дисперсия є постоянна: D(єi) = D(єi) = 2 для всех i, j;
значения єi независимы между собой. Откуда вытекает, в частности, что
 0 при i  j ,
cov(  i  j )   2
 при i  j .
(2.9)
Известно, что, если условия (1 - 4) выполняются, то оценки, сделанные с помощью
МНК, обладают следующими свойствами:
1. Оценки являются несмещенными, т.е. математическое ожидание оценки
каждого параметра равно его истинному значению: М(а) =; М(b)=. Это
вытекает из того, что М(єi) = 0, и говорит об отсутствии систематической
ошибки в определении положения линии регрессии.
6
2. Оценки состоятельны, так как дисперсия оценок параметров при
возрастании числа наблюдений стремится к нулю: lim D( a )  0 ;
n 
lim D( b )  0 . Иначе говоря, если п достаточно велико, то практически
n 
наверняка а близко к , а b близко к : надежность оценки при увеличении
выборки растет.
3. Оценки эффективны, они имеют наименьшую дисперсию по сравнению с
любыми другими оценками данного параметра, линейными относительно
величин уi . [1]
Перечисленные свойства не зависят от конкретного вида распределения величин єi, тем
не менее обычно предполагается, что они распределены нормально N(0;y2). Эта
предпосылка необходима для проверки статистической значимости сделанных оценок и
определения для них доверительных интервалов. При ее выполнении оценки МНК
имеют наименьшую дисперсию не только среди линейных, но среди всех несмещенных
оценок.
Если предположения (3 - 4) нарушены, то есть дисперсия возмущений непостоянна
и/или значения є. связаны друг с другом, то свойства несмещенности и состоятельности
сохраняются, но свойство эффективности - нет.
Рассмотрим теперь процедуру оценивания параметров парной линейной регрессии а
и b. Для того, чтобы функция СКО (2.5) достигала минимума, необходимо равенство
нулю ее частных производных:
n
 СКО


2
( y i  a  bx i )  0

 a
i 1
 СКО
n

 2( y i  a  bx i ) x i  0
 b
i 1
n
n

y

na

b
x i 0

  i
i 1
i 1
n
n
n
y i x i  a x i  bx i 2  0
 i 1
i 1
i 1
(2.10)
(2.11)
Откуда

n  y i x i  x i  y i
 b
n x i2  (x i ) 2


2
a  y  bx   y i x i  x i x i y i

n x i2  (x i ) 2

(2.12)
2.5 Расчёт коэффициентов МНК
Степенную функцию, нелинейную по параметрам, нужно привести к линейному виду:
N( t )  t 
Логарифмируем:
ln( N( t ))  ln( )  ln( t )
Линеаризуем исходные данные:
(2.15)
7
11
ti
13
14
15
16
17
2,398 2,565 2,639 2,708 2,773 2,833
ln(ti)
Ni
0,2
0,7
1
yi
-1,61
-0,36
0
1,5
2
3
18
2,89
4,5
20
21
22
23
24
2,996 3,045 3,091 3,135 3,178
6
7,5
9,5
12
15
0,405 0,693 1,099 1,504 1,792 2,015 2,251 2,485 2,708
n
СКО  [ N i  t i )] 2
i 1
y i ln( N i )
12
( y i  ln  ln( t i ))
 СКО


2
0





i 1
 СКО
12

 2( y i  ln  ln( t i )) ln( t i )  0

i 1
 
12
 12
y

12
ln



ln( t i )

i

 
i 1
i 1
 12
12
12
y i ln( t i )  ln ln( t i )  (ln( t i )) 2

i 1
i 1
 i 1
(2.13)
(2.14)
Из 2.13 и 2.14 находим  :
12
12
12

12
ln(
t
)
y

ln(
t
)
yi



i
i
i

i 1
i 1
i 1
 
12
12

12(ln( t i )) 2 (ln( t i )) 2

i 1
i 1
12
12

ln( t i )

y i 
i 1
   exp( i 1
)

12
n 12  число экспериментальных точек
ln( t )  34.25
(ln( t ))  98.4
y 12.99
ln( t ) y  40.56
i
2
i
i
i
i
 1240.56  34.2512.99  38.144

 4.78
   1298.4  34.25 2
 7.98



12.99  4.7834.25
)  exp( 12.56)  3.5910 6
  exp(
12

Следовательно, аппроксимирующая функция будет иметь вид:
N( t ) 3.5910 6  t .4.78
2.6. Итерационный метод наискорейшего спуска.
Рассмотрим метод наискорейшего спуска с шагом, длина которого зависит от свойств
минимизируемой функции, или метод Ньютона. Он основан на квадратической
аппроксимации минимизируемой функции в окрестности точки x (k), где (k) – номер
итерации Минимум квадратической функции легко найти, приравнивая ее градиент
8
нулю. Можно сразу же вычислить положение экстремума и выбрать его в качестве
следующего приближения к точке минимума. Новая итерация вычисляется по формуле:
x ( k 1)  x ( k )  x ( k )
(2.16)
Пусть f(x) - минимизируемая фукнция с векторным аргументом a [ x 1 ,x 2 ,...,x n ]T .
Алгоритм наискорейшего спуска реализует итерационную процедуру движения к
минимуму из произвольно выбранной точки начального приближения в направлении
наиболее сильного уменьшения функции, определенном в окрестности текущего
значения аргумента минимизируемой функции. Такое направление противоположно
направлению, задаваемому вектором градиента f ( x ) минимизируемой функции f(x):
f ( x ) [
f f
f T
,
,...,
]
x 1 x 2
x n
(2.17)
Вычисляя точку нового приближения по формуле (2.16) и разлагая f(x(k+1)) в ряд
Тейлора, получим формулу квадратической аппроксимации fкв(x(k+1)):
f ( x ( k 1) )  f ( x ( k ) x ( k ) )  f кв ( x ( k 1) ) , где
1
f кв ( x ( k 1) )  f ( x ( k ) )[f ( x ( k ) )] T x ( k )  [x ( k ) ] T  2 f ( x ( k ) )x ( k )
2!
(2.18)
 2 f ( x ( k ) ) - матрица вторых производных:
 2f
 2f
x 12 x 1x 2
 2f
 2f
 2 f ( x ( k ) )  x x
x 22
2
1


2
 f
 2f
x n x 1 x n x 2
 2f
x 1x n
 2f

x 2 x n
 
 2f

x 2n

(2.19)
Условие минимума fкв(x(k+1)) по x ( k ) : f кв ( x ( k 1) )  0 . Вычислим градиент f кв ( x ( k 1) ) из
(2.18):
f кв ( x ( k 1) ) f кв ( x ( k ) )   2 f кв ( x ( k ) )x ( k )  0
(2.20)
Для учета фактических особенностей минимизируемой функции будем использовать в
(2.20) значения градиента и матрицы вторых производных, вычисленных не по
аппроксимирующей fкв(x), а непосредственно по минимизируемой функции f(x).
Заменяя fкв(x) в (2.20), найдем длину шага x ( k ) :
x ( k )  [  2 f ( x ( k ) )] 1  f ( x ( k ) )
(2.21)
Итак, последовательность вычислений для реализации алгоритма метода Ньютона:
1. Произвольно задать точку начального приближения x(0)
2. В цикле по номеру итерации k=0,1… вычислить:
a. Значение вектора градиента f ( x ( k ) ) по формуле (2.17)
b. Значение матрицы вторых производных  2 f ( x ( k ) ) по формуле (2.19)
9
c. Значение матрицы, обратной матрице вторых производных
d. Значение шага x ( k ) по формуле (2.21)
e. Новое значение приближения x(0) по формуле (2.16)
3. Закончить итерационный процесс при достижении нужного приближения.[2]
2.7. Программа расчёта коэффициентов методом наискорейшего спуска
За минимизируемую функцию возьмём сумму квадратов отклонениий (СКО) между
исходными точками и аппроксимированными аналитической функцией:
n
n
i 1
i 1
СКО  [ N( t i ) N( t i ,,)] 2  [ N( t i )t i )] 2
(2.22)
2.8. Результаты расчёта коэффициентов методом наискорейшего спуска
За начальные приближения выберем:
  410 6
 5
Для случая со степенной функцией формулы (2.17) и (2.19) имеют следующий вид:
СКО [
10
СКО СКО T
,
]


 2 СКО  2 СКО

 2
 2 СКО  2
 СКО  2 СКО

 2
Итерации:
1. Первая итерация.
 ( 0)  410 6
 ( 0)  5
8


СКО   7.03610 3 
8
.
764

10


14
9


СКО   3.32110 9 6.32510 4 
6
.
325

10
7
.
882

10


9
  1.80810 
 0.111 
 (1)  4.00210 6
 (1)  4.889
2. Вторая итерация.
 (1)  4.00210 6
 (1)  4.889
8


СКО   2.23810 3 
2
.
787

10


14
9


СКО  1.66410 9 2.76810 4 
2
.
768

10
3
.
450

10


6
    0.2110 
  0.081 
 ( 2)  3.8110 6
 ( 2)  4.808
3. Третяя итерация.
 ( 2)  3.8110 6
 ( 2)  4.808
7
СКО   3.83210 
 452.983 
14
9


СКО  1.00510 9 1.30710 4 
1
.
307

10
1
.
346

10


6
    0.2110 
  0.020 
 (3)  3.610 6
 (3)  4.788
Итерационный цикл закончен, т.к. результат вычисления коэффициентов совпал с
рассчитанными на ПК (п.2.2).
  3.610 6
  4.788
11
6
N( t ) 3.5910  t
.4.78
2.9. Результаты
Коэффициенты аппроксимирующей степенной функции были рассчитаны тремя
способами: на ПК, безытерационным методом наименьших квадратов (метод
нормальных уравнений) и методом наискорейшего спуска (метод Ньютона). Все они
дали одинаковые результаты с точностью  0.01.
3. Расчёт биологических параметров.
3.1. Время жизни организма без лечения и запас жизненных сил.
Время жизни организма без лечения (Tж(до)) рассчитывается как последний день в
исходных данных плюс трое суток.
Tж(до) = 24+3 = 27 суток
Запас жизненных сил определяют как площадь под аналитической кривой от начала
заболевания до летального исхода.
Т ж ( до)
Z p ( до) 

0
27
N( t )dt  3.610 6  t 4.788dt 120,872
(3.1)
0
Рис. 3.1. Иллюстрация по запасу жизненных сил.
3.2. Дозовая зависимость.
12
Рис. 3.2. График дозовой зависимости
Задержку роста опухоли определяют по данным дозовой зависимости.
Вводимая доза: D=0.5 МПД
Режим введения доз: 8 раз через  t  5 суток
Задержка роста опухоли:

(D)  D tg ()  D MAX  0.52 1 сутки
1 МПД
(3.2)
3.3. Расчёт времени жизни организма после курса лечения.
Величина запаса жизненных сил не меняется со временем и является величиной
постоянной. На основании этого факта можно произвести расчёт времени жизни
организма после курса лечения. Поскольку при введении дозы препарата происходит
задержка роста опухоли, представим этот процесс в виде аналитической кусочнопрерывной функции из 9 интервалов: первый – до первого введения дозы, остальные после соответствующего введения дозы с задержкой в 5 суток (Рис.3.3).
Время жизни организма рассчитывается как:
it
Zi 
 N (t )dt
i
( i 1)t
(3.3)
13
5
N1 ( t )  N( t )  3.610 6  t 4.788
для t  (0;5)
Z1   N1 ( t )  0.007
0
N 2 ( t )  N( t  (D))  3.610 6 ( t 1) 4.788
10
для t  (5;10)
Z 2   N 2 ( t ) 0.207
5
N 3 ( t )  N( t  2(D))  3.610 6 ( t  2) 4.788
15
для t  (10;15)
Z 3   N 3 ( t ) 1.652
10
N 4 ( t )  N( t  3(D))  3.610 6 ( t  3) 4.788
20
для t  (15;20)
Z 4   N 4 ( t ) 7.2
15
N 5 ( t )  N( t  4(D))  3.610 6 ( t  4) 4.788
25
для t  (20;25)
Z 5   N 5 ( t ) 22.374
20
N 6 ( t )  N( t  5(D))  3.610 6 ( t  5) 4.788
30
для t  (25;30)
Z 6   N 6 ( t ) 56.144
25
35
6
N 7 ( t )  N( t  6(D))  3.610 ( t  6)
4.788
для t  (30;35)
Z 7   N 7 ( t ) 121.661
30
40
6
4.788
6
4.788
N 8 ( t )  N( t  7(D))  3.610 ( t  7)
для t  (35;40)
Z 8   N 8 ( t ) 236.959
35
N 9 ( t )  N( t 8(D))  3.610 ( t 8)
для t  40
Необходимо проверить, после какого введения дозы закончится запас жизненных сил:
2
it
  N (t )dt  0.214
 Z p до 120.872
i
i 1
( i 1)t
3
it
  N (t )dt 1.867
i
i 1
( i 1)t
4
it
i 1
( i 1)t
5
it
 Z p до 120.872
  N (t )dt 9.067 
Z p до 120.872
i
  N (t )dt 31.441 
i
i 1
( i 1)t
6
it
i 1
( i 1)t
7
it
i 1
( i 1)t
  N (t )dt 87.585
i
 Z p до 120.872 - организм выдержит 6 доз.
  N (t )dt  209.246
i
Z pдо 120.872
 Z p до 120.872 - организм умрёт до введения 7-ой дозы
14
Рис. 3.3. Пунктирная линия: график роста опухоли до лечения.
Жирная линия: график роста опухоли после лечения.
Т.к. запас жизненных сил величина постоянная и не зависит от производимой терапии,
расчёт времени жизни после лечения будет производиться по следующей формуле:
6
it
i 1
( i 1)t
Z p ( после)  Z p ( до)  

Т ж ( по сл е)
N i ( t )dt 
N
6 t
7
( t )dt
(3.4)
15
Т ж ( посл е)
6
 N 7 (t )dt  Z p( до) 
6 t
it
 N (t )dt
i 1 ( i 1)t
i
6.2210 7 (Т ж ( после)  6) 5.788  60.59 120.872 87.585
(Т ж ( после)  6) 5.788 1.510 8
5.788ln( Т ж ( после)  6)  ln( 1.510 8 )
ln( Т ж ( после)  6)  3.254
Т ж (после) e3.254 631.89431.9 суток
16
Заключение
Развитие опухоли лучше всего аппроксимирует степенная функция. Организм не
выдержит полный цикл лечения из 8 введений доз уровня 0.5 МПД. Организм умрёт в
промежутке между 6 и 7 дозой через 31.9 суток после начала лечения, что на 4.9 суток
больше, чем без лечения.
Рис. 4.1. Смоделированный график развития опухоли до летального исхода. Пунктиром отмечен график
развития опухоли до лечения.
17
СПИСОК ЛИТЕРАТУРЫ
1. Пыльнов Ю.В. Регрессионный анализ полиномиальных моделей. – М.:
МИРЭА, 1994, 56 с.
2. Ван дер Варден Б.Л. Математическая статистика. – М: Эдиториал УРСС, 2006,
435 c.
3. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Множественная
регрессия. Изд.2, перераб. и доп. –М.: Диалектика, 2007, 912 с.
4. http://www.medslv.ru/ - Медицинский словарь – Герена карцинома
Download