Рис. 42. График функции на [0, ]. - LMS

advertisement
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ
ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ
«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»
Московский институт электроники и математики
Новосёлова Анастасия Сергеевна
АНАЛИЗ SEIR МОДЕЛИ РАСПРОСТРАНЕНИЯ КОМПЬЮТЕРНОГО ВИРУСА
Выпускная квалификационная работа
студента образовательной программы бакалавриата
«Прикладная математика и информатика»
по направлению 01.03.02 Прикладная математика и информатика
Студент
___________
Рецензент
А.С. Новосёлова
Научный руководитель
к.ф. – м.н., проф.
к.ф. - м.н. доц.
Лавренов С.М.
Л.А. Манита
_________________
_______________
Москва 2015г.
Аннотация
Рассматривается SEIR модель распространения компьютерного вируса.
Изучается задача оптимального управления для этой модели. Доказано
существование оптимальных решений. Найдена структура оптимального
управления. Получены численные решения.
Abstract
In this work we consider the SEIR model of computer viruses spread. We study an optimal
control problem for this model. The existence of optimal solutions is proved. We find an
optimal control structure. We obtain numerical solutions.
2
Оглавление
Введение ............................................................................................................................... 4
Глава 1. Обзор основных моделей эпидемии в компьютерных сетях ........................... 6
Глава 2. Постановка задачи оптимального управления. Существование решения ... 14
Глава 3. Задача оптимального управления. Необходимые условия оптимальности . 16
Глава 4. Оптимизационная задача с одномерным управлением. Численное
моделирование экстремалей............................................................................................. 24
Заключение......................................................................................................................... 46
Список литературы............................................................................................................ 47
3
Введение
Под
словом
эпидемия
мы
привыкли
понимать
какой–либо
быстроразвивающийся процесс распространения инфекционного заболевания. Но в
век инновационных технологий данный термин всё чаще и чаще употребляется в
сфере компьютерных сетей.
Сетевой
червь
–
это
вредоносная
программа,
которая
способна
самостоятельно распространяется в локальных и глобальных компьютерных сетях и
находить уязвимые места в программном обеспечении, установленном на
удаленных компьютерах. Основная опасность активности червя заключается в том,
что он может менять, удалять или даже похищать персональные данные
пользователя. Поэтому эпидемия компьютерных вирусов и сетевых червей - это
важнейшая проблема информационной безопасности. Следовательно, появляется
необходимость изучать модели распространения компьютерных вирусов, чтобы
научиться обнаруживать эпидемии на ранних стадиях.
Большая часть моделей, описывающих распространение компьютерного
вируса, пришла из биологии. Но в отличие от человека или животного, компьютер
самостоятельно излечиться не может. Еще одной отличительной чертой является то,
что в моделях эпидемии человеческих болезней учитывается возможность
естественной смерти.
В дипломной работе исследуется SEIR - модель. Цель дипломной работы:
анализ минимизации задачи затрат для SEIR модели во время действия эпидемии.
Исследование основано на принципе максимума Понтрягина в форме Лагранжа.
В ходе работы было доказано существование решения. Получена форма
оптимального
управления,
и
найдены
численно
допустимые
траектории,
удовлетворяющие принципу максимума Понтрягина. Исследована зависимость
решений от параметров задачи.
Работа состоит из введения, четырех глав и заключения.
В главе 1 обзор основных моделей: SI, SIR, SEIQR, SEIR. Были описаны
возможные задачи для исследования в этих моделях и приведены основные
4
результаты, полученные для них.
В главе 2 была поставлена задача оптимального управления для SEIR модели с
двумерным управлением, сформулированы и доказаны теорема о существовании
оптимального решения и теорема об ограниченности множества решений.
В главе 3 излагается задача оптимального управления в форме Понтрягина с
фиксированным временем и свободным правым концом. Была сформулирована
теорема о необходимых условиях оптимальности для изучаемой задачи и приведена
схема решения подобных задач. Был применен принцип максимума Понтрягина к
SEIR модели. Доказана теорема о том, что на заключительном интервале времени
оптимальное управление равно нулю.
В главе 4 изучается оптимизационная задача для SEIR модели с одномерным
управлением. С помощью пакета Mathematica вычисляются допустимые экстремали.
5
Глава 1.Обзор основных моделей эпидемии в компьютерных
сетях
Для того чтобы лучше изучить характер распространения эпидемии и
предотвратить ее дальнейшее развитие, необходимо научиться моделировать
эпидемии сетевых червей. А для этого важно правильно выбрать модель эпидемии,
которая наиболее точно описывала бы процесс распространения сетевых червей.
У эпидемии сетевых червей существует несколько стадий [1].
1) Начало распространения червя по сети. На этой стадии червь не влияет на работу
сети, поэтому пользователь и системы защиты не замечают его.
2) Стадия «взрывного роста» популяции червей. На этой стадии активность червя
становится заметной, но не является максимальной. Наступает когда достигается
”критическая масса”
(в работе [2] эта масса достигается, когда заражено 5%
уязвимых узлов).
3) Насыщение узлов сети червями. После завершения второй стадии большая часть
узлов сети уже заражено. Черви взаимодействуют чаще с зараженными узлами,
поэтому увеличение зараженных узлов не возможно.
4) Затухание эпидемии. Начало противодействия эпидемии. Появляется возможность
удалить червя или препятствовать его проникновению на узел.
5) Полное затухание. В результате противодействия у червя не остается возможности
для распространения.
6) Возобновление эпидемии.
Рассмотрим основные модели, описывающие распространение эпидемии
сетевых червей.
Простейшая модель эпидемии SI (Susceptible-Infected) [2]
Предполагается, что в данной модели сеть не защищена, то есть, не
установлена антивирусная программа, а, следовательно, эпидемия не может
угаснуть. Компьютер может находиться только в двух состояниях: уязвимом
(Susceptible) и инфицированном (Infected). Тогда общее число узлов постоянно и
равно N:
6
𝑁 = 𝑆(𝑡) + 𝐼 (𝑡),
𝑆(𝑡) − число незараженных компьютеров,
𝐼(𝑡) − число инфицированных компьютеров.
β
S
I
Рис. 1. Структура SI – модели.
Пусть 𝑖 =
𝐼
𝑁
𝑆
и 𝑠 = , т.е. i – доля зараженных компьютеров, s – доля незараженных.
𝑁
Тогда динамика системы описывается следующим уравнением [2]:
𝑑𝑖
= 𝛽(1 − 𝑖)𝑖
𝑑𝑡
где β – частота заражения, то есть скорость размножения червя.
(1)
Уравнение (1) имеет аналитическое решение:
𝑖(𝑡) =
1
1
1 + ( − 1)𝑒 −𝛽𝑡
𝑖0
где 𝑖0 – доля зараженных компьютеров в начальный момент времени.
Таким образом, в рассматриваемой модели эпидемия задается только двумя
параметрами: скоростью размножения червя β и долей зараженных узлов сети в
начальный момент 𝑖0 . Отметим, что
lim 𝑖(𝑡) = 1
𝑡→+∞
т.е. в модели SI все компьютеры с течением времени будут заражены.
Модель эпидемии SIR (Susceptible–Infected–Removed) [1],[3],[4]
В этой модели узел может находиться в трех состояниях: здоровом, уязвимом
для червя (S), инфицированном (I) и невосприимчивом (R), то есть, учитывается
возможность
избавления
системы
от
заражённых
узлов.
В
SIR
модели
предполагается, что во время действия эпидемии некоторое количество заражённых
субъектов либо избавляется от вредоносной программы, например, после установки
антивирусного программного обеспечения, либо перестаёт функционировать. После
ликвидации вируса узел становится невосприимчивым к нему.
7
β
S
γ
I
R
Рис. 2. Структура SIR – модели.
Структура компьютерной системы на основе SIR - модели может быть представлена
выражением:
𝑁 = 𝑆(𝑡) + 𝐼(𝑡) + 𝑅(𝑡),
где 𝑆(𝑡) − число незараженных компьютеров, 𝐼(𝑡) − число инфицированных
компьютеров, 𝑅(𝑡) – число восстановленных компьютеров. N – общее число
компьютеров.
Обозначим доли уязвимых, инфицированных и вылеченных узлов через s, i и r:
𝑠=
𝑆
𝐼
𝑅
,𝑖 = ,𝑟 = .
𝑁
𝑁
𝑁
Уравнения, описывающие динамику системы:
𝑑𝑠
= − 𝛽𝑖𝑠
𝑑𝑡
𝑑𝑖
𝑑𝑡
= 𝛽𝑖𝑠 − 𝛾𝑖
(2)
𝑑𝑟
= 𝛾𝑖
𝑑𝑡
где  – частота заражения, 𝛾 – средняя скорость установки антивируса (частота
лечения).
Систему (2) часто называют системой Кермака–Маккендрика.
В работе [3] для этой модели определяется понятие порогового условия для
развития эпидемии. Введем функцию инфективности 𝐴(𝜏) – средняя инфективность
узла, зараженного 𝜏 единиц времени назад, по отношению к здоровым узлам сети.
Пусть 𝑝 − вероятность заразиться при контакте с инфицированным узлом, 𝑐 −
среднее число контактов в единицу времени, [𝑇1 , 𝑇2 ] − промежуток времени, когда
узел является заразным. Тогда
𝐴(𝜏) = {
𝑐𝑝, если 𝑇1 ≤ 𝜏 ≤ 𝑇2
0, иначе
Количество новых инфицированных в момент времени t узлов равно
8
∞
𝑆(𝑡)
𝑖̃(𝑡) =
∫ 𝐴(𝜏)𝑖 (𝑡 − 𝜏)𝑑𝑡
𝑁
(3)
0
Введем 𝑅0 − основное репродуктивное число, это понятие занимает центральное
место в математической эпидемиологии. Данная величина характеризует среднее
число зараженных узлов, помещенных в полностью здоровую сеть.
∞
𝑅0 = ∫ 𝐴(𝜏)𝑑𝑡
0
Теорема 1 (пороговая теорема).
Пусть процесс распространения вируса по сети описывается моделью (3).
Тогда вспышка эпидемии возникает тогда и только тогда, когда основное
репродуктивное число 𝑅0 больше единицы. В противном случае, появление вируса в
сети не приводит к эпидемии. [3]
В [4] был получен аналог основного репродуктивного числа. На участке
возрастания i(t) ее производная по времени должна быть больше 0. Поскольку
количество здоровых узлов непрерывно уменьшается за счет перехода узлов из
здорового состояния в инфицированное, следовательно, для наступления эпидемии
необходимо выполнение следующего условия:
𝛾
𝑠(0) > ≡ 𝑝
𝛽
В
[4]
показано,
что
наступление
эпидемии
возможно,
когда
𝛽≫𝛾 .
Следовательно, при 𝜌 ≥ 1 эпидемия не наступит.
Модель эпидемии SEIQR (Susceptible–Exposed–Infected–Quarantine–
Removed)[5]
Согласно данной модели объекты делятся на пять групп:
- здоровые (S)
- инфицированные, распространяющие инфекцию (I)
- инфицированные, не распространяющие инфекцию, то есть находящиеся в
инкубационном периоде(E)
9
- вылеченные, обладающие иммунитетом (R)
- находящиеся в карантине(Q)
Структура компьютерной системы, основанной на SEIQR – модели, задается
выражением:
𝑁 = 𝑆(𝑡) + 𝐸(𝑡) + 𝐼(𝑡) + 𝑄(𝑡) + 𝑅(𝑡)
Динамика системы описывается следующими уравнениями:
𝑑𝑆(𝑡)
𝛽𝐼(𝑡)
=−
𝑆(𝑡)
𝑑𝑡
𝑁
𝑑𝐸(𝑡) 𝛽𝐼(𝑡)
=
𝑆(𝑡) − (𝛼 + 𝑘)𝐸(𝑡)
𝑑𝑡
𝑁
𝑑𝐼(𝑡)
= 𝛼𝐸(𝑡) − (𝛾 + 𝛿)𝐼(𝑡)
𝑑𝑡
𝑑𝑄(𝑡)
= 𝛿𝐼(𝑡) − 𝛾𝑄(𝑡)
𝑑𝑡
𝑑𝑅(𝑡)
{ 𝑑𝑡 = 𝑘𝐸(𝑡) + 𝛾(𝑄(𝑡) + 𝐼(𝑡))
где β – коэффициент заражения, δ – коэффициент карантирования, k,γ –
коэффициенты лечения, α – коэффициент перехода из латентного состояния E в
инфицированное I (т.е. среднее время пребывания в латентном состоянии).
Представление SEIQR – модели:
S
β
k
E
α
I
δ
Q
γ
R
γ
Рис. 3. Структура SEIQR – модели.
В [5] показано, что введение дополнительных типов объекта управления и
возможность введения узлов сети в карантин повышает точность конечного
результата при условии, что имеется обновляемое антивирусное программное
обеспечение.
10
Модель эпидемии SEIR [6]-[9]
Очень часто стандартная модель SIR является слишком простой и
нереалистичной, так как в ней полагается, что узел становится заразным сразу же
после заражения. В SEIR модели предполагается, что вирус имеет латентный
период, в течение которого объекты инфицированы, но еще не заразны.
Используем
эту
модель
для
описания
процесса
распространения
компьютерного вируса на фиксированном интервале времени [0, T].
Объекты сети могут находиться в четырех состояниях:
- здоровые (S)
- инфицированные, распространяющие инфекцию (I)
- инфицированные, не распространяющие инфекцию, то есть находящиеся в
инкубационном периоде(E)
- вылеченные, обладающие иммунитетом (R).
Введем следующие переменные для описания модели:
N – общее количество компьютеров в сети,
S(t) – количество здоровых, но уязвимых узлов в момент времени t,
E(t) – количество узлов, находящихся в инкубационном периоде в момент времени t,
I(t) – количество зараженных узлов в момент времени t, которые распространяю
инфекцию,
β – коэффициент заражения,
α – коэффициент перехода вируса из латентного состояния,
𝑘, 𝛾 – коэффициенты лечения.
Тогда
динамика
модели
описывается
следующими
дифференциальными
уравнениями:
𝑑𝑆
𝐼
= −𝛽 𝑆(𝑡)
𝑑𝑡
𝑁
𝑑𝐸
𝐼
= 𝛽 𝑆(𝑡) − (𝛼 + 𝑘)E(t)
𝑑𝑡
𝑁
𝑑𝐼
= 𝛼𝐸(𝑡) − 𝛾𝐼(𝑡)
𝑑𝑡
11
(4)
𝑑𝑅
= 𝑘𝐸(𝑡) + 𝛾𝐼(𝑡)
𝑑𝑡
Так
𝑑𝑆
𝑑𝐸
𝑑𝐼
+ 𝑑𝑡 + 𝑑𝑡 +
𝑑𝑡
𝑑𝑅
𝑑𝑡
= 0, то 𝑆 + 𝐸 + 𝐼 + 𝑅 = 𝑁.
Представим граф перехода для модели SEIR:
S
β
α
E
I
𝛾
R
k
Рис. 4. Структура SEIR – модели.
В [6] для модели SEIR показано, что не все восприимчивые объекты
заражаются в течение действия эпидемии.
В [7] SEIR модель изучалась в предположении, что интенсивность заражения
зависит от возраста инфекции. Авторы показали, что несколько стандартных теорем
математической эпидемиологии могут быть применимы для SEIR – модели и
рассчитали основное репродуктивное число 𝑅0 , при котором положение равновесия
устойчиво. Найдены условия, при которых заболевание присутствует всегда.
В [8] изучается SEIR модель развития эпидемии в предположении, что особи
могут рождаться и погибать. Найдено положение равновесия рассматриваемой
системы, определены условия, при которых равновесия асимптотически устойчиво.
Рассмотрено применение модели к трансмиссивным заболеваниям (vector borne
diseases), т.е. заболеваниям, которые передаются кровососущими насекомыми.
В
[9]
рассматривается
оптимизационная
задача
для
модели
SEIR.
Предполагается, что численность популяции не является постоянной. Целевой
функционал оценивает затраты на вакцинацию и численность заболевших.
Управление – интенсивность вакцинации восприимчивых особей. Решение задачи
проводится с помощью приведения задачи к дискретной задаче оптимального
управления и использования специального разработанного приложения для решения
задач оптимального управления.
В данной работе оптимизационная задача рассмотрена для SEIR – модели с
фиксированным числом объектов, а управление является двумерным, именно,
рассматривается возможность управлять интенсивностью лечения как узлов,
12
находящихся в латентном состоянии E, так и в зараженном состоянии I.
Предполагается, что интенсивности различны.
13
Глава 2. Постановка задачи оптимального управления.
Существование решения
Зададим фиксированный интервал времени [0, T], на котором происходит
процесс распространение вируса. В качестве функционала затрат рассмотрим
следующий интеграл:
𝑇
∫(𝐶1 𝐼(𝑡) + 𝐶2 𝐸(𝑡) + 𝐶3 𝛾(𝑡) + 𝐶4 𝑘(𝑡))𝑑𝑡,
0
который включает в себя:
𝐶1 − затраты на один инфицированный и заразный узел (I).
𝐶2 − затраты, связанные с заражением одного узла (то есть ущерб, который мы
понесем при переходе одного узла из здорового состояния (S) в латентное (E)).
𝐶3 − затраты на излечение компьютеров, находящихся в инфицированном
состоянии (I), затраты на установку антивирусного программного обеспечения или
межсетевых экранов, которые защищают компьютерные сети или отдельные узлы от
несанкционированного доступа.
𝐶4 − затраты на излечение компьютеров, находящихся в латентном состоянии (E),
затраты на установку антивирусного программного обеспечения или межсетевых
экранов.
Цель управления состоит в выборе управляющих параметров 𝛾(𝑡) , 𝑘(𝑡) ,
которые минимизируют затраты для рассматриваемой модели во время действия
эпидемии. Получаем следующую задачу оптимального управления:
𝑇
∫(𝐶1 𝐼(𝑡) + 𝐶2 𝐸(𝑡) + 𝐶3 𝛾 + 𝐶4 𝑘)𝑑𝑡 → 𝑚𝑖𝑛
(5)
0
𝑑𝑆
𝐼
= −𝛽 𝑆(𝑡)
𝑑𝑡
𝑁
𝑑𝐸
𝐼
= 𝛽 𝑆(𝑡) − (𝛼 + 𝑘(𝑡))E(t)
𝑑𝑡
𝑁
𝑑𝐼
= 𝛼𝐸(𝑡) − 𝛾(𝑡)𝐼(𝑡)
𝑑𝑡
14
(6)
𝑑𝑅
= 𝑘𝐸(𝑡) + 𝛾(𝑡)𝐼(𝑡)
𝑑𝑡
𝑆(0) = 𝑆0 , 𝐸(0) = 𝐸0
𝐼(0) = 𝐼0 𝑅(0) = 𝑅0
Здесь 𝐶1 , 𝐶2 , 𝐶3 , 𝐶4 − заданные положительные постоянные величины, 𝛾(𝑡), 𝑘(𝑡) −
функции управления, 𝑆(𝑡), 𝐸(𝑡), 𝐼(𝑡), 𝑅(𝑡) − фазовые переменные.
Функции управления ограничены: 0 ≤ 𝛾(𝑡) ≤ 𝛾𝑚𝑎𝑥 , 0 ≤ 𝑘(𝑡) ≤ 𝑘𝑚𝑎𝑥 .
Теорема 2. Множество решений задачи (5) – (6) ограничено.
Доказательство: Утверждение теоремы вытекает из следующих Лемм [10]:
Лемма1. 𝑆(𝑡) ≥ 0 для любого t.
Лемма2. 𝐸(𝑡) ≥ 0 и 𝐼 (̇ 𝑡) ≥ 0 для любого t.
Лемма3. 𝑅(𝑡) ≥ 0 для любого t.
В силу приведенных Лемм,
𝑆(𝑡), 𝐸(𝑡), 𝐼(𝑡), 𝑅(𝑡) ≥ 0. Так как по нашему
предположению 𝑆(𝑡) + 𝐸(𝑡) + 𝐼(𝑡) + 𝑅(𝑡) = 𝑁, то 𝑆(𝑡) ≤ 𝑁, 𝐸(𝑡) ≤ 𝑁,
∎
𝐼(𝑡) ≤ 𝑁, 𝑅(𝑡) ≤ 𝑁 для всех t.
Теорема 3. В задаче (5) – (6) оптимальное решение существует.
Доказательство: Для доказательства существования решения применим теорему
Филиппова [11] – [12]. Для этого проверим выполнение следующих условий:
1) Множество допустимых управлений выпукло и компактно.
2) Множество допустимых скоростей выпукло.
3) Допустимые решения системы (6) ограничены.
Множество управлений – это прямоугольник. Прямоугольник – компактное,
выпуклое множество. Следовательно, выполнение условия 1 очевидно.
Условие 2 выполнено в силу того, что рассматриваемая задача является линейной по
управлению.
Условие 3 доказывается в Теореме 2.
Следовательно, теорему Филиппова можно применить, и решение существует.
15
∎
Глава 3. Задача оптимального управления. Необходимые
условия оптимальности. [13]
Нужно минимизировать следующий функционал:
𝑡
𝐼0 (𝑥(∙), 𝑢(∙)) = ∫𝑡 1 𝑓(𝑡, 𝑥(𝑡), 𝑢(𝑡))𝑑𝑡 + 𝜓(𝑥(𝑡1 ))
0
(7)
на траекториях системы:
𝑥̇ (𝑡) = 𝜑(𝑡, 𝑥(𝑡), 𝑢(𝑡)),
(8)
∀ 𝑡𝜖[𝑡0 , 𝑡1 ],
(9)
при условиях на управление:
𝑢(𝑡)𝜖 𝔘,
И заданном условии в момент 𝑡0 :
(10)
𝑥(𝑡0 ) = 𝑥0
Задача (7) - (10) называется задачей оптимального управления с заданным временем
и
незакрепленным
правым
концом
[13].
Здесь
вектор
функция 𝑥(∙) =
𝑥1 (∙), … , 𝑥𝑛 (∙) − фазовая переменная, 𝑢(∙) = 𝑢1 (∙), … , 𝑢𝑛 (∙) −управление. Уравнение
(8) называется дифференциальной связью, а соотношение (9) – ограничением на
управление, соотношение (10) - краевое условие.
Множество допустимых управлений 𝔘 замкнуто, ограниченно в Rr .
𝑓 ∶ 𝑅 × 𝑅𝑛 × 𝑅𝑟 → 𝑅, 𝜓 ∶ 𝑅𝑛 → 𝑅𝑛 , 𝜑 ∶ 𝑅 × 𝑅𝑛 × 𝑅𝑟 → 𝑅𝑛 .
Пару ( 𝑥(∙), 𝑢(∙)) будем называть управляемым процессом в задаче оптимального
управления (7) - (10), если функция управления
𝑢(∙) кусочно-непрерывная,
удовлетворяющая условию (9), а фазовая траектория 𝑥(∙) кусочно-непрерывно
дифференцируема и удовлетворяет уравнению дифференциальной связи (8) везде,
кроме точек разрыва управления 𝑢(∙) . Будем считать управляемый процесс
допустимым, если, помимо того, выполнено краевое условие.
Допустимый процесс 𝜉̂ = ( 𝑥̂(∙), 𝑢̂(∙) называется оптимальным, если ∃ 𝜀 > 0 : ∀
допустимого ξ = (𝑥(∙), 𝑢(∙)), для которого
||𝑥(∙) − 𝑥̂(∙)||𝐶(∆,𝑅𝑛) < 𝜀,
выполняется неравенство 𝐼0 (𝜉) ≥ 𝐼0 (𝜉̂ ).
16
Теорема 4. Пусть 𝜉̂ = (𝑥̂(∙), 𝑢̂(∙)) − оптимальный процесс в задаче оптимального
управления, функции 𝑓, 𝜑 и их частные производные по 𝑥 непрерывны в множестве
𝛶 × 𝔘 , где 𝛶 − окрестность множества {(𝑡, 𝑥̂(𝑡))|𝑡 ∈ [𝑡̂0 , 𝑡1̂ ]}, а функция 𝜓 ∈
𝐷(𝑥̂(𝑡1 )) (условие гладкости).
Тогда выполнено условие оптимальности по 𝑢:
𝑓(𝑡, 𝑥̂(𝑡), 𝑢) − 𝑝(𝑡)𝜑(𝑡, 𝑥̂(𝑡), 𝑢) ≥ 𝑓̂(𝑡) − 𝑝(𝑡)𝜑̂(𝑡)
∀ 𝑡 ∈ 𝑇, ∀ 𝑢 ∈ 𝔘,
где 𝑝(∙) − единственное решение дифференциального уравнения
𝑝̇ (𝑡) + 𝑝(𝑡)𝜑̂𝑥 (𝑡) = 𝑓̂𝑥 (𝑡)
∀𝑡 ∈ 𝑇
с краевым условием
𝑝(𝑡1 ) = −𝜓 ′ (𝑥̂(𝑡1 )).
Множитель Лагранжа 𝜆0 функционала 𝐼 оказывается равным единице, а условие
трансверсальности в 𝑡 = 𝑡0 несущественно. [13]
Схема решения задачи[13]
Пусть 𝑝(∙) векторная кусочно-дифференцируемая функция, которая называется
сопряженной функцией.
1) Выписываем необходимые условия оптимальности процесса 𝜉̂ = (𝑥̂(∙), 𝑢̂(∙)):
• Сопряженные уравнения (уравнение Эйлера):
𝑝̇ (𝑡) = 𝑓̂𝑥 (𝑡) − 𝑝(𝑡)𝜑̂𝑥 (𝑡)
• Условие трансверсальности - краевое условие для 𝑝(𝑡):
𝑝(𝑡1 ) = −𝜓 ′ (𝑥̂(𝑡1 )
• Оптимальность по 𝑢:
min(𝑓(𝑡, 𝑥̂(𝑡), 𝑢) − 𝑝(𝑡)𝜑(𝑡, 𝑥̂(𝑡), 𝑢)) = 𝑓(𝑡, 𝑥̂(𝑡), 𝑢̂(𝑡)) − 𝑝(𝑡)𝜑(𝑡, 𝑥̂(𝑡), 𝑢̂(𝑡));
𝑢∈𝔘
2) Ищем допустимые управляемые процессы, для которых выполняются условия
оптимальности.
3) Находим решение или доказываем, что его нет.
Замечание 1. Отметим, что в необходимые условия оптимальности не входит
переменная 𝑅(𝑡). Поэтому в дальнейшем можно рассматривать только фазовые
переменные 𝑆(𝑡), 𝐸(𝑡), 𝐼(𝑡).
17
Применим принцип максимума Понтрягина к нашей задаче
По условию теоремы о необходимом условии экстремума 𝜆0 = 1.
1) Выпишем уравнения Эйлера:
𝐼(𝑡)
𝐼(𝑡)
− 𝑝2 (𝑡)𝛽
𝑁
𝑁
= 𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘) − 𝑝3 (𝑡)𝛼
𝑝𝜑𝐸(𝑡) = 𝑝1 (𝑡)𝛽
𝑓𝐸(𝑡) + 𝑝𝜑𝐸(𝑡)
𝑓𝐼(𝑡) + 𝑝𝜑𝐸(𝑡) = 𝜆0 𝐶1 + 𝑝1 (𝑡)𝛽
𝑆(𝑡)
𝑆(𝑡)
− 𝑝2 (𝑡)𝛽
+ 𝑝3 (𝑡)𝛾
𝑁
𝑁
Получили систему сопряженных уравнений:
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘) − 𝑝3 (𝑡)𝛼
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝑝3 (𝑡)𝛾
𝑁
Запишем условия трансверсальности на правом конце:
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
𝑝𝑖 (𝑇) = 0, 𝑖 = 1,2,3
2) Условия оптимальности по управлению имеют вид:
𝐶3 𝛾(𝑡) + 𝑝3 (𝑡)𝐼(𝑡)𝛾(𝑡) → 𝑚𝑖𝑛𝛾
(11)
𝐶4 𝑘(𝑡) + 𝑝2 (𝑡)𝐸(𝑡)𝑘(𝑡) → 𝑚𝑖𝑛𝑘
(12)
Проанализируем условие для управления 𝛾. Заметим, что левая часть выражения
(11) принимает вид:
𝛾(𝑡)(𝐶3 + 𝑝3 (𝑡)𝐼(𝑡))
(13)
Для минимизации выражения (13) необходимо, чтобы 𝛾 принимала значение 0, если
𝐶3 + 𝑝3 (𝑡)𝐼(𝑡) > 0, значение 𝛾𝑚𝑎𝑥 , если 𝐶3 + 𝑝3 (𝑡)𝐼(𝑡) > 0 и значение 𝛾особая , если
𝐶3 + 𝑝3 (𝑡)𝐼(𝑡) = 0, то есть:
0, 𝐶3 + 𝑝3 (𝑡)𝐼(𝑡) > 0
𝛾 = { 𝛾𝑚𝑎𝑥 , 𝐶3 + 𝑝3 (𝑡)𝐼(𝑡) < 0
𝛾особая , 𝐶3 + 𝑝3 (𝑡)𝐼(𝑡) = 0
18
(14)
По аналогии рассмотрим условие для управления k. Левая часть выражения
(принимает вид:
𝑘(𝑡)(𝐶4 + 𝑝2 (𝑡)𝐸(𝑡))
(15)
Для минимизации выражения (15) необходимо, чтобы 𝑘 принимала значение 0, если
𝐶4 + 𝑝2 (𝑡)𝐸(𝑡) > 0, значение 𝑘𝑚𝑎𝑥 , если 𝐶4 + 𝑝2 (𝑡)𝐸(𝑡) > 0 и значение 𝑘особая , если
𝐶4 + 𝑝2 (𝑡)𝐸(𝑡) = 0, то есть:
0, 𝐶4 + 𝑝2 (𝑡)𝐸(𝑡) > 0
𝑘 = { 𝑘𝑚𝑎𝑥 , 𝐶4 + 𝑝2 (𝑡)𝐸(𝑡) < 0
𝑘особая , 𝐶4 + 𝑝2 (𝑡)𝐸(𝑡) = 0
(16)
Обозначим 𝑄𝛾 (𝑡) = 𝐶3 + 𝑝3 (𝑡)𝐼(𝑡), 𝑄𝑘 (𝑡) = 𝐶4 + 𝑝2 (𝑡)𝐸(𝑡). Будем называть
𝑄𝛾 (𝑡), 𝑄𝑘 (𝑡) функциями переключения управления 𝛾 и k.
Теорема 5. Существует 𝜀 > 0 такое, что 𝛾(𝑡) = 𝑘(𝑡) = 0 для любого 𝑡 ∈ (𝑇 − 𝜀, 𝑇).
Доказательство: Рассмотрим функции переключения 𝑄𝛾 и 𝑄𝑘 в момент времени T:
𝑄𝛾 (𝑇) = 𝐶3 + 𝑝3 (𝑇)𝐼(𝑇)
𝑄𝑘 (𝑇) = 𝐶4 + 𝑝2 (𝑇)𝐸(𝑇)
Используем условия трансверсальности, получим:
𝑄𝛾 (𝑇) = 𝐶3 > 0
𝑄𝑘 (𝑇) = 𝐶4 > 0
Отсюда, в силу (14), (16) получим 𝛾(𝑇) = 𝑘(𝑇) = 0 . Так как 𝑄𝛾 (𝑡) и 𝑄𝑘 (𝑡)
непрерывные функции, то существует интервал (𝑇 − 𝜀, 𝑇) такой, что 𝑄𝛾 (𝑡) > 0 ,
𝑄𝑘 (𝑡) > 0 для любого 𝑡 ∈ (𝑇 − 𝜀, 𝑇). Следовательно, 𝛾(𝑡) = 𝑘(𝑡) = 0 для любого 𝑡 ∈
∎
(𝑇 − 𝜀, 𝑇).
Таким образом, оптимальная траектория состоит из решений одной из девяти
систем, которые получаются подстановкой в сопряженные уравнения и в исходную
систему возможных значений управлений. Выпишем общий вид системы:
19
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘) − 𝑝3 (𝑡)𝛼
𝑆(𝑡)
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝑝3 (𝑡)𝛾
𝑁
𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − (𝛼 + 𝑘)𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡) − 𝛾𝐼(𝑡)
(17)
Подставим все возможные случаи управления:
1) 𝑘 = 0, 𝛾 = 0
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝛼(𝑝2 (𝑡) − 𝑝3 (𝑡))
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − 𝛼𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡)
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
2) 𝑘 = 0, 𝛾 = 𝛾особая
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝛼(𝑝2 (𝑡) − 𝑝3 (𝑡))
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝑝3 (𝑡)𝛾особая
𝑁
𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − 𝛼𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡) − 𝛾особая 𝐼(𝑡)
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
20
3) 𝑘 = 0, 𝛾 = 𝛾𝑚𝑎𝑥
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝛼(𝑝2 (𝑡) − 𝑝3 (𝑡))
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝑝3 (𝑡)𝛾𝑚𝑎𝑥
𝑁
𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − 𝛼𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡) − 𝛾𝑚𝑎𝑥 𝐼(𝑡)
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
4) 𝑘 = 𝑘𝑚𝑎𝑥 , 𝛾 = 0
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘𝑚𝑎𝑥 ) − 𝑝3 (𝑡)𝛼
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − (𝛼 + 𝑘𝑚𝑎𝑥 )𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡)
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
5) 𝑘 = 𝑘особая , 𝛾 = 0
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘особая ) − 𝑝3 (𝑡)𝛼
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − (𝛼 + 𝑘особая )𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡)
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
21
6) 𝑘 = 𝑘особая , 𝛾 = 𝛾𝑚𝑎𝑥
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘особая ) − 𝑝3 (𝑡)𝛼
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝑝3 (𝑡)𝛾𝑚𝑎𝑥
𝑁
𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − (𝛼 + 𝑘особая )𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡) − 𝛾𝑚𝑎𝑥 𝐼(𝑡)
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
7) 𝑘 = 𝑘особая , 𝛾 = 𝛾особая
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘особая ) − 𝑝3 (𝑡)𝛼
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝑝3 (𝑡)𝛾особая
𝑁
𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − (𝛼 + 𝑘особая )𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡) − 𝛾особая 𝐼(𝑡)
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
8) 𝑘 = 𝑘𝑚𝑎𝑥 , 𝛾 = 𝛾особая
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘𝑚𝑎𝑥 ) − 𝑝3 (𝑡)𝛼
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝑝3 (𝑡)𝛾особая
𝑁
𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − (𝛼 + 𝑘𝑚𝑎𝑥 )𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡) − 𝛾особая 𝐼(𝑡
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
22
9) 𝑘 = 𝑘𝑚𝑎𝑥 , 𝛾 = 𝛾𝑚𝑎𝑥
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘𝑚𝑎𝑥 ) − 𝑝3 (𝑡)𝛼
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝑝3 (𝑡)𝛾𝑚𝑎𝑥
𝑁
𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − (𝛼 + 𝑘𝑚𝑎𝑥 )𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡) − 𝛾𝑚𝑎𝑥 𝐼(𝑡)
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
23
Глава 4. Оптимизационная задача с одномерным
управлением. Численное моделирование экстремалей
Рассмотрим задачу (5) – (6) при условии, что параметр 𝛾 фиксирован и равен
некоторому положительному числу. Таким образом, управлением является только
параметр k.
𝑇
∫(𝐶1 𝐼(𝑡) + 𝐶2 𝐸(𝑡) + 𝐶3 𝛾 + 𝐶4 𝑘)𝑑𝑡 → 𝑚𝑖𝑛
(18)
0
𝑑𝑆(𝑡)
𝐼
= −𝛽 𝑆(𝑡)
𝑑𝑡
𝑁
𝑑𝐸(𝑡)
𝐼
= 𝛽 𝑆(𝑡) − (𝛼 + 𝑘(𝑡))E(t)
𝑑𝑡
𝑁
𝑑𝐼(𝑡)
= 𝛼𝐸(𝑡) − 𝛾𝐼(𝑡)
𝑑𝑡
(19)
𝑆(0) = 𝑆0 , 𝐸(0) = 𝐸0
𝐼(0) = 𝐼0 𝑅(0) = 𝑅0
Для задачи (18) – (19) верны теоремы 2 и 3. Необходимые условия оптимальности
принимают вид:
𝐶4 𝑘(𝑡) + 𝑝2 (𝑡)𝐸(𝑡)𝑘(𝑡) → 𝑚𝑖𝑛𝑘
(20)
Сопряженная система и граничные условия сохранятся:
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘(𝑡)) − 𝑝3 (𝑡)𝛼
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝑝3 (𝑡)𝛾
𝑁
(21)
𝑝𝑖 (𝑇) = 0, 𝑖 = 1,2,3
Заметим, что и в этом случае Теорема 5 выполняется, т.е. в конечный момент
времени управление 𝑘(𝑡) = 0.
24
Особые управления
Из условия оптимальности по управлению следует, что может реализоваться
случай, когда коэффициент при управлении (функция переключения) равен нулю.
Тогда для определения управления необходимы дополнительные вычисления.
Пусть для всех 𝑡 ∈ [𝑎, 𝑏] 𝑄𝑘 (𝑡) = 0. Тогда все существующие производные
(𝑚)
функции 𝑄𝑘 (𝑡) также равны нулю: 𝑄𝑘 (𝑡) = 0, 𝑡 ∈ [𝑎, 𝑏], 𝑚 ≥ 1.
Используем это для определения управления:
𝑄𝑘 (𝑡) = 0 ⇨ С4 + 𝑝2 (𝑡)𝐸(𝑡) = 0
(22)
𝑄𝑘̇ (𝑡) = 0 ⇨ 𝑝2̇ (𝑡)𝐸(𝑡) + 𝑝2 (𝑡)𝐸̇ (𝑡) = 0 ⇨
(23)
⇨ 𝐶2 𝐸(𝑡) − 𝛼𝑝3 (𝑡)𝐸(𝑡) + 𝑝2 (𝑡)𝛽
𝐼(𝑡)𝑆(𝑡)
=0
𝑁
𝑄𝑘̈ (𝑡) = 0 ⇨ 𝐶2 𝐸̇ (𝑡) − 𝛼𝑝3̇ (𝑡)𝐸(𝑡) − 𝛼𝑝3 (𝑡)𝐸̇ (𝑡) + 𝑝2̇ (𝑡)𝛽
𝐼(𝑡)𝑆(𝑡)
+
𝑁
𝐼 (̇ 𝑡)𝑆(𝑡)
𝐼(𝑡)𝑆̇(𝑡)
𝛽𝐼(𝑡)𝑆(𝑡)
𝑝2 (𝑡)𝛽
+ 𝑝2 (𝑡)𝛽
= 0 ⇨ 𝐶2 (
− (𝛼 + 𝑘)𝐸(𝑡)) −
𝑁
𝑁
𝑁
−𝛼𝐸(𝑡) (𝐶1 +
𝛽𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝛾𝑝3 (𝑡)) −
𝑁
𝛽𝐼(𝑡)𝑆(𝑡)
𝛽𝐼(𝑡)𝑆(𝑡)
−𝛼𝑝3 (𝑡) (
− (𝛼 + 𝑘)𝐸(𝑡)) +
(𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘) − 𝛼𝑝3 (𝑡)) +
𝑁
𝑁
𝛽𝑆(𝑡)
𝛽𝐼(𝑡)
𝛽𝐼(𝑡)𝑆(𝑡)
(𝛼𝐸(𝑡) − 𝛾𝐼(𝑡)) + 𝑝2 (𝑡)
(−
)=0
(24)
𝑁
𝑁
𝑁
Мы видим, что во второй производной появилось управление, т.е. мы можем из
+𝑝2 (𝑡)
последнего равенства выразить 𝑘особое :
𝑘особое =
𝛽𝐼(𝑡)𝑆(𝑡)
𝛽𝐼(𝑡)
− 𝛼𝑝3 (𝑡) − 𝑝2 (𝑡) (
− 𝛼 + 𝛾))
(2(С
2
𝑁
𝑁
𝛽𝐼(𝑡)𝑆(𝑡)
𝛼𝑝3 (𝑡)𝐸(𝑡) −
𝑝2 (𝑡)
𝑁
𝛽𝑆(𝑡)
(𝑡) − 2𝑝2 (𝑡)) + 𝑝3 (𝑡)(𝛼 − 𝛾))
𝛼𝐸(𝑡) (С2 + С1 −
𝑁 (𝑝1
+
𝛽𝐼(𝑡)𝑆(𝑡)
𝛼𝑝3 (𝑡)𝐸(𝑡) −
𝑝2 (𝑡)
𝑁
25
+
(25)
Для задачи (18) – (19) допустимые экстремали, построенные с помощью
пакета Mathematica, особые участки не содержали. Сложность выражения (25) не
позволило получить простые условия существования особых управлений.
Оптимальная траектория будет состоять из участков, являющихся решениями
одной из трех систем:
1) 𝑘 = 0
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝛼(𝑝2 (𝑡) − 𝑝3 (𝑡))
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝑝3 (𝑡)𝛾
𝑁
𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − 𝛼𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡) − 𝛾𝐼(𝑡)
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
2) 𝑘 = 𝑘𝑚𝑎𝑥
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘𝑚𝑎𝑥 ) − 𝑝3 (𝑡)𝛼
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝑝3 (𝑡)𝛾
𝑁
𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − (𝛼 + 𝑘𝑚𝑎𝑥 )𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡) − 𝛾𝐼(𝑡)
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
3) 𝑘 = 𝑘особая
𝑝̇1 (𝑡) = 𝛽
𝐼(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡))
𝑁
𝑝̇2 (𝑡) = 𝐶2 + 𝑝2 (𝑡)(𝛼 + 𝑘особая ) − 𝑝3 (𝑡)𝛼
𝑝̇3 (𝑡) = 𝐶1 + 𝛽
𝑆(𝑡)
(𝑝1 (𝑡) − 𝑝2 (𝑡)) + 𝑝3 (𝑡)𝛾
𝑁
26
𝐼(𝑡)
𝑆(𝑡)
𝑁
𝐼(𝑡)
𝐸̇ (𝑡) = 𝛽
𝑆(𝑡) − (𝛼 + 𝑘особая )𝐸(𝑡)
𝑁
𝐼 (̇ 𝑡) = 𝛼𝐸(𝑡) − 𝛾𝐼(𝑡)
𝑆̇(𝑡) = −𝛽
Построение допустимых экстремалей с использованием
пакета Mathematica
Будем рассматривать распространение сетевой эпидемии на отрезке времени
[0, T]. 1. Начнем решать задачу оптимального управления с правого конца, т.е.
положим
𝑡=𝑇 .
Необходимо
задать
граничные
условия.
Из
условий
трансверсальности следует, что 𝑝1 (𝑇) = 𝑝2 (𝑇) = 𝑝3 (𝑇) = 0, а значения
фазовых
переменных на правом конце зададим произвольно 𝑆(𝑇), 𝐸(𝑇), 𝐼(𝑇).
2. Теорема 5 утверждает, что на заключительном интервале времени управление
равно нулю, поэтому начинаем решать задачу с 𝑘 = 0.
3. Построим фазовые и сопряженные переменные.
4. По фазовым и сопряженным переменных вычисляем функцию переключения 𝑄𝑘 .
5. Определяем ближайшую к T точку, в которой функция переключения равна нулю,
и обозначим ее 𝑡1 . Момент 𝑡1 - момент переключения управления я с нуля на 𝑘𝑚𝑎𝑥 .
6. Далее решаем систему, подставляя управление равное 𝑘𝑚𝑎𝑥 . Для решения
системы с управлением 𝑘𝑚𝑎𝑥 используем значения фазовых и сопряженных
переменных в момент 𝑡1 , полученные на предыдущем этапе.
7. Снова определим ближайший к 𝑡1 момент переключения 𝑡2 ,
в котором 𝑄𝑘
обращается в ноль.
8. Действуем аналогично, пока не найдем решение на всем отрезке [0,T]. Если
выполняются
начальные
условия
для
фазовых
переменных,
удовлетворяет необходимым условиям оптимальности. Если
то
решение
для фазовых
переменных не выполняются начальные условия, то необходимо изменить
граничные условия для функций 𝑆(𝑇), 𝐸(𝑇), 𝐼(𝑇) на начальном этапе вычислений.
Пример 1. Рассмотрим развитие эпидемии компьютерного вируса на отрезке
времени [0, 10]. Так как известны значения сопряженных переменных в момент
27
времени T, то начнем решать систему уравнений принципа максимума Понтрягина в
обратном времени, начиная с T. Введем начальные условия:
T = 10, β = 5, 𝐶1 = 1, 𝐶2 = 1, 𝐶3 = 0.7, 𝐶4 = 3, N = 50, α =
1
, 𝑝1 (𝑇) = 0, 𝑝2 (𝑇) = 0,
30
𝑝3 (𝑇) = 0, 𝑆(𝑇) = 0.1, 𝐸(𝑇) = 20, 𝐼(𝑇) = 6, γ = 0.1, k = 0.
Вычислим фазовые и сопряженные переменные:
Рис. 5. График сопряженной функции 𝑝1 (t).
Рис. 6. График сопряженной функции 𝑝2 (t).
28
Рис. 7. График сопряженной функции 𝑝3 (t).
Рис. 8. График функции 𝑆(t).
Рис. 9. График функции 𝐸(t).
29
Рис. 10. График функции 𝐼(t).
Зная их, вычисляем функцию переключения 𝑄𝑘 :
Рис. 11. График функции переключения 𝑄𝑘 (𝑡 ).
Определим ближайший к T=10 момент переключения, в котором функция
переключения равна нулю, и обозначим его 𝑡1 = 9.851039135336476.
Рис 12. Момент последнего переключения.
30
В этот момент времени значение управления меняется с нуля на 𝑘𝑚𝑎𝑥 . Далее решаем
систему на отрезке времени [0, 9.851039135336476] с управлением равным 𝑘𝑚𝑎𝑥 =
0.03. В качестве краевых условий берем значения фазовых переменных в точке
переключения 𝑡1 = 9.851039135336476 в первой системе:
𝑝1 (𝑡1 ) = −0.006466434284565818 ,
𝑝2 (𝑡1 ) − 0.14932660918554894,
𝑝3 (𝑡1 ) = −0.29582772277001107,
𝑆[𝑡1 ] = 0.10934097954105065,
𝐸[𝑡1 ] = 20.090190330862413,
𝐼[𝑡1 ] = 5.989769758250416.
Рис. 13. График сопряженной функции 𝑝1 (𝑡) на [0, 9.851039135336476].
Рис. 14. График сопряженной функции 𝑝2 (𝑡) на [0, 9.851039135336476].
31
Рис 15. График сопряженной функции 𝑝3 (𝑡) на [0, 9.851039135336476].
Рис. 16. График функции 𝑆(𝑡) на [0, 9.851039135336476].
Рис. 17. График функции E(𝑡) на [0, 9.851039135336476].
32
Рис. 18. График функции 𝐼(𝑡) на [0, 9.851039135336476].
Определяем функцию переключения 𝑄𝑘 (𝑡). Видим, что больше переключений нет:
Рис. 19. График функции переключения 𝑄𝑘 (𝑡) на [0, 9.851039135336476].
Таким образом, получили решение на всем отрезке:
Рис. 20. График функции S(t).
33
Рис. 21. График функции E(t).
Рис. 22. График функции I(t).
Начальные
условия
фазовых
переменных
выполнены,
получили
решение,
удовлетворяющее необходимым условиям оптимальности.
Целевой функционал в данном случае равен 340.0261724012998.
Пример 2. Рассмотрим развитие эпидемии компьютерного вируса на отрезке
времени [0, 10]. По аналогии с первым примером начнем решать систему уравнений
принципа максимума Понтрягина, начиная с T. Введем начальные условия:
T = 10, β = 5, 𝐶1 = 1, 𝐶2 = 1, 𝐶3 = 0.7, 𝐶4 = 3, N = 50, α =
𝑝3 (𝑇) = 0, 𝑆(𝑇) = 0.4, 𝐸(𝑇) = 10, 𝐼(𝑇) = 4, γ = 0.1, k = 0.
Вычислим фазовые и сопряженные переменные:
34
1
, 𝑝1 (𝑇) = 0, 𝑝2 (𝑇) = 0,
30
Рис. 23. График сопряженной функции 𝑝1 (𝑡)
Рис. 24. График сопряженной функции 𝑝2 (𝑡)
Рис. 25. График сопряженной функции 𝑝3 (𝑡)
35
Рис. 26.График функции 𝑆(𝑡)
Рис. 27.График функции 𝐸(𝑡)
Рис. 28.График функции 𝐼(𝑡).
Зная их, вычисляем функцию переключения 𝑄𝑘 :
36
Рис 29.График функции переключения 𝑄𝑘 (𝑡 ).
Определим ближайший к T=10 момент переключения, в котором функция
переключения равна нулю, и обозначим его 𝑡1 = 9.70289649839587
Рис. 30. Момент последнего переключения функции 𝑄𝑘 (𝑡 ).
В этот момент времени значение управления меняется с нуля на 𝑘𝑚𝑎𝑥 . Далее решаем
систему на отрезке времени [0, 9.70289649839587] с управлением равным 𝑘𝑚𝑎𝑥 =
0.077. В качестве краевых условий берем значения фазовых переменных в точке
переключения 𝑡1 = 9.850968993001272 в первой системе:
𝑝1 (𝑡1 ) = −0.017085271689043884 ,
𝑝2 (𝑡1 ) = −0.29854694206395427,
𝑝3 (𝑡1 ) = −0.5872924558284254,
𝑆[𝑡1 ] = 0.45060928609428685,
𝐸[𝑡1 ] = 10.04867100382951,
𝐼[𝑡1 ] = 4.019855805519133.
37
Рис. 31. График сопряженной функции 𝑝1 (𝑡) на [0, 9.850968993001272].
Рис. 32. График сопряженной функции 𝑝2 (𝑡) на [0, 9.850968993001272].
Рис. 33. График сопряженной функции 𝑝3 (𝑡) на [0, 9.850968993001272].
38
Рис. 34. График функции 𝑆(𝑡) на [0, 9.850968993001272].
Рис. 35. График функции 𝐸(𝑡) на [0, 9.850968993001272].
Рис. 36. График функции 𝐼(𝑡) на [0, 9.850968993001272].
Вычисляем
𝑝1 (𝑡), 𝑝2 (𝑡), 𝑝3 (𝑡), 𝑆(𝑡), 𝐸(𝑡), 𝐼(𝑡)
для
𝑡 < 𝑡1
при
𝑘 = 𝑘𝑚𝑎𝑥 .
Определяем функцию переключения 𝑄𝑘 (𝑡), 𝑡 < 𝑡1 . Снова определим ближайший к
39
𝑡1 момент переключения 𝑡2 = 0.03456759821780173 в котором 𝑄𝑘 обращается в
ноль:
Рис 37. Момент предпоследнего переключения функции 𝑄𝑘 .
Таким образом, управление совершает еще одно переключение с 𝑘 = 𝑘𝑚𝑎𝑥 на 𝑘 = 0.
Теперь рассматриваем эпидемию на отрезке [0,0.03456759821780173]. В качестве
краевых условий берем значения фазовых переменных в точке переключения 𝑡2 =
0.03456759821780173 во второй системе:
𝑝1 (𝑡2 ) = −6.363599108393657 ,
𝑝2 (𝑡2 ) = −8.244056078930678,
𝑝3 (𝑡2 ) = −20.805102621322945,
𝑆[𝑡2 ] = 22.22835876180345,
𝐸[𝑡2 ] = 0.3638985435418247,
𝐼[𝑡2 ] = 4.264911672318557.
Рис. 38. График сопряженной функции 𝑝1 (𝑡) на [0, 0.03456759821780173].
40
Рис. 39. График сопряженной функции 𝑝2 (𝑡) на [0, 0.03456759821780173].
Рис. 40. График сопряженной функции 𝑝3 (𝑡) на [0, 0.03456759821780173].
Рис. 41. График функции 𝑆(𝑡) на [0, 0.03456759821780173].
41
Рис. 42. График функции 𝐸(𝑡) на [0, 0.03456759821780173].
Рис. 43. График функции 𝐼(𝑡) на [0, 0.03456759821780173].
Видим, что больше переключений нет:
Рис. 44.График функции переключения на [0, 0.03456759821780173].
Таким образом, мы получили решение на всем отрезке:
42
Рис. 45. График функции S(t).
Рис. 46. График функции E(t).
Рис 47. График функции I(t).
Начальные
условия
фазовых
переменных
выполнены,
удовлетворяющее необходимым условиям оптимальности.
43
получили
решение,
Целевой функционал в данном случае равен 196.17125282905.
Так же были рассмотрены и другие значения начальных условий и
управлений. Ниже приведена Таблица 1, в которой представлены результаты
вычислений, которые показывают, как меняются моменты переключений и целевой
функционал при изменении параметров задачи и начальных условий.
44
Таблица 1. Зависимость числа переключений, моментов переключений и значения функционала от параметров
𝑪𝟏
𝑪𝟐
𝑪𝟑
𝑪𝟒
α
β
γ
κ
n
T
S(T)
E(T)
I(T)
S(0)
E(0)
I(0)
Ко
лво
2
1
0.7
3
1/30
5
0.1
0.03
50
10
0.1
20
6
11.6184
23.8033
2.6439
1
Точки
переключения
Интегра
л
9.8510
340.026
−
2
1
0.7
3
1/30
5
0.08
0.03
50
10
0.1
20
6
5.2891
30.9274
0.6450
1
9.8510
2
1
0.7
3
1/40
5
0.08
0.03
50
10
0.1
20
6
24.3706
7.1007
5.0508
1
9.8507
−
335.811
325.201
−
2
1
0.7
3
1/30
5
0.1
0.05
50
10
0.1
20
6
7.6802
35.5952
1.0113
1
9.8510
−
368.899
2
1
0.7
3
1/30
5
0.1
0.03
50
10
0.2
20
6
32.0484
0.6682
4.4418
1
9.8509
−
302.166
2
1
0.7
3
1/30
5
0.19
0.05
50
10
0.11
15
3.563
7.2507
25.5236
4.3955
1
9.8018
−
300.329
2
1
0.7
3
1/30
5
0.1
0.03
50
10
0.2019
20
6
32.5641
0.0932
4.4804
2
9.8509
0.0141
301.330
2
1
0.7
3
1/30
5
0.1
0.03
50
10
0.2020
20
6
32.5914
0.0628
4.4825
2
9.8510
0.0161
301.267
2
1
0.7
3
1/30
5
0.1
0.03
50
10
0.2022
20
6
32.6461
0.0018
4.4866
2
9.8510
0.0203
301.198
2
1
0.7
3
1/30
5
0.1
0.08
50
10
0.1
10
5
24.5087
0.1564
6.1477
2
9.7039
0.0149
243.710
2
1
0.7
3
1/30
5
0.1
0.077
50
10
0.4
10
4
22.5590
0.0334
4.2794
2
9.7029
0.0345
196.171
45
Заключение.
В работе рассмотрена оптимизационная задача для SEIR – модели с одним и
двумя управлениями. Для задачи с двумерным управлением доказано, что
оптимальное решение существует, и множество решений ограничено. Получена
структура оптимального управления. Доказано, что на заключительном этапе
оптимальное управление нулевое. Для задачи с одним управлением, кроме того,
выписана
формула
для
особого
управления,
численно
смоделированы
допустимые решения и изучена их зависимость от параметров задачи.
46
Список использованной литературы
1. Качалин А.И. Моделирование процесса распространения сетевых червей для
оптимизации защиты корпоративной сети//Искусственный интеллект.2006.С.84 –
86.
2. Захарченко А. "Черводинамика: причины и следствия". SIR модель и её
варианты.URL:
http://citforum.ru/security/virus/ch_dinamic/
(дата
обращения
19.05.2015).
3. Братусь А.С. Новожилов А.С. Платонов А.П. Динамические системы и модели
биологии М.: Физматлит, 2010.
4. Котенко И. В., Воронцов В. В. Аналитические модели распространения сетевых
червей //Труды СПИИРАН. Вып. 4. — СПб.: Наука, 2007. С. 208-224.
5. Давыдов В.В. Сравнительный анализ моделей распространения компьютерных
вирусов
в
автоматизированных
системах
управления
технологическим
процессом//Вестник НТУ "ХПИ". 2012. № 38.С. 147-151.
6. Масленников
Б.И.
Сравнительный
анализ
методов
имитационного
моделирования//Интернет-журнал «Науковедение».2014.вып.1.С.1-9.
7. Gergely Röst, Jianhong Wu. SEIR epidemiological model with varying infectivity and
infinite delay// Math Biosci Eng.2008. 389-402.
8. Nita H. Shah, Jyoti Gupta.
SEIR Model and Simulation for Vector Borne
Diseases.//Applied Mathematics.2013.4.13-17.
9. Helmut Maurer, Maria Do Ros_ario De Pinho. Optimal Control of Epidemiological
SEIR models with L1-Objectives and Control-State Constraints. Submitted, 21 pages.
2014. <hal-01101291>.URL: https://hal.inria.fr/hal-01101291.
10. Yongqing Yuan. The Collision Regions Between Two Epidemic Models: SIR vs.
SEIR// Annandale-on-Hudson.New York.2012.23-24.
11.Knowles G. An Introduction to Applied Optimal Control.1982, Academic Press, N.Y.,
p.180
47
12. Cesari L. Optimization theory and Applications.1983, Springer,N.Y.p.554
13.Алексеев В.М., Галеев Э.М., Тихомиров В.М. Сборник задач по оптимизации.
Теория. Примеры. Задачи. М.: Наука. Главная редакция физико-математической
литературы.1984.
48
Download