Презентация Абрамовой А.А

advertisement
Линейные дифференциальные
игры преследования
Презентация студентки гр. 413
Абрамовой А.А.
Московский Государственный университет им. М.В. Ломоносова
Кафедра Оптимального Управления
Введение

Рассматриваемая модель:

Пример:
процесс преследования одного
управляемого объекта другим управляемым объектом.
один самолёт преследует другой. Цель первого самолёта
догнать второй, цель второго – уйти от преследования.
v
Убегающий
Управляя своим самолётом, они используют информацию
u
Преследователь
I. Знание о
технических
возможностях
самолётов
II. Сведения
о поведении
обоих
самолётов
Замечание относительно II: можно предпологать известным поведение
противника с некоторым опережением и строить соответствующую мат.модель, а
потом показать, что это применимо к реальной задаче.
Процесс преследования
Обозначения:
x = (x1, x2) – фазовый вектор преследователя.
y = (y1, y2) – фазовый вектор убегающего,
где x1, y1 – геометрическое положение соотв. объектов; x2, y2 – их скорости.
Уравнения управляемых объектов:
Эти уравнения соотв.
информации I.
(возможностям объектов)
где управление u принадлежит множеству P, управление v – множеству Q.
Окончание игры:
x1 = y1
Процесс преследования
заканчивается, когда объекты
геометрически совпадают.
Переход к дифференциальной игре
Дифференциальная игра возникает в результате упрощения обозначений
процесса преследования.
Обозначения:
z = (x, y) – фазовый вектор, образующий пространство R игры как
прямую сумму фазовых простанств соответствующий
объектов
Уравнение управляемых объектов:
где u – управление преследования, v – управление убегания.
Окончание игры:
z
M
Переход в терминальное простанство M.
R
Замечание
В случае дифференциальной игры и в случае процесса преследования мы
можем рассматривать две противоположные задачи.
1. Наша цель: завершение игры (приведение z на M).
В распоряжении: u(t) и сведения о z(s) и v(s) на t - θ ≤ s ≤ t
2. Наша цель: предотвращение конца игры.
В распоряжении: v(t) и сведения о z(s) и u(s) на t - θ ≤ s ≤ t
В дальнейшем нас будет интересовать первая задача (игра преследования).
Линейная дифференциальная игра
Фазовое пространство R линейной игры будем считать евклидовым
векторным пространством размерности n.
Уравнение игры:
u - преследователь.
v - убегающий.
где
z из R;
 C – линейное отображение пространства R в себя;
 u, v принадлежат выпуклым компактам P, Q из R соответственно;
 u(t), v(t) – измеримые функции t;
 M – выпуклое замкнутое подмножество R.

Мы будем рассматривать дифференциальную игру преследования.
Решение дифференциальной
игры преследования
Естественно, что мы, отождествляя себя с преследователем, стремимся
завершить игру за конечное время.
z
Точка начала
Как лучше выбрать
?..
M
R
Для этого нам бы хотелось уметь эффективно находить точки (
которых можно завершить преследование за конечное время.
), из
Это, как оказалось, можно сделать, используя альтернированный интеграл
Понтрягина.
Далее мы приступим к изучению этого нового для нас объекта.
Выпуклые множества и их
геометрическая разность
Для изучения альтернинованного интеграла Понтрягина нам понадобятся
некоторые знания о выпуклых множествах и их геометрической разности.
1. Пусть A, B – замк., вып. подмножества пространства R. Введём мн-во E:
Линейная комбинация множеств
Свойства:
где α и β – фикс.
действительные числа
1) E - выпукло.
2) Если A(B) компактно, то E – замкнуто.
3) Если A и B компактны, то E - компактно.
2. Пусть A – замк., вып. Подмножество пространства R. Введём его опорную ф-цию:
Вектор u – произвольный из R.
По аналогии с пунктом 1:
где α и β –
неотр. числа.
..кроме того, справедливо следующее:
<=>
3. Пусть A, B – замк., вып. подмножества пространства R, пусть B – комп. Введём:
Геометрическая разность.
т.е. совокупность точек z из R:
Обратим внимание на некоторые вытекающие отсюда соотношения:
I
II
(Для док-ва исп. п.2)
Пусть X – замк., вып. мн-во, Y – комп. вып. мн-во. Положим:
4. Пусть A – замк., вып. мн-во, а U, V – комп., вып. мн-ва. Тогда справедливо:
Это включение следует из
определения геом. разности и
предыдущего пункта.
5. Обозначим шар радиуса r с центром в начале координат в R через
Введём расстояние между двумя комп., вып. подмн-вами X, Y пространства R так:
Это расстояние обозначают как
h(X, Y) и называют хаусдорфовым.
Через
обозначим совокупность всех непустых комп. вып. подмножеств R.
Метрическое пространство.
6. Очевидна такая связь геом. разности и шара:
если r > s.
7. Пусть X(t) – непрерывная функция действительного числового параметра t со
значениями в метрическом пространстве Ω(R). Определим интеграл:
Он определяется как обычный
риманов интеграл. Расстояние между
интегральной суммой и Y(p, q) берётся
как расстояние хаусдорфа.
Предполагается, что p ≤ q.
Свойства:
1) Y(p, q) из Ω(R) – непрерывная функция
пределов интегрирования p и q.
2) Если r такое, что p ≤ r ≤ q, то
справедливо:
8, 9. Заметим, что вып. мн-во Y(p, q) совпадает с мн-вом всех точек y вида:
где x(t)  X(t) – измеримая функция переменного t в R.
Кроме того, имеет место соотношение:
Оценка геометрической разности
Продолжаем вспомогательные исследования для введения альтернированного
интеграла Понтрягина.
1. Пусть A – комп., вып. подмножество пространства R. Положим:
Понятно, что для непустоты
при некотором r нужно совпадение размерности A с R.
Обозначим: α = α(A) – максимальное значение r, при котором
δ = δ(A) – диаметр множества A.
Введём
Оценим хаусдорфово расстояние между
и
:
непусто (r ≤ α);
2. Пусть A, B – комп., вып. подмн-ва R. Пусть их разность D имеет размерность R.
Тогда существуют положительные числа γ и l, зависящие только от k(D), α(D) и δ(A),
что при r ≤ γ два произвольных комп., вып. подмн-ва A', B' пр-ва R обладают св-вом:
Если
то для разности
Справедливо соотношение:
3. Пусть A, A' и B, B' – комп., вып. подмножества пространства R.
Тогда
Теперь мы готовы перейти к изучению альтернированного интеграла Понтрягина.
Альтернированный интеграл
1. Пусть A – замк., вып. подмножество пространства R и пусть
- две последовательности комп., вып. подмножеств пространства R.
Положим
Альтернированная сумма
последовательностей U и V
с начальным значением A
Заметим, что если
Тогда имеет место включение
2. Пусть A – компактно и существует такое положительное число β, что верно:
Тогда альтернированная сумма
является непр.
функцией переменных
в пр-ве Ω(R), когда выполнено данное неравество.
3. Пусть A – замк., вып. подмн-во пр-ва R. Пусть U(τ), V(τ) – комп., вып. мн-ва в пр-ва R,
непрерывно зависящие от параметра τ на отрезке p ≤ τ ≤ q.
Пусть
- некоторое подразделение отрезка pq, т.е. последов-ть:
Положим
Теперь, исходя из A и U, V, так же как в пункте 1 составим последовательность мн-в:
Введём обозначение:
Далее рассмотрим случаи когда A компактно и когда A не компактно.
Тем самым
подчеркнув
зависимость
от A, P, r
Пусть A – компактно. Тогда считаем, что функции U(τ), V(τ) удовлетворяют требованию:
Существует непр. на отрезке функция β(r), положительная при всех значениях r > p,
что для любого подразд. P отрезка pq имеет место нер-во:
Т. о., не исключается возможность, что α(A) = 0, и множество
функцией чисел
Пусть A – не компактно.
является непрерывной
Тогда положим:
Кроме того, потребуем, чтобы существовало настолько большое число μ, что верно:
При этом предположении
является непр. ф-цией
4. Пусть
- такая посл -ть неогр. измельчающихся подразделений
отрезка pq, что имеет место включение:
Значит, эта посл - ть есть убывающая посл - ть замк., вып. мн-в в пространстве R.
Её пересечение
не зависит от последовательности подразделений
отрезка pq при выполнении условия из предыдущего пункта:
5. Считаем, что выполнено условие. Тогда множество
называется
альтернированным интегралом АИ функций U(τ), V(τ) на отрезке pq с нач. множеством A:
Кроме того,
6. Пусть x – произвольная точка отрезка pq, т.е. p ≤ x ≤ q. Введём интеграл:
Правая часть определена, т.к.
условие, при котором вводится
АИ, выполнено и на px.
Тогда можно ввести и
Заметим, что если x ≥ p + ε, где ε – положительное число, и A – компактно, то  λ:
т.е. при компактном A ф-ция W(x) имеет
равном.огр. рост на каждом отрезке
p + ε ≤ x ≤ q.
имеет равном. огр. рост на
отрезке p + ε ≤ x ≤ q.
шары с центром в нуле.
Допустим
имеет место
для каждого i.
и
и
Допустим
и
шары с центром в нуле.
при p < t ≤ q.
Спасибо за просмотр!
Download