минобрнауки рф

advertisement
МИНОБРНАУКИ РФ
Федеральное государственное автономное образовательное
учреждение высшего профессионального образования
«Южный федеральный университет»
Факультет математики, механики и компьютерных наук
Рассмотрено и рекомендовано
на заседании кафедры высшей математики
исследования операций ЮФУ
Протокол №_1___________
"__30___"___августа_______2011г.
Зав. кафедрой ________________
УТВЕРЖДАЮ
Декан факультета
(зам. декана по учебной работе)
___________________
"____"____________2011 г.
УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС
учебной дисциплины "Задачи оптимального управления"вузовского
компонента цикла ОПД
по специальности 010501прикладная математика и
информатика
Семестр 6
Всего часов –68 , из них – лекции-34,
–самостоятельная работа- 34 час.
Отчетность по курсу – зачёт
Составитель: профессор Рохлин Д.Б.
Утвержден Советом Южного федерального университета
Протокол №_____ от «______» _________ 2011г.
Ростов-на-Дону
2011
Пояснительная записка к рабочей программе по дисциплине
«Задачи оптимального управления»
Курс, читается в 6-ом. Форма занятий: лекции и практические занятия 34
часа. Виды отчетности: индивидуальные задания и зачет. Цели и задачи
курса: ознакомить студентов с постановками и методами решения задач
управления динамическими системами. Рассматриваются следующие
вопросы: принцип максимума Понтрягина, различные версии уравнения
Беллмана (дискретное и непрерывное время, конечный и бесконечный
горизонт, стохастические системы), концепции управляемости и
наблюдаемости, оптимальная остановка. Курс носит прикладной характер и
ориентирован на решение задач.
РАБОЧАЯ ПРОГРАММА КУРСА
«Задачи оптимального управления»
34 часа
Тема 1. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Вывод принципа максимума Понтрягина при помощи метода множителей
Лагранжа.
2 часа
Уничтожение насекомых. Пчелы как оптимизаторы. Задача о
быстродействии. Простейшая задача преследования.
Успокоение маятника.
5 часов
Тема 2. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ:
НЕПРЕРЫВНОЕ ВРЕМЯ
Вывод уравнения Беллмана в случае конечного горизонта.
2 часа
Планирование расходов. Оптимальный режим снижения мощности ядерного
реактора.
3 часа
Вывод уравнения Беллмана в случае бесконечного горизонта. Задачи об
оптимальном отлове рыбы и планировании расходов в случае бесконечного
горизонта.
3 часа
Тема 3. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ:
ДИСКРЕТНОЕ ВРЕМЯ
Вывод уравнения Беллмана в случае конечного и бесконечного
горизонта.
2 часа
Оптимальное потребление. Задача о покупке пакета акций большим
инвестором. Оптимальный отлов рыбы.
4 часа
Тема 4. УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ В ЛИНЕЙНЫХ
СИСТЕМАХ
Определение и критерии управляемости и наблюдаемости в
дискретного и непрерывного времени.
Игра в чехарду. Управление спутником в окрестности круговой
Наблюдаемость популяций. Радиоактивный распад.
случае
3 часа
орбиты.
3 часа
Тема 5. СТОХАСТИЧЕСКИЕ СИСТЕМЫ: ДИСКРЕТНОЕ ВРЕМЯ
Условное математическое ожидание. Марковские процессы. Метод
динамического программирования. Азартные игры. Динамическая
оптимизация портфеля.
4 часа
Задача об оптимальной остановке. Оптимальная реализация
американского опциона. Выбор с отбрасыванием.
3 часа
ЛИТЕРАТУРА
Основная
1. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление.
М.:Наука, 1979.
2. Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теория
конструирования систем управления. М.:Высш. шк., 1998.
3. Bertsekas D.P. Dynamic programming and optimal control, vol.1, Athena
Scientific, Massachusetts, 1995.
4. Пантелеев А.В., Бортаковский А.С., Летова Т.А. Оптимальное управление
в примерах и задачах. М.:МАИ, 1996.
5. Калихман И.Л. Войтенко М.А. Динамическое программирование в
примерах и задачах. М.:Высш.шк., 1979, 125 с.
Дополнительная
6. Weber R. Optimization and control. Cambridge University, 2001.
(http://www.statslab.cam.ac.uk/~rrw1/oc/index.html)
7. Жак С.В. Задачи оптимального управления. Мет. указ. для студ. веч. отд.
мехмата РГУ, Ростов-на-Дону, 1983.
8. Де Гроот Оптимальные статистические решения. М.:Мир, 1974.
9. Ширяев А.Н. Вероятность. М.:Наука, 1980.
10.Дыхта В.А., Самосюк О.Н. Оптимальное импульсное управление с
приложениями. М.:Физматлит, 2000.
Примеры индивидуальных и контрольных заданий
1. Решить с использованием принципа максимума.
4
 (u
0
2
 x)dt  min,
x  u, | u | 1, x(4)  0.
6
 (u
2
 x)dt  min,
x  u, | u | 1, x(0)  0.
0
2
 (u  1) dt  x(2)  min,
x  u  1, u  2, x(0)  1.
2
0
5
 (u  5) dt  2 x
2
2
(5)  min,
x  u,
u  3, x(0)  1.
0
2. Найти функцию Беллмана и оптимальное управление.
2
x  ux,
u
2
dt  2 ln( x(2))  min
0
1
u
x  x  u,
2
dt  2 x 2 (1)  min
0
1
x1  x2  u, x 2  x1 ,
u
2
dt  x12 (1)  min
0
2
x  2t  u,
u
2
dt  ( x(1)  4) 2  min
0
3. Найти функцию Беллмана V (t , x) , оптимальное управление u t (x) и
оптимальную траекторию xt .
3.1. xt 1  ( xt  u t ) 2 ,
h 1
 u
0  u t  xt ,
t
t 0
1/ 2
t
 max,
x0  1, h  2,   1 / 2.
3.2. xt 1  xt  u t ,
0  u t  xt ,
h 1

t 0
t
ln u t  max,
x0  1, h  2,   1 / 2.
3.3. xt 1  2 xt  yt ,
yt 1   xt  ut , xh2  y hh  min
x0  1, y 0  2, h  2
4. При каких значениях параметров  ,  система x  Ax  Bu ,
1 0 1


A   2  1 0 ,
 0 1 0


является управляемой.
0

B  
0



0 
 
5. При каких значениях параметров  ,  система x  Ax, y  Cx
1 0 1


A   2  1 0 ,
 0 1 0



C  
0
0

 

0 
является наблюдаемой.
6. Решить задачу об оптимальной остановке
EX 2  min,
X i 1  X i   i , i  0,1,2; X 0  1; P( i  1)  1 / 4, P( i  0)  1 / 4, P( i  1)  1 / 2.
7. Сформулировать оптимизационную задачу и наметить путь ее решения.
7.1. Колода карт тщательно перетасована и положена на стол. Можно
переворачивать карты одну за другой, подсчитывая количество красных и
черных. В точности один раз можно сделать ставку, что следующая карта
будет красной. Максимизировать вероятность выигрыша.
7.2. Бабочка летает между цветущими деревьями. Ветер начинает дуть, когда
она находится между деревьями A и B на расстоянии x 0 от A . Бабочка может
регулировать свою скорость. Скорость появившегося ветра постоянна и
направлена от B к A .
7.3. На интервале времени [0,1] цена золота составляет s (t ) фунтов за унцию.
В начальный момент времени инвестор имеет x1 (0) фунтов и x2 (0) унций
золота. Покупка, (но не продажа) золота облагается налогом  фунтов за
унцию. Пусть u (t ) – скорость, с которой инвестор продает золото в момент
времени t и | u | 1 . Отрицательные значения u соответствуют покупке. Цель
состоит в том, чтобы максимизировать количество фунтов при t  1 .
7.4. Прямая река течет со скоростью c( y ) , где y – расстояние от берега,
который покинула лодка. Направлением скорости лодки можно управлять, а
величина скорости постоянна и равна v . Лодочник хочет достичь заданной
точки на противоположном берегу за минимальное время.
Программа зачета
1. Вывод принципа максимума Понтрягина.
2. Уничтожение насекомых.
3. Пчелы как оптимизаторы.
4. Задача о быстродействии.
5. Простейшая задача преследования.
6. Формальный вывод уравнения Беллмана в случае непрерывного времени
(конечный горизонт).
7. Связь между уравнением Беллмана и исходной оптимизационной задачей.
8. Задача о планировании расходов (конечный горизонт).
9. Оптимальный режим снижения мощности ядерного реактора.
10. Вывод уравнения Беллмана в случае непрерывного времени
(бесконечный горизонт).
11. Оптимальный отлов рыбы (непрерывное время).
12. Задача о планировании расходов (бесконечный горизонт).
13. Вывод уравнения Беллмана в случае дискретного времени
(конечный горизонт).
14. Инвестирование в строительную фирму.
15. Задача о покупке пакета акций большим инвестором.
16. Управляемость и ее критерий (дискретное время), игра в чехарду.
17. Наблюдаемость и ее критерий (дискретное время), игра в чехарду.
18. Управляемость и ее критерий (непрерывное время).
19. Управление спутником в окрестности круговой орбиты.
20. Наблюдаемость (непрерывное время). Задачи о популяциях и
радиоактивном распаде и спутнике.
21. Метод динамического программирования при наличии случайных
факторов. Азартная игра.
22. Задача об оптимальной остановке. Выбор с отбрасыванием.
Download