МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ Государственное образовательное учреждение высшего профессионального образования

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
Государственное образовательное учреждение
высшего профессионального образования
«Самарский государственный архитектурно-строительный
университет»
Кафедра прикладной математики и вычислительной техники
МЕТОДИЧЕСКИЕ УКАЗАНИЯ
К ВЫПОЛНЕНИЮ ЛАБОРАТОРНЫХ РАБОТ
ПО ДИСЦИПЛИНЕ
«Теория оптимального управления»
для магистров направления 230400
«Информационные системы и технологии»
Утверждены редакционноиздательским советом университета
2011 г.
Самара 2011
Составитель С.А.Пиявский
УДК 001+62+37+ 681.3.015+621.001.2+517.51
Теория оптимального управления: методические указания
к
выполнению лабораторных работ / сост. С.А.Пиявский; Самарск. гос. арх.строит. ун-т./ - Самара, 2011. 34 с.
Предназначено
для
магистрантов
направления
230400
«Информационные системы и технологии», а также аспирантов
специалистов, интересующихся оптимизацией сложных решений.
и
Редактор Л.Н.Конаныхина
Технический редактор А.И.Непогодина
Корректор Е.М.Фоменкова
Подписано в печать
Формат 60х80 1/16. Бумага офсетная. Печать
оперативная. Уч.-изд. л. Усл. уч. л. . Тираж экз.
Самарский государственный архитектурно-строительный университет
443001 Самара, ул. Молодогвардейская, 194
(С) Самарский государственный
архитектурно-строительный
университет, 2011
ОГЛАВЛЕНИЕ
ЛР1. КЛАССИЧЕСКИЕ МЕТОДЫ ОПТИМИЗАЦИИ (ЛИНЕЙНОЕ ...... 5
И НЕЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ - РАЗРАБОТКА
МАТЕМАТИЧЕСКОЙ МОДЕЛИ И ПОЛУЧЕНИЕ РЕШЕНИЯ) ............. 5
Содержание работы ...................................................................................................................5
Справочные сведения ................................................................................................................6
Таблица производных ...........................................................................................................7
Варианты заданий ......................................................................................................................8
А. Варианты заданий .............................................................................................................8
Б. Варианты заданий .............................................................................................................9
В. Варианты заданий ...........................................................................................................12
ЛР 2. ОПТИМИЗАЦИЯ ДИНАМИЧЕСКИХ СИСТЕМ ............................ 18
(ПРИНЦИП МАКСИМУМА) ........................................................................... 18
Содержание работы .................................................................................................................18
Справочные сведения ..............................................................................................................19
Методы интегрирования ОДУ............................................................................................19
Правило Рунге оценки погрешности. ................................................................................21
Экстраполяция Ричардсона. ...............................................................................................21
Принцип максимума Л.С. Понтрягина (необходимое условие оптимальности): .........21
Задача с незакрепленными концами. Условия трансверсальности ...............................23
Варианты заданий ....................................................................................................................25
ЛР 3. МЕТОДЫ ПРИНЯТИЯ АВТОНОМНЫХ РЕШЕНИЙ .................... 27
(ВЫБОР МЕСТА РАБОТЫ И ВАКАНСИИ) Error! Bookmark not defined.
Содержание работы .................................................................................................................28
Справочные сведения ..............................................................................................................28
Оптимальность по Парето ..................................................................................................28
MAUT (Multi-Attribute Utility Theory) ...............................................................................30
ELECTRE (Elimination Et Choix Traduisant la Realite) .....................................................30
Подход аналитической иерархии АНР (Analytic Hierarchi Process) ...............................28
ЦИКЛ (Цепная Интерактивная КЛассификация)............. Error! Bookmark not defined.
ШНУР (Шкала Нормализованных Упорядоченных Различий) .....Error! Bookmark not
defined.
ЛР4. ПАРНЫЕ ИГРЫ С НУЛЕВОЙ СУММОЙ .......................................... 34
Содержание работы .................................................................................................................39
Справочные сведения ..............................................................................................................40
Платежная матрица .............................................................................................................40
Чистые стратегии, седловая точка, цена игры ..................................................................40
Смешанные стратегии .........................................................................................................41
Геометрическая интерпретация игры 2  n ..................................................................42
Приведение парной игры к задаче линейного программирования ................................45
Таблица 5.5 - Платежная матрица примера 5.7 .................................................. 47
Критерии оптимальности в играх с Природой .....................................................................48
Критерий Вальда .................................................................................................................48
Критерий Лапласа................................................................................................................48
Критерий Сэвиджа (принцип минимального сожаления) ...............................................49
Критерий Гурвица ...............................................................................................................49
ЛР 5. Некооперативные игры n игроков........................................................ 51
Содержание работы .................................................................................................................51
Справочные сведения ..............................................................................................................52
Полагаем, что для игроков желательными являются максимальные значения
результата игры, .е. речь идет о выигрышах, а не о проигрышах ..................................52
Гарантирующая (максиминная) стратегия ........................................................................52
Доминантная стратегия .......................................................................................................52
Равновесие Нэша .................................................................................................................52
Точка Парето ........................................................................................................................53
Варианты заданий ................................................................ Error! Bookmark not defined.
ЛР 6. ИЕРАРХИЧЕСКИЕ ИГРЫ .................................................................... 53
Содержание работы .................................................................................................................53
Справочные сведения ..............................................................................................................53
Решение Штакельберга .......................................................................................................53
Игра Г1..................................................................................................................................54
Игра Г2..................................................................................................................................55
Игра Г3..................................................................................................................................55
Теорема Кукушкина ............................................................................................................57
Литература ........................................................................................................... 57
ЛР1. КЛАССИЧЕСКИЕ МЕТОДЫ ОПТИМИЗАЦИИ (ЛИНЕЙНОЕ
И НЕЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ - РАЗРАБОТКА
МАТЕМАТИЧЕСКОЙ МОДЕЛИ И ПОЛУЧЕНИЕ РЕШЕНИЯ)
6 часов
Содержание работы
1. Исследовать на экстремум и получить оптимальное решение
(аналитически и численно в Excel) для функции многих переменных из
п.А,
2. Разработать математическую модель и получить оптимальное
решение для задачи из п.Б
3. Разработать математическую модель линейного программирования
и, используя Exсel, получить оптимальное решение для задачи из п.В
Области применения теории принятия решений
Цикл принятия решения
Осознание
цели
принимаемого
решения
Формирование
набора
критериев
оптимальности
принимаемого
решения
Описание
множества
альтернативных
вариантов
принимаемого
решения
Разработка и валидизация
математической модели объекта принятия решения
(переменные, соотношения, ограничения, коэффицинты)
Выбор конкретной технологии принятия решения
Формирование текущей версии оптимального решения
Осмысление текущей версии оптимального решения
РЕШЕНИЕ !!!
Пример принятия решения об объеме
выпуска продукции предприятием
Справочные сведения
Таблица производных
Варианты заданий
А. Варианты заданий
1. Найти наибольшее и наименьшее значение функции в заданной области:
f  x 3  3 y 2  x  18 y  4, 0  x  1, 0  y  1.
2. Найти наибольшее и наименьшее значение функции в заданной области:
f  x  y  z, x 2  y 2  z  1.
3. Найти точки условных экстремумов следующих функций:
f  xyz, xy  xz  yz  a 2 , x  0, y  0, z  0, a  0 .
4. Найти наибольшее и наименьшее значение функции в заданной области:
f  x 3  y 3  9 xy  27, 0  x  a, 0  y  a, 3  a  9 .
5. Найти наибольшее и наименьшее значение функции в заданной области:
f  ( x  y 2 )3 (1  x) 2 ,
y2  x  2 .
6. Найти наибольшее и наименьшее значение функции в заданной области:
f  x 4  y 4  2 x 2  4 xy  2 y 2 , 0  x  a, 0  y  a, a  1.
7. Найти наибольшее и наименьшее значение функции в заданной области:
xy x 2 y xy 2
f 


, x  0, y  0, x / 3  y / 4  1 .
2
6
8
8. Найти наибольшее и наименьшее значение функции в заданной области:
f  xy  yz  zx, x 2  y 2  z 2  a 2 .
9. Найти наибольшее и наименьшее значение функции в заданной области:
f  x 3  3 y 2  3xy, 0  x  2, 0  y  1.
10. Найти наибольшее и наименьшее значение функции в заданной области:
f  x 6  y 6  3x 2  6 xy  3 y 2 , 0  y  x  2.
11. Найти наибольшее и наименьшее значение функции в заданной области:
f  xy  x 2 y  xy2 , 0  x  1, 0  y  2 .
2
Б. Варианты заданий
Образцы индивидуальных заданий
1.
Груз
веса
G,
лежащий
на
горизонтальной плоскости, должен быть
сдвинут приложенной силой F. Под каким
углом к горизонту приложить ее ( с
учетом трения), чтобы ее величина была
наименьшей? (Сила трения, по закону
Кулона, пропорциональна силе, прижимающей тело к плоскости;
коэффициент пропорциональности называется коэффициентом трения, для
трения камня по дереву он равен 0,4).
2. Стоимость плавания судна в течение часа рассчитывается по формуле
S=a+b*V^3, где a-стоимость амортизации и зарплата экипажа, b*V^3 –
стоимость топлива (b=0,01, V – в узлах, 1 узел=1,85 км/ч). Какая скорость
является наивыгоднейшей (экономической)?
3. От канала шириной a под прямым углом к нему отходит канал шириной b.
Стенки каналов прямолинейны. Найти наибольшую длину бревна, которое
можно сплавить по этим каналам из одного в другой.
4. Под каким углом к оси OX надо провести прямую через точку (a,b), a,
b>0, чтобы треугольник, образованный ею и осями координат, имел
наименьший периметр?
5. Под каким углом к оси OX надо провести прямую через точку (a,b), a, b>0,
чтобы её отрезок между положительными полуосями имел наименьшую
длину?
6. На какой высоте повесить лампочку, чтобы получить максимальную
освещенность стола?
sin 
Освещенность задается формулой
I  c 2 .
r
h

a
7. Как проложить шоссе при транспортировке грузов из А в С, если
стоимость провоза по железной дороге -λ, а по шоссе - β (на единицу пути)?
(Исследовать при различных соотношениях λ и β).
C
l
А
х
d
8. Найти наибольшее значение произведения четырех положительных чисел
при условии того, что их сумма равна заданному числу.
9. Найти кратчайшее расстояние от заданной точки (1,0) до эллипса
4х2+9х2=36.
10. Найти кратчайшее расстояние между параболой у=х2 и прямой х-у=5.
11. В шар вписать цилиндр с наибольшей площадью поверхности.
12. Найти наибольшую площадь прямоугольника, вписанного симметрично в
сектор круга радиуса а с центральным углом 2.
13 . Найти наибольший объем конуса с данной образующей длины l.
14.Две точки равномерно движутся по осям координат. Скорость первой
точки равна V1 , скорость второй - V2, их начальные положения – (а, 0) и (0,
b). Найти возможное кратчайшее расстояние между ними.
15. Точка движется по плоскости со скоростью V1, а по оси ОХ со скоростью
V2, V2 >V1. Найти путь из точки (0, а) в точку (b,0), требующий наименьшего
времени на его прохождение.
16. На данной прямой найти точку, суммарное расстояние от которой до двух
заданных точек плоскости минимально (угол падения равен углу отражения).
17. Найти кратчайшее расстояние от заданной точки (1,2) до прямой
2 x1  3x2  1.
18. При каком наклоне боковых сторон равнобедренной трапеции и ее
площадь будет наибольшая, если меньшее основание трапеции равно a , а
боковые стороны равны b ?
19. Найти оптимальную конструкцию кронштейна, предназначенного для
передачи усилия (P,) и написать отчёт-инструкцию проектировщику по
расчёту (используя представление результатов в безразмерном виде).
20. Сечение бетонного канала представляет собой равнобедренную трапецию
площадью S и высотой h, которые заданы из гидрологических соображений.
Каким должен быть угол между боковой стороной и основанием, чтобы
сумма длин нижнего основания и боковых сторон, определяющая расход
материала, была наименьшей?
21. Найти оптимальную конструкцию кронштейна, предназначенного для
передачи усилия (P,), и написать отчёт-инструкцию проектировщику по
расчёту (используя представление результатов в безразмерном виде).
22. Найти соотношение между углами d1и d2 при преломлении света на
границе двух сред (по принципу Ферма свет вбирает при преломлении между
двумя точками путь, время прохождения которого минимально возможно, а
скорость света в разных средах различна).
В. Варианты заданий
1. Для изготовления четырех видов продукции используется три вида
сырья. Запасы сырья, нормы его расхода и цена каждого продукта приведены
в таблице.
Тип сырья
I
II
III
Цена
изделия
Нормы расхода сырья на одно изделие
А
Б
В
Г
1
2
1
0
1
1
2
1
1
3
3
2
12
7
18
Запасы
сырья
18
30
40
10
Сформулируйте прямую оптимизационную задачу на максимум общей
стоимости, составьте оптимальную производственную программу.
Сформулируйте двойственную задачу и найдите ее оптимальное решение.
Проанализируйте использование ресурсов в оптимальном плане.
Определите, как изменится общая стоимость продукции и план ее
выпуска при увеличении запасов сырья I и II вида на 4 и 3 единицы,
соответственно, и уменьшении на 3 единицы количества сырья III.
Определите целесообразность включения в план изделия "Д" ценой 10
единиц, на изготовление которого расходуется по две единицы каждого вида
сырья.
2. Для изготовления четырех видов продукции используют три вида
сырья. Запасы сырья, нормы его расхода и цена каждого продукта приведены
в таблице.
Тип сырья
Нормы расхода сырья на одно изделие
А
Б
В
Г
Запасы
сырья
I
II
III
Цена
изделия
1
0
4
0
1
2
2
3
0
1
2
4
9
6
4
7
120
240
800
Сформулируйте прямую оптимизационную задачу на максимум общей
стоимости, укажите оптимальную производственную программу.
Сформулируйте
двойственную
задачу.
Найдите
объективно
обусловленные оценки.
Проанализируйте использование ресурсов в оптимальном плане.
Определите, как изменятся общая стоимость продукции и план ее выпуска
при увеличении запасов сырья II и III на 120 и 160 единиц, соответственно, и
одновременном уменьшении на 60 единиц запасов сырья I вида.
Определите целесообразность включения в план изделия "Д" ценой 12
единиц, на изготовление которого расходуется по две единицы каждого вида
сырья.
3. Для производства трех видов продукции используется три вида сырья.
Запасы сырья, нормы его расхода и цена каждого из продуктов приведены в
таблице.
Тип сырья
I
II
III
Цена изделия
Нормы расхода сырья на одно изделие
А
Б
В
4
2
1
3
1
3
1
2
5
10
14
12
Запасы сырья
180
210
244
Сформулируйте прямую оптимизационную задачу на максимум общей
стоимости. Найдите оптимальную производственную программу.
Сформулируйте двойственную задачу и найдите двойственные оценки.
Проанализируйте использование ресурсов в оптимальном плане.
Определите, как изменится общая стоимость и план выпуска продукции
при увеличении запасов сырья I и III видов на 4 единицы каждого.
Определите целесообразность включения в план изделия "Г" ценой 13
единиц, на изготовление которого расходуется 1, 3 и 2 единицы каждого вида
сырья, соответственно, и изделия "Д" ценой 12 единиц, на изготовление
которого расходуется по две единицы каждого вида сырья.
4. Фабрика "Турпищепром" выпускает два вида консервированных
продуктов питания: "Завтрак туриста" и "Обед туриста". Используемые для
производства ингредиенты не являются дефицитными. Основным
ограничением, накладываемым на объем выпуска, является наличие фонда
рабочего времени в каждом из трех цехов. Соответствующая информация
приведена в таблице.
Необходимый фонд рабочего
времени, чел.-ч на тонну
"Завтрак"
"Обед"
4
10
Цех
№1. Производство
№2. Добавка
приправ
№3. Упаковка
Прибыль от
реализации одной
тонны, $
Общий фонд
рабочего времени,
чел.-ч в месяц
1000
2
3
360
5
2
600
75
150
Сформулируйте прямую оптимизационную задачу на максимум прибыли
и составьте оптимальную производственную программу на месяц.
Сформулируйте двойственную задачу и найдите двойственные оценки.
Проанализируйте использование ресурсов в оптимальном плане.
Определите, как изменится месячный доход и план выпуска продукции
при увеличении фонда рабочего времени на 120 ч в производственном цехе и
на 40 ч в цехе добавки приправ.
Определите целесообразность включения в программу производства
нового вида консервов - "Ужин туриста", если прибыль от реализации одной
тонны равна $60, а необходимый фонд рабочего времени каждого цеха - 3, 3
и 2 чел.-ч/т, соответственно.
5. Для изготовления четырех видов продукции используется три вида
сырья. Запасы сырья, нормы его расхода и прибыль от реализации каждого
продукта приведены в таблице.
Тип сырья
I
II
III
Прибыль от
реализации
изделия
Нормы расхода сырья на одно изделие
А
Б
В
Г
2
1
3
2
1
2
4
8
2
4
1
1
5
7
3
6
Запасы
сырья
200
160
170
Сформулируйте прямую оптимизационную задачу на максимум общей
прибыли, найдите оптимальный план производства.
Сформулируйте двойственную задачу и найдите ее оптимальный план.
Проанализируйте использование ресурсов в оптимальном плане.
Определите, как изменится общая прибыль и план производства при
увеличении запасов сырья I и II на 8 и 10 единиц, соответственно, и
одновременном уменьшении на 5 единиц запасов сырья III.
Определите целесообразность включения в план изделия "Д", на
изготовление которого расходуется по две единицы каждого вида сырья;
ожидаемая прибыль - 10 единиц на одно изделие.
6. Мини-завод производит два популярных безалкогольных напитка:
«Живая вода» и «Доброе утро». Объем выпуска ограничен количеством
основного ингредиента и производственной мощностью технологического
оборудования. Для производства 1 л «Живой воды» требуется 0,02 ч работы
оборудования, а для производства 1 л «Доброго утра» - 0,04 ч. Расход
специального ингредиента составляет 10 г и 40 г на 1 л «Живой воды» и
«Доброго утра», соответственно. Ежедневно в распоряжении предприятия
имеется 24 ч времени работы оборудования и 16 кг специального
ингредиента. Доход составляет 0,1 ед. стоимости на 1 л «Живой воды» и 0,3
ед. стоимости на 1 л «Доброго утра».
Сколько продукции каждого вида следует производить ежедневно, если
цель - максимизация прибыли?
Сформулируйте двойственную задачу и найдите объективно
обусловленные оценки.
Проанализируйте использование ресурсов в оптимальном плане.
Определите, как изменится ежедневный доход и план производства, если
количество потребляемого ингредиента увеличится до 17 кг, а фонд рабочего
времени оборудования сократится до 22 ч.
Определите целесообразность включения в производственную программу
напитка «Капля росы», если для изготовления одного литра требуется 0,02 ч
работы оборудования и 30 г ингредиента. Предполагаемый доход от
реализации нового напитка - 0,2 ед. стоимости на 1 л.
7. На основании информации, приведенной в таблице 1.6, составьте
оптимальную производственную программу по критерию максимума общей
стоимости.
Ресурсы
Труд
Сырье
Оборудование
Нормы затрат ресурсов на единицу
продукта
I вид
II вид
III вид
1
4
3
1
1
2
1
1
2
Запасы
200
80
140
Цена
40
60
80
Сформулируйте двойственную задачу и найдите объективно
обусловленные оценки.
Проанализируйте использование ресурсов в оптимальном плане.
Определите, как изменится общая стоимость продукции и план выпуска
при увеличении запасов сырья на 18 единиц.
Определите целесообразность включения в план изделия четвертого вида
ценой 70 ед., на изготовление которого расходуется по две единицы каждого
вида ресурсов.
8. Фабрика выпускает три вида тканей. Суточные ресурсы фабрики, их
расход на единицу ткани и цена 1 метра выпускаемой продукции
представлены в таблице.
Нормы затрат на производство 1 м ткани
I
II
III
Оборудование
2
3
4
Сырье
1
4
5
Электроэнергия
3
4
2
Цена
8
7
6
Ресурсы
Суточный
лимит
700
800
600
Сформулируйте прямую оптимизационную задачу на максимум общей
стоимости, найдите оптимальный план производства.
Сформулируйте двойственную задачу и найдите объективно
обусловленные оценки.
Проанализируйте использование ресурсов в оптимальном плане.
Как изменится общая стоимость выпускаемой продукции и план
производства, если суточный лимит использования электроэнергии
увеличится на 50 единиц?
Определите целесообразность включения в производственную программу
ткани нового вида ценой 9 единиц, для производства 1 м которой требуется
по 3 единицы оборудования и электроэнергии и 4 единицы сырья.
9. Предприятие выпускает три вида изделий, используя при этом три вида
сырья (данные представлены в таблице).
Тип сырья
I
II
III
Цена изделия, $
Нормы затрат на единицу продукции, кг
I
II
III
18
15
12
6
4
8
5
3
3
9
10
16
Запасы сырья,
кг
360
192
180
Сформулируйте прямую оптимизационную задачу на максимум общей
стоимости, составьте оптимальную производственную программу.
Сформулируйте двойственную задачу и найдите ее оптимальный план.
Проанализируйте использование ресурсов в оптимальном плане.
Как изменится общая стоимость выпускаемой продукции и план выпуска,
если запас сырья I вида увеличить на 45 кг, а II - уменьшить на 9 кг?
Целесообразно ли включение в производственную программу изделия "Г"
ценой $11, если нормы затрат сырья составляют 9, 4 и 6 кг, соответственно?
10. Предприятие выпускает 4 вида продукции и использует три типа
основного оборудования: токарное, фрезерное и шлифовальное. Затраты на
изготовление единицы продукции приведены в таблице; там же указан
общий фонд рабочего времени и цена изделия каждого вида.
Тип
оборудования
Токарное
Фрезерное
Шлифовальное
Цена изделия,
$
Нормы затарт времени на одно изделие, ч
А
Б
В
Г
2
1
1
1
0
2
1
2
1
3
1
0
8
3
2
1
Общий фонд
рабочего
времени, ч
300
70
340
Сформулируйте прямую оптимизационную задачу на максимум общей
стоимости, найдите оптимальный план.
Сформулируйте двойственную задачу и найдите объективно
обусловленные оценки.
Проанализируйте использование ресурсов в оптимальном плане.
Как изменится общая стоимость выпускаемой продукции и план выпуска,
если фонд времени шлифовального оборудования увеличится на 24 часа?
Целесообразно ли выпускать изделие «Д» ценой $11, если нормы затрат
времени - 8, 2 и 2 ч, соответственно?
11. Для изготовления четырех видов продукции используется три вида
сырья. Запасы, нормы расхода сырья и прибыль от реализации единицы
каждого продукта приведены в таблице
Тип сырья
I
II
III
Нормы расхода сырья (кг) на одно изделие
А
Б
В
Г
2
1
0,5
4
1
5
3
0
3
0
6
1
Запасы
сырья, кг
2400
1200
3000
Прибыль на
единицу
продукции, $
7,5
3
6
12
Сформулируйте прямую оптимизационную задачу на максимум прибыли,
укажите оптимальный план.
Сформулируйте двойственную задачу и найдите объективно
обусловленные оценки.
Проанализируйте использование ресурсов в оптимальном плане.
Определите, как изменится прибыль и план выпуска продукции, если
запас сырья первого вида увеличить на 100 кг, а второго - уменьшить на 150
кг.
Определите целесообразность включения в производственную программу
модифицированного варианта изделия «А», если цена такого изделия $10, а
нормы расхода сырья - 2, 4 и 3 кг.
12. На предприятии выпускается три вида изделий. При этом
используется три вида сырья (данные представлены в таблице).
Тип сырья
I
II
III
Цена изделия, $
Нормы затрат на единицу продукции, кг
I вид
II вид
III вид
1
2
1
3
0
2
1
4
0
3
2
5
Запасы сырья,
кг
430
460
420
Сформулируйте прямую оптимизационную задачу на максимум общей
стоимости, укажите оптимальную производственную программу.
Сформулируйте двойственную задачу и найдите двойственные оценки.
Проанализируйте использование ресурсов в оптимальном плане.
Как изменится общая стоимость выпускаемой продукции и план выпуска,
если запас сырья I вида уменьшить на 10 кг, а II - увеличить на 20 кг?
Целесообразно ли выпускать изделие IV вида ценой $7, если нормы затрат
сырья - 2, 4 и 3 кг?
ЛР 2. ОПТИМИЗАЦИЯ ДИНАМИЧЕСКИХ СИСТЕМ
(ПРИНЦИП МАКСИМУМА)
6 часов
1.
Содержание работы
Запрограммировать
модель
решения
заданной
задачи
оптимального управления при каком-либо выбранном управлении в
Excel методами Эйлера и Рунге-Кутта
2.
3.
4.
5.
6.
Решить задачу оптимального управления непосредственным
выбором управления с помощью функции «поиск решения» и
сравнить точность различных методов
Записать уравнения принципа максимума (включая условия
трансверсальности) для заданной задачи оптимального управления
и согласовать их с преподавателем
Запрограммировать полученную краевую задачу оптимального
управления в Excel методами Эйлера или Рунге-Кутта и решить
ее методом стрельбы. Если не удается подобрать исходный
интервал для метода стрельбы, получить начальное значение
сопряженной переменной обратным интегрированием системы
уравнений при известном оптимальной законе управления,
построенном ранее непосредственным подбором. Затем
заключить найденное значение в интервал и использовать метод
стрельбы.
Сравнить решения, полученные непосредственным выбором
управления и принципом максимума.
Оформить отчет, сделать выводы.
Справочные сведения
Принятие решений
при управлении процессами
Пример 1. Расширение выпуска продукции и развитие
технологического уровня предприятия
Пусть
S (t ) - накопленная прибыль,
y (t ) - выпуск продукции в единицу времени,
r (t ) - текущее значение коэффициента технического уровня производства,
u y (t ), u r (t ) - доли накопленной прибыли, расходуемын в текущий момент
соответственно на развитие выпуска продукции и повышение технического
уровня производства,
k y ,  y , k r ,  yr - коэффициенты эффективности деятельности соответственно по
развитию выпуска продукции и повышению технического уровня
производства.
Тогда развитие производства описывается системой уравнений
 y u y2 S 2
dS
 k yu y S 
,
dt
ry
 r u r2 S 2
dr
 kr ur S 
,
dt
rr
 y u y  r u r2
dS
y 2
 y 
 S2(

)
dt
r
ry
rr
при очевидных ограничениях
abs (u y )  u r  1, u y  0, u r  0 .
2
Критерием оптимальности является максимизация прибыли
за определенный интервал времени T :
S (T )  max .
u y ,u r
Задача решается принципом максимума Л.С.Понтрягина.
Методы интегрирования ОДУ
Метод Эйлера (  ~ h)
2
(

~
h
)
Усовершенствованный метод Эйлера
y
n
1
2
 yn 
h
f ( xn , y n )
2
h
yn 1  yn  hf ( xn  , y 1 )
2 n 2
2
(

~
h
)
Метод предиктор – корректор
y n*1  y n  hf ( xn , y n )
f ( xn , y n )  f ( xn 1 , y n*1 )
y n 1  y n  h
2
4
(

~
h
)
Метод Рунге-Кутта
Правило Рунге оценки погрешности.
X h  Xh

2
2 p 1
Экстраполяция Ричардсона.
2p X h  Xh
X* 
2
p
2 1
Принцип максимума Л.С. Понтрягина (необходимое условие оптимальности):
Задача оптимального управления
Если пара ( y (t ), u (t )) есть элемент минимума
функционала в задаче оптимального управления с
закрепленными концами,
то значения
элемент минимума функции
при каждом
t(t0, t1) есть
H (t , y, u )   f 0 (t , y, u)   (t ) f (t , y, u) ,
где  (t )  ( 1 (t ), 2 (t ),..., k (t )) - k - мерная вектор-функция (ее размерность
равна
размерности
вектор-функции
фазовых
координат
y(t)),
удовлетворяющая уравнениям
 (t )  
дH (t , y, u, )
дy
,
т. е.
H (t , y, u , )  max H (t , y, u, )
uQ
t  (t 0 , t1 ) .
Функцию H называют гамильтонианом, а систему – сопряженной
системой.
Принцип максимума дает следующую схему решения задачи
оптимального управления.
I.
Записывается гамильтониан.
2. Записывается сопряженная система k дифференциальных уравнений
1-го порядка.
3. Из условий максимума гамильтониана по управлениям находятся r
уравнений, связывающих оптимальное значение ũ (t) с переменными
t, y, ψ.
4. Решается полученная система 2k + r уравнений:
- (k – исходных дифференциальных уравнений,
- k дифференциальных уравнений сопряженной системы,
- r уравнений относительно ũ (t), полученных из условия
максимума гамильтониана с 2k граничными условиями
(заданные значения y(t0) и y(t1) относительно 2k + r неизвестных
функций:
- k функций yi (t), i =1, …, k,
- k функций ψi (t), i =1,…, k,
- r функций uj (t), j =1,…, r.
Решение (ỹ(t), u~ (t)) “подозрительно” на то, что является элементом
максимума.
Если удастся, то на (ỹ(t), u(t)) проверяются достаточные условия
минимума Кротова, что позволяет убедиться в том, что (ỹ(t), u(t)) –
действительно элемент минимума.
Пример I.
1
Ј =  ( y 2  u 2 )dt ;
0
y  u ;
y(0) = 0; y(1) =
I.
H = -y2 – u2 + ψ·u.
2.   2 y .
3. Hu = -2u + ψ.
Huu = -2.
Hu = -2u +  = 0.
Huu < 0, значит, u =
4.
1
.
2

- отвечает максимуму H.
2
ỷ = u.
  2 y .

u .
2
y(0) = 0, y(1) =
1
2
.
Исключая из системы u и ψ, получаем
ÿ = y.
Решение этого уравнения:
y = C1et + C2e-t .
Произвольные постоянные определим из граничных условий
0 = С1 + С2,
откуда С1 =
e
;
1
= С1e + C2é,
2
e
C2 = .
2
2(e  1)
2(e  1)
e
e
Итак, ỹ(t) =
(et – e-t); ū(t) =
(et + e-t).
2
2
2(e  1)
2(e  1)
2
Задача с незакрепленными концами. Условия трансверсальности
Пусть в задаче оптимального управления начальные и конечные
значения фазовых координат y (t ) y(t1 ) не заданы однозначно, а
подчиняются лишь некоторым условиям.
y(t 0 )  B0 , y(t1 )  B1 .
Тогда возникает так называемая задача с незакрепленными концами. В
данном случае принцип максимума уже не дает замкнутой системы для
определения элемента минимума: при его применении число уравнений
2k  r равно числу неизвестных функций 2k  r , но количество граничных
условий меньше того, которое необходимо (2k ) .
Недостающие
граничные
условия
называют
условиями
трансверсальности. Для их нахождения записывают функцию Кротова
 ( y(t 0 ), y(t1 )) при условии  (t , y )   (t ) y
Ô ( y(t 0 ), y(t1 ))  F ( y(t 0 ), y(t1 ))   (t1 ) y(t1 )  (t 0 ) y(t 0 )  min
y ( t0 ), y ( t1 )
и решают задачу об ее минимуме по переменным y(t 0 ), y(t1 ) при заданных
граничных условиях (задача на условный минимум функции переменных).
Из необходимых условий этого минимума получаются условия
трансверсальности.
Пример 1.
1
2
I  y 2 (1)   u dt ,
0
y  2u , y (0)  1.
Принцип максимума
1. H  u 2  2u .
2.   0.
3. H u  2u  2  0 .
H uu  20.
4. y  2u .
  0.
u  .
Полученная на основе принципа максимума система содержит три
уравнения с тремя неизвестными. Из них
два уравнения –
дифференциальные 1-го порядка, значит, необходимы два граничных
условия, а есть только одно: y (0)  1. Для получения второго (условия
трансверсальности) составим функцию
 ( y(0), y(1)  y 2 (1)   (1) y(1)   (0) y(0)).
Найдем ее минимум по переменной y (1) (переменная y (0) задана):
 y (1)  2 y (1)   (1)  0 ,
 y(1) y (1)  2 0.
Соотношение 2 y (1)   (1)  0 , связывающее конечные значения y (1) и  (1) ,
есть недостающее условие трансверсальности.
Решаем систему дифференциальных уравнений
  C1 ; u  C1 ; y  C2  C1t.
Из граничных условий находим
C2  1,
2
2  4C1  C1  0; C1   .
5
Итак, только пара
y (t )  1 
4
2
t; u  
5
5
может быть элементом минимума.
РЕЦЕПТ:
Принцип максимума решения задачи оптимального управления
Вводим столько новых функций, столько сопряжённых переменных, сколько
в задаче фазовых переменных.
Записываем Гамильтониан
Записываем систему диф. уравнений относительно сопряжённых
переменных.
Записываем систему динамических отношений, определяющих управление
из условия максимума по ним Гамильтониана.
В итоге мы получили столько дифференциальных уравнений, сколько у нас
фазовых координат и условия, задающие управления в зависимости от
времени фазовых координат.
Если граничных условий не хватает для получения однозначиного решения ,
то записываем условия трансвесальности:
1) Если значения фазовой переменной в начале или конце не задано, то
значение соответствующей сопряжённой переменной в начале или конце
равно 0.
2) Если фазовая переменная в конце входит в критерий с коэффициентом С,
то сопряжённая переменная в этой точке имеет значение -С
Теперь у нас есть всё, чтобы решить
Варианты заданий
0.4
1.
F   x 2 dt  max;
0
x(0)  0
dx
 x 3  3 y 2  x  18 y  4, 0  y  0,1 .
dt
0, 2
2.
F   ( x 2  y 2 )dt  max;
0
x(0)  0
dx
 x  y  z,
dt
y  0, y 2  z  1 .
0, 2
3.
F   ( x 2  y 2 )dt  max;
0
x(0)  0,1
dx
 xyz, yz  2, 3  y  0, z  0 .
dt
0, 2
4.
F   x 2 dt  max;
0
x(0)  0,1
dx
 x 3  y 2  9 xy  0,27, 0  y  5 .
dt
0, 2
5.
F
 xdt
 max;
0
x(0)  0,2;
dx
 ( x  y 2 )3 (1  x) 2 ,
dt
y2  x  2 .
0, 2
6.
F   ( x  y )dt  max;
0
x(0)  0,1;
dx
 x 4  2 x 2  4 xy  2 y 2 , 0  y  0,2 .
dt
0, 2
7.
F   (2 x 2  y )dt  max;
0
x(0)  0,1;
dx xy x 2 y xy2



, x  0,
dt
2
6
8
0, 2
8.
F   ( y  x 2 )dt  max;
0
x(0)  0;
dx
 xy  yz  zx, y 2  z 2  3 .
dt
y  0, x / 3  y / 4  1 .
0, 2
F
9.
 x dt
2
 max;
0
x(0)  0,
dx
 x 3  3 yx  y 2 0  y  1 .
dt
0, 2
10.
F   (3x 2  2 y )dt  max;
0
x(0)  0, x(2)  0,1;
dx
 x 6  3x 2  6 xy  3 y 2 , 0  y  x  2 .
dt
0, 2
11.
F   tx 2 dt  max;
0
x(0)  0,1;
dx
 xy  x 2 y 
dt
xy 2
2
, 0  y  2.
ЛР 3. МЕТОДЫ ПРИНЯТИЯ АВТОНОМНЫХ РЕШЕНИЙ
(6 часов)
Пример принятия решения об объеме
выпуска продукции предприятием
Второй критерий – развитие эффективности производства, на что забирать из дохода
часть денег z
r  r 0[1  k (1 
1
( z  1)(1  k )  k
)]  r 0
.
z 1
z 1
Тогда возникает 2=хкритериальная задача
Содержание работы
1. Подготовить краткое описание методов MAUT, ELECTRE, АНР,
ПРИНН, не более чем 1 стр. на метод, не списанное друг у друга и из
первоисточника (будет проверено на сайте www.antiplagiat.ru).
Перекрестно доложить на занятии.
2. Разработать и доложить собственную задачу принятия решений (не
менее 5 вариантов и не менее 6 критериев).
3. Разработать методику подготовки и анализа информации для
принятия решения методами MAUT (ограничиться тремя
критериями для уменьшения объема работы), ELECTRE, АНР,
ПРИНН
4. Подготовить необходимые добавочные исходные данные
5. Осуществить выбор решения методами MAUT, ELECTRE, АНР,
ПРИНН
6. Оформить сводный отчет, в котором проанализировать
сравнительные достоинства и недостатки методов,
и сдать
преподавателю.
Справочные сведения
Оптимальность по Парето
Множество вариантов решений, среди которого нет ни одного заведомо
худшего решения по сравнению с другими вариантами исходного
допустимого множества решений, называется множеством Парето.
Подход аналитической иерархии АНР (Analytic Hierarchi Process)
Пример. Выбор площадки для аэропорта
Варианты
решения
Стоимость,
млн. $
А
В
К
100
140
200
Время в
пути,
мин
90
40
60
Кол-во жителей,
подвергающихся
шуму, тыс.чел.
5
50
20
Метод MAUT (Multi-Attribute Utility Theory)
В основе лежит теорема Кини:
n
U ( x)   wi K i ( x)
i 1
n
w
i 1
i
1
Основными
этапами
решения задачи при подходе
MAUT являются:
1. Разработка перечня
критериев и их количественных
шкал.
2. Построение функции
полезности (ФП) по каждому
из
критериев
методом
мысленных лотерей (с равной
вероятностью
сыграть
в
лотерею между крайними
значениями критерия или
сразу
обеспечить
себе
выбранное значение критерия)
3.Проверка условий, определяющих вид общей ФП.
Условие независимости по полезности: ФП по каждому критерию
должна быть одинакова при любых значениях других критериев. Для
проверки ФП строится 2 раза - при максимальных и при минимальных
значениях прочих критериев – и она должна быть одинакова.
Условие независимости по предпочтению проверяется для всех пар
критериев Кi, Кj: Для каждой рассматривается, какая альтернатива лучше –
(макс Кi, мин Кj) или (мин Кi, макс Кj). Если первая, значит критерий Кi
важнее, чем Кj. Тогда ищется опросом ЛПР, при каком значении Сij критерия
Кi, альтернативы (Сij, мин Кj) и (мин Кi, макс Кj) эквивалентны. Это
предпочтение и величина Сij не должны зависеть от значений других
критериев.
4. Определение весовых коэффициентов wi из соотношений,
полученных при анализе независимости по предпочтению:
wiU i (Cij )  w jU j ( ìèíÊ
U j ( ìèíÊ
поэтому
j
)  0,
j
)  wiU i ( ìèíÊ
U i ( ìèíÊ
i
i
)  w jU j ( ìàêñÊ j )
)  0, U j ( ìàêñÊ j )  1
wiU (Cij )  w j .
n
Из этих соотношений и условия нормировки
w
i 1
i
 1 определяются
весовые коэффициенты
4. Построение построение общей функции полезности: зависимости
между оценками альтернатив по критериям и общим качеством альтернативы
(многокритериальная функция полезности)
n
U ( x)   wiU i ( x) .
i 1
5. Оценка всех имеющихся альтернатив и выбор наилучшей.
ELECTRE (Elimination Et Choix Traduisant la Realite)
Индекс согласия
c A B 
w
w
i 1
Индекс несогласия
d A B  max
iI 
i
iI  , I 
n
i
| K i ( A)  K i ( B) |
max K i  min K i
Принятие решений в условиях неопределенности (ПРИНН)
Требования к методам принятия решений, пригодным для практического
применения
в системах поддержки принятия решений
группы.
1
0,8
0,6
наилучший
оптимистический
средний
осторожный
0,4
наихудший
релейный
0,2
0
нив елирующий
Формирование компьютерной
оптимизационной математической
модели целевой программы на основе
базовой компьютерной модели
Формирование
исходной
информационной
базы
Цели
ЛПР
Показатели
эффективности и
целевые
индикаторы
ЭМ
Мероприятия
Исполнители
Ресурсы
Многокритериальный выбор
наиболее рационального
варианта целевой программы
ПРИНН
Универсальный программный комплекс
сравнительной оценки и выбора
альтернатив в условиях неопределенности
Разработка математического содержания
базовой оптимизационной модели
целевой программы
СО
Задачи
И
Разработка логической структуры
базовой оптимизационной
математической модели целевой
программы
Формирование базового
набора рациональных
вариантов целевой программы
ПРИНН
ЭЦ
Компьютерная реализация разработанной
базовой оптимизационной
математической модели
ЭМ
ЭИ
Реализация
информационноаналитической
системы,
увязывающей
компьютерную
математическую
модель с
информационно
й базой
формируемой
целевой
программы
Валидизация базовой
компьютерной
оптимизационной
математической
модели целевой
программы
Реализация
компьютерной
оптимизационной
математической
модели целевой
программы
Реализация
интерактивной
компьютерной
системы
аргументирова
нного
согласования
заинтересованн
ыми сторонами
данных,
моделей и
методов
ПРИНН
Реализация
программного
комплекса
корректировк
ии
согласования
целевых
установок и
приоритетов
целевой
программы с
согласующим
и
организациям
и целевой
программы
Реализация программного комплекса
многокритериального выбора наиболее
рационального варианта целевой
программы из базового набора вариантов
целевой программы
Формирование
первоначального
набора
рациональных
вариантов целевой
программы
Понимание и согласие ЛПР с основными положениями
технологии подготовки и принятия решений по выбору
наиболее рационального варианта целевой программы
Уточнение
информационной
базы, моделей и
методов,
закладываемых в
оптимизационную
математическую
модель целевой
программы
Формирование
согласованного
базового набора
рациональных
вариантов целевой
программы для
принятия
окончательного
решения
ЭЦ
ЭМ
ЛПР
ПРИНН
Выбор ЛПР-ом наиболее рационального варианта
целевой программы при подготовленной
информационной и методической базе и осмысление
полученного результата с неформальных позиций
ЛПР
При необходимости,
формирование указаний по
модификации
информационной и
ЭИ
методической базы и
повторный выбор
наиболее рационального
варианта целевой
программы
ЭМ
При необходимости,
корректировка целевых
установок и приоритетов,
являющихся
СО
компетенцией ЛПР и
повторный выбор
наиболее рационального
варианта целевой
программы
ЭМ
Принятие ЛПР окончательного решения о наиболее
рациональном варианте целевой программы
ЛПР
Документальное оформление принятого решения и его
подробное обоснование
ЭЦ
ЭМ
ЛР4. ПАРНЫЕ ИГРЫ С НУЛЕВОЙ СУММОЙ
6 часов
Содержание работы
1. Разработать содержательный пример матричной игры двух лиц и использовать
для выполнения работы эту игру при различных формируемых самим обучаемым
исходных числовых данных.
2. Написать программу, которая в игре двух лиц с нулевой суммой определяет
максимальную и минимальную цену игры, проверяет наличие седловой точки,
находит максиминные и минимаксные чистые стратегии и проверяет их
устойчивость.
3. Сформировать пример, в котором отсутствует устойчивость решения в чистых
стратегиях, и найти в нем решение игры в смешанных стратегиях.
4. Написать программу, которая имитирует реализацию игры в смешанных
стратегиях и продемонстрировать ее работу на примере, сформированном в п.3.
Сопоставить результаты.
5. Дать геометрическую иллюстрацию решения задачи в примере, в котором один из
игроков располагает двухэлементным множеством стратегий. Решить этот же
пример своей программой. Сопоставить результаты.
6. Привести конкретную игру при n  m к задаче линейного программирования и
решить. Проверить решение на программе, разработанной в п.4.
7. Оформить отчет и сдать преподавателю.
Справочные сведения
Рассматриваются парные игры, в которых выигрыш первого игрока (А)
является проигрышем второго (В).
Платежная матрица
A1
A2
...
Am
B1
B2
...
Bn
a11
a21
...
am1
a12
a22
...
am2
...
...
...
...
A1n
A2n
...
Amn
Чистые стратегии, седловая точка, цена игры
B1
B2
B3
A3
0,5
0,9
0,7
0,6
0,7
0,6
0,8
0,8
0,6
j
0,9
0,7
0,8
A1
A2
i
0,5
0,7
0,6
максимин=
минимакс=
0,7
Нижняя цена игры или максимальный выигрыш (максимин) гарантированный выигрыш игрока А при любой стратегии игрока В:
.
Верхняя цена игры или минимакс - минимальный гарантированный
проигрыш игрока В:
.
Если же верхняя и нижняя цены игры совпадают, то общее значение
верхней и нижней цены v = = называется чистой ценой игры, или просто
ценой игры. Максиминная и минимаксная стратегии, соответствующие цене
игры, являются оптимальными стратегиями, а их совокупность –
оптимальным решением, или просто решением игры.
В этом случае игрок А получает максимальный гарантированный (не
зависящий от поведения игрока В) выигрыш v, а игрок В добивается
минимального гарантированного (не зависящего от поведения игрока А)
проигрыша v. Говорят, что решение игры обладает устойчивостью, т.е., если
один из игроков придерживается своей оптимальной стратегии, то для
другого не может быть выгодным отклоняться от своей оптимальной
стратегии.
Смешанные стратегии
Теорема Неймана. Каждая конечная игра с нулевой суммой имеет
решение в смешанных стратегиях.
Пусть U* = ( , , ..., ) и Z* = ( , , ..., ) - пара оптимальных стратегий.
Если чистая стратегия входит в оптимальную смешанную стратегию с
вероятностью, отличной от нуля, то она называется активной.
Теорема об активных стратегиях. Если один из игроков
придерживается своей оптимальной смешанной стратегии, то выигрыш
остается неизменным и равным цене игры v, если второй игрок не выходит
за пределы своих активных стратегий.
При m  n и активности всех стратегий
n
a u
i 1
*
ij i
n
u
i 1
*
i
n
a
 v j  1,..., n
j 1
ij
z *j  v,
*
j
1
n
1
или
z
j 1
i  1,..., n
Этим удобно пользоваться в игре 2х2, если показано, что она не имеет
решения в чистых стратегиях, потому что ясно, что тогда все стратегии
являются активными. В иных случаях надо выяснять, какие стратегии
активны.
Пример.
В1
2
6
6
В2
5
4
5
мин
А1
2
А2
4
макс
Нижн.ц.=4
Верх.ц.=5
Решение – в смешанных стратегиях. По теореме об активных стратегиях, для
игрока В цена его игры при использовании им активных стратегий В1 и В2
одинакова и соответственно равна:
2u1  6u 2  v
5u1  4u 2  v
u1  u 2  1.
Здесь u1, u 2 - стратегии игрока А, а v - цена игры. Решив систему уравнений,
2
3
22
получим u1  , u 2  , v   4,4 .
5
5
5
Аналогично, для игрока А цена его игры при использовании им активных
стратегий А1 и А2 одинакова и соответственно равна:
2 z1  5 z 2  v
6 z1  4 z 2  v
z1  z 2  1.
Здесь z1, z 2 - стратегии игрока В, а v - цена игры. Решив систему уравнений,
1
4
22
получим z1  , z 2  , v   4,4 .
5
5
5
Геометрическая интерпретация игры 2  n
Решение, если игрок А имеет всего две стратегии
(«максимин» в смешанных стратегиях)
U2
U1
Важно заметить, что по оси абсцисс вероятности стратегий идут в обратном
порядке!
Решение, если игрок В имеет всего две стратегии
(«минимакс» в смешанных стратегиях)
Пример
Предприятие может выпускать два вида продукции (A1 и А2), получая при
этом прибыль, зависящую от спроса, который может оказаться в одном из
четырех состояний (В1, В2, В3 и В4). Задана матрица, ее элементы
характеризуют прибыль, которую получит предприятие при выпуске i-го
вида продукции и j-ом состоянии спроса (таблица 5.4).
Определите оптимальные пропорции в выпускаемой продукции,
гарантирующие среднюю величину прибыли при любом состоянии спроса,
считая его неопределенным.
Таблица 5.4 - Платежная матрица примера 5.6
A1
A2
B1
B2
B3
B4
3
9
3
10
6
4
8
2
Решение.
Задача сводится к игровой модели, в которой игра предприятия А против
спроса В задана платежной матрицей, представленной в таблице 5.4.
Определим верхнюю и нижнюю цены игры: = 3, = 6. Как видно,
седловая точка отсутствует, и решение нужно искать в смешанных
стратегиях игроков: U* = ( , ), Z* = ( , , , ).
Решим игру, используя геометрический метод. Соответствующие
построения приведены на рисунке 5.5.
Рисунок 5.5 – Геометрическое решение игры примера 5.6
Точка M – точка максимального гарантированного выигрыша. Она
находится на пересечении отрезков, соответствующих состояниям спроса B1
и B3.
Найдем координаты точки M.
B1B'1:
=
, откуда y = 6x + 3,
=
, откуда y = -2x + 6,
6x + 3 = -2x + 6,
8x = 3,
x = 3/8,
y = 21/4.
B3B'3:
Таким образом, получим:
= 5/8, = 3/8, v = 21/4.
Полученное решение интерпретируется следующим образом. Продукция
А1 должна составлять 62,5% (5/8) от общего объема выпущенной продукции,
продукция А2 – 37,5% (3/8). Это гарантирует предприятию среднюю прибыль
в размере 5,25 (21/4) при любом характере спроса.
Для полного решения игры осталось отыскать оптимальную стратегию
спроса.
Активными стратегиями игрока B (спроса) являются стратегии B1 и B3,
следовательно, = 0, = 0.
Используя выражение (5.2), вытекающее из теоремы об активных
стратегиях, составим систему из двух уравнений с двумя неизвестными:
3 + 6 = 21/4,
+ = 1.
Второе уравнение умножим на три и вычтем из первого:
3 = 9/4,
= 3/4, = 1/4.
*
*
Ответ: U = (5/8, 3/8); Z = (1/4, 0, 3/4, 0); v = 21/4.
Еще раз обратим внимание на рисунок 5.5 и платежную матрицу,
представленную в таблице 5.4.
Стратегия B2 заведомо невыгодна для игрока В по сравнению со
стратегией B1. На рисунке 5.5 все точки отрезка B2B'2 лежат выше отрезка
B1B'1, следовательно, заранее понятно, что стратегия B2 не входит в
оптимальное решение.
Таким образом, столбец B2 может быть исключен из рассмотрения до
начала решения задачи, поскольку соответствующая стратегия заведомо
невыгодна для игрока B по сравнению со стратегией B2.
Итак, исходная игра может быть упрощена путем исключения из
платежной матрицы строк и столбцов, соответствующих заведомо
невыгодным стратегиям.
Такими стратегиями для игрока А являются те, которым соответствуют
строки с элементами, заведомо меньшими по сравнению с элементами каколибо другой строки.
Для игрока В невыгодным стратегиям соответствуют столбцы с
элементами, заведомо бoльшими по сравнению с элементами какого-либо
другого столбца.
Приведение парной игры к задаче линейного программирования
(теорема об активных стратегиях неудобна тем, что изначально неясно, какие
стратегии активны)
Теорема. Для того чтобы число v было ценой игры, а U* и Z*оптимальными стратегиями, необходимо и достаточно выполнение
неравенств:
m
a u
*
ij i
i 1
m
u
i 1
*
i
n
a
j 1
j 1
1
ij
z *j  v,
*
j
1
n
z
 v j  1,..., n
i  1,..., m
Пусть, без ограничения общности, цена игры положительна. Введем
переменные
yi 
zj
ui
, xj 
v
v
Разделим все уравнения на v . Заметим, что тогда
m
y
i 1
i

1
 min и игрок А
v
стремится максимизировать цену игры, т.е. минимизировать эту сумму.
Потому его стратегии можно найти, решив следующую задачу линейного
программирования
= y1 + y2 + ... + ym → min;
a11y1 + a21y2 + ... + am1ym ≥ 1,
a12y1 + a22y2 + ... + am2ym ≥ 1,
...
a1ny1 + a2ny2 + ... + amnym ≥ 1;
yi ≥ 0,
.
Аналогичные рассуждения для игрока В, который стремиться
минимизировать цену игры, позволяют найти его оптимлаьные стратегии,
решая следующую задачу линейного программировнаия:
= x1 + x2 + ... + xn → max;
a11x1 + a12x2 + ... + a1nxn ≤ 1,
a21x1 + a22x2 + ... + a2nxn ≤ 1,
...
am1x1 + am2x2 + ... + amnxn ≤ 1;
xj ≥ 0,
.
Пример
Предприятие выпускает скоропортящуюся продукцию, которую может сразу
отправить потребителю (стратегия В1), отправить на склад для хранения
(стратегия В2) или подвергнуть дополнительной обработке (стратегия В3) для
длительного хранения.
Потребитель может приобрести продукцию немедленно (стратегия A1), в
течение небольшого времени (стратегия A2), по истечении длительного
периода времени (стратегия A3).
В случае стратегий B2 и B3 предприятие несет дополнительные затраты на
хранение и переработку продукции, которые не требуются для B1, однако при
B1 следует учесть возможные убытки из-за порчи продукции, если
потребитель выберет стратегии А2 или А3.
Определите оптимальные пропорции продукции для применения
стратегий B1, B2 и B3, руководствуясь «минимаксным критерием»
(гарантированный средний уровень затрат) при матрице затрат,
представленной в таблице 5.5.
Таблица 5.5 - Платежная матрица примера 5.7
A1
A2
A3
Наихудший с
позиции Bj
B1
B2
B3
2
8
12
5
6
8
10
8
6
12
8
10
Наихудший
с позиции
Ai
2
6
6
нижн.ц.=6<
верхн.ц=8
Решение.
Проверим игру на наличие седловой точки: = 6, = 8. Седловая точка
отсутствует. Упростить игру, путем исключения заведомо невыгодных
стратегий не удается.
Составим пару двойственных задач линейного программирования.
= y1 + y2 + y3 → min;
2y1 + 8y2 + 12y3 ≥ 1,
5y1 + 6y2 + 8y3 ≥ 1,
10y1 + 8y2 + 6y3 ≥ 1;
y1 ≥ 0, y2 ≥ 0, y3 ≥ 0.
= x1 + x2 + x3 → max;
2x1 + 5x2 + 10x3 ≤ 1,
8x1 + 6x2 + 8x3 ≤ 1,
12x1 + 8x2 + 6x3 ≤ 1;
x1 ≥ 0, x2 ≥ 0, x3 ≥ 0.
Решая первую из задач, получим:
= 0,04; = 0; = 0,1;
= 0,14.
Решение второй задачи дает следующие результаты:
= 0; = 0,08; = 0,06;
= 0,14.
Используя соотношения (5.8) найдем решение игры:
v=
= ≈ 7,14;
= 50/7 ∙ 0,04 = 4/14 ≈ 0,29;
= 50/7 ∙ 0 = 0;
= 50/7 ∙ 0,1 = 10/14 ≈ 0,71;
= 50/7 ∙ 0 = 0;
= 50/7 ∙ 0,08 = 8/14 ≈ 0,57;
= 50/7 ∙ 0,06 = 6/14 ≈ 0,43.
Таким образом, чтобы гарантировать себе среднюю величину затрат на
уровне 7,14 независимо от поведения потребителей, предприятию следует
около 57% продукции отправлять на склад для хранения и около 43%
продукции подвергать дополнительной обработке.
Критерии оптимальности в играх с Природой
Критерий Вальда
Это -максиминный критерий из классической теории игр
Критерий Лапласа
Данный критерий опирается на «принцип недостаточного основания»,
согласно которому все состояния природы Bj полагаются равновероятными,
т.е. вероятности того, что природа окажется в одном из n своих состояний,
одинаковы и равны:
.
Если для принимающего решение элементы матрицы aij платёжной
матрицы – выигрыши, то оптимальной считается та стратегия Ai, для
которой среднее арифметическое возможных выигрышей максимально, т.е.
критерий:
.
Критерий Сэвиджа (принцип минимального сожаления)
Введём понятие матрицы рисков R. Это матрица, имеющая размерность
mxn. Её элементы rij определяются по следующей формуле (если A – игрок, В
- природа):
rij = - aij,
где – максимальный элемент j-ом столбце платёжной матрицы.
Можно определить риск как проигрыш игрока А при принятии решений I
в условиях Природы j по сравнению с выигрышем, который игрок А получил
бы, если бы в этих условиях Природы принял самое выгодное для себя
решение. К этой матрице применяется затем обычный максиминный кририй
Вальда.
Критерий Сэвиджа использует матрицу рисков R и рекомендует в
условиях неопределенности выбирать ту стратегию, при которой величина
риска принимает наименьшее значение в самой неблагоприятной ситуации,
т.е.:
.
Критерий Гурвица
Данный критерий основан на использовании так называемого
коэффициента доверия. Обозначим его и предположим, что природа
окажется в самом выгодном состоянии с вероятностью и в самом
невыгодном состоянии с вероятностью 1- .
Критерий Гурвица ориентирован на установление баланса между
случаями крайнего пессимизма и крайнего оптимизма путем взвешивания
обоих исходов.
Если принимающий решение – игрок А, то:
.
(5.15)
Если принимающий решение – игрок B, то:
(5.16)
.
Заметим, что, если коэффициент доверия равен нулю, критерий Гурвица
превращается в "классический" минимакс, а при =1 получаем правило
"максимум из максимумов" - выбор лучшего из лучших исходов.
Пример
Телефонная компания должна определить уровень своих возможностей по
предоставлению услуг так, чтобы удовлетворить спрос своих клиентов на
планируемый период.
Для каждого уровня спроса существуют различные уровни возможностей
телефонной компании (например, при вводе нового тарифа). Имеются четыре
варианта спроса на телефонные услуги, что равнозначно наличию четырёх
состояний природы. Известны также четыре варианта предоставления
телефонных услуг.
Прибыль для каждого сочетания «управленческое решение – состояние
природы» приведена в таблице 5.6.
Таблица 5.6 - Платежная матрица примера 5.8
A1
A2
A3
A4
Наихудший с
позиции Вj
B1
B2
B3
B4
23
21
5
18
20
24
12
22
12
22
14
9
8
5
9
10
23
24
22
10
Наихудший
c позиции
Аi
8
5
5
9
нижн.ц.=9 <
верхн.ц.=10
Необходимо определить оптимальную стратегию телефонной компании,
используя различные критерии.
Решение.
Максиминный критерий (критерий Вальда).
В данном случае обычным образом определяем нижнюю цену игры: =9.
Оптимальная стратегия - A4.
Критерий Лапласа.
Необходимо определить среднее арифметическое по каждой из строк
платежной матрицы, а затем выбрать максимальное значение (критерий
(5.9)). В результате расчетов получим:
для стратегии A1: 15,75 ;
для стратегии A2: 18 ;
для стратегии A3: 10 ;
для стратегии A4: 14,75 .
Оптимальная стратегия по критерию Лапласа - A2.
Критерий Сэвиджа.
Сначала сформируем матрицу рисков R. Для этого воспользуемся
соотношением (5.11), т.е. будем вычитать каждый элемент платежной
матрицы из максимального элемента соответствующего столбца.
В результате получим следующую матрицу рисков:
0 4 10 2
2 0 0 5
R=
18 12 8 1
5 2 13 0 .
Вычисляя максимум в каждой строке, получим:
для стратегии A1: 10 ;
для стратегии A2: 5 ;
для стратегии A3: 18 ;
для стратегии A4: 13 .
Выбираем минимум. Таким образом, по критерию Сэвиджа оптимальной
является стратегия A2.
Критерий Гурвица.
Определение оптимальной стратегии по критерию Гурвица предполагает
установление коэффициента доверия. Примем его равным 0,5 и найдем
оптимальную стратегию для данного значения. Используя критерий (5.15),
для каждой из строк платежной матрицы определим значение выражения в
квадратных скобках:
для стратегии A1: 15,5 ;
для стратегии A2: 14,5 ;
для стратегии A3: 9,5 ;
для стратегии A4: 15,5 .
Таким образом, оптимальными стратегиями по критерию Гурвица
являются две стратегии - A1 и A4.
Заметим, что такое решение было получено при =0,5. При иных
значениях коэффициента доверия оптимальное решение может быть другим.
ЛР 5. Некооперативные игры n игроков
6 часов
Содержание работы
1. Разбившись на несколько групп, моделировать ситуацию взаимодействия
на международной арене нескольких стран. Каждая группа играет за свою
страну. Игрокам каждой страны придумать набор варианты ее стратегий
и огласить.
2. Каждой группе разработать втайне матрицу выигрышей своей страны.
3. Проанализировать в этой игре
- доминантные стратегии,
- гарантирующие (максиминные) стратегии,
4. Написать программы для выявления ситуаций равновесия Нэша
(подсказка: перебором всех возможных исходов с проверкой их на
«нэшевость») и множества парето-оптимальных стратегий.
5. Используя эти программы, проанализировать в этой игре
- все точки Парето,
- все ситуации равновесия Нэша
6. Оформить отчет и сдать преподавателю.
Справочные сведения
Полагаем, что для игроков желательными являются максимальные значения
результата игры, .е. речь идет о выигрышах, а не о проигрышах
Гарантирующая (максиминная) стратегия
Гарантирующая стратегия y iг - когда игрок полагает, что остальные игроки,
несмотря на свои собственные интересы, будут действовать против него,
а уж выбором своего действия он будет максимизировать то, что зависит
от него самого.
Доминантная стратегия
Стратегия y будет доминантной стратегией, если какая бы обстановка
не складывалась,
выигрыш игрока будет максимальным при выборе
именно этой стратегии:
d
i
Равновесие Нэша
Равновесие Нэша – когда ни один из агентов, в одиночку меняя свою
стратегию на другую, не может увеличить свой выигрыш при условии, что
остальные своих стратегий не меняют.
Точка Парето
Вектор действий агентов y будет эффективным по Парето, если для
любого другого вектора действий найдется агент такой, что значение его
целевой функции будет строго меньше, чем в точке Парето
P
ЛР 6. ИЕРАРХИЧЕСКИЕ ИГРЫ ДВУХ ИГРОКОВ
6 часов
1.
2.
3.
4.
Содержание работы
Сформировать небольшую содержательную конкретную матричную
игру «Центр – Агент» (например, Государство – государственная
монополия) и согласовать ее с преподавателем.
Написать программы, позволяющие решить игру для равновесия
Штакельберга и игр Г1, Г2, Г3 (подсказка – перебором правил
принятия решения Центром в игре Г2 и Агентом в игре Г3) .
Сопоставить результаты решения и сделать выводы
Оформить отчет и сдать преподавателю.
Справочные сведения
Решение Штакельберга
P (u ) ,
Гипотеза
благожелательности:
из
множества
решений
максимизирующих целевую функцию Агента, он выбирает наиболее
желательное для Центра. Тогда решение Центра:
Центр принимает решение, считая,
что агент примет решение, наилучшее для Центра, и сообщает его Агенту,
после чего Агент принимает свое решение
МАТРИЦА ЦЕНТРА
ЦЕНТР\АГЕНТ
А1
А2
3
Ц1
8
7
Ц2
9
А3
1
2
Ц3
5
5
МАТРИЦА АГЕНТА
ЦЕНТР\АГЕНТ
А1
А2
6
4
Ц1
8
2
Ц2
8
10
Ц3
6
А3
9
10
4
Результат Игры Штакельберга:
Выигрыш Центра = 2
Выигрыш Агента = 10
Игра Г1
Центр выбирает свое решение, исходя из пессимистической гипотезы, что
Агент из решений, максимизирующих его целевую функцию, выберет
наихудшее для Центра решение.
Центр принимает решение, считая,
что агент примет решение, наихудшее для Центра, и сообщает его Агенту,
после чего Агент принимает свое решение
МАТРИЦА ЦЕНТРА
ЦЕНТР\АГЕНТ
А1
А2
3
8
Ц1
9
7
Ц2
Ц3
5
5
А3
1
2
6
МАТРИЦА АГЕНТА
ЦЕНТР\АГЕНТ
А1
А2
6
4
Ц1
8
2
Ц2
8
Ц3
10
А3
9
10
4
Результат Игры Г1:
Выигрыш Центра = 5
Выигрыш Агента = 10
Игра Г2
Центр сообщает Агенту не свое конкретное решение, а правило выбора

своего решения в зависимости от решения Агента u  u ( y ) .
Тогда множество решений Агента, максимизирующих его целевую функцию
Центр принимает решение, исходя из
Центр сообщает Агенту, какое решение примет в ответ на решение Агента;
Агент принимает решение и сообщает его Центру; после этого Центр
принимает окончательное решение и сообщает его Агенту
МАТРИЦА ЦЕНТРА
ЦЕНТР\АГЕНТ
А1
А2
А3
3
8
1
Ц1
9
7
2
Ц2
5
5
6
Ц3
МАТРИЦА АГЕНТА
ЦЕНТР\АГЕНТ
А1
А2
6
4
Ц1
8
2
Ц2
8
10
Ц3
А3
9
10
4
Стратегия решения,
которую Центр сообщает Агенту:
А1 – Ц2
А2 – Ц1
А3 – Ц3
Рассуждения Агента:
А1 – Ц2 = 8
А2 – Ц1 = 4
А3 – Ц3 = 4
Решение Агента - А1
Решение Центра - Ц2
Выигрыш Центра = 9
Выигрыш Агента = 8
Игра Г3
Центр сообщает Агенту зависимость управления от того, как в зависимости
от управления будет вести себя Агент. То есть стратегия Агента
становится функцией, а стратегия центра является функцией от этой
функции.
Агент сообщает Центру свою стратегию принятия решения; Центр в ответ
сообщает Агенту , какое решение принял; Агент, в соотвтетствии со своей
стратегией, принимает свое решение.
МАТРИЦА ЦЕНТРА
ЦЕНТР\АГЕНТ
А1
А2
3
8
Ц1
9
7
Ц2
5
5
Ц3
А3
1
2
6
МАТРИЦА АГЕНТА
ЦЕНТР\АГЕНТ
А1
А2
6
4
Ц1
8
2
Ц2
8
10
Ц3
А3
9
10
4
Стратегия решения, которую Агент сообщает Центру:
Ц1 – А3
Ц2 – А3
Ц3 – А2
Рассуждения Центра:
Ц1 – А3 =1
Ц2 – А3 = 2
Ц3 – А2 = 5
Решение Центра Ц3, соответственно решение Агента А2, Выигрыш Центра = 5, Выигрыш
Агента = 10
Итого:
Решение
Игра
Игра Игра
Выигрыш Центра
Выигрыш Агента
Штакельберга
2
10
Г1
5
10
Г2
9
8
Г3
5
10
Теорема Кукушкина
о выигрышах Центра в различных играх
Г 2k  Г 2
Г 2 k 1  Г 3
Г1  Г 3  Г 2
Итак, Центру выгоднее всего играть игру Г2, если нельзя – то Г3, если ничего другого
нельзя, то Г1. Центру измышлять более многоходовые игры бесполезно.
1.
2.
3.
4.
Литература
Бурков В.Н., Коргин Н.А., Новиков Д.А. Введение в теорию
управления организационными системами / Под ред. чл.-корр. РАН
Д.А. Новикова. – М.: Либроком, 2009. – 264 с.
Пиявский С.А. Методы оптимизации и принятия решений, Самара,
СГАСУ, 2004
Ларичев О.И. Теория и методы принятия решений, М., Логос, 2000. 295 с.
Ларичев О.И. Вербальный анализ решений, ИСИ РАН – Мю: Наука,
2006 – 181 с.
5. http://emm.ostu.ru/lect/lect5.html#vopros2
Download