ЕН.Ф.5 Теория игр

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«Мурманский государственный гуманитарный университет»
(ФГБОУ ВПО «МГГУ»)
УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС ДИСЦИПЛИНЫ
ЕН.Ф.05 ТЕОРИЯ ИГР
ОСНОВНАЯ ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА ПОДГОТОВКИ СПЕЦИАЛИСТА ПО
СПЕЦИАЛЬНОСТИ
080116 «Математические методы в экономике»
Утверждено на заседании кафедры
математики и математических методов
в экономике факультета
физико-математического образования,
информатики и программирования
(протокол № 6 от 27 февраля 2013 г.)
Зав. кафедрой _______________О.М. Мартынов
Раздел 1. Программа учебной дисциплины
1. Автор программы:
Давидюк Е.С., старший преподаватель
2. Рецензенты:
Мартынов О.М., кандидат ф.-м. наук, доцент
Верещагин Б.М., кандидат ф.-м. наук, доцент
3. Пояснительная записка:
Цель курса.
Изучение дисциплины «Теория игр» направлено на формирование у студентов
умения строить и анализировать игровые модели.
Задачи курса:
Научить строить игровые модели и решать их;
Научить применять игровые модели для решения прикладных задач в экономике и
бизнесе
Место курса в общей системе подготовки специалиста. Курс теории игр наряду
с другими дисциплинами специального блока служит фундаментальной базой
экономического и управленческого образования. Использование игровых моделей в
управлении и экономике позволяет выделять и формально описывать в математическом
виде наиболее важные связи экономических переменных и объектов, проводить их анализ,
получать количественные соотношения, принимать оптимальные решения, что может
представлять конкретный практический интерес и способствовать развитию
экономической теории.
Требования к уровню освоения содержания дисциплины
Студенты должны знать:
- ключевые понятия теории игр,
- основные элементы теории бескоалиционных игр,
- равновесие по Нэшу и его модификации,
- кооперативная игра;
- биматричная игра;
- антагонистическая игра;
- коалиционная игра;
- оптимальность по Парето;
- равновесие по Байесу-Нэшу;
- вектор Шепли;
- С-ядро;
- разнообразные
теоретико-игровые
модели,
используемые
в
современной
экономической теории.
Студенты должны уметь:
- формально ставить задачи принятия решений;
- строить математические модели конфликта;
- находить седловые точки и минимаксы, оптимальные стратегии, смешанные стратегии
в задачах теории игр,
- осуществлять многокритериальную оптимизацию,
- решать биматричные игры;
- решать кооперативные игры;
- решать дифференциальные игры,
- решать задачи по разделам курса,
- применять теоретический материал,
- творчески подходить к решению профессиональных задач,
ориентироваться в нестандартных условиях и ситуациях, анализировать возникающие
проблемы.
-
В подготовке программы использовались:
программа курса «Теория игр» Государственного Университета– Высшей Школы
Экономики, составители Бусыгин В.П., к.ф.-м.н., доцент ГУ–ВШЭ, Левина Е.А.,
преподаватель ГУ–ВШЭ, 2004.
программа курса «Теория игр» кафедры математического моделирования в
экономике Вятский государственного университета, составитель Лукиных И. Г., доцент,
к.ф.-м.н., 2005.
Данная программа составлена в соответствии с требованиями Государственного
образовательного стандарта высшего профессионального образования к содержанию и
уровню подготовки выпускника по специальности 080116 Математические методы в
экономике.
4. Извлечение из ГОС ВПО
ЕН.Ф.05
Теория игр
Задачи принятия решений. Многокритериальная оптимизация.
Антагонистические
игры.
Бескоалиционные
игры.
Бескоалиционные неантагонистические игры. Кооперативные
игры.
5. Объем дисциплины и виды учебной работы
Виды учебной работы в часах
№
п/п
Шифр и
наименование
специальности
Курс
Семестр
Трудоемкость
Всего
аудит.
ЛК
ПР/
СМ
ЛБ
Сам.
работа
1
080116
Математические
методы в
экономике
3
5
100
50
24
12
14
50
Вид
итогового
контроля
(форма
отчетности)
экзамен
6. Содержание дисциплины.
6.1. Разделы дисциплины и виды занятий (в часах). Примерное распределение
учебного времени:
Количество часов
№
Наименование раздела, темы
п/п
Общая
Всего
Сам.
ЛК ПР/СМ ЛБ
труд-ть
ауд.
раб.
Задачи принятия решений.
1
Многокритериальная
10
6
2
2
2
4
оптимизация.
2
Основные понятия теории игр
6
2
2
4
3
Антагонистические игры
14
8
4
2
2
6
4
Биматричные игры
14
8
4
2
2
6
5
Кооперативные игры
14
8
4
2
2
6
6
Игры с природой
13
7
4
1
2
6
7
Многошаговые игры
11
5
2
1
2
6
Дифференциальные игры
8
9
3
1
1
1
6
преследования
9
Иерархические игры
Всего
9
100
3
50
1
24
1
12
1
14
6
50
6.2. Содержание разделов дисциплины.
Тема 1. Задачи принятия решений. Многокритериальная оптимизация.
Условия принятия решений. Задачи принятия решения. Многокритериальная
оптимизация. Эффективность по Парето.
Тема 2. Основные понятия теории игр.
Понятие игры. Классификация игр. Формальное представление игр. Позиционная
форма игры. Нормальная форма игры.
Начальная позиция, полная или частичная информированность, окончательная
позиция.
Платежная матрица. Чистая стратегия. Оптимальная чистая стратегия. Равновесные
ситуации.
Тема 3. Антагонистические игры
Матричная антагонистическая игра. Связь выигрышей игрока и противника.
Понятие о значении и решении игры. Нижнее значение игры и принцип максимина.
Верхнее значение игры и принцип минимакса. Значение (цена) игры. Соотношения между
ними.
Решение игры в чистых стратегиях. Ситуации равновесия. Седловые точки.
Свойства ситуаций равновесия. Доминирование стратегий. Теорема о масштабе для
антагонистической игры. Понятие смешанной стратегии. Связь действий и стратегий.
Теорема о существовании решения матричной игры в классе смешанных стратегий.
Аналитическое решение игры (2*2). Графический способ решения (2*n) и (m*2)
игры. Решение игр вида (m*n) с помощью линейного программирования
Вполне смешанные и симметричные игры. Игры с вогнутой функцией выигрыша.
Игры с выпуклой функцией выигрыша.
Тема 4. Биматричные игры
Бескоалиционные игры. Поведение игроков. Ситуации равновесия по Нэшу и
оптимальность по Парето.
Максиминные стратегии в биматричных играх. Доминируемые стратегии.
Равновесие в смешанных стратегиях. Решения 2*n биматричной игры. Байесовское
равновесие.
Тема 5. Кооперативные игры
Игры двух лиц с постоянной суммой. Критерии выбора оптимальных стратегий для
игр с ненулевой суммой. Теория игры n лиц. Понятие дележа. С-ядро. Решение НейманаМоргенштерна. Вектор Шепли.
Тема 6. Игры с природой
Выбор оптимальной стратегии в условиях неопределенности. Специфика ситуации
полной неопределенности. Матрица рисков. Критерии выбора оптимальной стратегии
Лапласа, Гурвица, Сэвиджа, Байеса, Вальда, Ходжа-Лемана, Гермейера.
Тема 7. Многошаговые игры
Оценка стратегий. Дерево решений. Характеристики дерева решения.
Тема 8. Дифференциальные игры преследования
Фазовые координаты управления. Игры с движущимся объектом. Игры
преследования. Игры преследования в прямоугольнике. Игры преследования на графе.
Тема 9. Иерархические игры
Принципы иерархических игр. Иерархическая игра с жёстким решением первого
игрока и его первым ходом. Матричный и непрерывный примеры.
Иерархическая игра с жёстким решением первого игрока и его вторым ходом.
Теорема Гермейера. Матричный и непрерывный примеры.
Иерархическая игра с мягким решением первого игрока. Матричный и
непрерывный примеры.
6.3. Темы для самостоятельного изучения.
№
Наименование раздела
Форма
п/п
дисциплины.
самостоятельной
Тема.
работы
1
2
3
4
5
6
7
8
Минимакс и максимин. Решение
матричных игр в чистых
стратегиях.
Смешанное расширение игры.
Решение игр в смешанных
стратегиях.
Геометрический способ решения
игр в смешанных стратегиях.
Принципы оптимальности в
неантагонистических играх.
Решение биматричных игр в
смешанных стратегиях.
Принятие решений в условиях
неопределенности и риска.
Игры при наличии разных видов
неопределенностей.
Позиционные игры.
9
Ситуация абсолютного
равновесия.
10
Стратегии наказания
11
Коалиционные игры
12
Общая теория игры n лиц
13
Вектор Шепли
Колво
часов
Форма контроля
выполнения
самостоятельной
работы
проверка
контрольных работ
контрольные
работы
4
контрольные
работы
4
проверка
контрольных работ
контрольные
работы
контрольные
работы
вопросы для
самостоятельного
изучения
контрольные
работы
контрольные
работы
контрольные
работы
вопросы для
самостоятельного
изучения
вопросы для
самостоятельного
изучения
контрольные
работы
вопросы для
самостоятельного
изучения
контрольные
работы
4
проверка
контрольных работ
проверка
контрольных работ
выполнение тестов
4
4
4
проверка
контрольных работ
проверка
контрольных работ
проверка
контрольных работ
выполнение тестов
2
выполнение тестов
4
проверка
контрольных работ
выполнение тестов
4
4
4
4
4
проверка
контрольных работ
7. Методические рекомендации по организации изучения дисциплины.
7.1. Тематика и планы аудиторной работы студентов по изученному материалу
(практические занятия и лабораторные работы).
Практическое занятие №1. Многокритериальная оптимизация.
По представленным данным о проектах необходимо выбрать несколько лучших проектов,
общая сумма финансирования по которым соответствует инвестиционным возможностям,
один самый эффективный проект, используя правило Парето и правило Борда.
Сравнить полученные результаты, сделать выводы.
Практическое занятие №2. Матричные антагонистические игры
Найти минимакс и максимин для платежных матриц
Найти седловые точки платежных матриц
Сократить платежные матрицы, используя принцип доминирования стратегий.
Решить симметрическую игру.
Решить аналитически и графически игры 2*2
Построить платежную матрицу игры, удовлетворяющую указанным условиям.
Решить антагонистическую игру вида m*n симплекс методом.
Практическое занятие №3. Биматричные игры
Решить биматричную игру: найти равновесие по Нэшу и оптимальность по Парето.
Построить область решений.
Практическое занятие №4. Кооперативные игры
Решить кооперативную игру.
Найти вектор Шепли. Найти С-ядро игры. Найти решение Неймана-Моргенштерна.
Практическое занятие №5. Игры с природой
Найти оптимальные стратегии игрока, используя все известные критерии. Сравнить
полученные результаты.
Вычислить матрицу рисков и найти оптимальную стратегию.
Практическое занятие №6. Многошаговые игры
По представленным данным выбрать решение, максимизирующее прибыль.
Построить дерево решений.
По представленным данным о рынке выбрать стратегию выхода (или невыхода) на рынок.
Построить дерево решений.
Практическое занятие №7. Дифференциальные игры преследования.
Решить игру преследования.
Построить область решений.
Практическое занятие №8. Иерархические игры
Решить игру с первым ходом первого игрока.
Решить игру с первым ходом второго игрока.
Решить игру с первым ходом первого игрока и информацией о действиях второго.
Решить игру на квадрате.
Лабораторная работа №1. Многокритериальная оптимизация.
По представленным данным о проектах необходимо выбрать несколько лучших проектов,
общая сумма финансирования по которым соответствует инвестиционным возможностям,
один самый эффективный проект, используя правило Парето и правило Борда.
Сравнить полученные результаты, сделать выводы.
Лабораторная работа №2. Матричные антагонистические игры
Построить платежную матрицу игры, удовлетворяющую указанным условиям. Решить
антагонистическую игру с помощью линейного программирования.
Лабораторная работа №3. Биматричные игры
Решить биматричную игру: найти равновесие по Нэшу и оптимальность по Парето.
Построить область решений.
Лабораторная работа №4. Кооперативные игры
Решить кооперативную игру.
Найти вектор Шепли. Найти С-ядро игры. Найти решение Неймана-Моргенштерна.
Лабораторная работа №5. Игры с природой
Найти оптимальные стратегии игрока, используя все известные критерии. Сравнить
полученные результаты.
Вычислить матрицу рисков и найти оптимальную стратегию.
Лабораторная работа №6. Многошаговые игры
По представленным данным выбрать решение, максимизирующее прибыль.
Построить дерево решений.
По представленным данным о рынке выбрать стратегию выхода (или невыхода) на рынок.
Построить дерево решений.
Лабораторная работа №7. Дифференциальные игры преследования.
Решить игру преследования.
Построить область решений.
Лабораторная работа №8. Иерархические игры
Решить игру с первым ходом первого игрока.
Решить игру с первым ходом второго игрока.
Решить игру с первым ходом первого игрока и информацией о действиях второго.
Решить игру на квадрате.
8. Учебно-методическое обеспечение дисциплины.
8.1. Рекомендуемая литература:
Основная литература
1. Васин А.А.,.Морозов В.В. Введение в теорию игр с приложениями к экономике. –М.:
ВМиК МГУ, 2003. – 277 с.
2. Катулев А.Н., Северцев Н.А. Исследование операций. Принципы принятия решений и
обеспечение безопасности. – М. ФМЛ. – 320 с.
3. Оуэн. Г. Теория игр. –М.: Едиториал УРСС. – 2004. – 216 с.
4. Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. –М.: Высшая школа. Книжный
дом “Университет”. – 1998.
5. Протасов И.Д. Теория игр и исследование операций. – М. Гелиос АПВ, 2003, – 368 с.
6. Толстопятенко, А.В. Черемных. Ю.Н.- М.: ДИС, 1997, 1998,1999,2004. - 365c. - (Учеб.
МГУ им. М. В. Ломоносова).
Дополнительная литература
1. Айзекс Р. Дифференциальные игры. - М., 1967.
2. Вентцель. Е.С.Исследование операций. –М. Высшая школа. 2001, – 208 с.
3. Воробьёв, Н.Н. Теория игр для экономистов-кибернетиков /Н.Н.Воробьёв.- М.: Наука,
1985. - 272c.: ил.
4. Воробьев Н.Н. Основы теории игр. Бескоалиционные игры. – М.: 1984.
5. Дюбин Г.Н., Суздаль В.Г. Введение в прикладную теорию игр. – М.: 1981.
6. Карлин. С.Математические методы в теории игр, программировании и экономике. –
М.: Мир. – 1964. – 838 с.
7. Коваленко А.А. Сборник задач по теории игр. - Львов: 1974.
8. Мулен Э. Теория игр. – М.: 1985.
9. Петросян Л.А. Дифференциальные игры преследования. – Л.: 1977.
10. Петросян Л.А., Данилов Н.Н. Кооперативные дифференциальные игры и их
приложения. – Томск: 1985.
11. Петросян Л.А., Зенкевич Н.А. Оптимальный поиск в условиях конфликта. – Л.: 1987.
9. Материально-техническое обеспечение дисциплины.
9.1. Перечень используемых технических средств: компьютеры на базе процессора Intel
Pentium 2.10 Гц, 256 МВ ОЗУ.
9.2. Перечень используемых пособий: Васин А.А.,.Морозов В.В. Введение в теорию игр
с приложениями к экономике. –М.: ВМиК МГУ, 2003. – 277 с.
9.3. Перечень видео- и аудиоматериалов программного обеспечения: руководство по
выполнению лабораторных работ в формате pdf; пакеты прикладных программ: Maple 8.09.0;
10. Примерные зачетные тестовые задания.
Вариант 1
1  1 0 


1. Матричная игра с матрицей А   0 0 2  имеет седловую точку
1 0 1 


а). (1,2)
б). (2,2)
в). (3,2)
г). (2,1)
д). Нет верного ответа
  3 1 2


2. Верхняя цена игры с матрицей А   2 0 4  равна
 1 1 5


а) 5
б).0
в).1
 2

 1
3. В игре с матрицей А   2

 2
а). А1
б). А2
г). -3
д). Нет верного ответа
5 1

0 0
1  2  доминируемая стратегия

1 1 
в). В1
г). В3
д). Нет верного ответа
  2 2


4. В игре с матрицей А   1  2  игрок А имеет оптимальную стратегию
 2 0


а).  1 , 2 
3 3
б).  2 , 1 
 3 3
в).  1 ,0, 2 
3
г).  2 ,0, 1 
3
3
3
д). Нет верного ответа
5. В игре «камень-ножницы-бумага» обозначим стратегии игроков А1 = В1 = «камень», А2
= В2 = «ножницы», А3 = В3 = «бумага». Цена игры равна
а). -1
б). 1
в). 0
г). 1/3
д). Нет верного ответа
 0 1  2  5
 1 0 7 5 
6. В игре с матрицей
 оптимальной является стратегия
À
 2  7 0 15 


 5  5  15 0 
а). x   5 , 5 ,0, 1 
 11 11
11 
б). y   5 , 5 ,0, 1 
 11 11
в). x   1 , 1 ,0, 1 
11 
3 3
3
г). y   1 , 1 ,0, 1 
3 3
3
д). Нет верного ответа
 4 1 5
7. Оптимальной стратегией игрока В в игре с матрицей А   0 5 2  является


3 3 7 


а). 0,0,1
б).  1 , 1 , 1 
 3 3 3
в).  1 ,0, 2 
3
3
г).  2 , 3 ,0 
5 5 
д). Нет верного
ответа
2 8 3 
8. Найти решение и цену игры с матрицей А   7 3 8  . (Выписать ответ)


6 2 7


9. В биматричной игре с матрицей  А, В    10,8 2,12  ситуацией оптимальной по
 12,2 7,7  


Парето является
а). (1,1)
ответа
10.
б). (2,2)
в). (1,2)
г). (2,1)
д). Нет верного
В биматричной игре с матрицей  А, В    10,8 2,12  ситуацией равновесия по
 12,2 7,7  


Нэшу является
а). (1,1)
ответа
11.
б). (2,2)
в). (1,2)
г). (2,1)
д). Нет верного
В биматричной игре с матрицей  А, В    10,8 2,12  сильно равновесной
 12,2 7,7  


ситуацией является
а). (1,1)
ответа
12.
б). (2,2)
в). (1,2)
г). (2,1)
д). Нет верного
На столе лежит кучка из нескольких спичек. Двое ходят по очереди. Одним ходом
можно взять две или три спички. Проиграет тот, кто возьмет последнюю спичку.
Начертите граф и исследуйте игру в зависимости от начального количества спичек (кто
выиграет и как ему надо для этого играть).
13.
На окружности расставлено 30 точек. За ход можно соединить любые две из них
отрезком, причем проведенные отрезки не должны пересекаться внутри окружности.
Проигрывает тот, кто не может сделать ход. Кто выигрывает при правильной игре?
14.
15.
Решить графически игру: А    1 7 5  .
 5 3 10 


 0 3 2 4


Решить симметрическую игру:
 3 0 4 1  .
А
2  4 0  7


0 
 4 1 7
Вариант 2
2 0
1. Матричная игра с матрицей А  1 1

2 1

а). (1,2)
ответа
б). (2,2)
в). (3,2)
1

3  имеет седловую точку
2 
г). (2,1)
д). Нет верного
  3 1 2


2. Нижняя цена игры с матрицей А   2 0 4  равна
 1 1 5


а). 5
ответа
б). 0
в). 1
г). -3
д). Нет верного
1 0  2 1 
3. В игре с матрицей А   5 0 1 1  доминируемая стратегия


 2 1 2  2


а). А1
ответа
б). А2
в). В2
г). В3
д). Нет верного
  2 2


4. В игре с матрицей А   1  2  игрок В имеет оптимальную стратегию
 2 0


а).  1 , 2 
б).  2 , 1 
3 3
 3 3
в).  1 ,0, 2 
3
г).  2 ,0, 1 
3
3
3
д). Нет верного
ответа
5. В игре «камень-ножницы-бумага» обозначим стратегии игроков А1 = В1 =
«камень», А2 = В2 = «ножницы», А3 = В3 = «бумага». Оптимальными стратегиями
игроков будут:
а). x  y   1 , 1 , 1 
в). x  0,1,0, y   0, 2 , 1 
б). x  1,0,0, y  0,0,1
 3 3 3
 3 3
г). Нет верного ответа
 0 1  2  5


 1 0 7 5 
6. В игре с матрицей А   2  7 0 15  оптимальной является стратегия


 5  5  15 0 
а). x   5 , 5 ,0, 1 
 11 11
11 
б). y   5 , 5 ,0, 1 
 11 11
в). x   1 , 1 ,0, 1 
11 
3 3
3
г). y   1 , 1 ,0, 1 
3 3
3
д). Нет верного ответа
 4 1 5
7. Оптимальной стратегией игрока А в игре с матрицей А   0 5 2  является


3 3 7 


а). 0,0,1
б).  1 , 1 , 1 
 3 3 3
в).  1 ,0, 2 
3
3
г).  2 , 3 ,0 
5 5 
д). Нет верного
ответа
0 6 1 
8. Найти решение и цену игры с матрицей А   5 1 6  . (Выписать ответ)


 4 0 5


9. В биматричной игре с матрицей  А, В    8,8 0,10  ситуацией оптимальной по
 10,0 1,1 


Парето является
а). (1,1)
ответа
б). (2,2)
в). (1,2)
г). (2,1)
д). Нет верного
10. В биматричной игре с матрицей  А, В    8,8 0,10  ситуацией равновесия по
 10,0 1,1 


Нэшу является
а). (1,1)
ответа
б). (2,2)
в). (1,2)
г). (2,1)
д). Нет верного
11. В биматричной игре с матрицей  А, В    8,8 0,10  сильно равновесной ситуацией
 10,0 1,1 


является
а). (1,1)
ответа
б). (2,2)
в). (1,2)
г). (2,1)
д). Нет верного
12. На столе лежит 2 кучки конфет: в одной 20 штук, в другой 21 штука. Одним ходом
нужно взять одну из кучек, а другую разделить на две непустые кучки.
Проигрывает тот, кто не может сделать ход. Начертите граф. Кто выигрывает при
правильной игре?
13. На окружности расставлено 20 точек. За ход можно соединить любые две из них
отрезком, причем проведенные отрезки не должны пересекаться внутри
окружности. Проигрывает тот, кто не может сделать ход. Кто выигрывает при
правильной игре?
14. Решить графически игру: А    2 1  6  2  .
8  5 6 5


 0  4 2  3


15. Решить симметрическую игру:
 4 0 8  2 .
А
 2 8 0 1


 3 2 1 0 
11. Примерный перечень вопросов к экзамену.
1. Определение и примеры антагонистической игры в нормальной форме.
2. Максиминные и минимаксные стратегии. Седловая точка.
3. Ситуация равновесия в антагонистической игре.
4. Лемма о масштабе.
5. Смешанное расширение антагонистической игры.
6. Существование решения матричной игры в классе смешанных стратегий.
7. Свойства оптимальных стратегий в классе смешанного расширения матричной игры.
8. Геометрическая интерпретация игры 2*п и т*2.
9. Доминирование стратегий.
10. Вполне смешанные игры.
11. Симметрические игры.
12. Решение игр вида m*n с помощью линейного программирования.
13. Определение и примеры бескоалиционной игры в нормальной форме.
14. Принципы оптимальности в бескоалиционных играх.
15. Смешанное расширение бескоалиционной игры.
16. Свойства оптимальных решений в смешанном расширении бескоалиционной игры.
17. Многошаговые игры с полной информацией.
18. Существование ситуации абсолютного равновесия в многошаговой игре с полной
информацией.
19. Иерархические игры. Теорема Гермейера.
20. Дерево решений в многошаговой игре с полной информацией.
21. Теория моделирования игр с природой. Игры при наличии разных видов
неопределенностей.
22. Дифференциальные игры преследования. Игры с движущимся объектом.
23. Понятие дележа.
24. С-ядро.
25. Н-М-решение.
26. Вектор Шепли.
12. Комплект экзаменационных билетов.
13. Примерная тематика рефератов.
Не предусмотрены.
14. Примерная тематика курсовых работ.
Учебным планом не предусмотрены
15. Примерная тематика квалификационных (дипломных) работ.
Учебным планом не предусмотрены
16. Методика(и) исследования (если есть).
нет
17. Балльно-рейтинговая система, используемая преподавателем для оценивания
знаний студентов по данной дисциплине.
Знания студентов по теоретическим вопросам оцениваются по 4-х балльной шкале:
Балл
Расшифровка
2
Неудовлетворительно
3
Удовлетворительно
4
Хорошо
5
отлично
Усвоение практических навыков оценивается по системе «зачет/незачет»
Раздел 2. Методические указания по изучению дисциплины и контрольные задания
для студентов заочной формы обучения.
Заочная форма обучения не предусмотрена.
Раздел 3. Содержательный компонент теоретического материала.
Тема 1. Задачи принятия решений. Многокритериальная оптимизация.
1.1. Постановка задачи. Основные понятия.
Постановка задачи критериального анализа.
Лицо, принимающее решение (ЛПР).
Задачи стратегические и тактические.
Множество альтернатив. Критерии.
1.2. Формирование критериальной системы.
Этапы формирования критериальной системы
Требования к критериальной системе:
Проверка критериев на независимость.
1.3. Аксиома Парето и эффективные варианты.
Аксиома Парето:
Эффективные варианты.
Тема 2. Основные понятия теории игр.
2.1. Постановка задачи. Основные понятия.
Игра (в математике). Ход. Игроки. Стратегия.
2.2. Классификация игр.
По количеству игроков:
По количеству стратегий
По количеству ходов
По характеру взаимодействия
По характеру выигрышей
По виду функций выигрыша
Тема 3. Антагонистические игры
3.1. Решение матричных игр в чистых стратегиях.
Матричная антагонистическая игра двух игроков с нулевой суммой.
Платежная матрицу А.
 a11 a12  a1 j  a1n 


  
ai 2  aij  ain 
А =  ai1


  
a

 m1 a m2  a mj  a mn 
Чистая стратегия. Оптимальная стратегия.
Нижняя чистая цена игры. Верхняя чистая цена игры.
Теорема. Для любой конечной игры выполнено соотношение
max min aij  min max aij
1im 1 j n
1 j n 1im
Седловая точка.
Теорема. Конечная игра имеет седловую точку тогда и только тогда, когда
существуют такие чистые стратегии (io,jo), при которых aij0  ai0 j0  ai0 j
3.2. Смешанное расширение матричной игры
Смешанная стратегия игрока.
Матричная антагонистическаяа игра в нормальной форме
Средний выигрыш игрока 1 и игрока 2.
Оптимальные смешанные стратегии игроков 1 и 2
Цена игры.
Решение матричной игры.
Теорема (о минимаксе). Для матричной игры с любой матрицей А величины
vн  max min Е (А, х, y) и vв  min max Е (А, х, y)
x
y
y
x
существуют и равны между собой.
Свойства решений матричных игр.
Доминируемые (строго доминируемые) стратегии.
Спектр смешанной стратегии
3.3. Игры порядка 2 х 2.
Матрица игры 2  2
 a11
A
 a 21
a12 

a 22 
Решение игры 2  2
3.4. Графический метод решения игр 2 х n и m х 2.
Решение игр вида 2 х n.
Решение игр вида m х 2.
3.5. Сведение матричной игры к задаче линейного программирования.
Формирование задачи линейного программирования.
Составление двойственной задачи.
3.6. Решение бесконечных антагонистических игр в чистых стратегия.
Бесконечные антагонистические игры (БАИ)
[0; 1] – единичный промежуток, из которого игрок может сделать выбор;
х – число (стратегия), выбираемое игроком 1;
y – число (стратегия), выбираемое игроком 2;
Мi(x,y) – выигрыш i-го игрока;
G (X,Y,M1,M2) – игра двух игроков, с ненулевой суммой, в которой игрок 1
выбирает число х из множества Х, игрок 2 выбирает число y из множества Y, и после этого
игроки 1 и 2 получают соответственно выигрыши M1(x, y) и M2(x, y).
Решение в чистых стратегиях.
Оптимальная стратегия игрока 1. Оптимальная стратегия игрока 2.
Цена игры. Седловая точка в чистых стратегиях.
Точка -равновесия
Теорема. Для того, чтобы функция М имела -седловые точки для любого >0
необходимо и достаточно чтобы
sup inf M(x, y) = inf sup M(x, y).
x
y
y
x
3.7. Решение бесконечных антагонистических игр в смешанных стратегиях
Смешанные стратегии игроков 1 и 2.
Средний выигрыш игрока 1 и игрока 2
Седловая точка в смешанных стратегиях
Теорема (существования). Всякая антагонистическая бесконечная игра двух
игроков G с непрерывной функцией выигрышей М(х,y) на единичном квадрате имеет
решение (игроки имеют оптимальные смешанные стратегии).
Теорема. Пусть G(Х,Y,М) – бесконечная антагонистическая игра с непрерывной
функцией выигрышей М(х, y) на единичном квадрате и ценой игры v. Тогда, если Q(y) –
оптимальная стратегия игрока 2 и для некоторого xo
1
 M (x
o
, y ) dQ ( y )  v ,
0
то xo не может входить в точки спектра оптимальной стратегии игрока 1; если F(х) –
оптимальная стратегия игрока 1и для некоторого yo
1
 M ( x, y
o
) d F ( x)  v ,
0
то yo не может быть точкой спектра оптимальной стратегии игрока 2.
Теорема. Пусть в бесконечной антагонистической игре функция выигрышей М(х,y)
непрерывная для х[0; 1], y[0; 1] и
М(х, y) = М(y, х),
тогда цена игры равна нулю и любая оптимальная стратегия одного игрока будет также
оптимальной стратегией другого игрока.
3.8. Игры с выпуклыми функциями выигрышей.
Теорема. Пусть М(х, y) – непрерывная функция выигрышей игрока 1, на единичном
квадрате и строго выпуклая по y для любого х. Тогда имеется единственная оптимальная
чистая стратегия y = yo [0;1] для игрока 2, цена игры определяется по формуле
v = min max M(x, y), 1
y
x
значение yo определяется как решение следующего уравнения
max M(x, yo) = v. 2
x
Теорема. Для игрока 1: если функция выигрышей М(х, y) непрерывна по обоим
аргументам и строго вогнута по х при любом y, то в этом случае игрок 1 имеет
единственную оптимальную стратегию.
Цена игры определяется по формуле
v = max min M(x,y), 3
x
y
а чистая оптимальная стратегия хo игрока 1 определяется из уравнения
min M(xo, y) = v. 4
y
Теорема. Пусть дана бесконечная антагонистическая игра с непрерывной и
дифференцируемой по y на единичном квадрате при любом х функцией выигрышей М(х,
y), с оптимальной чистой стратегией yo игрока 2 и ценой игры v, тогда :
1) если yo = 1, то среди оптимальных стратегий игрока 1 имеется существенная
чистая стратегия х1, для которой
M y' (х1, 1)  1;
2) если yo = 0, то среди оптимальных стратегий игрока 1 имеется существенная
чистая стратегия х2, для которой
M y' (х2, 0)  0;
3) если 0  yo  1, то среди оптимальных стратегий игрока 1 найдётся такая, которая
является смесью двух существенных стратегий х1 и х2. Для этих стратегий
M y' (х1, yo)  0, M y' (х2, yo)  0,
стратегия х1 употребляется с вероятностью , стратегия х2 – с вероятностью (1),
где  находится из уравнения
 M 'y (х1, yo) + (1  ) M 'y (х2, yo) = 0.
Тема 4. Биматричные игры
4.1. Решение в чистых стратегиях.
Биматричная игра.
Ситуация равновесия по Нэшу
Свойства равновесия по Нэшу.
Оптимальность по Парето.
4.2. Решение в смешанных стратегиях.
Смешанная стратегия игрока 1.
Смешанная стратегия игрока 2.
Средние выигрыши игроков 1 и 2.
Теорема (Нэша). Каждая биматричная игра имеет по крайней мере одну ситуацию
равновесия в смешанных стратегиях.
Тема 5. Кооперативные игры
5.1. Основные определения
Кооперативные игры. Характеристическая функция игры . Простая
характеристическая функция. Простейшая характеристическая функция. Дележ.
Классическая кооперативная игра.
Теорема о существовании дележа в классической кооперативной игре.
Свойства кооперативных игр.
Свойства стратегических эквивалентных игр.
(0,1)-редуцированная форма кооперативных игр.
Правило перевода в (0,1)-редуцированную форму
Теорема о соответствии существенной кооперативной игры игре в (0,1)редуцированной форме.
5.2. С – ядро
Доминирование по коалиции.
Доминирование дележей.
Теорема. Если  и 1 – две стратегически эквивалентные характеристические
функции, и дележам x и y соответствуют дележи x 1 и y 1 , то из x > y следует x 1 > y 1 .
Барицентрические координаты на плоскости.
Вполне устойчивый дележ
С-ядро.
Теорема. Для того чтобы делёж x принадлежал С-ядру кооперативной игры с
характеристической функцией , необходимо и достаточно, чтобы для любой коалиции K
выполнялось неравенство
 ( K )   x i 9 
i K
Свойства С-ядра:
5.3. Решение по Нейману-Моргенштерну. Вектор Шепли.
Решение по Нейману-Моргенштерну (Н-М-решение) кооперативной игры
Теорема. Если в кооперативной игре существует С-ядро C и Н-М-решение R, то C
R.
Свойство Н-М-решений.
Недостатки Н-М-решения.
Носитель игры.
Вектор цен (вектор Шепли)
Аксиомы Шепли.
Теорема. Существует единственная функция , определённая для всех игр и
удовлетворяющая аксиомам Шепли.
Тема 6. Игры с природой
6.1. Классические критерии принятия решений
Максиминный критерий Вальда.
Критерий Байеса – Лапласа.
Критерий Сэвиджа.
Максимаксный критерий.
6.2. Производные критерии.
Критерий Гурвица.
Критерий Ходжа–Лемана.
Критерий Гермейера.
Критерий произведений.
Тема 7. Многошаговые игры
7.1. Определение стратегий.
Словесное описание стратегий.
Формальное определение стратегий.
7.2. Дерево решений.
Обозначения.
Характеристики дерева решения.
Тема 8. Дифференциальные игры преследования
8.1. Фазовые координаты управления.
8.2. Игры с движущимся объектом.
8.3. Игры преследования.
Игры преследования в прямоугольнике.
Игры преследования на графе.
Тема 9. Иерархические игры
9.1. Игра №1
Иерархические игры.
Описание игры №1
Алгоритм решения дискретной игры №1.
Алгоритм решения непрерывной игры №1.
9.2. Игра №2
Описание игры №2
Алгоритм решения дискретной игры №2.
Алгоритм решения непрерывной игры №2.
9.3. Игра №3
Описание игры №3
Алгоритм решения дискретной игры №3.
Алгоритм решения непрерывной игры №3.
Раздел 4. Словарь терминов.
(0,1)-редуцированная форма. Кооперативная игра с характеристической функцией
v имеет (0,1)-редуцированную форму, если выполняются соотношения: v * ( i ) = 0 ( i  N
), v * (N) = 1.
Бесконечная антагонистическая игра. Бесконечные антагонистические игры
(БАИ) – игры, в которых хотя бы один из игроков имеет бесконечное количество
возможных стратегий.
Биматричная игра. Биматричная игра – это конечная бескоалиционная игра двух
игроков. Каждый игрок делает один ход. Выигрыши игроков задаются двумя матрицами
A и B.
Биматричная игра. Биматричная игра – это конечная игра двух игроков с
ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно
для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1,
столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице
находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)
Вектор Шепли. Вектором цен (вектором Шепли) игры с характеристической
функцией  называется n-мерный вектор  () = (1(), 2(), ..., n()), удовлетворяющий
аксиомам Шепли.
Верхняя чистая цена игры. Число vв, называется чистой верхней ценой игры и
показывает, какой максимальный выигрыш за счёт своих стратегий может себе
гарантировать игрок 1.
Вполне устойчивый дележ. Вполне устойчивый дележ – это такой дележ, который
не доминируется никакими другими дележами.
Выпуклая игра. Выпуклая игра – игра, функция выигрышей которой является
выпуклой.
Дележ.
Вектор
x
=
(x1,
...,
xn),
удовлетворяющий
условиям
1. индивидуальной рациональности: xi  ( i ), для i N, т.е. любой игрок должен получить
выигрыш в коалиции не меньше, чем он получил бы, не участвуя в ней (в противном
случае
он
не
будет
участвовать
в
коалиции);
2. коллективной рациональности:  xi = (N), т.е. сумма выигрышей игроков должна
i N
соответствовать возможностям (если сумма выигрышей всех игроков меньше, чем (N),
то игрокам незачем вступать в коалицию; если же потребовать, чтобы сумма выигрышей
*
была больше, чем (N), то это значит, что игроки должны делить между собой сумму
большую, чем у них есть), называется дележом в условиях характеристической функции
.
Доминирование дележа по коалиции. Пусть имеется два дележа x = (x1, ..., xn) и y
= (y1, ..., yn) в кооперативной игре G = {N,}, и K N – некоторая коалиция. Тогда делёж x
доминирует
y
по
коалиции
K,
если
выполняются
свойства:
1)
эффективности
доминирующего
дележа
(K)
 xi 
i K
2) предпочтительности xi > yi для всех iK
Доминирование дележа. Делёж x доминирует y, если существует такая коалиция
K, для которой делёж x доминирует y. Это доминирование обозначается так: x > y.
Наличие доминирования x > y означает, что в множестве игроков N найдётся коалиция,
для которой x предпочтительнее y.
Доминирование стратегий. Стратегия х1 игрока 1 доминирует (строго
доминирует)
над
стратегией
х2,
если
1
2
1
2
А (х , y)  А (х , y) (А (х , y) > А (х , y)), y  .
Стратегия y1 игрока 2 доминирует (строго доминирует) над стратегией y2, если
А (х, y1)  А (х, y2) (А (х,
y1) < А (х,
y2)), х  Х.
При этом стратегии х2 и y2 называются доминируемыми (строго доминируемыми).
Игра с природой. Матричная игра, в которой игрок взаимодействует с
окружающей средой, не заинтересованной в его проигрыше, и решает задачу определения
наиболее выгодного варианта поведения с учётом неопределённости состояния
окружающей среды, называется «игрой с природой». Игрок в этой игре называется лицом,
принимающим решение (ЛПР)
Игра. "Игра (в математике) - это идеализированная математическая модель
коллективного поведения: несколько игроков влияют на исход игры, причем их интересы
различны".
Иерархическая игра. Иерархические игры – это неантагонистические
многошаговые игры двух лиц, в которых игроки прежде, чем выбрать свои действия,
предварительно обмениваются информацией о своих выборах.
Классическая кооперативная игра. Система {N, }, состоящая из множества
игроков, характеристической функции над этим множеством и множеством дележей,
удовлетворяющих соотношениям (2) и (3) в условиях характеристической функции,
называется классической кооперативной игрой.
Классы
стратегической
эквивалентности.
Классы
стратегической
эквивалентности – это попарно непересекающиеся множества стратегически
эквивалентных игр.
Кооперативная игра. Кооперативные игры – это игры n игроков, в которых
разрешается образовывать определённые коалиции.
М(х, y )    M( x , y )  М( x , y) + .
Матричная игра. Матричная игра – это конечная игра двух игроков с нулевой
суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (строка матрицы
соответствует номеру применяемой стратегии игрока 1, столбец – номеру применяемой
стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока
1, соответствующий применяемым стратегиям).
Непрервная игра. Непрерывная игра – игра, в которой функция выигрышей
каждого игрока является непрерывной.
Несущественная кооперативная игра. Если в условии супераддитивности
выполняется равенство (K) + (L) = (KL), т.е. выполняется свойство аддитивности, то
такие игры называются несущественными.
Нижняя чистая цена игры. Число vн, называется нижней чистой ценой игры и
показывает, какой минимальный выигрыш может гарантировать себе игрок 1, применяя
свои чистые стратегии при всевозможных действиях игрока 2.
Нормальная форма матричной антагонистической игры. Система G (Х,Y,А), где
Х – множество смешанных стратегий игрока 1, Y – множество смешанных стратегий
игрока 2, А - платежная матрица, называется матричной антагонистической игрой в
нормальной форме
Носитель игры. Носителем игры с характеристической функцией  называется
такая коалиция T, что (S) = (S  T) для любой коалиции S.
Нулевая кооперативная игра. Кооперативная игра называется нулевой, если все
значения её характеристической функции равны нулю.
Оптимальная стратегия. Стратегия игрока является оптимальной, если
применение этой стратегии обеспечивает ему наибольший гарантированный выигрыш при
всевозможных стратегиях другого игрока.
Оптимальность по Парето. Ситуация (i°, j°) называется оптимальной по Парето,
если не существует такой ситуации (i, j), что выполнены неравенства
aij  aio j o
,
bij  bio j o
и при этом хотя бы одно из них – строгое.
Подыгра. Игра G = (Х,Y,А) называется подыгрой игры G (Х,Y,А), если Х Х, 
, а матрица А является подматрицей матрицы А. Матрица А при этом строится
следующим образом. В матрице А остаются строки и столбцы, соответствующие
стратегиям Х и , а остальные “вычеркиваются”. Всё то что “останется” после этого в
матрице А и будет матрицей А.
Простая характеристическая функция. Характеристическая функция 
называется простой, если она принимает только два значения: 0 и 1. Если
характеристическая функция  простая, то коалиции K, для которых (K)=1, называются
выигрывающими, а коалиции K, для которых (K) = 0, – проигрывающими.
Простейшая характеристическая функция. Если в простой характеристической
функции  выигрывающими являются те и только те коалиции, которые содержат
фиксированную непустую коалицию R, то характеристическая функция , обозначаемая в
этом случае через R, называется простейшей.
Равновесие по Нэшу. Ситуация (i°, j°) биматричной игры называется ситуацией
равновесия по Нэшу, если aijo  aio jo ; bio j  bio jo
Решение игры. Пара чистых стратегий (iо,jо) игроков 1 и 2, образующая седловую
точку и седловой элемент a io jo , называется решением игры. При этом iо и jо называются
оптимальными чистыми стратегиями соответственно игроков 1 и 2.
Решение по Нейману-Моргенштерну. Решением по Нейману-Моргенштерну (НМ-решением) кооперативной игры называется множество R дележей в нём, обладающее
следующими
свойствами:
1) внутренняя устойчивость: никакие два дележа из R не доминируют друг друга;
2) внешняя устойчивость: каков бы ни был делёж s не принадлежащий R, найдётся делёж
r, принадлежащий R, который доминировал бы s.
Седловая точка. Седловая точка – это пара чистых стратегий (iо,jо) соответственно
игроков 1 и 2, при которых достигается равенство vн = vв. В это понятие вложен
следующий смысл: если один из игроков придерживается стратегии, соответствующей
седловой точке, то другой игрок не сможет поступить лучше, чем придерживаться
стратегии, соответствующей седловой точке.
Смешанная стратегия. Смешанная стратегия игрока 1 – полный набор
вероятностей x = (x1, ..., xm) применения 1 игроком своих чистых стратегий. Смешанная
стратегия игрока 2 – полный набор вероятностей у = (y1, ..., yn) применения 2 игроком
своих чистых стратегий
Спектр. Спектром смешанной стратегии игрока в конечной антагонистической
игре называется множество всех его чистых стратегий, вероятность которых
положительна.
Средний выигрыш игроков. Средний выигрыш игрока 1 в матричной игре с
матрицей А выражается в виде математического ожидания его выигрышей E (A, x, y)
m
n
=   aij xi y j = x A yT
i 1 j 1
Стратегическая эквивалентность. Кооперативная игра с множеством игроков N
и характеристической функцией  называется стратегически эквивалентной игре с тем же
множеством игроков и характеристической функцией v1 , если  k  0 и Ci  ; i  N , что
для любой коалиции K  N имеет место равенство: v1 ( K )  k * v( K )   Ci
iK
Стратегия. Стратегия - совокупность ходов игрока, совершаемых им для
достижения цели игры.
Существенная кооперативная игра. Кооперативные игры считаются
существенными, если для любых коалиций K и L выполняется неравенство (K) + (L) <
(KL), т.е. в условии супераддитивности выполняется строгое неравенство.
С-ядро. Множество вполне устойчивых дележей в кооперативной игре называется
С-ядром этой игры.
Точка -равновесия. Точка ( x  , y ), где x X, y  Y, в антагонистической
непрерывной игре G называется точкой -равновесия, если для любых стратегий xX
игрока 1, yY игрока 2 имеет место неравенство
Характеристическая функция. Характеристическая функция игры  - это
функция, ставящая в соответствие каждой коалиции K наибольший, уверенно получаемый
его выигрыш (K). v :   ;    K K  N 
Ход. Ход - регулярное действие, выполняемое игроком во время игры
Цена игры. Величина Е (А, хо ,уо) называется ценой игры и обозначается через .
Раздел 5. Практикум по решению задач.
Тема 1. Задачи принятия решений. Многокритериальная оптимизация.
Примеры решения задач.
Пусть U = (u,v,s,t) - множество альтернатив. Найти эффективные варианты.
k1
k2
k3
u
5
3
7
v
4
3
6
s
5
2
7
t
6
3
1
k (u)  k (v), i =1:3, поэтому K(u)P K(v).
k (u)  k (s), i =1:3, поэтому K(u) P K(s), варианты s и v оказались
доминируемыми, а остальные векторные оценки сравнить невозможно: k (u) N k (t)
Таким образом все множество векторных оценок делится на два подмножества:
эффективных { k(u),k(t)} и неэффективных { k(v), k(s)} векторных оценок.
Задачи для самостоятельного решения.
а) Пусть U = (u,v,s,t) - множество альтернатив. Найти эффективные варианты.
u
v
s
t
k1
5
4
5
6
k2
3
3
2
3
k3
7
6
7
1
k4
7
3
7
5
б) Пусть U = (u,v,s,t,d) - множество альтернатив. Найти эффективные варианты.
k1
k2
k3
k4
u
5
3
7
7
v
4
3
6
3
s
5
2
7
7
t
6
3
1
5
d
5
7
3
4
Тема 3. Антагонистические игры
Примеры решения задач.
Пример 1
 1 3 2 
A=  0 5 4 
 2 3 2


Седловой точкой является пара (iо = 3; jо = 1), при которой  =  =  = 2.
Заметим, что хотя выигрыш в ситуации (3;3) также равен 2, она не является
седловой точкой, т.к. этот выигрыш не является максимальным среди выигрышей
третьего столбца.
Пример 2
min aij
j
 10 30 
H  

 40 20 
max aij  
i
40 30

minmax aij 30
j
10
aij  20
 max min
j
20 i
i
Из анализа матрицы выигрышей видно, что vн < vв, т.е. данная матрица не имеет
седловой точки. Если игрок 1 выбирает свою чистую максиминную стратегию i = 2, то
игрок 2, выбрав свою минимаксную j = 2, проиграет только 20. В этом случае игроку 1
выгодно выбрать стратегию i = 1, т.е. отклониться от своей чистой максиминной
стратегии и выиграть 30. Тогда игроку 2 будет выгодно выбрать стратегию j = 1, т.е.
отклониться от своей чистой минимаксной стратегии и проиграть 10. В свою очередь
игрок 1 должен выбрать свою 2-ю стратегию, чтобы выиграть 40, а игрок 2 ответит
выбором 2-й стратегии и т.д.
Пример 3. Пусть G = (Х,Y,А), где Х = {1, 2, 3, 4}; Y = {1, 2, 3, 4}, а функция выигрыша А
задана следующим образом:
1
2
3
4
1  2C
C
2C 3C 


2  3C 3C 2 C 2C 
A 
3 2C 2C
C
C 


4 C
C
C C 2
где С > 0.
Прежде всего заметим, что по свойству 6 достаточно решить игру G1 = (Х,Y,А), где
1
А1 = А . В матричной форме игра G1 определяется матрицей выигрышей
C
1 2
3 4
12 1 2 3 


23 3 2 1 2 
1
A  
3 2 2 1 1


4  1 1 1 1 2
Элементы четвёртой строки этой матрицы “  ” соответствующих элементов
третьей строки и поэтому третья стратегия игрока 1 доминирует над четвёртой. Кроме
того, элементы первого столбца матрицы А1 “  ” соответствующих элементов второго
столбца, Следовательно, вторая стратегия игрока 2 доминирует над его первой стратегией.
Далее, из свойства 5 следует, что всякое решение игры G2 = (Х \ {4}, Y \ {1}, А1)
является решением игры G1. В матричной форме игру G2 можно представить матрицей
2 3 4
1  1 2 3


2
A  2  3 2 1 2 .


3  2 1 1
Очевидно, что элементы второй строки “ ” полусуммы соответствующих
элементов первой и третьей строк. Кроме того, элементы третьего столбца матрицы А2 “
“ соответствующих элементов второго столбца. Применяя свойство 5 получим, что
всякое решение игры G3 = (Х \ {4,2}, Y \ {1,4}, А2) является решением игры G2, а
следовательно и игры G1. Игра G3 определяется матрицей
2 3
1
1
2

A3  
.
3  2 1
Матрица А3 не имеет седловой точки, т.к. не выполнено равенство
max min a ij = min max a ij ,
i
j
j
i
а игра G не имеет решения в чистых стратегиях, т.е. оптимальные стратегии игроков
являются смешанными. Эти стратегии (в данном случае) легко найти из анализа
структуры матрицы А3. Поскольку матрица А3 симметрична, можно предположить, что
игроки в оптимальной стратегии используют свои чистые стратегии с равными
вероятностями.
Действительно, если игрок 1 выбирает с равными вероятностями стратегии 1 и 3,
то при применении любой из двух чистых стратегий игроком 2 математическое ожидание
выигрыша игрока 1 будет равным либо
3
либо
1
1
3
1   2  ,
2
2
2
1
1
3
 2  1  .
2
2
2
Аналогично, если игрок 2 использует свои чистые стратегии 2 и 3 с равными
вероятностями, то математическое ожидание его проигрыша будет равно
3
.
2
Следовательно, указанные стратегии являются оптимальными в игре G3, а величины
значением игры G3. Из предыдущего следует, что эти стратегии оптимальны и в G1.
1
2
3
–
2
1
2
Таким образом, стратегия Х = ( , 0, , 0) является оптимальной стратегией игрока
1 1
2 2
1, стратегия Y = (0, , , 0) – оптимальной стратегией игрока 2 в игре G1, а значение игры
G1 равно
3
3C
. В силу свойства 4 решением игры G будет тройка (Х,Y, ).
2
2
Пример 4.
Рассмотрим игру, заданную платёжной матрицей.
B1
A1  2
1

A2 7
2
B2
3
5
B3
11

2
На плоскости хОy введём систему координат и на оси Ох отложим отрезок
единичной длины А1, А2, каждой точке которого поставим в соответствие некоторую
смешанную стратегию игрока 1 (х, 1  х). В частности, точке А1 (0;0) отвечает стратегия
А1, точке А2 (1;0) – стратегия А2 и т.д.
В точках А1 и А2 восстановим перпендикуляры и на полученных прямых будем
откладывать выигрыш игроков. На первом перпендикуляре (в данном случае он совпадает
с осью 0y) отложим выигрыш игрока 1 при стратегии А1, а на втором – при стратегии А2.
Если игрок 1 применит стратегию А1, то выиграет при стратегии В1 игрока 2 – 2, при
стратегии В2 – 3, а при стратегии В3 – 11. Числам 2, 3, 11 на оси 0х соответствуют точки
В1, В2 и В3.
Если же игрок 1 применит стратегию А2, то его выигрыш при стратегии В1 равен 7,
при В2 – 5, а при В3 – 2. Эти числа определяют точки В1, В2, В3 на перпендикуляре,
восстановленном в точке А2.Соединяя между собой точки В1 и В1, В2 и В2, В3 и В3
получим три прямые, расстояние до которых от оси 0х определяет средний выигрыш при
любом сочетании соответствующих стратегий. Например, расстояние от любой точки
отрезка В1В1 до оси 0х определяет средний выигрыш 1 при любом сочетании стратегий
А1 А2 (с частотами х и 1–х) и стратегией В1 игрока 2. Это расстояние равно
2х1 + 6(1  х2) = 1
Таким образом, ординаты точек, принадлежащих ломанной В1 M  В3 определяют
минимальный выигрыш игрока 1 при применении им любых смешанных стратегий. Эта
минимальная величина является максимальной в точке ; следовательно этой точке
соответствует оптимальная стратегия Х* = (х, 1х), а её ордината равна цене игры .
Координаты точки  находим как точку пересечения прямых В2 B2 и В3 B3.
Соответствующие два уравнения имеют вид
 3x  5(1  x )  
3
49
 x , 
.

11
11
11x  2(1  x )  
Следовательно Х = (
3 9
49
;
), при цене игры  =
. Таким образом мы можем
11 11
11
найти оптимальную стратегию при помощи матрицы
 3 11


5 2 
Оптимальные стратегии для игрока 2 можно найти из системы
3 y  5(1  y )  
9
 y

11
5 y  2(1  y )  
и, следовательно, Y = (0;
оптимальную стратегию.
9 2
;
). (Из рисунка видно, что стратегия B1 не войдёт в
11 11
Пример 5. Найти решение игры, заданной матрицей
2
B1 B2
A1  6
5


A2  4
6
1
A3  2
7


A4  1
8
Матрица имеет размерность 2 х 4. Строим прямые, соответствующие стратегиям
игрока 1. Решение игры таково
3
8
=( ;
5
7
1
43
); Х = ( ; 0; 0; );  =
.
8
8
8
8
Пример 6. Найти решение игры, определяемой матрицей.
 0 1  1


A  0  1 0 


 1 0  1
При решении этой игры к каждому элементу матрицы А прибавим 2 и получим
следующую матрицу
2 3 1


A1   2 1 2 
3 2 1


Составим теперь пару взаимно-двойственных задач:
q1 q2 q3  max
p1  p2  p3  min
2 p1  2 p 2  3 p3  1,  2q1  3q 2 + q3  1,
3 p  p  2 p  1,  2q  q + 2q  1,
 1
 1
2
3
2
3


 p1  2 p 2  p3  1, 3q1  2q 2 + q3  1,
 q1 , q 2 , q3  0
 p1 , p 2 , p3  0
Решим вторую из них с помощью симплекс – метода:
Б.п. q1
q2
q3
q4
q5
q6
Решени 
Отношени
е
е
0
0
0
0
1
1
1
3
q4
1
2
0
1
0
0
1
5
—
11
q5
1
0
1
0
1
0
1
4
q6
2
1
0
0
0
1
1
5
—
Б.п.
q1
q2
q3
q4
q5
q6
q4
q3
q6
0
1
1
2
1
2
0
1
0
0
1
0
0
1
0
0
1
0
1
0
0
0
0
1
Б.п.
q1
q2
q3
q4
q5
q6
12
0
1
0
0
0
0
1
0
12
1
0
1
0
0
0
0
1
q2
q3
q6
12
1
32
12
0
1 2
Решени
е
1
1
1
1

Решени
е

32
72
12
52
1
4
12
52
Из оптимальной симплекс-таблицы следует, что 7 2
1
2
(q1, q2, q3) = (0; ; 1),
а из соотношений двойственности следует, что
1
2
1
5
4
5
( p1, p2, p3) = ( ; 1; 0).
Отношени
е
12
—
111
Отношени
е
Следовательно, цена игры с платёжной матрицей А1 равна

1
1
2 
1
1 
 1
 . 
,
p1  p2  p3 2  1 3  q1  q 2  q 3 
а игры с платёжной матрицей А:
2
1
1  .
3
3
При этом оптимальные стратегии игроков имеют вид:
  1  1 
2 1 2
2
1 2
Х = (х1, х2, х3) = (р1; р2; р3) =   ;  1;  0 =  ; ; 0
3 2 3
3  3 3 
2
2 1 2
1 2
Y = (y1, y2, y3) = (q1; q2; q3) =   0;  ;  1 =  0; ;  .
3
3 2 3   3 3
Задачи для самостоятельного решения.
1) Найти верхнюю, нижнюю цену игры, седловую точку (если существует):



а) 






 25
2* N
1
 25
45
35
N
3* N
4
N
13
N
10

N
4
6
N
N *2
2

55 

45 

 5* N 

0 
8 

7 6 5 4
б)  1 8 2 3 
8 1 3 2


 5 6 5 8 
в)  1 2 2 3 
 8 1 4 5 


г) Пусть задана следующая игра с участием двух игроков:
Первый игрок загадывает любое целое число от 1 до 3. Второй игрок должен отгадать это
число. Если второй игрок указывает число правильно, он получает выигрыш, равный
значению этого числа. В противном случае этот выигрыш получает первый игрок.
Определите число стратегий игроков и составьте платёжную матрицу задачи.
Определите нижнюю и верхнюю цену игры. Установите, существует ли в данной игре
решение в чистых стратегиях.
д) Постройте платежную матрицу для двухпальцевой игры Морра, которая заключается в
следующем. В игру играют 2 человека: каждый из них показывает 1 или 2 пальца и
одновременно называет число пальцев, которое, по его мнению, покажет противник
(естественно противник этого не видит и не знает). Если один из игроков угадывает
правильно, то он выигрывает сумму, равную сумме пальцев, показанных им и его
противником. В противном случае - ничья и выигрыш равен 0.
Определите нижнюю и верхнюю цену игры. Установите, существует ли в данной игре
решение в чистых стратегиях.
е) Постройте платежную матрицу для игры. Два игрока независимо друг от друга
называют по одному целому числу из диапазона 1-5. Если сумма названных чисел четная,
то выигрывает второй игрок и первый платит ему сумму, равную максимальному из
чисел. Если сумма названных чисел нечетная, то выигрывает первый игрок и второй
платит ему сумму, равную максимальному из чисел.
Определите нижнюю и верхнюю цену игры. Установите, существует ли в данной игре
решение в чистых стратегиях.
ж) Необходимо составить платежную матрицу игры, заданную условиями:
Число стратегий первого игрока n=5, число стратегий второго игрока m=7
Платежная матрица задана условием:
.
N – номер студента в журнале.
2) Сократить матрицу и найти верхнюю, нижнюю цену игры, седловую точку (если
существует):
2
N 1 N  2 
1 2 3 4 4 7
1




7 6 5 4 4 8
4 N /100 N 2
3 


а)
б)
1 8 2 3 3 6
6
1
3
N 




2
3
4 
8 1 3 2 2 5
1
3) Решить матричную игру графическим методом:
N
 4


2
6
3
N
1.5 * N N 2 * N / 3 


а) 
б)

  2 * N 2.5 * N
 N 1 2 

N
8
2
*
N




5 
 8
Тема 4. Биматричные игры
Примеры решения задач.
Пример 1.
Пусть заданы матрицы выигрышей:
 2 0
3 0
A
; B  

0 1
1 0
Найдем ситуацию равновесия, для этого проверим условия (1) и (2)
o
1). i  1; j o  1; aio j o  2; bio j o  3
i  2; a21  0  2  aio jo
j  2; b12  0  3  bio jo
→ ситуация (1;1) - ситуация равновесия по Нэшу
2). i o  2; j o  1; aio j o  0; bio j o  1
i  1; a11  2  0  aio jo
j  2; b22  0  1  bio jo
→ ситуация (2;1) не является ситуацией равновесия по Нэшу
3). i o  1; j o  2; aio j o  0; bio j o  0
i  2; a22  1  0  aio jo
j  1; b11  3  0  bio jo
→ ситуация (1; 2) не является ситуацией равновесия по Нэшу
4). i o  2; j o  2; aio jo  1; bio jo  0
i  1; a12  0  1  aio j o
j  1; b21  1  0  bio j o
→ ситуация (2; 2) не является ситуацией равновесия по Нэшу
Пример 2.
Покупатель приходит на рынок за яблоками. Продавец может либо честно взвесить
яблоки, либо обвесить покупателя на 200 гр. за каждый кг яблок.
Покупатель может либо поверить продавцу, либо проверить на контрольных весах
и пожаловать на продавца.
Рассмотрим все возможные ситуации:
1. Покупатель честно взвесил, покупатель поверил. Дополнительный выигрыш 0
(цену яблок в расчет не берем).
2. Продавец обманул, покупатель поверил. Выигрыш продавца 1, покупателя -1.
3. Покупатель честно взвесил, покупатель проверил. Выигрыш продавца 0,
покупателя -½ (время зря потратил).
4. Продавец обманул, покупатель проверил. Выигрыш продавца -1, покупателя ½.
Матрицы выигрышей будут иметь вид:
0 0 
 0 1/ 2 
A
; B  

 1 1
 1 1/ 2 
Найдем ситуацию равновесия, для этого проверим условия (1) и (2)
o
i

1; j o  1; aio j o  0; bio j o  0
1).
i  2; a21  1  0  aio jo
→ ситуация (1;1) не является ситуацией равновесия по Нэшу
j  2; b12   1  0  bio jo
2
o
o
2). i  2; j  1; aio j o  1; bio j o  1
i  1; a11  0  1  aio jo
→ ситуация (2;1) не является ситуацией равновесия по Нэшу
j  2; b22  1  1  bio jo
2
o
o
3). i  1; j  2; aio jo  0; bio jo   1
2
i  2; a22  1  0  aio jo
→ ситуация (1; 2) не является ситуацией равновесия по Нэшу
j  1; b11  0   1  bio jo
2
o
o
4). i  2; j  2; aio jo  1; bio jo  1
2
i  1; a12  0  1  aio jo
→ ситуация (2; 2) не является ситуацией равновесия по Нэшу
j  1; b21  1  1  bio jo
2
Пример 3 (семейный спор).
Муж (В) и жена (А) решают, куда пойти вечером – на футбол или на балет.
 4 0
2 0
A
; B  

 0 2
 0 4
Найдем ситуацию равновесия, для этого проверим условия (1) и (2)
o
1). i  1; j o  1; aio j o  4; bio j o  2
i  2; a21  0  4  aio jo
j  2; b12  0  2  bio j o
→ ситуация (1;1) - ситуация равновесия по Нэшу
2). i o  2; j o  1; aio j o  0; bio j o  0
i  1; a11  4  0  aio j o
j  2; b22  4  0  bio j o
→ ситуация (2;1) не является ситуацией равновесия по Нэшу
3). i o  1; j o  2; aio j o  0; bio j o  0
i  2; a22  2  0  aio jo
j  1; b11  2  0  bio jo
→ ситуация (1; 2) не является ситуацией равновесия по Нэшу
4). i o  2; j o  2; aio j o  2; bio jo  4
i  1; a12  0  2  aio jo
j  1; b21  0  4  bio jo
→ ситуация (2; 2) - ситуация равновесия по Нэшу
Пример 4 (дилемма заключенного).
Два человека, находящихся под следствием. Каждый может либо сознаться, либо
нет. Если один сознается, а другой нет, то первый получает 1 год тюрьмы, второй 10. Если
оба не сознаются, то получают по 2 года. Если оба сознаются, то получают по 5 лет.
 5 1 
 5 10 
A
; B  

 10 2 
 1 2 
Найдем ситуацию равновесия, для этого проверим условия (1) и (2)
o
1). i  1; j o  1; aio jo  5; bio jo  5
i  2; a21  10  5  aio jo
j  2; b12  10  5  bio jo
→ ситуация (1;1) - ситуация равновесия по Нэшу
2). i o  2; j o  1; aio j o  10; bio jo  1
i  1; a11  5  10  aio jo
→ ситуация (2;1) не является ситуацией равновесия по Нэшу
j  2; b22  2  1  bio jo
3). i o  1; j o  2; aio j o  1; bio j o  10
i  2; a22  2  1  aio jo
j  1; b11  5  10  bio jo
→ ситуация (1; 2) не является ситуацией равновесия по Нэшу
4). i o  2; j o  2; aio j o  2; bio jo  2
i  1; a12  1  2  aio jo
j  1; b21  1  2  bio jo
→ ситуация (2; 2) - не является ситуацией равновесия по Нэшу
Однако ситуация (2; 2) - обоим не сознаваться является более выгодной для
игроков.
Пример 5.
Министерство желает построить один из двух объектов на территории города.
Городские власти могут принять предложения министерства или отказать. Министерство
– игрок 1 – имеет две стратегии: строить объект 1, строить объект 2. Город – игрок 2 –
имеет две стратегии: принять предложение министерства или отказать. Свои действия
(стратегии) они применяют независимо друг от друга, и результаты определяются
прибылью (выигрышем) согласно следующим матрицам:
 10 2 
 5 2 
A
; B  

 1 1
 1 1 
(например: если игроки применяют свои первые стратегии, министерство решает строить
1 объект, а городские власти разрешают его постройку, тогда город получает выигрыш 5
млн, а министерство теряет 10 млн, и т.д.)
Для этой игры имеем:
a1 = a11  a12  a21 + a22 = 10  2  1  1 = 14 < 0,
a2 = a22  a12 = 1  2 = 3,
a
3
3
.
 = 2 =
=
a1
4
14
Так как a1 < 0, то множество решений K имеет следующий вид:
(0, y) при
3
 y  1;
14
3
) при 0  x  1;
14
3
(1, y) при 0  y 
.
14
(x,
Для 2 игрока имеем:
b1 = b11  b12  b21 + b22 = 5 + 2 + 1 + 1 = 9 > 0,
b2 = b22  b21 = 1 + 1 = 2,
 =
2
.
9
Так как b1 > 0, то множество решений L имеет следующий вид:
2
9
(x; 0), при 0  x  ;
3
14
2
( ; y), при 0  y  1; 0 29 1 x
9
(x; 1), при
2
 x  1.
9
Точка пересечения множеств L и K есть точка C (рис.4) с координатами x =
3
и является соответственно приемлемыми стратегиями министерства и города.
14
Рис.1. Графическое решение примера 2.2
При этом выигрыш соответственно равен
 a11 a12   y   2 7    10 2   3 14 
4
E1(A,x,y) = (x, 1x) 

=  ;  
 
= 
 a 21 a 22   1  y   9 9   1  1  11 14
7
 b11 b12   y  1
E2(A,x,y) = (x, 1x) 
 
=
 b21 b22   1  y 3
Задачи для самостоятельного решения.
В биматричной игре найти равновесие по Нэшу и оптимальность по Парето. Если
равновесия не существует, то решить игру в смешанных стратегиях.
1 8 2 7 9 
 1 9 N 5 4 




а) A   5 0 N 5 7  ; B   6 2 4 3 0 
 2 1 4 0  N 
2 6 7 3 N 




2
;y=
9
0
б) A  
N
8
0 
2
; B  

4
 1 1 N 
Тема 5. Кооперативные игры
Примеры решения задач.
Пример.
Рассматривается корпорация из четырёх акционеров, имеющих акции
соответственно в следующих размерах
a1 = 10, a2 = 20, a3 = 30, a4 = 40.
Любое решение утверждается акционерами, имеющими в сумме большинство
акций. Это решение считается выигрышем, равным 1. Поэтому данная ситуация может
рассматриваться как простая игра четырёх игроков, в которой выигрывающими
коалициями являются следующие:
{2; 4}, {3; 4},
{1; 2; 3}, {1; 2; 4}, {2; 3; 4}, {1; 3; 4},
{1; 2; 3; 4}.
Найдём вектор Шепли для этой игры.
При нахождении 1 необходимо учитывать, что имеется только одна коалиция
T = {1; 2; 3}, которая выигрывает, а коалиция T \{1} = {2; 3} не выигрывает. В коалиции T
имеется 3 игрока, поэтому
2!1! 1
1 
 .
4! 12
Далее, определяем все выигрывающие коалиции, но не выигрывающие без 2-го
игрока: {2; 4}, {1; 2; 3}, {2; 3; 4}. Поэтому
1
1
1
1
2 


 .
12 12 12 4
Аналогично получаем, что  3 
1
5
, 4  .
12
4
1 1 1 5
В результате получаем, что вектор Шепли равен  ; ; ;  .
 12 4 4 12 
При этом, если считать, что вес голоса акционера пропорционален количеству
имеющихся у него акций, то получим следующий вектор голосования
 1 2 3 4
 ; ; ; ,
 10 10 10 10 
который, очевидно, отличается от вектора Шепли.
Анализ игры показывает, что компоненты 2-го и 3-го игроков равны, хотя третий
игрок имеет больше акций. Это получается вследствие того, что возможности образования
коалиций у 2-го и 3-го игрока одинаковые. Для 1-го и 4-го игрока ситуация естественная,
отвечающая силе их капитала.
Задачи для самостоятельного решения.
Перевести игру в (0,1)-редуцированную форму. Найти С-ядро и вектор Шепли
кооперативной игры трех игроков.
v(1, 2,3)  14  2* N /10; v(1, 2)  3  2* N /10; v(1,3)  5  N /10; v(2, 3)  4  N /10;
v(1)  1; v(2)  1; v(3)  2
Тема 6. Игры с природой
Примеры решения задач.
Пример 1. При работе ЭВМ необходимо периодически приостанавливать обработку
информации и проверять ЭВМ на наличие в ней вирусов. Приостановка в обработке
информации приводит к определённым экономическим издержкам. В случае же если
вирус вовремя обнаружен не будет, возможна потеря и некоторой части информации, что
приведёт и ещё к большим убыткам.
Варианты решения таковы:
Е1– полная проверка;
Е2– минимальная проверка;
Е3– отказ от проверки.
ЭВМ может находиться в следующих состояниях:
F1– вирус отсутствует;
F2– вирус есть, но он не успел повредить информацию;
F3– есть файлы, нуждающиеся в восстановлении.
Результаты, включающие затраты на поиск вируса и его ликвидацию, а также
затраты, связанные с восстановлением информации имеют вид:
Максимаксный
ММ-критерий
критерий B-L
F1
F2
F3 air= max aij max air air= min aij max air air =  aij max air
j
i
i
i
j
j
E1 -20.0 -22.0 -25.0
-20.0
-25.0
-25.0
-22.33
E2 -14.0 -23.0 -31.0
-14.0
-31.0
-22.67
E3
0
-24.0 -40.0
0
0
-40.0
-21.33
-21.33
Согласно ММ-критерию следует проводить полную проверку. Критерий БайесаЛапласа, в предположении, что все состояния машины равновероятны (P(Fj) = qj = 0.33), и
максимаксный критерий рекоменду.т отказаться от проверки.
Матрица рисков и их оценка согласно критерию Сэвиджа имеет вид:
Критерий Сэвиджа
F1
F2
F3
v
max rij
j
E1
+20.0
0
0
+20.0
E2
+14.0 +1.0
+6.0
+14.0
+14.0
E3
0
+2.0 +15.0
+15.0
Пример специально подобран так, что практически каждый критерий предлагает
новое решение. Неопределённость состояния, в котором проверка застаёт ЭВМ,
превращается в неясность, какому критерию следовать.
Поскольку различные критерии связаны с различными условиями, в которых
принимается решение, лучшее всего для сравнительной оценки рекомендации тех или
иных критериев получить дополнительную информацию о самой ситуации. В частности,
если принимаемое решение относится к сотням машин с одинаковыми параметрами, то
рекомендуется применять критерий Байеса-Лапласа. Если же число машин не велико,
лучше пользоваться критериями максимина или Севиджа.
Пример 2
Условия из примера 1
Построение оптимального решения для матрицы решений о проверках по критерию
Гурвица имеет вид (при С =0.5):
aij
С min aij (1-С) max aij
j
j
air
max air
i
-20.0 -22.0 -25.0
-12.5
-10.0
-22.5
-14.0 -23.0 -31.0
-15.5
-7.0
-22.5
0
-24.0 -40.0
-20.0
0
-20.0
-20.0
В данном примере у решения имеется точка перегиба относительно весового
множителя С: до при С<0.57 в качестве оптимального выбирается Е3, при С>0.57 – Е1.
Применение критерия Ходжа-Лемана (q = 0.33,  = 0.5):
a
ij
qj
j
min aij
j

a
ij
qj
(1-  ) min aij
j
j
air
max air
i
-22.33
-25.0
-11.17
-12.5
-23.67 -23.67
-22.67
-31.0
-11.34
-15.5
-26.84
-21.33
-40.0
-10.67
-20.0
-30.76
Критерий Ходжа-Лемана рекомендует вариант Е1 (полная проверка) – так же как и
ММ-критерий. Смена рекомендуемого варианта происходит только при  = 0.94.
Поэтому равномерное распределение состояний рассматриваемой машины должно
распознаваться с очень высокой вероятностью, чтобы его можно было выбрать по
большему математическому ожиданию. При этом число реализаций решения всегда
остаётся произвольным.
Критерий Гермейера при qj = 0.33 даёт следующий результат:
air = min aijqj max air
aij qij
aij
j
i
-20.0 -22.0 -25.0 -6.67 -7.33 -8.33
-8.33
-8.33
-14.0 -23.0 -31.0 -4.67 -7.67 -10.33
-10.33
0
-24.0 -40.0
0
-8.0 -13.33
-13.33
В качестве оптимального выбирается вариант Е1. Сравнение вариантов с помощью
величин air показывает, что способ действия критерия Гермейера является даже более
гибким, чем у ММ-критерия.
Результаты применения критерия произведения при d = 41 и d = 200 имеют вид :
air = П aij max air
aij  d
j
i
+21
+19
+16
6384
6384
+27
+18
+10
4860
+41
+17
+1
697
+180 +178 +175
5607
d=200 +186 +177 +169
5563
+200 +176 +160
5632
5632
Условие aij  0 для данной матрицы не выполнимо. Поэтому к элементам матрицы
добавляется (произвольно) сначала d = 41, а затем d = 200.
Для d = 41103 оптимальным оказывается вариант Е1, а для d = 200 – вариант Е3, так
что зависимость оптимального варианта от а очевидна.
d=41
Задачи для самостоятельного решения.
Решить игру с природой при     0.4
П1
qj
0.7
Ф1 -N
Ф2 5
Ф3 1
П2
0.3
10
-N+5
6
Тема 7. Многошаговые игры
Примеры решения задач.
Фирма, производящая вычислительную технику, провела анализ рынка нового
высокопроизводительного персонального компьютера. Если будет выпущена крупная
партия компьютеров, то при благоприятном рынке прибыль составит 2500 тыс. руб., а при
неблагоприятных условиях фирма понесет убытки в 1850 тыс. руб. Небольшая партия
техники, в случае ее успешной реализации, принесет фирме 420 тыс. руб. прибыли и 10
тыс. руб. убытков - при неблагоприятных внешних условиях. Возможность
благоприятного и неблагоприятного исходов фирма оценивает одинаково.
Исследование рынка, которое может провести эксперт, обошлось фирме в 75 тыс.
руб. Эксперт считает, что с вероятностью 0,65 рынок окажется благоприятным. В то же
время при положительном заключении благоприятные условия ожидаются лишь с
вероятностью 0,73. При отрицательном заключении с вероятностью 0,45 рынок также
может оказаться благоприятным. Используйте дерево решений для того, чтобы помочь
фирме выбрать правильную технико-экономическую стратегию.
Ответьте на следующие вопросы:
• Следует ли заказывать эксперту дополнительное обследование рынка?
• Какую максимальную сумму фирма может выплатить эксперту за проделанную
работу?
• Какова ожидаемая денежная оценка наилучшего решения?
Решение:
Процедура решения заключается в построении дерева решения и вычисления для
каждой вершины дерева ожидаемой денежной оценки с учетом вероятностей, и
последующее отбрасывание неперспективных ветвей.
Дерево решений:
Знаком «+» отмечено благоприятное состояние рынка продукции, «-»
неблагоприятное состояние.
Концевые вершины дерева – это прибыль и вероятность получения этой прибыли в
соответствующих ситуациях.
В вершинах вида «треугольник» записывается ожидаемая денежная оценка от
принятого решения.
1325,5=2500*0,73+ (-1850)*0,27;
303,9=420*0,73+ (-10)*0,27;
107,5=2500*0,45+ (-1850)*0,55;
183,9=420*0,45+ (-10)*0,55;
325=2500*0,5+ (-1850)*0,5
205=420*0,5+ (-10)*0,5;
925,8=1325,5*0,65+ 183,5*0,35;
В вершинах типа «окружность» записывается значение прибыли, полученной от
решения с максимальной ожидаемой денежной оценкой.
1325,5=max{1325,5; 303.9};
183,5=max{107,5; 183,5};
325=max{325; 205};
850,8=max{925,8-75; 325}.
Вывод: Анализируя дерево решений, можно сделать следующие выводы:
- необходимо сделать дополнительное исследование рынка;
- если прогнозируется благоприятное состояние рынка, то фирме необходимо
выпустить крупную партию компьютеров;
- если прогнозируется неблагоприятное состояние рынка, то фирме необходимо
выпустить небольшую партию компьютеров.
Задачи для самостоятельного решения.
1. При крупном автомобильном магазине планируется открыть мастерскую по
предпродажному обслуживанию и гарантийному ремонту автомобилей.
Консультационная фирма готова предоставить дополнительную информацию о том, будет
ли рынок благоприятным или нет. Эти сведения обойдутся магазину в 13 тыс. руб.
Администрация магазина считает, что эта информация гарантирует благоприятный рынок
с вероятностью 0,5. Если рынок будет благоприятным, то большая мастерская принесет
прибыль в 60 тыс. руб., а маленькая - 30 тыс. руб. При неблагоприятном рынке магазин
потеряет 65 тыс. руб., если будет открыта большая мастерская, и 30 тыс. руб.- если
откроется маленькая. Не имея дополнительной информации, директор оценивает
вероятность благоприятного рынка как 0,6. Положительный результат обследования
гарантирует благоприятный рывок с вероятностью 0,8. При отрицательном результате
рынок может оказаться благоприятным с вероятностью 0,3. Постройте дерево решений и
определите:
• Следует ли заказать консультационной фирме дополнительную информацию,
уточняющую конъюнктуру рынка?
• Какую мастерскую следует открыть при магазине: большую или маленькую?
• Какова ожидаемая денежная оценка наилучшего решения?
• Какова ожидаемая ценность дополнительной информации?
2. Фирма, производящая вычислительную технику, провела анализ рынка нового
высокопроизводительного персонального компьютера. Если будет выпущена крупная
партия компьютеров, то при благоприятном рынке прибыль составит 250 тыс. руб., а при
неблагоприятных условиях фирма понесет убытки в 185 тыс. руб. Небольшая партия
техники в случае ее успешной реализации принесет фирме 50 тыс. руб. прибыли и 10 тыс.
руб. убытков - при неблагоприятных внешних условиях. Возможность благоприятного и
неблагоприятного исходов фирма оценивает одинаково. Исследование рынка, которое
может провести эксперт, обошлось фирме в 15 тыс. руб. Эксперт считает, что с
вероятностью 0,6 рынок окажется благоприятным. В то же время при положительном
заключении благоприятные условия ожидаются лишь с вероятностью 0,8. При
отрицательном заключении с вероятностью 0,15 рынок также может оказаться
благоприятным. Используйте дерево решений для того, чтобы помочь фирме выбрать
правильную технико-экономическую стратегию. Ответьте на следующие вопросы:
• Следует ли заказывать эксперту дополнительное обследование рынка?
• Какую максимальную сумму фирма может выплатить эксперту за проделанную
работу?
• Какова ожидаемая денежная оценка наилучшего решения?
Тема 8. Дифференциальные игры преследования.
Примеры решения задач.
Одновременная игра преследования.
Пусть S1 и S2 – замкнутые пересекающиеся круги с центрами O1 и О, причём O1О =
d, радиусами R1 и R2, расположенные на плоскости так, что центр первого круга
расположен вне второго d > R2. Игра заключается в следующем. Пусть игрок 1 выбирает
некоторую точку xS1 а игрок 2 – точку yS2, причём при совершении выбора игроки не
имеют информации о действиях противника. Подобный выбор можно интерпретировать
как одновременный. Точки xS1 и yS2 являются действиями игроков. Таким образом,
множества действий игроков совпадают с множествами S1 и S2 на плоскости. Игрок 2
преследует игрока 1, который убегает от преследования. Целью игрока 1 является
максимизация расстояния между ним и вторым игроком, игрок 2 преследует
противоположную цель. Выигрышем F(х, у) игрока 1 в этой игре будем понимать
евклидово расстояние (х, у) между точками xS1 и yS2:
F(х, у) = (х, y), xS1, yS2.
Решение: Найдем нижнее значение игры VН = maxх minу(х, y). Для любой
фиксированной точки x1S1, находящейся вне круга S2, наименьшее расстояние minу(х1,
y) достигается в точке y1 пересечения прямой, проходящей через точку х1 и центр O круга
S2 с границей круга S2. В противном случае точка y совпадает с х2. Область возможных
положений точек y – это выделенная жирной линией дуга верхней окружности и
закрашенная лунка между окружностями. Максимум расстояния VН = maxх minу(х, y) =
М1М2 = d + R1 – R2 достигается в точке M1S1, являющейся точкой пересечения линий
центров ОО1 с границей круга S1, наиболее удаленной от точки O1.
Для вычисления VВ = miny maxx(x, у) учтём, что для каждого y1S2 точка x1,
доставляющая maxx(x, у1) лежит на пересечении прямой О1у1 с границей круга S1
наиболее удаленной от точки у1. Действительно, круг радиусом х1y1 с центром в точке y1
содержит S1 и его граница касается границы круга S1 в единственной точке х1. Область
возможных положений точек х1 – это выделенная жирной линией дуга нижней
окружности. Величина maxx(х, y1) = (х1, у1) достигает минимума в точке М2 пересечения
отрезка О1М1 с границей круга S2. Таким образом, VВ = miny maxx(x, у) = М1М2 = VН. Игра
имеет седловую точку. Оптимальные стратегии заключаются в выборе точек М1 и M2
игроками, значение игры V = d + R1 – R2.
Если в качестве допустимых множеств рассматривать открытые круги, то значение
игры существует и равно VВ = infy supx F(x, у) = VН = V = d + R1 – R2, однако оптимальных
стратегий не существует. Тем не менее для любого  > 0 существуют -оптимальные
стратегии. Это точки из -окрестности точек М1 и M2 принадлежащие соответственно
множествам S1 и S2.
Задачи для самостоятельного решения.
Пусть S1 и S2 – замкнутые пересекающиеся круги с центрами O1 и О, причём O1О
= d=6, радиусами R1=10+N и R2=4-N, расположенные на плоскости так, что центр первого
круга расположен вне второго d > R2. Найти Выигрыш второго игрока.
Тема 9. Иерархические игры
Примеры решения задач.
Пример 1.
Иерархическая игра G1 задана парой матриц выигрыша для её участников:
8
3 6
 7 4 3




A  4 3
2 ; B   7 7 3 
 7  5  1
 4 6 6




1. Формируем множество J
i  1; j  arg max 7, 4,3  1
j
i  2; j  arg max 7, 7,3  1  2
j
i  3; j  arg max 4, 6, 6  2  3
j
J  1,1  2, 2  3
2. Формирование множество W
i  1; aij*  min aij  min 3  3
j (1)J
1
i  2; a  min aij  min 4,3  3
*
ij
j (2)J
1 2
i  3; a  min aij  min 5, 1  5
*
ij
j (3)J
2 3
W  3,3, 5
3. Выигрыш первого игрока v11  max
aij*  max 3,3, 5  3
*
aij W
4. Выигрыш второго игрока
*
i  arg max
aij*  arg max
3,3, 5  arg max
a11 , a22 , a32   1 или 2,
*
*
*
i
aij W
i
aij W
i
aij W
j  arg max
a  arg max
3,3, 5  arg max
a11 , a22 , a32   1 или 2,
*
*
*
*
j
aij W
*
ij
j
aij W
j
aij W
v12  bi* j*  b11 или b22
Пример 2.
Иерархическая игра G1 задана на квадрате X  Y  [0,1] , с функциями выигрыша:
f ( x, y)  6 x  4 y; g ( x, y)  ( x  y) 2
1. Формируем множество J
x  0.5; y ( x)  arg max( x  y ) 2  1
y
x  0.5; y ( x)  arg max( x  y ) 2  0
y
x  0.5; y ( x)  arg max( x  y ) 2  0  1
y
J  1, 0, 0  1
2. Формирование множество W
x  0.5; w( x)  min f ( x, y )  min(6 x  4 y)  6 x  4
y ( x )J
1
x  0.5; w( x)  min f ( x, y )  min(6 x  4 y )  6 x
y ( x )J
0
x  0.5; w( x)  min f ( x, y )  min(6 x  4 y )  3
y ( x )J
0 1
W  6 x  4;6 x;3
3. Выигрыш первого игрока v11  sup w( x)  sup 6 x  4;6 x;3  7   ;   0;   0
x
4. Выигрыш второго игрока
x
x*  arg sup w( x)  arg sup 6 x  4;6 x;3  x( )  0.5   / 6,
x
x
x
x
y  arg sup w( x)  arg sup 6 x  4;6 x;3  1,
*
y
x
y
x
v  ( x( )  1)  (0.5   / 6  1) 2  (0.5   / 6) 2  0.25
Пример 3.
Иерархическая игра G2 задана парой матриц выигрыша для её участников:
2
1
2
8
3 6
 7 4 3




A  4 3
2 ; B   7 7 3 
 7  5  1
 4 6 6




1. Определение наилучшего гарантированного выигрыша игрока 2
v  max min bij  max{4, 4,3}  4
i
j
j
2.Формирование множества наилучших стратегий игрока 2 в случае, если он делает
ход первым
j  arg max min bij  arg max{4, 4,3}  arg max{b31 , b12 , b13  b23}  1; 2
i
j
j
j
j
j
j
J  1, 2
3. Формирование множества ситуаций, в которых выигрыш игрока 2 больше чем v
D  (1,1);(2,1);(2, 2);(3, 2);(3,3)
4. Определение максимального выигрыша игрока 1 в ситуациях D
K  max aij  max{3, 4,3, 5, 1}  4
( i , j )D
5. Определение наилучшего гарантированного выигрыша игрока 1, если игрок 2
применяет стратегии из J.
M  min max aij  min max({3, 4,7},{6,3, 5})  min{7,6}  6
j (i )J
j (i )J
i
j (i )J
i
6. Выигрыш первого игрока v  max{K , M }  6
7. Выигрыш второго игрока
*
i  arg max{K , M }  arg max{4, 6}  arg max{a21 , a12}  1,
1
2
i
i
i
j  arg max{K , M }  arg max{4, 6}  arg max{a21, a12}  2,
*
j
j
j
v  b12  4
Пример 4.
Иерархическая игра G2 задана на квадрате X  Y  [0,1] , с функциями выигрыша:
2
2
f ( x, y)  6 x  4 y; g ( x, y)  ( x  y) 2
1. Определение наилучшего гарантированного выигрыша игрока 2
v  max min g ( x, y)  max min( x  y) 2  0
y
x
y
x
2.Формирование множества наилучших стратегий игрока 2 в случае, если он делает
ход первым
J   y  x
3. Формирование множества ситуаций, в которых выигрыш игрока 2 больше чем v
D  ( x  y)
4. Определение максимального выигрыша игрока 1 в ситуациях D
K  sup f ( x, y)  sup(6 x  4 y)  10   ;   0;   0
( x , y )D
x y
5. Определение наилучшего гарантированного выигрыша игрока 1, если игрок 2
применяет стратегии из J.
M  min max f ( x, y)  min max(6 x  4 y)  10
y ( x )J
yx
x
x
6. Выигрыш первого игрока v  max{K , M }  10
7. Выигрыш второго игрока
x*  arg max{K , M }  1,
1
2
x
y  arg max{K , M }  1,
*
y
v 0
Однако игрок 2 может снизить выигрыш первого и выбрать стратегию y  1   / 4 ,
получив при этом выигрыш  2 /16 , а первый игрок тогда получит 10  
Пример 5.
Иерархическая игра G3 задана парой матриц выигрыша для её участников:
2
2
8
3 6
 7 4 3




A  4 3
2 ; B   7 7 3 
 7  5  1
 4 6 6




1. Определение наилучшего гарантированного выигрыша игрока 2 в случае, если
игрок 1 применяет стратегию «наказания»
v  min max bij  min{7,7,6}  6
i
i
j
2. Формирование множества ситуаций, в которых выигрыш игрока 2 больше чем v
D  (1,1);(2,1);(2, 2)
3. Определение максимального выигрыша игрока 1 в ситуациях D
K  max aij  max{3, 4,3}  4
( i , j )D
4. Выигрыш первого игрока v  max{K , v11}  max{4,3}  4
5. Выигрыш второго игрока
i*  arg max{K , v11}  arg max{a21 , a11  a22 }  2,
1
3
i
i
j  arg max{K , v }arg max{a21 , a11  a22 }  1,
*
1
1
j
i
v  b21  7
Пример 6.
Иерархическая игра G3 задана на квадрате X  Y  [0,1] , с функциями выигрыша:
f ( x, y)  6 x  4 y; g ( x, y)  ( x  y) 2
1. Определение наилучшего гарантированного выигрыша игрока 2 в случае, если
игрок 1 применяет стратегию «наказания»
v  min max g ( x, y)  min max( x  y) 2  0.25
2
3
x
x
y
y
2. Формирование множества ситуаций, в которых выигрыш игрока 2 больше чем v
D  ( x, y) ( x  y)2  0.25, x  X , y  Y  ( x, y) x  y  0.5, x  X

 
3. Определение максимального выигрыша игрока 1 в ситуациях D
K  sup f ( x, y)  8  
( x , y )D
4. Выигрыш первого игрока v  max{K , v11}  8  
1
3

x*  arg max{K , v11}  1,
x
5. Выигрыш второго игрока y  arg max{K , v11}  0.5   / 4,
*
y
v  g ( x* , y* )  (0.5   / 4) 2  0.25
2
3
Задачи для самостоятельного решения.
Решить дискретные иерархические игры вида 1, 2, 3, заданные матрицами:
8 6 8 
7 4 4


2  ; B   7 6 3 
а) A  4 0

 4 5 1
4 6 6




 1 9 4 5 
8
 7 7 9 8 
2
; B  
б) A  
 6 5 8 9 
8



4 5 8 
 9
7
8 8 1
6 9 4 
8 6 3

5 6 2
Решить непрерывные иерархические игры вида 1,2,3, заданные функциями:
а) f ( x, y)  6 x  4 y; g ( x, y)  ( x  y) 2
б) f ( x, y)  8 x 2  2 y; g ( x, y)  (3x  y) 2
Раздел 6. Изменения в рабочей программе, которые произошли после утверждения
программы.
Характер
изменений в
программе
Номер и дата
протокола заседания
кафедры, на котором
было принято
данное решение
Подпись заведующего
кафедрой,
утверждающего
внесенное изменение
Подпись декана
факультета (проректора
по учебной работе),
утверждающего данное
изменение
Раздел 7. Учебные занятия по дисциплине ведут:
Ф.И.О., ученое звание и степень
преподавателя
Давидюк Е.С.
Учебный год Факультет
2006/2007
ПМПЭ
Давидюк Е.С.
2007/2008
ПМПЭ
Новожилова Е.А.
2010-2011
ФМОИП
Давидюк Е.С.
2011-2012
ФМОИП
Специальность
080116 «Математические
методы в экономике»
080116 «Математические
методы в экономике»
080116 «Математические
методы в экономике»
080116 «Математические
методы в экономике»
Download