Тема 1. Общая математическая постановка игры. Лекции

advertisement
Тема 1. Общая математическая постановка игры
Лекция 1
Аннотация
Тема 1 курса «Исследование операций» посвящена описанию предмета
теории игр и общей математической постановке игры. Вводятся понятия
ситуации, функций выигрыша, равновесной ситуации, оптимальных
стратегий игроков, стратегически эквивалентных игр, антагонистической
игры. Изучаются свойства седловых точек функций.
Ключевые слова
Игра, стратегия, ситуация равновесия, антагонистическая игра, седловая
точка.
Методические рекомендации по изучению темы для студентов
Предполагается, что студент, изучающий курс, сначала ознакомится с
приведенными ниже лекциями, просмотрит материал данной темы в
предлагаемой учебно-методической литературе. Затем нужно будет ответить
на сформулированные контрольные вопросы к теме 1 и прислать ответы на
них преподавателю.
Методические рекомендации для преподавателей
Лекционный курс «Исследование операций» должен быть построен так,
чтобы в жестких временных рамках можно было изложить материал со
строгим его обоснованием и при этом согласовать по времени порядок
изложения с проведением практических занятий по данному курсу. В
частности, уже на втором практическом занятии согласно плану начинать
решение матричных игр в чистых стратегиях.
Свойства седловых точек и теорему о седловой точке удобно включить
в тему 1. Тогда далее в темах 2, 3 эти свойства и теорему удобно
использовать при обосновании методов решения матричных игр.
Источники информации
Основная литература:
1. Воробьев Н. Н. Теория игр. – М.: Наука. – 1985. – 371 с.
2. Дюбин Г. Н., Суздаль В. Г. Введение в прикладную теорию игр. – М.:
Наука. – 1981. – 336 с.
Дополнительная литература:
1. Оуэн Г. Теория игр. – М.: ЛКИ. – 2008.
2. Заботин Я. И. Теория игр. Часть 1. Набережные Челны. – 2003. – 37 с.
3. Петросян Л.А., Зенкевич Н.А., Семина В.А. Теория игр. Учебное пособие.
– М.: Наука. – 1998. – 300 с.
4. Давыдов Э.Г.. Исследование операций. – М.: Высшая школа. – 1990. – 383
с.
Интернет-ресурсы:
1. Онлайн-учебник теории игр Роджера МакКейна (Roger A. McCain)
ecsocman.hse.ru/text/22286719/
Глоссарий
Антагонистическая игра – игра двух лиц такая, что в любой из
сложившихся ситуаций выигрыш одного из игроков равен проигрышу
другого.
Игра – процесс, при котором каждый игрок выбирает одну из своих
стратегий поведения и в возникшей ситуации получает некоторый выигрыш.
Игра без седловой точки – антагонистическая игра, не имеющая решение.
Игра с седловой точкой – антагонистическая игра, имеющая решение, т. е.
имеющая седловую точку.
Оптимальная стратегия i –го игрока – компонента (стратегия) x i в
ситуации s = ( x 1 , x 2 , ... , x n ) , которая является решением игры.
Равновесная ситуация – то же, что и ситуация равновесия.
Решение игры – ситуация равновесия (см.) в игре.
Седловая точка антагонистической игры – то же, что и решение, или
ситуация равновесия (см.) антагонистической игры.
Ситуация – набор s = ( x 1 , x 2 , ... , x n ) , где n – число игроков в игре, а x i –
стратегия i-го игрока.
Ситуация, приемлемая для i –го игрока – это такая ситуация
s = ( x 1 , x 2 , ... , x n ) , изменение которой путем замены i –м игроком своей
стратегии x i на любую другую стратегию, может повлечь для i –го игрока
лишь уменьшение его выигрыша.
Ситуация равновесия – ситуация, приемлемая для всех игроков
одновременно.
Функция выигрыша i –го игрока – определенная на множестве всех
ситуаций функция H i ( s ) , значение которой в каждой ситуации
s = ( x 1 , x 2 , ... , x n ) означает величину выигрыша i –го игрока в этой ситуации.
Цена антагонистической игры – значение функции выигрыша первого
игрока в седловой точке игры.
Вопросы для изучения:
1. Примеры прикладных задач, которые могут быть поставлены в виде
игровых задач.
2. Математическая постановка игры (основные понятии и определения).
3. Стратегически эквивалентные игры и их свойства.
4. Антагонистическая игра.
5. Свойства седловых точек.
Текст лекции
Теория игр – это математическая теория, изучающая конфликтные
ситуации. Конфликтная ситуация характерна тем, что в ней две или более
сторон, противодействую друг другу, стараются добиться некоторой цели.
Примерами конфликтных ситуаций могут служить военные конфликты,
конфликты в экономике при наличии конкуренции и т. д. Цель названной
теории заключается в разработке методов, позволяющих вырабатывать
рекомендации по рациональному или в каком-то смысле оптимальному
поведению сторон в конфликтных ситуациях.
При изложении материала все определения, утверждения, примеры и
формулы для удобства ссылок на них будут помечаться двойной нумерацией.
Первое число пары будет означать номер темы, к которой относится
материал, а второе число – номер, соответственно, определения,
утверждения, примера или формулы внутри темы.
Приведем математическую постановку игровой задачи.
Понятие конфликт не определяется математически. Модель,
описывающая конфликт и поведение в нем участников, которые в результате
по определенным правилам получают в том или ином виде некоторый
выигрыш, называют игрой. Каждый из участников конфликта называется
игроком. Под словом «игрок» можно понимать человека, группу людей,
предприятие, и т. д.
Пусть в игре участвует n игроков. Установим взаимно однозначное
соответствие между множеством игроков и множеством натуральных чисел
I = {1, 2, … , n}.
Тогда каждый из игроков получает свой номер, и игрока можно называть
согласно присвоенному ему номеру.
Обозначим через S i множество всех стратегий, которыми может
пользоваться игрок с номером i Î I в игре. Любой элемент x i Î S i будем
называть стратегией i-го игрока.
Заметим, что множества S i могут быть как конечными, так и
бесконечными. В частности, все множества S i могут быть одинаковыми, т. е.
у всех игроков могут быть одни и те же стратегии поведения в конфликте.
Пусть каждый из игроков выбрал одну из своих стратегий x i Î S i .
Определение 1.1. Набор
s = ( x 1 , x 2 , ... , x n )
называется ситуацией.
Множество всех возможных ситуаций обозначим через S. Ясно, что
множество S представляет собой декартово произведение множеств S i , т. е.
S = ( S 1 ´ S 2 ´ ... ´ S n ) .
Если все множества S i конечны, то множество ситуаций также конечно. Если
хотя бы одно из множеств S i бесконечно, то ситуаций в игре бесконечное
число.
После того, как каждый из игроков выбрал свою стратегию поведения,
т. е. возникла ситуация s = ( x 1 , x 2 , ... , x n ) , следует определить, какой
выигрыш в этой ситуации получит каждый игрок.
Введем на множестве S ситуаций следующие n функций:
H i ( s ) = H i ( x 1 , x 2 , ... , x n ) , i Î I .
Определение 1.2. Если число H i ( s ) означает величину выигрыша,
получаемого i-ым игроком в сложившейся ситуации s Î S , то функцию
H i ( s ) , определенную на множестве S всех ситуаций, называют функцией
выигрыша i-го игрока.
На основе введенных понятий можно теперь дать математическое
определение игры.
Определение 1.3. Игрой называется процесс, при котором каждый
игрок выбирает свою стратегию x i Î S i поведения и в возникшей ситуации
s = ( x 1 , x 2 , ... , x n ) получает выигрыш, равный величине H i ( s ) . Если задан
набор множеств
Г=
I , { S i } i Î I , {H i ( s )} i Î
I
,
то говорят, что определена игра, а сам набор Г называют математической
моделью игры или игрой Г.
Из сказанного ясно, что величина выигрыша каждого игрока зависит не
только от стратегии, выбранной им, но и от стратегий, выбранных
остальными игроками. При этом каждый из игроков, выбирая стратегию
поведения в игре, руководствуется определенными интересами, и у каждого
игрока возникает вопрос об оптимальности его выбора. Выясним теперь, что
понимать под оптимальными стратегиями игроков в игре и что понимать под
решением игры.
Пусть в игре Г в результате выбора игроками своих стратегий
возникла следующая ситуация:
s * = ( x 1* , ... , x i* , ... , x n* ) .
В этой ситуации каждый из игроков получает выигрыш в размере
H i ( s * ) , i Î I . Если игрок с номером i заменит свою стратегию x i* Î S i на
стратегию x ¢i Î S i , а остальные игроки свои стратегии оставят прежними, то
возникнет новая ситуация ( x 1* , ... , x i*- 1 , x¢i , x i*+ 1 , ... , x n* ) , которую обозначим
через s *  x ¢i .
Определение 1.4. Ситуация s * называется приемлемой для i-го игрока,
если выполняются неравенства
H i ( s *  x ¢i ) £
H i (s* )
" x ¢i Î S i .
Определение 1.5. Ситуация s * , называется решением игры или
ситуацией равновесия (по Нэшу), если она является приемлемой для всех
игроков одновременно. При этом, если ситуация s * является решением игры,
то стратегия x i* называется оптимальной для i-го игрока.
Сразу отметим, что не каждая игра имеет решение.
Введем класс так называемых стратегически эквивалентных игр.
Определение 1.6. Пусть определены две следующие игры:
Г¢=
I,
{ S i }i Î I , { H ¢i ( s ) }i Î I ,
Г ¢¢ =
I,
{ S i }i Î I , { H ¢i ¢( s ) }i Î I
,
отличающиеся между собой только функциями выигрышей игроков. Игра
Г ¢¢ называется стратегически эквивалентной игре Г ¢ (записывается в виде
Г ¢¢: Г ¢), если существуют такие вещественные числа k i > 0 и c i , что для
всех
i  I и всех s  S выполняются равенства
H ¢i¢( s ) = k i H i ¢( s ) + c i .
Легко проверить, что для стратегически
справедливы следующие три свойства.
эквивалентных
игр
1. Свойство рефлексивности: всякая игра
Г=
I , {Si }iÎ I , {Hi (s)}iÎ I
эквивалентна самой себе.
2. Свойство симметрии: если Г ¢¢: Г ¢, то Г ¢: Г ¢¢.
В силу второго свойства игры Г ¢ и Г ¢¢можно теперь называть просто
стратегически эквивалентными.
3. Свойство транзитивности: если Г : Г ¢ и Г ¢: Г ¢¢, то Г : Г ¢¢.
Теорема 1.1 (о стратегически эквивалентных играх). Стратегически
эквивалентные игры Г ¢и Г ¢¢ имеют одни и те же ситуации равновесия.
Антагонистические игры
Пусть задана игра Г = I , { S i } i Î I , {H i ( s )} i Î I , в которой
I  {1, 2} .
Определение 1.7.
равенство
Если для каждой ситуации s  S выполняется
H1 (s)  H 2 (s)  0,
то игра Г называется антагонистической.
Для антагонистической игры Г стандартную форму ее записи
Г = I , { S i } i Î I , {H i ( s )} i Î I можно упростить. А именно, положим
S1 = X ,
S2 = Y ,
Тогда ситуация s будет представлять собой пару ( x , y ) , где
x Î X ,
y Î Y .
Далее, так как в антагонистической игре для каждой ситуации s  S
выполняется равенство
H1 (s) = - H 2 (s),
то нет необходимости вводить две функции выигрышей. Введем функцию
выигрыша только первого игрока, положив
K ( x, y) = H 1 ( x, y) = H 1 ( s) .
Тогда функция выигрыша второго игрока будет иметь вид
H 2 ( x, y) = - K ( x, y) .
Таким образом, антагонистическая игра определяется набором
Г =
X , Y , K ( x, y ) ,
где X , Y – множества стратегий первого и второго игроков, соответственно,
а K ( x , y ) , где x Î X , y Î Y , – функция выигрыша первого игрока.
Согласно определению 1.4 пара ( x * , y * ) является решением
антагонистической игры, если одновременно выполняется два следующих
неравенства:
K ( x , y * ) £ K ( x *, y *)
" xÎ X,
- K ( x *, y ) £ - K ( x * , y *)
" y Î Y,
или
K ( x , y * ) £ K ( x *, y * ) £ K ( x *, y )
Определение
" x Î X, y Î Y.
(1.1)
1.8.
f ( x, y )
Пусть функция
определена при
x Î X Ì R m , y Î Y Ì R n . Пара ( x , y )  X  Y
называется седловой
точкой функции f ( x , y ) на множестве X  Y , если
f ( x, y ) £ f ( x , y ) £ f ( x , y )
" xÎ X, y Î Y .
Таким образом, согласно условию (1.1) решением антагонистической
игры является седловая точка ( x * , y * ) функции выигрыша K ( x , y ) первого
игрока на множестве X  Y , а оптимальными стратегиями первого и второго
игроков являются первая и, соответственно, вторая координата седловой
точки ( x * , y * ) функции K ( x , y ) на множестве X  Y . В связи с этим
решение антагонистической игры называют также седловой точкой игры.
Приведем далее несколько вспомогательных утверждений, касающихся
свойств седловых точек функции общего вида f ( x , y ) .
Свойства седловых точек
Лемма 1.1. Пусть функция f ( x , y ) определена на множестве X ´ Y ,
где X  R m , Y  R n . Если точки x Î X , y Î Y , таковы, что выполняется
неравенство
f ( x, y ) £ f ( x , y )
" x Î X, y Î Y,
то пара ( x , y ) является седловой точкой функции f ( x , y ) на множестве
X´ Y.
Следствие. Если число V таково, что для элементов x Î X , y Î Y
выполняются неравенства
f ( x, y ) £ V £ f ( x , y )
" x Î X, y Î Y,
то ( x , y ) – седловая точка функции f ( x , y ) на множестве X ´ Y , и
V  f ( x, y ).
Лемма 1.2. Если ( x¢, y¢) , ( x¢¢, y¢¢) – седловые точки функции f ( x , y )
на множестве X ´ Y , то
1) точки ( x¢, y¢¢) , ( x¢¢, y¢) также являются седловыми для функции
f ( x , y ) на множестве X ´ Y ;
2) во всех седловых точках значения функции f ( x , y ) совпадают.
Теорема 1.2 (о максимине и минимаксе). Для определенной на X ´ Y
функции f ( x , y ) имеет место неравенство
max min f ( x , y)
xÎ X
yÎ Y
£
min max f ( x , y )
yÎ Y
xÎ X
.
Приведем еще одно утверждение, касающееся свойств седловых точек,
которое понадобится далее при отыскании решения некоторых игр.
Теорема 1.3 (о седловой точке) Для определенной на X ´ Y функции
f ( x , y ) имеют место следующие утверждения:
а) для того чтобы функция f ( x , y ) имела седловую точку, необходимо
и достаточно, чтобы выполнялось равенство
max min f ( x , y)
xÎ X
yÎ Y
=
min max f ( x , y )
yÎ Y
xÎ X
б) если ( x 0 , y 0 ) – седловая точка функции f ( x , y ) , то
f ( x 0 , y 0 ) = max min f ( x , y)
xÎ X
yÎ Y
=
min max f ( x , y )
yÎ Y
xÎ X
Определение 1.9. Пусть K ( x , y ) – функция выигрыша первого игрока в
антагонистической игре Г. Числа
V = max min K ( x , y ) ,
xÎ X
yÎ Y
V = min max K ( x , y )
yÎ Y
xÎ X
называют, соответственно, нижней и верхней ценой игры Г, а если
V = V @ V , то число V называют ценой игры Г.
Согласно теореме 1.2 нижняя цена антагонистической игры не
превосходит верхней цены. Теорема 1.3 утверждает, что игра имеет цену
тогда и только тогда, когда максимин равен минимаксу, и цена игры равна
значению функции выигрыша первого игрока в седловой точке.
Определение 1.10. Если функция выигрыша K ( x , y ) первого игрока в
антагонистической игре имеет седловую точку на множестве X  Y , то
такую игру называют игрой с седловой точкой, а в противном случае –
игрой без седловой точки.
Таким образом, чтобы уметь решать игры с седловой точкой, надо
уметь находить седловую точку функции выигрыша K ( x , y ) первого игрока
и значение V = min max K ( x , y ) . К настоящему времени разработан ряд
yÎ Y
xÎ X
методов последовательных приближений для отыскания минимакса в случае,
когда множества X , Y являются выпуклыми, а функция K ( x , y ) является
выпуклой по y Î Y для любого x Î X и одновременно вогнутой по x Î X
для любого y Î Y . Наиболее простые и эффективные алгоритмы
разработаны для случая, когда оба множества X , Y являются конечными. К
изучению таких игр и перейдем в следующей теме.
Контрольные вопросы к теме 1:
1. Привести пример экономической задачи, которая может быть
интерпретирована как задача теории игр, имеющая решение. Дать
математическую постановку этой задачи. Пояснить на этом примере, что
понимать под ситуацией, функциями выигрыша игроков, оптимальными
стратегиями игроков, ценой игры.
2. Привести пример двух стратегически эквивалентных игр. Пояснить, что
они являются стратегически эквивалентными.
3. Доказать свойство рефлексивности для стратегически эквивалентных игр.
4. Доказать свойство симметрии для стратегически эквивалентных игр.
5. Доказать свойство транзитивности для стратегически эквивалентных игр.
6. Привести пример антагонистической игры без седловой точки.
7. Привести в двумерном случае пример функции, которая имеет седловую
точку на прямом произведении двух множеств.
Download