Иерархические игры

advertisement
1
17.11.09
Иерархические игры
Иерархия
Теория игр и теория принятия решений.
Модель – всегда для определенных целей.
Пример: барометр и хронометр.
Пример: Уником – Сбербанк.
В построенной модели оперирующая сторона явно может не присутствовать.
Иерархические игры.
Определение. Игра с иерархической структурой – модель конфликтной ситуацией
при фиксированной последовательности ходов и обмена информацией участников.
(Математическая энциклопедия, И. А. Ватель, Ф. И. Ерешко).
 Неэлементарная теория игр.
 Порядок ходов.
 «Игры с фиксированным порядком ходов».
 Личностный фактор. Мехлис.
 «Игры с непротивоположными интересами».
 Научная работа и пьянка.
3. Принцип максимального гарантированного результата
 Третий принцип Гермейера.
 Четвертый принцип Гермейера.
 Пример: осторожность – антагонизм – персонификация – религия.
 Пример: закон о монетизации льгот.
 Обобщенный принцип максимального гарантированного результата.
4. Синтез оптимальной структуры.
 Пример: план бухгалтерских счетов – фискальный.
 Пример: Институт комиссаров.
 Пример: Китай и Германия.
 Найти решение для оптимальной структуры проще.
 Сложность управления как второй критерий.
1.




2.

Принцип максимального гарантированного результата
– Право, боюсь я на первых-то порах, чтобы какнибудь не понести убытку. Может быть, ты, отец
мой, меня обманываешь, а они того… они
больше как-нибудь стоят.
Н.В. Гоголь
На протяжении всей лекции будут рассматриваться только игры двух лиц. Пусть
Г=<U1,U2,g1,g2> – такая игра. Везде далее будем предполагать, что первый игрок, в силу
своего положения обладает правом первого хода, то есть первым выбирает свою
стратегию u1 и имеет право и обязан сообщить ее противнику. В таком случае второй
игрок, принимая свое решение, решает обычную задачу оптимизации. Следовательно, его
действия становятся предсказуемыми, и первый игрок, выбирая u1, должен учитывать это.
В конце 60-х годов двадцатого века Ю.Б. Гермейер предложил следующий
принцип оптимальности.
470180447 25.04.2016
2
Определение. Множество рациональных ответов второго игрока на стратегию u1
первого1
{u 2 U 2 : g 2 (u1 , u 2 )  max g 2 (u1 , w)}, если max g 2 (u1 , w) достигается,

wV
wV
1
B(u )  
2
2
2
1
2
2
1
{u U : g (u , u )  sup g (u , w)   } в противном случае.

wV

(Здесь  заранее заданное и известное обоим игрокам положительное число).
 М. Захаров характеризовал Кочкарева, как человека не думающего о
последствиях своих действий.
 Гипотеза о точной реализации максимума
Определение.
Максимальный гарантированный результат первого игрока
1
R()  sup inf g (u, v) .
uU 1 vB ( u )
Близкий по смыслу принцип оптимальности изучался в начале двадцатого века Г.
фон Штакельбергом. Будем считать, что первому игроку известно о том, что его партнер
благожелателен, то есть из равноценных для него стратегий выбирает ту, которая лучше
для первого игрока. Тогда естественно следующее
Определение. Максимальный гарантированный результат первого игрока в игре с
благожелательным противником S ()  sup sup g 1 (u, v) .
uU 1 vB ( u )
Свойства максимального гарантированного результата
Без труда устанавливается справедливость следующих трех утверждений.
Лемма. Для любой игры Г R()  sup inf2 g1 (u, v) .
uU 1 vU
Лемма. Для любого >0 и любой стратегии u1 первого игрока в множестве B(u1)
найдется стратегия u2, для которой g 2 (u1 , u 2 )  inf1 sup g 2 (u, v)   . Если стратегия u1
uU vU 2
такова, что верхняя грань sup g (u , v) достигается, то для любой стратегии u2B(u1)
2
1
vU 2
1
выполняется неравенство g (u , u 2 )  inf1 sup g 2 (u, v) .
2
uU vU 2
Лемма. Для любой игры Г справедливо неравенство R(Г)≥S(Г).
Теорема 1. Если <*Г,,c1,c2> – квазиинформационное расширение игры Г, то
R(*Г)R(Г).
Доказательство. Достаточно доказать, что при любом u1U1 стратегия c1(u1)
гарантирует первому игроку в игре *Г по крайней мере такой же выигрыш, какой
гарантирует стратегия u1 в игре Г.
Рассмотрим произвольную стратегию u1 в игре Г=<U1,U2,g1,g2> и стратегию c1(u1)
в игре *   *U 1 , *U 2 , * g 1 , * g 2 . Зафиксируем произвольное >0. Пусть стратегия u2U2
выбрана
так,
g 2 (u1 , u 2 )  sup g 2 (u1 , v)   .
что
vU 2
2
1
sup * g 2 (c1 (u1 )), * v)  * g 2 (c1 (u1 )), c 2 (u 2 )))  g 2 (u1 , u 2 )  sup g (u , v)   .
* v* U
Тогда
В
силу
vU 2
2
произвольности  отсюда следует, что sup * g 2 (c1 (u1 )), * v)  sup g 2 (u1 , v) .
* v * U
2
vU 2
В обозначении не учтена зависимость множества рациональных ответов от рассматриваемой игры, хотя в
дальнейшем будут систематически рассматриваться пары игр. К какой именно игре относится данное
множество всегда будет ясно из контекста, поэтому я позволяю себе некую вольность, дабы не перегружать
формулы.
1
470180447 25.04.2016
3
Обратно,
пусть
стратегия
*
g (c (u )), u )  sup * g (c (u )), * v)  
2
*
1
1
2

2
* v * U
1
условию
 (c (u ), * u )  (u , u ) .
и
1
удовлетворяет
u2
1
2
1
2
1
Тогда
2
sup g 2 (u1 , v)  g 2 (u1 , u 2 )  * g 2 (с1 (u1 ), * u 2 )  sup * g 2 (с1 (u1 ), * v)   . Так как число  может
vU 2
* v* U
быть
выбрано
сколь
2
1
2
1
sup g (u , v)  sup * g (с (u1 ), * v) .
vU 2
* v* U
2
угодно
малым,
получаем
неравенство
2
Окончательно имеем sup g 2 (u1 , v)  sup * g 2 (с1 (u1 ), * v) . С учетом этого равенства
vU 2
* v* U
2
непосредственно проверяется, что если максимум max2 g 2 (u1 , v) достигается в точке u2, то
vU
есть g (u , u )  max2 g (u , v) , то в точке c (u ) достигается максимум max2 * g 2 (с1 (u1 ), * v) .
2
1
2
2
1
2
2
* v * U
vU
И
обратно,
если
в
точке
*
u
достигается
2
максимум
max2 * g 2 (с1 (u1 ), * v)
* v * U
и
 (c1 (u1 ), * u 2 )  (u1, u 2 ) , то в точке u2 достигается максимум max2 g 2 (u1 , v) .
vU
Из
полученных
результатов
следует,
что
если
*
u 2  B(c1 (u1 ))
и
 (c1 (u1 ), u2 )  (u1 , u 2 ) , то u2B(u1), то есть B(c1(u1))c2(B(u1)). Поэтому
inf
v B ( с1 ( u1 ))
g1 (с1 (u1 ), v ) 
inf
2
1
* vc ( B ( u ))
*
g 1 (c1 (u1 ), * v)  inf 1 * g 1 (c1 (u1 ), с 2 (v))  inf 1 g 1 (u1 , v) .
vB ( u )
В силу произвольности u имеем тогда
sup
inf1 1 * g 1 ( * u1 , * v)  sup
inf
А
c1 (U 1 )  *U 1 ,
vB ( u )
1
* vB ( с ( u ))
* u c (U )
1
1
1
поскольку
sup
*
1
*u
inf
1
U 1 * vB ( * u )
*
1
u
очевидно
1 1
U 1 * vB ( с ( u ))
*
g 1 (с1 (u1 ), * v)  sup inf 1 g 1 (u1 , v) .
u1U 1 vB ( u )
окончательно
имеем
g 1 ( * u1 , * v)  sup inf 1 g 1 (u1 , v) . Теорема доказана.
u1U 1 vB ( u )
Игра Г1
и
Лемма. Пусть в игре Г=<U1,U2,g1,g2> множества U1 и U2 компактны, а функции g1
g2
непрерывны.
Обозначим
Тогда
E(u)  {v U 2 : g 2 (u, v)  max2 g 2 (u, w)}.
wU
R()  sup min g (u, v) .
1

uU 1 vE ( u )
Доказательство. При сделанных предположениях верхняя грань sup g 2 (u1 , v)
vU 2
достигается при любой стратегии u1U1, поэтому всегда B(u )  E(u ) . Множество E (u1 )
замкнуто, как прообраз замкнутого множества (точки). А так как оно содержится в
компактном множестве U1, оно само является компактным. Поэтому минимум
min g1 (u1 , v) достигается.
1
1
vE  ( u )
Верхняя грань sup min g1 (u, v) может не достигаться даже в очень простых

uU 1 vE ( u )
случаях.
Пример. Пусть U1=U2=[0,1], g1(u1,u2)=u1–u2, g2(u1,u2)= u2 (u1+u2–2).
Значения функции выигрыша второго игрока всегда не положительны и равны
нулю при u2=0. Если первый игрок выберет стратегию u1<1, то u2=0 будет единственным
рациональным ответом второго игрока, а значит первый игрок гарантированно получит
выигрыш равный u1. Это выигрыш может быть сделан сколь угодно близким к 1. А
выигрыш равный 1 первый игрок может получить только в одном случае, когда u1=1 и
470180447 25.04.2016
4
u2=0. Но при u1=1 у второго игрока имеется два рациональных ответа: u2=0 и u2=1.
Поэтому с гарантией первый игрок может рассчитывать только на нулевой выигрыш.
 Максимин со связанными переменными
 Пример: назначение цен
Лемма. Пусть в игре Г=<U1,U2,g1,g2> множества U1 и U2 компактны, а функции g1
и g2 непрерывны. Тогда S ()  max1 max g1 (u, v) .
uU

Доказательство.
vE  ( u )
При

сделанных
предположениях
множество
H  (u1 , u 2 ) : g 2 (u1 , u 2 )  max2 g 2 (u1 , v) замкнуто, так как задается уравнением, в левой и
vU
правой частях которого стоят непрерывные функции. А так как оно содержится в
компактном множестве U1U2, множество H само компактно. Следовательно, в некоторой
точке  u01 , u02  достигается максимум max g 1 (u, v) . Тогда u01 – одна из оптимальных
 u ,v H
стратегий первого игрока.
Сложные иерархические системы
Принято считать, что иерархия предполагает наличие многоуровневой
разветвленной структуры. В данной лекции мы ограничиваемся рассмотрением игр двух
лиц. Такие модели принципиально проще моделей общего вида. Это важная, но не
единственная причина такого выбора. Многие интересные в прикладном плане модели
сводятся к рассматриваемому нами частному случаю с помощью декомпозиции или
агрегирования. Приведем несколько примеров.
Пусть в рассматриваемой системе оперирующая сторона стоит ни на самом
верхнем уровне иерархии, то есть имеется игрок, который стоит выше оперирующей
стороны, и, соответственно, принимает свое решение раньше. Тогда, в случае, когда
имеется всего два игрока, для оперирующей стороны задача принятия решения становится
просто задачей оптимизации. В общем случае можно считать уже выбранные стратегии
всех игроков, которые по рангу выше оперирующей стороны, параметрами игры.
Поэтому, по крайней мере, на уровне теоретического анализа можно ограничиться
рассмотрением того случая, когда оперирующая сторона – это игрок самого верхнего
уровня.
Весьма часто встречаются иерархические системы так называемого веерного типа.
Пусть имеется игра Г=<{1,2,…,n},U1,…,Un,g1,…,gn> в которой игрок с номером 1 – это
оперирующая сторона, а критерии всех стальных игроков имеют специальный вид:
gi(u1,u2,…,un)=hi(u1,ui) для i=2,…,n. Тогда по-прежнему оперирующая сторона может
оценить множество наилучшего ответа i игрока на его стратегию u1:
Bi (u1 )  Arg max
hi (u1 , u i ) . Тогда его максимальный гарантированный результат равен
i
i
u U
n
max
1
1
min
n
u U ( u 2 ,...,u )B ( u1 )
g 1 (u1 , u 2 ,..., u n ) , где B(u1 )   B i (u1 ) .
i 2
Рассмотрим
n
игру
двух
лиц
  1, 2 , U , U , g , g
1
2
1
2
,
в
которой
n
U  U 1 ,U   U i , g  g 1 , g   g i . Непосредственно проверяется, что данные две
1
2
i 2
1
2
i2
модели эквивалентны в том смысле, что максимальный гарантированный результат
первого игрока и его оптимальные стратегии совпадают в обеих моделях, а если
2
u  (u 2 ,..., u n ) – наилучший ответ второго игрока на оптимальную стратегию центра в
агрегированной модели, то ui – наилучшие ответы на ту же стратегию игроков в исходной
модели и наоборот.
470180447 25.04.2016
5
В общем случае необходимы некоторые дополнительные предположения о
взаимодействии игроков между собой. Рассмотрим, например, двухуровневую
иерархическую систему, в которой на верхнем уровне находится один игрок
(оперирующая сторона), а остальные игроки равноправны и принимают свои решения,
зная стратегию «центра». Во многих случаях оправданным является предположение о том,
что игроки нижнего уровня стремятся к выбору равновесия по Нэшу.
Тогда максимальный гарантированный результат первого игрока равен
max
min
g 1 (u1 , u 2 ,..., u n ) , где B(u1) – множество всех ситуаций равновесия в игре
1
n
1
1
1
u U ( u ,...,u )B ( u )
n
<{2,…,n},U2,…,Un,h2,…,hn>, в которой функции выигрыша h :  U i 
определены
i2
условиями hi(u2,…,un)=gi(u1,u2,…,un).
В шестой лекции было показано, что ситуации равновесия – это точки максимума
 g (u )  g i (u v i )  по (u2,…,un) при фиксированном u1. Таким образом,
функции min inf
i
i 

2i  n v U
рассматриваемая задача сводится к исследованию иерархической игры двух лиц
  1, 2 , U , U , g , g
1
2
1
2
,
в
которой
n
U  U 1 ,U  U i , g  g 1 ,
1
2
1
i 2
2
 g (u )  g i (u vi )  .
g  min inf

2i  n vi U i 
 Трехуровневые системы.
 Ромбовидные системы.
Игра Г2
Найдем максимальный гарантированный результат первого игрока в
метарасширении 1Г игры Г=<U1,U2,g1,g2> с правом первого хода у игрока 1. По традиции
эту модель называют игрой Г2.
Введем обозначения
L  sup inf1 g 2 (u, v), D  {(u, v) U 1 U 2 : g 2 (u, v)  L}, K  sup g1 (u, v) ,
vU 2 uU
( u , v )D
E  {v U :inf1 g (u, v)  max2 inf1 g (u, w)} , M  inf sup g1 (u, v) .
2
2
2
uU
wU
vE uU 1
uU
Будем считать, что игра Г=<U ,U ,g ,g > такова, что верхняя грань в определении
величины L достигается, или, что то же самое, множество E не пусто. Этим условиям
удовлетворяют, например, игры, в которых множества U1 и U2 компактны, а функции g1 и
g2 непрерывны. Тогда справедлива
Теорема 2. Максимальный гарантированный результат центра в игре Г2 равен
наибольшему из чисел K и M.
Доказательство. Докажем сначала, что R(Г2)max{K,M}.
Фиксируем произвольное >0. Выберем точку  u01 , u02  из множества D, для которой
1
2
1
2
выполняется неравенство g 1 (u01 , u02 )  K   и определим функцию u1p : U 2  U 1 условием:
для любого u2 выполняется неравенство g 2 (u1p (u 2 ), u 2 )  g 2 (u10 , u02 ) . Такая функция
существует. Например, для любой точки
u , u 
1
0
2
0
из множества D подходит функция
u1p (u 2 )  arg min1 g 2 (u, u 2 ) (или, если этот минимум не достигается, функция при каждом u
uU
достаточно точно реализующая соответствующую нижнюю грпнь).
Пусть функция u1r : U 2  U 1 определяется условием
 u1 , если u 2  u02 ,
u1r (u 2 )   1 0 2
2
2
u p (u ), если u  u0 .
470180447 25.04.2016
6
Оценим
множество
B(u1r ) .
g (u (u ), u )  g (u , u ) .
2
1
r
2
0
2
0
2
1
0
А
2
0
В
в
точке
любой
другой
g (u (u ), u )  g (u (u ), u )  g (u , u ) .
2
1
r
2
2
2
1
p
2
2
2
1
0
второй
u 02
точке
inf g 1 (u1r (v), v)  g 1 (u1r (u02 ), u02 )  g 1 (u10 , u02 )  K  
inf 1 g 1 (u* (v), v)  K   .
В
u  (U ,U ) vB ( ur )
2
1
силу
выигрыш
получит
выигрыш
он
u2
1
r
произвольности
а
2
0
и
vB ( u1r )
sup
получает
B (u )  {u } ,
Поэтому
2
0
игрок
тем

значит
более
имеем
отсюда
inf 1 g 1 (u* (v), v)  K .
sup
u  (U ,U ) vB ( ur )
2
1
Таким образом, если KM, то неравенство R(Г2)max{K,M} доказано. Остается
рассмотреть случай, когда K<M.
В этом случае, если u2E и стратегия u1 удовлетворяет условию g1 (u1 , u 2 )  K , то
выполняется равенство g 2 (u1 , u 2 )  min1 g 2 (u, u 2 )  L . Действительно, предположим
uU
противное. Так как для любого u E выполняется неравенство g2(u1,u2)L, то наше
предположение приводит к неравенству g2(u1,u2)>L. А значит точка (u1,u2) принадлежит
множеству D и выполняются неравенства K  g1 (u1 , u 2 ) , что противоречит неравенству
g1 (u1 , u 2 )  K .
 Картинка
Фиксируем положительное <M–K и определим теперь стратегию u1a условием
2
g1 (u1a (u 2 ), u 2 )  sup g1 (u, u 2 )   . Выберем стратегию u1q , удовлетворяющую условию:
uU 1
g 2 (u1q (u 2 ), u 2 )  L для всех u2 не принадлежащих множеству E. Рассмотрим стратегию
u1a (u 2 ), если u 2  E ,
u (u )   1 2
2
 uq (u ), если u  E.
Оценим множество B (ui1 ) . Если u2E, то второй игрок получает выигрыш
1
i
2
g 2 (ui1 (u 2 ), u 2 )  g 2 (u1a (u 2 ), u 2 )  min1 g 2 (u, u 2 )  L .
uU
Если
же
u2E,
то
g 2 (ui1 (u 2 ), u 2 )  g 2 (u1q (u 2 ), u 2 )  L . Таким образом, B(ui1 )  E . Следовательно,
inf 1 g1 (u1r (v), v)  inf g1 (u1r (v), v)  inf g1 (u1a (v), v)  inf sup g1 (u, v)    M   ,
vE
vB ( ui )
и тем более
sup
vE
vE uU 1
inf g 1 (u* (v), v)  M   . Поскольку  может выбрано произвольно
1
u  (U ,U ) vB ( ur )
2
1
малым, выполняется и неравенство
sup
inf g 1 (u* (v), v)  M .
1
u  (U ,U ) vB ( ur )
2
1
Обратное неравенство R(Г2)max{K,M} непосредственно
утверждения теоремы 3.
 Пример: оптовые и розничные цены
 Неполное наказание
 Результат в Г2 лучше, чем в Г1
 В оптимальном расширении решение выглядит проще
получается
из
Оптимальное расширение
Теорема 3. Если *Г – произвольное расширение той же игры Г, то R(*Г)max{K,M}.
Доказательство. Фиксируем произвольное >0. Выберем стратегию * u1  *U 1 так,
что
*u
2
inf
B ( * u )
1
*
g 1 ( * u1 , * u 2 )  sup
470180447 25.04.2016
1
1 *u
* u * U
inf
2
B ( * u )
1
*
g 1 ( * u1 , * u 2 )    R( * )   . Пусть * u 2  B ( * u1 ) .
7
Допустим
1
2
1
Если
*
что
*
g 2 ( * u1 , * u 2 )  L .
 ( * u1 , * u 2 )  D
Тогда
и
g ( * u , * u )  g ( ( * u , * u ))  K и, следовательно, R(*Г)K+max{K,M}+.
1
*
сначала,
1
2
же
*
g 2 ( * u1 , * u 2 )  L ,
то
для
u2E
любого
имеем
g 2 ( * u1 , c2 (u 2 ))  g 2 ( ( * u1 , c2 (u 2 )))  g 2 (u1 , u 2 )  min
g 2 (u1 , u 2 )  max
min1 g 2 (u1 , u 2 )  L ,
1
1
2
2 1
u U
u U u U
а
значит стратегия c2(u2) принадлежит множеству рациональных ответов B ( * u1 ) . А тогда
*u
2
inf
*
B ( * u )
1
g1 ( * u1 , * u 2 )  2inf2
c ( E )
*u
*
g 1 ( * u1 , * u 2 ) 
 inf
g (u , u 2 )  min
max
g 1 (u1 , u 2 )  M
* g ( ( * u , c (u )))  inf
2
2
2
1
1
1
1
2
2
u E
1
1
u E
u E u U
Таким образом, в этом случае R(*Г)M+max{K,M}+.
Итак, в обоих случаях R(*Г)max{K,M}+. А так как число  произвольно, отсюда
следует неравенство R(Г*) max{K,M}. Теорема доказана.
Игра Г3
Найдем максимальный гарантированный результат первого игрока в
метарасширении 12Г игры Г=<U1,U2,g1,g2> с правом первого хода у игрока 1. По традиции
эту модель называют игрой Г3.
 Второй игрок знает выбор первого
 Желание увеличить выигрыш
Пусть игра Г=<U1,U2,g1,g2> такова, что множества U1 и U2 компактны, а функции g1
2
и g непрерывны.
Введем обозначения
L  min1 max2 g 2 (u, v), D  {(u, v) U 1 U 2 : g 2 (u, v)  L}, K   sup g 1 (u, v) ,
uU
vU
( u ,v )D
E(u)  {v U : g (u, v)  max2 g (u, w)}, M   sup min g1 (u, v) .
2
2
2

uU 1 vE ( u )
wU
Теорема 4. Максимальный гарантированный результат центра в игре Г3 равен
наибольшему из чисел K и M.
Доказательство. Теорема может быть доказана тем же методом, которым был
доказана теорема 2. Мы приведем другое, более техническое доказательство, сводящее
рассматриваемую задачу к уже решенной.
Рассмотрим квазиинформационное расширение <Г*,,c1,c2> игры Г, определенное
2
1
2
1
1
1
2
1
2
условиями:
,
2U   (U , U ) ,
2U  U ,
2   2U , 2U , 2 g , 2 g
2
g 1 ( 2 u1 , 2 u 2 )  g 1 ( 2 u1 , 2 u1 ( 2 u1 )) ,
2
g 2 ( 2 u1 , 2 u 2 )  g 2 ( 2 u1 , 1 u 2 ( 2 u1 )) ,
 ( 2 u1 , 2 u 2 )  ( 2 u1 , 2 u 2 ( 2 u1 )) , c1 ( 2 u1 )  2 u1 , а отображение c2 ставит в соответствие
элементу u2U2 функцию 2 u 2 : U 1  U 2 , тождественно равную u2. Покажем, что игра 2Г
удовлетворяет условиям теоремы 2.
Определим функцию 2 ua2 условием g 2 (u1 , 2 ua2 (u1 ))  max2 g 2 (u1 , v) для любого
vU
u U . Тогда
1
1
sup
2u
2
inf
1
2U 2 2 u 2U
1
2
g 2 ( 2 u1 , 2 u 2 )  inf
1
2u
2U
1
2
g 2 ( 2 u1 , 2 ua2 ) 
 inf
g 2 (u1 , 2 ua2 (u1 ))  inf
max2 g 2 (u1 , v)  min1 max2 g 2 (u, v)
1
1
1
1
u U
u U
uU
vU
С другой стороны, если u1 удовлетворяет условию
max g 2 (u1 , v)  min max g 2 (u, v),
vV
то
470180447 25.04.2016
uU
vV
vU
.
8
inf
sup
1
1
2 u 2U
2
2
2 u 2U
2
g 2 ( 2 u1 , 2 u 2 )  sup
2
2
2 u 2U
2
g 2 (с1 (u1 ), 2 u 2 )  sup g 2 (u1 , 2 u 2 (u1 )) 
2u
2
2U 2
 sup g 2 (u1 , u 2 )  max2 g 2 (u1 , v)  min1 max2 g 2 (u, v).
С учетом неравенства sup
2u
sup
2u
2
2
inf
1
1
U 2 2 u 2U
2
2
2
uU
vU
u 2 U 2
g ( 2 u , 2 u )  inf
1
2
inf
1
1
U 2 2 u 2U
2
1
2
vU
sup
1
2
2
2 u 2U
2 u 2U
g 1 ( 2 u1 , 2 u 2 )  inf
1
sup
1
2
2
2 u 2U
2 u 2U
2
2
g 2 ( 2 u1 , 2 u 2 ) , получим
g 2 ( 2 u1 , 2 u 2 )  min1 max2 g 2 (u, v) ,
uU
vU
причем верхняя грань в левой части равенства достигается, например, на функции 2 ua2 .
Поэтому выполняются условия теоремы 2, и для вычисления максимального
гарантированного результата первого игрока в игре Г* достаточно вычислить величины
1
2
2
2
2 L  max2 inf 1 2 g ( 2 u , 2 v ), 2 D  {( 2 u , 2 v )  2U  1U :2 g ( 2 u , 2 v )  2 L},
2 u 2 U
2 v 2 U
2
K  sup
g ( 2 u, 2 v) , 2 E  { 2 v  2U 2 : inf 1 2 g 2 ( 2 u , 2 v)  max2 inf
1
2
( 2 u , 2 v )D
2 u 2 U
2
M  inf sup
2 v 2 E
2 u 2 U
1
2
1
2 u 2 U
2 w 2 U
2
g 2 ( 2 u, 2 w)} ,
g 1 ( 2 u, 2 v) .
Только что доказано, что 2L=L. Для вычисления величины 2K нужно решить задачу
оптимизации. Информированность в таких задачах никакой роли не играет. Формально
это доказывается следующим образом.
Пусть
(u,v)
–
произвольный
элемент
из
D.
Тогда
2
1
2
2
1
2

2 g (c (u ), c (v ))  g (u , v )  L  2 L , то есть (c (u),c (v)) принадлежит 2D, и поскольку
2
g 1 (c1 (u ), c 2 (v))  g 1 (u, v) , выполняется неравенство K2K. Обратно, если ( 2 u, 2 v)  2 D , то
g 2 ( 2 u, 2 v( 2 u ))  2 g 2 ( 2 u, 2 v)  2 L  L , а значит ( 2 u, 2 v( 2 u ))  D . Следовательно, так как
g 1 ( 2 u, 2 v( 2 u ))  2 g 1 ( 2 u, 2 v) , приходим к неравенству K2K. Окончательно имеем K=2K.
Рассмотрим
2
произвольную
функцию
определенную
условием
u 2 (u )  Arg min g1 (u, v) для любого uU1. Непосредственно проверяется, что 2 u 2  2 E .
vE  ( u )
По
g1 (u, u*2 (u ))  min g1 (u, v) ,
определению
uU
uU
M  inf sup
2 v 2 E
2 u 2 U
1
2
а
vE  ( u )
max1 g1 (u, 2 u 2 (u ))  max1 min g1 (u, v)  M 
2
u*2 ,
значит
и,
vE  ( u )
следовательно
g 1 ( 2 u , 2 v)  inf sup g 1 (u , 2 v(u ))  max1 g 1 (u , 2 u 2 (u ))  M  .
2 v 2 E
uU
uU 1
В случае KM теорема 4 доказывается ссылкой на теорему 2, так как тогда
MMK=
2
2K и, следовательно, max{2K,2M}=2K=K=max{K,M}.
Остается рассмотреть случай K<M. Выберем u1  Arg max1 min g1 (u, v) . Если
uU
vE  ( u )
K<M, то выбранный так элемент удовлетворяет условию u  Arg min1 max2 g 2 (u, v) .
1
uU
vU
Действительно, иначе для любого vE(u ) выполняется неравенство g (u ,v)>L, а значит
пара (u1,v) принадлежит D и g1(u1,v)<K, что противоречит неравенству K<M. Но тогда
для любой функции 2 u 2  2 E выполняется условие 2 u 2 ( 2 u1 )  E ( 2 u1 ) и значит
1
2
inf
g 1 ( 2 u1 , 2 u 2 ( 2 u1 ))  min g 1 ( 2 u1 , v)  max1 min g 1 (u, v)  M 
2
2u
2
vE  ( u )
E*
M  inf
2
uU
vE  ( u )
sup g 1 ( 2 u1 , 2 u 2 ( 2 u1 ))  inf
g 1 ( 2 u1 , 2 u 2 ( 2 u1 ))  M  .
2
2 u  2 E u1 U 1
2
2
2u
2 E
и
1
тем
Учитывая
более
доказанное
двумя абзацами выше неравенство 2MM, получаем равенство 2M*=M. И доказательство
теоремы 4 завершается ссылкой на теорему 2.
470180447 25.04.2016
9
Дальнейшие расширения
Лемма. Пусть игра Г=<U1,U2,g1,g2> такова, что множества U1 и U2 компактны, а
функции g1 и g2 непрерывны. Тогда выполняются неравенства R(Г1)R(Г3)R(Г2).
Доказательство. Первое неравенство следует из того, что игра Г3 является
квазиинформационным расширением игры Г. Второе непосредственно вытекает из теорем
2 и 3.
Лемма. Пусть игра Г=<U1,U2,g1,g2> такова, что множества U1 и U2 компактны, а
функции g1 и g2 непрерывны, а *Г – произвольное квазиинформационное расширение
игры 1Г. Тогда R(*Г)=R(Г2).
Доказательство. Так как *Г – квазиинформационное расширение игры 1Г,
выполняется неравенство R(*Г)≥R(Г2). А в силу теорем 2 и 3 выполняется неравенство
R(*Г)R(Г2).
Лемма. Пусть игра Г=<U1,U2,g1,g2> такова, что множества U1 и U2 компактны, а
функции g1 и g2 непрерывны, а *Г – произвольное квазиинформационное расширение
игры 12Г. Тогда R(*Г)=R(Г3).
Доказательство. Так как *Г – квазиинформационное расширение игры 12Г,
выполняется неравенство R(*Г)≥R(Г3).
Так как *Г – квазиинформационное расширение игры 12Г, игра *Г является также
квазиинформационным расширением игры 2Г. Значит, в силу теоремы 3 R(*Г)R(1(2Г))=
R(12Г).
Игры с агрегированной информацией
Пусть Г=<{1,2},U1,U2,g1,g2> – игра двух лиц, и P:U2W – некоторое отображение.
Рассмотрим информационное расширение PГ=<{1,2},PU1,PU2,Pg1,Pg2> игры Г,
1
1
2
2
определенное
следующим
образом.
Положим
PU =(W,U ),
PU =U ,
1
2
1
2
2
1
2
(Pu ,Pu )=(Pu (P(Pu )),Pu ), функции выигрыша Pg и Pg определим в соответствии с
определением квазиинформационного расширения, в качестве c1 возьмем отображение,
которое каждому u1U1 ставит в соответствие функцию из W в U1, тождественно равную
u1, а в качестве c2 – тождественное отображение.
Множество B(Pu1) рациональных ответов второго игрока на стратегию Pu1
определим стандартным образом:

{u 2 U 2 : g 2 ( P u1 ( P(u 2 )), u 2 )  max g 2 ( P u1 ( P( w)), w)}, если
wV

2
1

max g ( P u ( P( w)), w) достигается,
B ( P u1 )  
wV
 2
2
2
1
2
2
g 2 ( P u ( P( w)), w)   ( P u1 )} в противном случае.
{u U : g ( P u ( P(u )), u )  sup
wV
(Здесь  заранее заданная и известная обоим игрокам функция, принимающая
положительные значения). Максимальный гарантированный результат первого игрока
R( P )  sup inf 1 g 1 ( P u1 ( P(v)), v) .
P u P U
1
vB ( P u )
В дальнейшем будем предполагать, что множества U1 и U2 компактны, а функции
g1, g2 и P непрерывны. Тогда, не ограничивая общности можно считать, что и множество
W компактно, так как в противном случае можно перейти к его подмножеству
{P(v): vU2}, которое компактно как образ компактного множества при непрерывном
отображении.
Займемся поиском максимального гарантированного результата первого игрока в
рассматриваемой игре. Введем обозначение: Q(w)={vU2: P(v)=w}. Для любого wW
множество Q(w) замкнуто, как прообраз замкнутого множества (точки), а, следовательно,
и компактно, поскольку содержится в компактном множестве U2.
470180447 25.04.2016
10
Определим
R(u, w)  Q( w)
множество

B(u ) ,

где,
как
обычно,
B(u )  u 2 U 2 : g 2 (u , u 2 )  max2 g 2 (u, u 2 ) .
vU
Рассмотрим игру =<{1,2},U1,W,h1,h2>, функции
определяются
условиями
h1 (u, w)  min g 1 (u, v) ,
vR ( u , w )
выигрыша в которой
h2 (u, w)  max g 2 (u, v) .
vR ( u , w )
Непосредственным сравнением определений устанавливается, что максимальные
гарантированные результаты в рассматриваемом нами информационном расширении
исходной игры Г и в стандартном метарасширении 1 игры  совпадают, так же как и
множества оптимальных стратегий первого игрока.
Функция h2 может не быть непрерывной. Однако при сделанных нами
предположениях максимум в выражении max inf1 h2 (u, w) достигается. Действительно,
wW uU
пусть
последовательность
w1 , w2 ,...
точек
из
множества
W
такова,
что
lim inf1 h (u, wt )  sup inf1 h (u, wt ) . В силу сделанного предположения о компактности
2
2
t  uU
wW uU
множества W, можно, не ограничивая общности, считать, что эта последовательность
сходится к точка w0. Тогда достаточно доказать, что lim inf1 h2 (u, wt )  inf1 h2 (u, w0 ) .
t  uU
uU
Допустим, что напротив lim inf1 h (u, wt )  inf1 h (u, w0 )  2  0 . Выберем u0U1 так, что
2
2
t  uU
h(u0 , w0 )  inf1 h(u, w0 )   . Тогда
uU
uU
2
lim inf1 h (u, wt )  lim h2 (u0 , wt )  lim max g 2 (u0 , v) . В
t  uU
t 
t  vR ( u0 , wt )
силу сделанных предположений о непрерывности и компактности каждое из множеств
Q(wt) и B(u0) замкнуто, а значит, замкнуто и их пересечение R(u0,wt). Так как это
множество содержится в компактном множестве W, оно само компактно, а потому
существует vtR(u0,wt), для которого g 2 (u0 , vt )  max g 2 (u0 , v) . В силу компактности
vR ( u0 , wt )
множества V можно, не умаляя общности, считать, что последовательность v1,v2,…
сходится к некоторому v0V. В силу непрерывности отображения P, выполняется условие
v0Q(w0), а в силу непрерывности функции g2 имеет место включение v0B(u0). Значит,
v0R(u0,w0). Но тогда
lim inf1 h2 (u, wt )  lim h 2 (u0 , wt )  lim g 2 (u0 , vt ) 
t  uU
t 
t 
 g (u0 , v0 )  max g (u0 , v)  h (u0 , w0 )  inf1 h 2 (u, w0 )   .
2
2
2
vR ( u0 , w0 )
U U
Получено противоречие.
Таким образом, при поиске максимального гарантированного результата в игре 1
можно воспользоваться полученными выше результатами. Конкретизируя их для игры
специального вида, придем к следующему результату.
Теорема. Максимальный гарантированный результат первого игрока в игре PГ
равен наибольшему из чисел K и M, где
L  sup inf1 min g 1 (u, v) , D  {(u, v) U 1 U 2 : g 2 (u, v)  L}, K  sup g1 (u, v) ,
wW uU vQ ( w )
( u , v )D
E  {w W :inf1 sup g (u, v)  max inf1 sup g (u, v)} , M  inf sup inf g1 (u, v) .
2
uU vQ ( w )
2
wW uU vQ ( w )
wE uU 1 vQ ( w)
Игры с блефом
Пусть Г=<{1,2},U1,U2,g1,g2> – игра двух лиц. Рассмотрим ее информационное
расширение *Г=<{1,2},*U1,*U2,*g1,*g2>, определенное следующим образом. Положим
2
2
2
1
2
1
1
1
1
*U =U U , *U =(U , U ), отображение c ставит в соответствие элементу u из U
функцию из U2 в U1, тождественно равную u1, отображение c2 ставит в соответствие
470180447 25.04.2016
11
элементу u2 пару (u2,u2) , а проекция  определяется условием (*u1,(v,w))=(*u1(w),v).
Функции выигрыша определены условиями *gi(*u1,*u2)=gi((*u1,*u2)).
Рассмотрим еще игру =<{1,2},U1,U2U2,h1,h2> функции выигрыша в которой
определяются условиями hi(u,v,w)=gi(u,v) и ее информационное расширение P,
определенное так как в предыдущем разделе, где отображение P: U2U2 U2 определено
равенством P(v,w)=v.
Непосредственно проверяется, что игры *Г и P изоморфны в том смысле, что
каждая из них является квазиинформационным расширением другой. Поэтому
максимальные гарантированные результаты в них равны. И для поиска максимального
гарантированного результата в игре *Г можно использовать результаты, полученные в
предыдущем разделе.
Нетрудно убедиться, что в данном случае он равен максимальному
гарантированному результату первого игрока в исходной игре Г. Таким образом,
информация, которую первый игрок не может проверить, ничего не дает ему в смысле
повышения гарантированного результата. В следующей лекции будет показано, что этот
вывод существенно зависит от того, что первому игроку точно известна функция
выигрыша противника.
Разумеется, результаты данного раздела можно2 получить непосредственно, не
апеллируя к моделям с агрегированием информации. Полезно сделать это для
упражнения.
Игры с добровольным обменом информацией
Пусть Г=<{1,2},U1,U2,g1,g2> – игра двух лиц. Рассмотрим ее информационное
расширение *Г=<{1,2},*U1,*U2,*g1,*g2>, определенное следующим образом. Положим
2
2
1
2
1
1
1
*U =U {0,1}, *U =(U , U )U . Пусть оператор d ставит в соответствие элементу u из
U1 функцию из (U2, U1), тождественно равную u1. Определим вложение c1, положив
c1(u1)=(d(u1),u1). Вложение c2 определим условием c2(u2)=(u2,0), Проекцию  зададим
(u (v), v), если l  1,
условием  ((u , u ), (v, l ))  
Функции выигрыша определим условиями
 (u , v), если l  0.
i
1
2
i
1
2
*g (*u ,*u )=g ((*u ,*u )).
Теорема. Максимальный гарантированный результат R(*Г) первого игрока в игре
Г
равен
его максимальному гарантированному результату R(Г3) в игре Г3.
*
Доказательство. Используем введенные выше обозначения.
Величина M   max1 min g1 (u, v) (где E(u)  {v U 2 : g 2 (u, v)  max2 g 2 (u, w)} ) есть,
uU
vE  ( u )
wU
по сути, максимальный гарантированный результат первого игрока в исходной игре Г. А
так как *Г – ее квазиинформационное расширение, получаем неравенство R(*Г)≥M.
Фиксируем
произвольное
>0
и
выберем
в
множестве
1
2
1
2
2


(
u
,
u
)
точку
удовлетворяющую
условию
D  {(u, v) U U : g (u, v)  L }

 ,
(напомним, что L  min1 max2 g 2 (u, v), K   sup g 1 (u, v) ). Определим
g 1 (u1 , u2 )  K   
управление u
1
p
uU
vU
( u ,v )D
условием max2 g (u , v)  min1 max2 g (u , v) и функцию u (U2, U1)
2
vU
2

2

1
p
2
uU
vU
1
p
u , если v  u ,
условием u (v)   1
 u p , если v  u
Рассмотрим стратегию ( u , u1p ) первого игрока. Если в ответ на нее второй игрок
1
выберет стратегию  u2 ,1 , то он получит выигрыш g 2 (u1 , u2 )  L . В противном случае он
2
И даже проще.
470180447 25.04.2016
12
получит выигрыш g 2 (u1p , v)  max2 g 2 (u1p , v)  min1 max2 g 2 (u1p , v)  L . Поэтому множество
uU
vU
vU
рациональных ответов второго игрока на стратегию ( u , u1p ) состоит из одного элемента
 u ,1 и первый игрок гарантированно получает выигрыш g (u , u )  K    .
1
2

1

2

R( * )  K    . А поскольку  выбиралось произвольно,
выполняется и неравенство R( * )  K  . Итак, R(*Г)≥R(Г3).
Таким образом,
Пусть теперь *u1=( u ,u) – произвольная стратегия первого игрока, а управление v
удовлетворяет условию g 2 (u, v)  max2 g 2 (u, w) . Тогда стратегия (v,0) гарантирует второму
wU
игроку выигрыш g 2 (u, v)  max2 g 2 (u, w)  L . Поэтому возможны два случая.
wU
1. sup
*u
2
* U 2
g ( * u , * u )  L . В таком случае, по крайней мере, для одного элемента
2
*
1
2
множества B(*u1) выполняется условие (*u1,*u2)D, и первый игрок не может
гарантированно получить выигрыш больший, чем K.
2. sup * g 2 ( * u1 , * u 2 )  L . Тогда для любого элемента v множества E стратегия
2
*u
*u
2
* U 2
(v,0) принадлежит B(*u1) , и первый игрок не может гарантированно получить выигрыш
больший, чем K.
Итак, в обоих случаях R(*Г)R(Г3), что и требовалось доказать.
Последняя теорема доказывает, что в случае K> M, обмен информацией выгоден
обоим игрокам.
Дуополия Курно
В качестве примера решения соответствующих задач рассмотрим уже знакомую
модель.
Две фирмы выпускают однородный товар и продают его на рынке. Цена,
складывающаяся на рынке, линейно убывает с ростом суммарного предложения:
p(u1,u2)=a–b(u1+u2), где u1 и u2 объемы выпуска продукции первой и второй фирмой
соответственно (по своему смыслу величины u1 и u2 неотрицательны). Пусть затраты
первой и второй фирм на выпуск единицы продукции равны c1 и c2, а их цели состоят в
максимизации прибылей g1(u1,u2)= p(u1,u2)u1–c1u1 и g2(u1,u2)= p(u1,u2)u2–c2u2.
Сразу исключим из рассмотрения тривиальные случаи aс1 или ac2. В этих
случаях одной из фирм выгодно совсем не выпускать продукцию, не зависимо от
действий конкурентов. Поэтому существует точка, в которой достигаются максимумы
критериев обоих игроков, и любой разумный3 принцип оптимальности должен приводить
к этой точке.
Рассмотрим сначала игру Г1. Соответствующая модель может быть
проинтерпретирована, например, следующим образом. Фирмы производят пшеницу, и
объем выпуска каждой фирмы линейно зависит от посевных площадей. В силу
климатических условий первая фирма производит сев раньше второй, и информация о
засеянных площадях общедоступна.
Итак, пусть первая фирма произвела продукцию в объеме u1 и это стало известно
второй фирме. Найдем ее оптимальную реакцию. Для нее задача сводится к максимизации
(по u2) функции  a  c2  bu1  u2  bu22 . Максимум достигается в точке u2=0, если a–c2–
bu10, и в точке
3
1
 a  c2  bu1  в противном случае.
2b
А все рассматриваемые нами принципы оптимальности относятся к этой категории.
470180447 25.04.2016
13
Таким образом, в данном случае множество B(u1) рациональных ответов второго
игрока при любой стратегии u1 состоит из одной точки. Поэтому в рассматриваемой игре
a  c2
1
2
,
 (a  2c1  c2 )u1  bu1  , если u1 
1
f (u1 )  min g (u1 , v)   2
b
vB ( u1 )
 (a  c1 )u1  bu12 , в противном случае.
Остается найти максимум этой (непрерывной!) функции. Характер решения
зависит от соотношения параметров задачи.
 Картинки
a  c1
1
1. Если c2 
, то вершина параболы (a  2c1  c2 )u1  bu12  лежит справа от
2
2
 a  c2 
отрезка  0,
, а потому максимум функции f(u1) достигается на интервале
b 

a  c1
 a  c2

,

.
При
таком
сочетании
параметров
вершина
параболы (a  c1 )u1  bu12

 b
2b

принадлежит указанному интервалу, а потому максимум достигается именно в этой точке.
a  c1
Таким образом, оптимальная стратегия первого игрока в этом случае есть u1 
, а
2b
наилучший ответ второго игрока на эту стратегию – u2=0. Максимальный
(a  c1 ) 2
гарантированный результат первого игрока при этом равен
. Это – глобальный
4b
максимум выигрыша первого игрока.
Непосредственно проверяется, что это решение является равновесием по Нэшу и
эффективной точкой.
a  2c1
a  c1
1
 c2 
2. Если
, то вершина параболы (a  2c1  c2 )u1  bu12  лежит
3
2
2
 a  c2 
справа от отрезка  0,
, а вершина параболы (a  c1 )u1  bu12 лежит слева от интервала

b


a  c2
a

c


2
u

,

.
Значит,
максимум
функции
f(u
)
достигается
в
точке
. Наилучший
1
1

 b
b

ответ на эту стратегию по-прежнему u2=0, а максимальный гарантированный результат
(a  c2 )(c2  c1 )
первого игрока равен
.
b
Теперь решение уже не является ни равновесием, ни эффективным.
a  2c1
1
(a  2c1  c2 )u1  bu12  лежит на
3. Если c2 
, то вершина параболы
3
2
a

c

2 
отрезке  0,
, а вершина параболы (a  c1 )u1  bu12 лежит слева от интервала

b 

a  2c1  c2
 a  c2

 b ,   . Значит, максимум функции f(u1) достигается в вершине u1 
2b
1
параболы (a  2c1  c2 )u1  bu12  . Наилучший ответ второго игрока на эту стратегию есть
2
a  2c1  3c2
u2 
. Максимальный гарантированный результат первого игрока в этом
4b
(a  2c1  c2 ) 2
случае равен
.
8b
 Равновесность и эффективность?
470180447 25.04.2016
14
Обратимся к игре Г2. Проинтерпретирована эта модель может быть следующим
образом. Пусть игрок 2 – это совокупность производителей какой-то продукции,
например, той же пшеницы, внутри страны, а игрок 1 – это фирма «Экспортхлеб»,
закупающая ту же продукцию за рубежом. Разумеется, закупки осуществляются уже
после сбора урожая. Если «Экспортхлеб» имеет возможность заранее обнародовать свои
планы по объемам закупок в зависимости от количества продукции, произведенной
внутри страны, то получается как раз интересующая нас модель.
Универсальной стратегией наказания второго игрока может быть любая стратегия
a
u1 p  . Осторожной стратегией второго игрока при этом будет u2=0. Поскольку это
b
наилучшая для первого игрока стратегия его партнера, в данном случае максимальный
гарантированный результат первого игрока в игре Г2 в данном случае достигается,
 a  c1
, если u2  0,

1
например, на стратегии u0 (u2 )  
Оптимальным ответом второго
2b
u1 p в противном случае.

игрока, разумеется будет u2=0.
Это решение является эффективным, поскольку доставляет глобальный максимум
выигрышу первого игрока. По той же причине, оно будет равновесием по Нэшу в
рассматриваемом информационном расширении. Равновесием по Нэшу в исходной игре
данное решение будет лишь при достаточно высокой себестоимости продукции второй
фирмы.
Рассмотрим игру Г3. Интерпретация данной модели может быть такой. Игрок 1 –
это министерство сельского хозяйства, управляющее производством пшеницы внутри
страны, а игрок 2 – это пресловутая фирма «Экспортхлеб», которая по-прежнему
выбирает объем закупок за рубежом, зная объем производства внутри страны. Если
министерство рассчитывает получить информацию о планах «Экспортхлеба», и оно имеет
возможность сделать первый ход, то приходим к рассматриваемой модели.
a
Поскольку стратегия наказания u1 p 
второго игрока может быть выбрана не
b
 a  c1
, если u2 (u1 )  0,

1
зависящей от его действий, стратегия u1 (u2 )   2b
гарантирует
u1 p в противном случае,

первому игроку тот же выигрыш, что и в игре Г2.
 Лемма 1 из «Топологической постановки» – в задачи
Задачи
1. Может ли максимальный гарантированный результат в игре Г1 быть меньше, чем
max min g1 (u, v) ? А меньше, чем min max g1 (u, v) ?
uU
vV
2. Пусть заданы игры
vV
uU
  {1, 2},U ,V , g , h
и
  {1, 2}, U , W , g, h
и V W .
Докажите, что максимальный гарантированный результат первого игрока в игре 
не превосходит аналогичного результата в игре .
3. Пусть заданы игры   {1, 2},U ,V , g , h и   {1, 2},W ,V , g , h и V  W . Докажите,
что максимальный гарантированный результат первого игрока в игре  не меньше
аналогичного результата в игре .
4. Пусть игра Г антагонистическая. Чему равны максимальные гарантированные
результаты в соответствующих играх Г1, Г2 и Г3.
5. Пусть   {1, 2},U ,V , g , h . Предположим, что в игре   {1, 2},U ,V , h, h
существует седловая точка. Верно ли, что R(1)=R(12)?
470180447 25.04.2016
15
6. Пусть в игре двух лиц Г существует и единственна ситуация равновесия по Нэшу.
Докажите, что выигрыш первого игрока в этой ситуации не превосходит его
максимального гарантированного результата в соответствующей игре Г1. Верно ли
это утверждение без предположения о единственности ситуации равновесия.
7. Докажите,
что
если
M>K
и
то
min g1 (u, v)  max min g1 (u, v) ,
vE  ( u )
uU vE  ( u )
max g (u, v)  min max g (u, v) .
2
vV
2
uU
vV
***
8. Определить наибольшие гарантированные результаты и какие-либо оптимальные
(или -оптимальные) результаты в играх Г2 и Г3, если U1=U2=[0,1], g1(u1,u2)= u1+u2,
g1(u1,u2)= u1–2u2.
3 6 8 
9. Решите игры Г1, Г2, Г3, если выигрыши игроков задаются матрицами  4 3 2 
 7 5 1


 7 4 3
и  7 7 3  .
 4 6 6


10. Определить наибольшие гарантированные результаты и какие-либо оптимальные
результаты в играх Г2 и Г3, если функции выигрыша задаются матрицами
 3 2 7 4   2  1  2  3 

 

 3 2 1 1  и  1 2 3 1  .
  2 4 5 1   3 4  2 2 

 

 3 1 0 4   1 5 4 4 
11. Пусть a,b>0, acb, U1=[0,), U2=[0,a), g1(u1,u2)=cu2–u1u2,g2(u1,u2)=u1u2–bln(a/(a–u2)).
Найти оптимальную стратегию центра в игре Г1.
12. Пусть a,b>0, ac>b, U1=[0,), U2=[0,a), g1(u1,u2)=cu2–u1, g2(u1,u2)=u1u2–bln(a/(a–u2)).
Найти оптимальную стратегию центра в игре Г1.
13. Решите игры Г1, Г2, Г3, если U1=U2=[0,1], g1(u1,u2)=3u1/4+u2/2, g1(u1,u2)=(u1–u2)2.
m


U 1  u1  m :  ui1  A, i  1,..., m  ,
14. Пусть
i 1


m


U 2  u1  m :  ui1  B, ui1  0, i  1,..., m  ,
g1 (u1 , u 2 )  min Wi1 (u1 , u 2 ),
1i  m
i 1


 ui1 (a1  bi )
1
2
 1 2 , если ui  ui  0,
2
1
2
2
1
2
1
1
2
Wi (u , u )   ui  ui
g (u , u )  min Wi (u , u ), где
1i  m

ai , если ui1  ui2  0,

 ui2 (a1  bi )
1
2
 1 2 , если ui  ui  0,
2
1
2
Решить игры Г1 и Г2, если известно, что
Wi (u , u )   ui  ui
1
2

bi , если ui  ui  0.

B
bi  min(ai  b j )
, i  1,..., m. (Здесь ai и bi – неотрицательные параметры.)
i j m
A B
15. Будем говорить, что в игре Г1 первый игрок использует блеф, если вместо
сообщенной второму игроку стратегии v1, он выбирает стратегию u1. Найти
выражение для наибольшего гарантированного результата первого игрока в игре Г1
470180447 25.04.2016
16
при использовании блефа, предполагая что функции g1 и g2 непрерывны, а
множества U1 и U2 компактны.
16. Найти решение игры Г1 при использовании блефа первым игроком, если
U1=U2=[0,1], g1(u1,u2)=3u1+2u2, g1(u1,u2)=(u1–u2)2.
17. Докажите, что максимальный гарантированный результат первого игрока в игре Г 2
непрерывно зависит от функции выигрыша первого игрока, если на множестве этих
функций задана равномерная метрика.
18. Докажите, что зависимость максимального гарантированный результат первого
игрока в игре Г2 от функции выигрыша второго игрока, вообще говоря, не является
непрерывной, если на множестве этих функций задана равномерная метрика.
***
19. Решите игры Г1, Г2, Г3 в условиях доброжелательности второго игрока, если
 3 6 8   7 4 3
выигрыши игроков задаются матрицами  4 3 2  и  7 7 3  .
 7 5 1  4 6 6 

 

20. Решите игры Г1, Г2, Г3 в условиях доброжелательности второго игрока, если
U1=U2=[0,1], g1(u1,u2)=3u1/4+u2/2, g1(u1,u2)=(u1–u2)2.
21. Найдите максимальные гарантированные результаты первого игрока в играх Г2 и
Г3 при условии доброжелательности второго игрока
***
22. Обязательно ли решение игры Г1 будет эффективным?
23. В каком случае будет эффективным решение игры Г2?
24. В каком случае будет эффективным решение игры Г3?
 Игры с малыми побочными платежами
Литература
1. Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Наука. 1976.
2. Кукушкин Н.С., Морозов В.В. Теория неантагонистических игр. М.: МГУ. 1984.
3. Горелик В.А., Кононенко А.Ф. Теоретико-игровые модели принятия решений в
эколого-экономических системах. М.: Радио и связь. 1982.
470180447 25.04.2016
Download