(-2)+

advertisement
Лекция 8.
Позиционные игры (часть 2)
13.11.2014
1
8.1. Позиционные игры с полной
информацией
8.2. Решение позиционных игр с полной
информацией
2
2-й ход
1-й ход
P(x=1) = 0.5
1?2
1
2
P(x=2) = 0.5
3-й ход
1?2
1?2
M (X, Y, Z)
3
Функция М(X, Y, Z) определяется следующим образом
М(1, 1, 1) = -2
М(1, 1, 2) = -1
М(1, 2, 1) = 3
М(1, 2, 2) = -4
М(2, 1, 1) = 5
М(2, 1, 2) = 2
М(2, 2, 1) = 2
М(2, 2, 2) = 6
4
Графическое изображение игры – Пример 5
1
2
1
2
2
1
2
2
2
2
1
1
2
1
1
2
2
1
1
0
2
5
Нормализация игры – Пример 5
Стратегии 1-го игрока
1-я стратегия – выбирать Y=1, не взирая на X,
2-я стратегия – выбирать Y=2, не взирая на X,
3-я стратегия – выбирать Y=X,
4-я стратегия – выбирать Y=1, если X=2, и наоборот.
Стратегии 2-го игрока
1-я стратегия – выбирать Z=1, не взирая на Y,
2-я стратегия – выбирать Z=2, не взирая на Y,
3-я стратегия – выбирать Z=Y,
4-я стратегия – выбирать Z=1, если Y=2, и наоборот.
6
Платежная матрица – Пример 5
Z=1
Y=1
Y=X
Y≠X
Y=2
Z=Y
Z≠Y
Z=2
1,5
Если (Х=1) и (Y=1) и (Z=1), то М(1, 1, 1) = -2
Если (Х=2) и (Y=1) и (Z=1), то М(2, 1, 1) = 5
Выигрыш 1-го игрока = 0,5*М(1,1,1)+0,5*М(2,1,1) = 1,5
7
Расчет элементов платежной матрицы – Пример 5
Y=1
Z=1
=0,5*M(1,1,1)+0,5*М(2,1,1) = 0,5*(-2)+0,5*5=1,5
Y=X
Z=1
=0,5*M(1,1,1)+0,5*М(2,2,1) = 0,5*(-2)+0,5*2=0
Y≠X
Z=1
=0,5*M(1,2,1)+0,5*М(2,1,1) = 0,5*3+0,5*5=4
Y=2
Z=1
=0,5*M(1,2,1)+0,5*М(2,2,1) = 0,5*3+0,5*2=2,5
Y=1
Z=Y
=0,5*M(1,1,1)+0,5*М(2,1,1) = 0,5*(-2)+0,5*5=1,5
Y=X
Z=Y
=0,5*M(1,1,1)+0,5*М(2,2,2) = 0,5*(-2)+0,5*6=2
Y≠X
Z=Y
=0,5*M(1,2,2)+0,5*М(2,1,1) = 0,5*(-4)+0,5*5=0,5
Y=2
Z=Y
=0,5*M(1,2,2)+0,5*М(2,2,2) = 0,5*(-4)+0,5*6=1
Y=1
Z≠Y
=0,5*M(1,1,2)+0,5*М(2,1,2) = 0,5*(-1)+0,5*2=0,5
Y=X
Z≠Y
=0,5*M(1,1,2)+0,5*М(2,2,1) = 0,5*(-1)+0,5*2=0,5
Y≠X
Z≠Y
=0,5*M(1,2,1)+0,5*М(2,1,2) = 0,5*3+0,5*2=2,5
Y=2
Z≠Y
=0,5*M(1,2,1)+0,5*М(2,2,1) = 0,5*3+0,5*2=2,5
Y=1
Z=2
=0,5*M(1,1,2)+0,5*М(2,1,2) = 0,5*(-1)+0,5*2=0,5
Y=X
Z=2
=0,5*M(1,1,2)+0,5*М(2,2,2) = 0,5*(-1)+0,5*6=2,5
Y≠X
Z=2
=0,5*M(1,2,2)+0,5*М(2,1,2) = 0,5*(-4)+0,5*2=-1
Y=2
Z=2
=0,5*M(1,2,2)+0,5*М(2,2,2) = 0,5*(-4)+0,5*6=1
8
Платежная матрица – Пример 5
Y=1
Y=X
Y≠X
Y=2
Z=1
Z=Y
Z≠Y
Z=2
1,5
1,5
0,5
0,5
0
2
0,5
2,5
4
0,5
2,5
-1
2,5
1
2,5
1
9
При составлении информационных
множеств, следует учесть:
1. В одно информационное множество могут
входить узлы, относящиеся только к одному
игроку.
2. Любая ветвь дерева, отображающая партию
игры, не должна пересекать одно и то же
информационное множество больше одного
раза.
10
Графическое изображение игры – Ошибки
1
2
1
2
1
1
1
1
2
2
1
1
1
1
2
2
2
2
1
1
2
11
8.1. Позиционные игры с полной информацией
Позиционная игра называется игрой с полной
информацией, если в любой точке ее партии игрок,
делающий ход, точно знает, какие выборы были
сделаны раньше.
В графическом изображении каждый узел такой
игры будет представлять собой отдельное
информационное множество.
12
10.1. Позиционные игры с полной информацией
Любая игра с полной информацией имеет
седловую точку.
4
-2
3
-2
2
2
1
13
10.1. Позиционные игры с полной информацией
Выбрать 1 Выбрать 2 Выбрать
Y=X
Выбрать 1
4
-2
4
Выбрать 2
-2
4 -2 4 -2 -2
-2 3 3 -2 -2
4
3
4 -2
3
3
Выбрать
Y≠X
-2
-2
Первый игрок моет выбирать
любую стратегию.
Второй игрок всегда выбирать
Y≠X.
Цена игры в этом случае будет
равна -2.
14
10.1. Позиционные игры с полной информацией
Допустим, что второй игрок не знает, что
выбрал первый
4
-2
3
-2
2
2
1
15
10.1. Позиционные игры с полной информацией
Решение позиционной игры с неполной информацией
Выбрать 1 Выбрать 2
Выбрать 1
Выбрать 2
4 -2 -2
-2 3 -2
4
3
4
-2
-2
3
3  ( 2 )
5
6
p1 
  p2 
4  3  ( 2 )  ( 2 ) 11
11
3  ( 2 )
5
6
q1 
  q2 
4  3  ( 2 )  ( 2 ) 11
11
4 * 3  ( 2 )* ( 2 ) 8
V

4  3  ( 2 )  ( 2 ) 11
16
10.2. Решение позиционных игр с полной информацией
Решение позиционной игры с полной
информацией можно находить в соответствии с
теоремой Куна, утверждающей, что данная
игра разрешима по доминированию, т. е. для
каждого из игроков имеются доминирующие
стратегии, которые и необходимо применять.
17
10.2. Решение позиционных игр с полной информацией
Пример «Выборы с правом вето»
Игроки
Кандидаты в президенты
18
10.2. Решение позиционных игр с полной информацией
Пример «Выборы с правом вето»
Накладывает вето
Накладывает вето
Накладывает вето
Победитель определен
19
10.2. Решение позиционных игр с полной информацией
Представление игры в виде дерева
4
3
3 4
2 3
2 4
3 4
4
4
3
4
3
2
2
3
3
3
3
2
1 4
2 4
1 2
1 3
2 3
1 2
1
4
3
4
4
2
3
3
2
1
2
3
3
4
1
3
3
2
1
1 3
3
4
3
4
1
2
1
3
2
2
2
1
3
1
3
1
2
3
3
2
3
2
1
1
1
4
20
10.2. Решение позиционных игр с полной информацией
Известны также функции выигрышей игроков, в
зависимости от того какой президент будет выбран
U1=(5; 4; 3; 7)
U2=(6; 7; 5; 8)
U3=(3; 8; 5; 4)
Поскольку из всех вершин, предшествующих
конечным, ходит игрок 3, то остальные
игроки, зная его функцию выигрыша U3, могут
легко предвидеть его решения.
21
10.2. Решение позиционных игр с полной информацией
Представление игры в виде дерева –
выигрыши третьего игрока
4
4
3
5 4
3 4
8 5
2 3
8 4
2 4
5 4
3 4
4
4
3
4
3
2
2
3
3
3
3
2
3 4
1 4
8 4
2 4
3 8
1 2
3 5
1 3
2 5
2 3
3 8
1 2
3
1
4
3
4
4
2
3
3
2
1
2
3
3
4
1
3
3
2
1
3 5
1 3
3
4
3
4
1
2
1
3
2
2
2
1
3
1
3
1
2
3
3
2
3
2
1
1
1
4
22
10.2. Решение позиционных игр с полной информацией
Представление игры в виде дерева –
выигрыши третьего игрока
5
3
8
2
8
2
5 4
3 4
4
4
3
4
3
3
3
3
2
1
1
4
3
3
4
8 4
2 4
1
3
3
2
5
3
3
1
4
3
3
3
4
1
2
8 5
2 3
1
2
2
8
2
1
3
1
3
1
2
3
3
2
3
2
1
8
2
1
4
23
10.2. Решение позиционных игр с полной информацией
Представление игры в виде дерева –
выигрыши второго игрока
5
3
7
2
7
2
5 8
3 4
4
4
3
4
3
3
3
3
2
1
1
4
3
3
4
7 8
2 4
1
3
3
2
5
3
3
1
4
3
3
3
4
1
2
7 5
2 3
1
2
2
7
2
1
3
3
1
3
1
2
3
3
2
3
2
1
7
2
1
4
24
10.2. Решение позиционных игр с полной информацией
Представление игры в виде дерева –
выигрыши второго игрока
7
2
7
2
4
3
3
8
4
1
3
3
1
2
3
2
3
2
1
1
3
2
2
7
2
3
3
3
4
7
2
1
3
3
2
8
4
1
4
25
10.2. Решение позиционных игр с полной информацией
Представление игры в виде дерева –
выигрыши первого игрока
4
4
7
7
4
4
2
2
4
4
2
2
4
3
3
1
3
3
3
2
1
3
3
4
1
3
2
2
3
1
2
3
2
3
2
1
3
1
4
26
10.2. Решение позиционных игр с полной информацией
Представление игры в виде дерева –
выигрыши первого игрока
7
7
4
4
1
1
3
3
3
2
2
2
3
2
1
Первый игрок на первом ходе
отклонит 2 или 3 претендента.
Второй игрок также отклонит 2
или 3 претендента, в зависимости
от того какого претендента
отклонил первый игрок.
Третий игрок отклонит первого
претендента.
В итоге выиграет четвертый
претендент.
27
10.2. Решение позиционных игр с полной информацией
Алгоритм решения игр с полной информацией, в
соответствии с теоремой Куна, состоит в том, что начиная с
последнего хода, последовательно отбрасываются
заведомо худшие для игрока, делающего этот ход,
решения. В итоге получаем решение в чистых стратегиях.
28
Download