Методы решения игровых задач».

advertisement
Моделирование конфликтных
ситуаций в экономике
Методы решения игровых задач
Моделирование конфликтных ситуаций
в экономике
1. Принцип доминирования.
Цель. Уменьшить размерность задачи (редуцировать
платежную матрицу).
Принцип доминирования – один из приемов
редуцирования платежной матрицы.
Идея принципа – выбросить из рассмотрения те
стратегии игроков, которые являются очевидно не
выгодными для игроков.
Моделирование конфликтных ситуаций
в экономике
Рассмотрим применение принципа на примере.
Пусть матрица игры имеет вид:
Аi\Bj
B1
B2
B3
А1
-2
1
3
0
1
А2
-1
-4
2
-1
-4
А3
1
-5
6
3
-5
B4 B5
Начнем анализ этой
матрицы с позиций игрока В.
1. Значения проигрышей игрока В в столбцах В2 и В5
совпадают.
Это означает, что с точки зрения исхода игры стратегии В2
и В5 равноценны и дублируют друг друга.
Игроку В не имеет смысла оставлять в своем арсенале
обе стратегии. Одну можно исключить. Пусть В.
Моделирование конфликтных ситуаций
в экономике
Пример (Принцип доминирования, продолжение).
Аi\Bj B1
B2
B3
B4
А1
-2
1
3
0
А2
-1
-4
2
-1
А3
1
-5
6
3
В результате получена матрица игры
на один столбец меньше.
Вывод. Матрица игры может
содержать дублирующие столбцы
(строки).
2. Столбец В3 приносит максимальный проигрыш игроку В
при любой стратегии игрока А, т.к. аi3>aij при всех i и j≠3.
Такой столбец (стратегию) называют строго
доминирующим остальные столбцы.
Столбец В3 можно удалить, т.к. разумный игрок этой
стратегией никогда не воспользуется.
Моделирование конфликтных ситуаций
в экономике
Пример (Принцип доминирования, продолжение).
Аi\Bj
B1
B2
B4
А1
-2
1
0
А2
-1
-4
-1
А3
1
-5
3
3. Если сравнить столбцы В1 и
В4, то видно, что а14>а11, a24=a21,
a43>a31, т.е. в столбце В4
содержатся элементы, которые
либо строго больше элементов
столбца В1, либо равны
соответствующим элементам
столбца В1.
В этом случае говорят, что столбец (стратегия) В4 не
строго доминирует столбец (стратегию) В1.
Столбец (стратегию) В4 можно исключить из
рассмотрения, т.к. эта стратегия приносит не меньший
проигрыш, что и стратегия В1.
Моделирование конфликтных ситуаций
в экономике
Пример (Принцип доминирования, продолжение).
Аi\Bj
А1
B1
-2
B2
1
А2
-1
-4
А3
1
-5
В результате рассмотрения
неэффективности стратегий игрока В,
удалось игру размерностью 3×5
уменьшить до размера 2×3.
С аналогичных позиций можно
рассмотреть эффективности стратегий
игрока А, т.е. выявить дублирующие,
строго и не строго доминирующие строки
(стратегии) игрока А.
Вывод. Прежде, чем начинать решение игры, следует по
возможности уменьшить ее размерность. Одним из приемов
понижения размерности является принцип доминирования.
Моделирование конфликтных ситуаций
в экономике
2. Геометрический метод решения игры 2×2.
Ai\Bj
B1
B2
A1
a11
a12
A2
a21
a22
Общий вид матрицы
игры 2×2
Решению такой игры можно дать
наглядную геометрическую
интерпретацию.
Метод базируется на том, что
множество всех смешанных
стратегий игроков можно
представить в виде отрезка [0,1].
Учитывая минимальную размерность игры, все
смешанные стратегии обоих игроков можно разместить
на одном отрезке [0,1].
Моделирование конфликтных ситуаций
в экономике
2. Геометрический метод решения игры 2×2.
Пусть игрок А имеет смешанную стратегию Р={p1, p2}.
Обозначим p2 через p, учитывая, что p1+p2=1, получим
p1=1-p, или P={(1-p), p}.
При р=0 Р={1,0} – стратегия А1, при р=1 P={0,1} – стратегия
А2.
Если точка 0 соответствует стратегии А1, а точка 1
стратегии А2, то устанавливается взаимно однозначное
соответствие между точками отрезка [0,1] и множеством
смешанных стратегий игрока А.
А1
0
А2
р2=р
р
р1=1-р
1
Моделирование конфликтных ситуаций
в экономике
2. Геометрический метод решения игры 2×2.
Пусть игрок А выбирает свою смешанную
стратегию P={1-p, p}, а игрок В чистую
стратегию В1. Тогда выигрыш игрока А есть:
H(P,B1) = Σpiai1 = p1a11+p2a21=(1-p)a11+pa21=
= p(a21-a11)+a11
(6.1)
В системе координат (p,H) зависимость (6.1)
представляет собой отрезок прямой, заданный
на отрезке [0,1], проходящий через точки (0,а11)
и (1, а21)
Моделирование конфликтных ситуаций
в экономике
2. Геометрический метод решения игры 2×2.
Пусть для определенность а11<а21.
а21
H(P)
а11
Если игрок В придерживается своей
чистой стратегии В1, то выигрыш
игрока А при всех его смешанных
стратегиях будет лежать на отрезке
[a11,a21].
Пусть игрок В придерживается
чистой стратегии В2. Тогда выигрыш
игрока А есть:
0(А1)
1(А2)
H(P,B2)=Σpiai2 = p1a12 + p2a22 = (1-p)a12+pa22 = p(a22-a12)+a12
Моделирование конфликтных ситуаций
в экономике
2. Геометрический метод решения игры 2×2.
H(P)
а21
а12
а22
а11
0(А1)
1(А2)
Зависимость H(P,B2)=H(P) есть
отрезок между точками (0,a12) и
(1,a22). Пусть а12>а22.
Вопрос. Как определить оптимальную смешанную стратегию
игрока А?
Показатель эффективности
смешанной стратегии P={1-p,p}
есть min{H(P,B1),H(P,B2). Графически это нижняя огибающая
отрезков а11-а21 и а12-а22.
Моделирование конфликтных ситуаций
в экономике
2. Геометрический метод решения игры 2×2.
а21
H(P)
а12
V
N
а22
α =а11
0(А1)
p
1(А2)
Оптимальной стратегии игрока А
соответствует max α(P) или
наивысшая точка на огибающей.
В данном случае это точка N
пересечение отрезков а11-а21 и а12а22. Абсцисса точки N соответствует оптимальной стратегии P0={1pN,PN} игрока А. Ордината точки N
– цена игры V.
Показатель эффективности стратегии А1 - α(A1)=min a11,a12=a11,
показатель эффективности стратегии А2 - α(A2)=min (a22,a21)=a22.
Нижняя цена игры – min(α(A1), α(A2))=a11
Моделирование конфликтных ситуаций
в экономике
2. Геометрический метод решения игры 2×2.
А21=β
H(P)
а12
V
N
а22
α =а11
0(А1)
p
1(А2)
Оптимальные стратегии игрока
В лежат на верхней огибающей
отрезков а11-а21 и а12-а22.
Соответственно неэффективности стратегий игрока В и верхняя цена игры соответственно
есть: β(В1)=max (a11,a21)=a21,
β(В2)=max(a12,a22)=a12,
β=min(β(В1),β(В2))=a12.
Для нахождения оптимальной смешанной стратегии игрока В
необходимо вспомнить, что В=-АТ и провести аналогичные
построения.
Моделирование конфликтных ситуаций
в экономике
2. Геометрический метод решения игры 2×2.
H(P)
a22=β
а11
N
а21=α
а11
H(P)
а11
а12
а12
α=β
а21
N
a22
а21
а12
p
a11 =a21
a22
p
P0={0,1}
α=β=a12 P0={1,0}
Положение оптимальной стратегии зависит от соотношений
между компонентами платежной матрицы.
Моделирование конфликтных ситуаций
в экономике
2.1 Решение игры 2×N
Игрок А имеет SA={A1, A2}
Игрок В имеет SB={B1,B2,B3,…,Bn}
Тогда получим:
H(P,B1)=(1-p)a11+pa21=p(a21-a11)+a11
H(P,B2)=(1-p)a12+pa22=p(a22-a12)+a12
H(P,Bn)=(1-p)a1n+pa2n=p(a2n-a1n)+a1n
Получаем N отрезков в координатах (р,Н), строим
огибающую, ищем наивысшею точку на ней.
Моделирование конфликтных ситуаций
в экономике
3. Аналитическое решение игры 2×2.
Рассмотрим случай, когда матрица игры не имеет
седловой точки. Тогда решение можно получить
исходя из геометрического решения.
Имеем:
H(P,B1) = Σpiai1 = p(a21-a11)+a11
(7.3)
H(P,B2)=Σpiai2 = p(a22-a12)+a12
(7.4)
Условие наличия цены игры V есть:
H(P,B1) = H(PB2)
Моделирование конфликтных ситуаций
в экономике
3. Аналитическое решение игры 2×2.
Приравняв выражения (7.3) и (7.4), получим уравнение, из
которого легко вычислить значение р=Р20:
p(a22-a12)+a12 = p(a21-a11)+a11
или
р(а11+а22-а12-а21)= а11-а12
Откуда следует:
р2 = р =
0
а11 – а12
(а22 + а11) – (а12 + а21)
р1 = 1-р =
0
а22 – а21
(а22 + а11) – (а12 + а21)
Моделирование конфликтных ситуаций
в экономике
3. Аналитическое решение игры 2×2.
Соответственно для игрока В получим:
H(Q,A1)=q1a11+q2a12 = q(a12-a11)+a11
H(Q,A2)=q1a21+q2a22 = q(a22-a21)+a21
Откуда следует:
q2 0 = q =
a11 – a21
(а22 + а11) – (а12 + а21)
V=
q10 =1- q =
a11a22 – a12a21
(а22 + а11) – (а12 + а21)
a22 – a12
(а22 + а11) – (а12 + а21)
Моделирование конфликтных ситуаций
в экономике
3. Аналитическое решение игры 2×2.
Вопрос. При каком условии справедливы
полученные соотношения?
Очевидно, когда знаменатель не равен 0.
(а22 + а11) – (а12 + а21) ≠ 0
(7.5)
Равенство нулю выражения (7.5) является
необходимым условием наличия седловой точки в
матрице игры.
Моделирование конфликтных ситуаций
в экономике
4. Матричные игры и задачи линейного
программирования.
Между матричными играми и линейным
программированием существует взаимосвязь,
которая состоит в том, что решение любой
матричной игры можно свести к решению пары
двойственных задач линейного
программирования специального вида и,
наоборот, любая задача линейного
программирования, которая имеет решение,
может быть сведена к матричной игре
специального вида.
Моделирование конфликтных ситуаций
в экономике
4. Матричные игры и задачи линейного
программирования.
Теорема. Решение матричной игры m×n c матрицей А,
элементы которой aij>0, эквивалентно решению
следующей пары двойственных задач линейного
программирования:
m
 x  min
i 1
i
m
 aij x  1
i 1
i
n
y
j 1
j
 max
n
 aij y
j 1
1
j
Моделирование конфликтных ситуаций
в экономике
4. Матричные игры и задачи линейного
программирования.
Поясним теорему, опуская доказательство.
Пусть имеем матрицу игры m×n.
Оптимальная стратегия P={p1,p2,…,pm}
обеспечивает ему выигрыш H(P,Q)≥ V.
Если игрок В выбирает чистую стратегию Вj, то
выигрыш игрока А есть:
H(P,Bj)=Σaijpi=a1jp1+a2jp2+…+amjpm≥ V; Σpi = 1
Получим систему из n неравенств.
Моделирование конфликтных ситуаций
в экономике
 p1 a11  p2 a21  ...  pn an1  V
p
 1 a12  p2 a22  ...  pn an 2  V

.......... .......... .......... .......

 p1 a1n  p2 a2n  ...  pn ann  V
p1  p2  ...  pn  1
(7.6)
Если V>0, то все неравенства можно разделить на V.
Условие V>0 легко достигается путем прибавления к
каждому элементу aij константы r>0.
Эта операция приведет к смещению цены игры V на r,
но не повлияет на выбор оптимальных стратегий.
Моделирование конфликтных ситуаций
в экономике
4. Матричные игры и задачи линейного программирования.
В результате получим:
p2
pn
 p1


...

a n1  1
 V a11 V a21
V
p
p
p
 1 a12  2 a22  ...  n an 2  1
V
V
V
.......... .......... .......... .......

 p1 a1n  p2 a2n  ...  pn ann  1
 V
V
V
p1 p2
p
1

 ...  n 
V V
V V
(7.7)
Моделирование конфликтных ситуаций
в экономике
4. Матричные игры и задачи линейного программирования.
Вводя переменные x1=p1/v, x2=p2/v,… и, учитывая, что игрок А
стремится получить максимальный выигрыш (V=>max или
1/v=>min), получим задачу линейного программирования для
игрока А: (Аналогичные рассуждения приводят к
двойственной задачи для игрока В)
x1+x2+x3+…+xm=>min
a11x1+a21x2+…+am1xm ≥ 1
a12x1+a22x2+…+am2xm ≥ 1
y1+y2+y3+…+yn=>max
a11y1+a12y2+…+a1nyn ≤ 1
a21y1+a22y2+…+a2nyn ≤ 1
a1nx1+a2nx2+…+amnxm ≥ 1
am1y1+am2y2+…+amnyn ≤ 1
Решения этих задач позволяет найти оптимальные смешанные
стратегии игроков А и В.
Моделирование конфликтных ситуаций
в экономике
Пример. Пусть исходная матрица игры имеет вид.
А\В
В1
В2
В3
αi
А\В
В1
В2
В3
αi
А1
-3
4
4
-3
А1
1
8
8
1
А2
1
-2
1
-2
А2
5
2
5
2
А3
4
4
-2
-2
А3
8
8
2
2
βj
4
4
4
4\-2
βj
8
8
8
8\2
Задачи линейного программирования для игроков А и В
имеют вид:
Решение есть:
Х1+х2+х3 => min y1+y2+y3=>max
1x1+5x2+8x3 ≥ 1 1y1+8y2+8y3≤ 1
8x1+2x2+8x3 ≥ 1 5y1+2y2+5y3≤ 1
8x1+5x2+2x3 ≥ 1 8y1+8y2+2y3≤ 1
Z=0.2045; V1=1/z=4.89; V=V1-4=0.89
x1=0.045; x2=0.106; x3=0.053;
p1=0.222; p2=0.519; p3=0.259;
q1=0.444; q2=0.037; q3=0.519
Download