ТЕОРИЯ ИГР

advertisement
Теория игр
• Теория игр – это совокупность
математических методов анализа и
оценки конфликтных ситуаций.
• Задача теории игр состоит в выборе
такой линии поведения игрока,
отклонение от которой может лишь
уменьшить его выигрыш.
• Моделями теории игр можно описать
экономические, правовые, классовые,
военные конфликты, взаимодействие
человека с природой.
• Все такие модели в теории игр принято
называть играми.
Если имеется несколько конфликтующих
сторон(лиц),каждая из которых принимает
некоторое
решение,
определяемое
заданным набором правил, и каждому из
лиц
известно
возможное
конечное
состояние конфликтной ситуации с заранее
определенными для каждой из сторон
платежами, то говорят, что имеет место
игра
Определения
1.Ситуация наз-ся конфликтной, если в
ней участвуют стороны, интересы
которых полностью или частично
противоположны.
2. Игра - это действительный или
формальный конфликт, в котором
имеется по крайне мере два участника,
каждый из которых стремится к
достижению собственных целей.
3. Допустимые действия каждого из
игроков, направленные на достижение
некоторой цели, называются правилами
игры.
4. Количественная оценка результатов
игры называется платежом.
5.Игра называется парной , если в ней
участвуют только два лица.
6. Парная игра называется игрой с
нулевой суммой, если проигрыш одного
игрока равен выигрышу второго.
7. Однозначное описание выбора игрока в
каждой из возможных ситуаций, при которой
он должен сделать личный ход, называется
стратегией игрока.
8.Стратегия игрока называется
оптимальной, если при многократном
повторении игры она обеспечивает
игроку максимально возможный средний
выигрыш ( минимально возможнай
средний проигрыш).
• Рассмотрим простейшую модель – игру, в
которой участвуют два игрока, множество
стратегий каждого игрока конечно, а
выигрыш одного игрока равен проигрышу
другого (бескоалиционная, конечная,
антагонистическая игра двух лиц).
• Такую игру называют матричной.
• Пусть 1-й игрок имеет всего m стратегий
(i=1,2, …, m), а 2-й – n стратегий (j=1,2,…, n).
• Тогда игра полностью определяется
заданием матрицы A  aij mn,
где aij – выигрыш 1-го игрока при условии,
что он выбрал стратегию i (т.е. строку) а 2-й
игрок – стратегию j (т.е. столбец). Эти
стратегии называют чистыми).
• Матрица А называется матрицей игры или
платежной матрицей.
 mn
A  aij
max aij
i
v
Схема:
a12 
a1n  min a 
 a11

 j 1j

a

a 22 
a 2 n min a 2 j 
21

 j

А
min aij  v
    max
j
i







 a m1
am 2 
a mn min a mj 

 j



max ai1 max ai 2  max ain
i 
ii
min max aij  v
j
i
• Например,
 2 3 4 3


А    3 4  5   5  v  3
 4 5 6 5


4
4
6
v4
• Соответствующие стратегии:
i0=1(максиминная), j0=1;2 (минимаксная).
Теорема. Нижняя цена игры всегда не
превосходит верхней цены игры:
vv
• Например,
  5 3 1 20   5


А 5
5 4 6  4  v  v  4.
  4  2 0  5  5


5
5 4 20
• (2,3)-ситуация равновесная, v =4 – цена
игры, i*=2, j*=3 – оптимальные стратегии
1-го и 2-го игроков. Выбрав их, 1-й игрок
обеспечит себе выигрыш не менее 4 ед., а
2-й игрок проиграет не более 4 ед. при
любом выборе другого игрока.
Опр. Вектор, каждая из компонент которого
показывает относительную частоту
(вероятность) использования игроком
соответствующей чистой стратегии,
называется смешанной стратегией данного
игрока.
xi  0
m
 xi  1
i 1
n
yj  0
yj
j 1
1
𝑚
𝑎𝑖𝑗 𝑥𝑖∗ ≥ 𝜈
(𝑗 = 1,2, … , 𝑛)
𝑎𝑖𝑗 𝑦𝑗∗ ≤ 𝜈
(𝑖 = 1,2, … , 𝑚)
𝑖=1
𝑛
𝑗 =1
 a11 a12 
 – платежная матрица
• Пусть А  
 a21 a22 
игры .
Если она не имеет седловой точки, то
единственное решение игры можно найти
• 1) решив две системы:
a11 y1  a12 y 2  v,

a21 y1  a22 y 2  v,
 y  y  1;
2
 1
a11x1  a21x2  v,

a12 x1  a22 x2  v,
 x  x  1;
 1 2
• 2) по формулам:
a22  a21
x1 
a11  a22  a12  a21
a11  a12
x2 
a11  a22  a12  a21
или x2  1  x1
a22  a12
y1 
a11  a22  a12  a21
или y2  1  y1
a11a22  a12 a21
v
a11  a22  a12  a21
a11  a21
y2 
a11  a22  a12  a21
• Найдем, например, решение игры с
платежной матрицей
 3  1

А  
 2 4
имеет седловой точки.
, которая не
• 1) Составим системы:
3x1  2 x2  v,

 x1  4 x2  v,
 x  x  1.
 1 2
3 y1  y 2  v,

2 y1  4 y 2  v,
 y  y  1.
2
 1
• Решив системы, получим:
y1 
5
6
y2 
1
6
x1 
1
3
2
x2 
3
7
v
3
7
1 2 * 5 1
• то есть x   ;  y   ;  v  -решение игры.
6 6
3 3
3
*
• 2) Найдем решение по формулам:
42
2 1
x1 
 
3  4  2 1 6 3
1 2
x2  1  
3 3
4 1
5
y1 

3  4  2 1 6
5 1
y2  1  
6 6
3  4  2 1 14 7
v


3  4  2 1 6 3
Сведение матричной игры
к двойственной задаче
линейного
программирования
• Пусть матрица игры имеет вид
 a11

 a 21
А
...

a
 m1
a12
a 22
...
am 2
a1n 

a2n 
... ... 

... a mn 
...
...
a11x1  a21x2  ...  am1 xm  v,

a12 x1  a22 x2  ...  am 2 xm  v,
      

a1n x1  a2 n x2  ...  amn xm  v,
 x1  x2  ...  xm  1,

 xi  0, i  1,2,..., m.
a11 p1  a 21 p 2  ...  a m1 p m  1,

a12 p1  a 22 p 2  ...  am 2 pm  1,

      
a p  a p  ...  a p  1,
mn m
2n 2
 1n 1
 pi  0, i  1,2,..., m;
1
p1  p 2  ...  p m   min
v
a11 p1  a21 p2  ...  am1 pm  1,
a p  a p  ...  a p  1,
m2 m
 12 1 22 2
      
a p  a p  ...  a p  1,
mn m
 1n 1 2 n 2
 pi  0, i  1,2,...,m;
a11 y1  a12 y 2  ...  a1n y n  v,

a21 y1  a22 y 2  ...  a2n y n  v,
      

am1 y1  am 2 y 2  ...  amn y n  v,
 y1  y 2  ...  y n  1,

 y j  0, j  1,2,..., n.
(1)
a11q1  a12 q2  ...  a1n qn  1,

a21q1  a22 q2  ...  a2 n qn  1,

      
a q  a q  ...  a q  1,
mn n
 m1 1 m 2 2
q j  0, j  1,2,..., n;
1
q1  q2  ...  qn   max
v
a11q1  a12 q2  ...  a1n qn  1,

a21q1  a22 q2  ...  a2 n qn  1,

      
a q  a q  ...  a q  1,
m2 2
mn n
 m1 1
q j  0, j  1,2,..., n;
• Пример. Найти решение игры с матрицей
  2  2 0


А   2
0  1
 0  1  1


• Решение. Перейдем к положительной
матрице, прибавив 3 ко всем элементам
матрицы А:
1 1 3


А   1 3 2 
3 2 2


• Составим двойственную задачу линейного
программирования:
q1  q 2  3q3  1,

q1  3q 2  2q3  1,

3q1  2q 2  2q3  1,
q j  0, j  1,2,3;

1
q1  q 2  q3   max
v
 p1  p 2  3 p3  1,

 p1  3 p 2  2 p3  1,

3 p1  2 p 2  2 p3  1,
 pi  0, i  1,2,3;
1
p1  p 2  p3   min
v
• Решим задачу симплексным методом
q1  q 2  3q3  q 4  1,

q1  3q 2  2q3  q5  1,
3q  2q  2q  q  1,
2
3
6
 1
q  0, j  1,6;
 j
1
q1  q 2  q3   max
v
1
1
0
0
0
q1
q2
q3
q4
q5
q6
С0
P0
q4
0
1
1
1
3
1
0
0
q5
0
1
1
3
2
0
1
0
q6
0
1
3
2
2
0
0
1
0
-1
-1
-1
0
0
0
Базис
1-я
итерация
1
1
1
0
0
0
q1
q2
q3
q4
q5
q6
С0
P0
q4
0
2/3
0
1/3
7/3
1
0
-1/3
q5
0
2/3
0
7/3
4/3
0
1
-1/3
q1
1
1/3
1
2/3
2/3
0
0
1/3
0
0
-1/3
-1/3
0
0
1/3
Базис
2-я
итерация
1
1
1
0
0
0
q1
q2
q3
q4
q5
q6
С0
P0
q4
0
4/7
0
0
15/7
1
-1/7
-2/7
q2
1
2/7
0
1
4/7
0
3/7
-1/7
q1
1
1/7
1
0
2/7
0
-2/7
3/7
3/7
0
0
-1/7
0
1/7
2/7
Базис
3-я
итерация
1
1
1
0
0
0
q1
q2
q3
q4
q5
q6
С0
P0
q3
1
4/15
0
0
1
7/15
-1/15
-2/15
q2
1
2/15
0
1
0
-4/15
7/15
-1/15
q1
1
1/15
1
0
0
-2/15
-4/15
7/15
7/15
0
0
0
1/15
2/15
4/15
Базис
4-я
итерация
1
• Получаем решение двойственной задачи:
1 2 4
p ; ; 
 15 15 15 
 1 2 4
q ; ; 
 15 15 15 
1 7

v 15
• Тогда решение игры с матрицей
1 2 4
y   ; ; 
7 7 7
1 2 4
x   ; ; 
7 7 7
• Решение исходной игры:
1 2 4
x  ; ; 
7 7 7
*
1 2 4
y  ; ; 
7 7 7
*
6
v
7
A
15
v
7
Download