Методы решения игровых задач».

Моделирование конфликтных ситуаций в экономике Методы решения игровых задач Моделирование конфликтных ситуаций в экономике 1. Принцип доминирования. Цель. Уменьшить размерность задачи (редуцировать платежную матрицу). Принцип доминирования – один из приемов редуцирования платежной матрицы. Идея принципа – выбросить из рассмотрения те стратегии игроков, которые являются очевидно не выгодными для игроков. Моделирование конфликтных ситуаций в экономике Рассмотрим применение принципа на примере. Пусть матрица игры имеет вид: Аi\Bj B1 B2 B3 А1 -2 1 3 0 1 А2 -1 -4 2 -1 -4 А3 1 -5 6 3 -5 B4 B5 Начнем анализ этой матрицы с позиций игрока В. 1. Значения проигрышей игрока В в столбцах В2 и В5 совпадают. Это означает, что с точки зрения исхода игры стратегии В2 и В5 равноценны и дублируют друг друга. Игроку В не имеет смысла оставлять в своем арсенале обе стратегии. Одну можно исключить. Пусть В. Моделирование конфликтных ситуаций в экономике Пример (Принцип доминирования, продолжение). Аi\Bj B1 B2 B3 B4 А1 -2 1 3 0 А2 -1 -4 2 -1 А3 1 -5 6 3 В результате получена матрица игры на один столбец меньше. Вывод. Матрица игры может содержать дублирующие столбцы (строки). 2. Столбец В3 приносит максимальный проигрыш игроку В при любой стратегии игрока А, т.к. аi3>aij при всех i и j≠3. Такой столбец (стратегию) называют строго доминирующим остальные столбцы. Столбец В3 можно удалить, т.к. разумный игрок этой стратегией никогда не воспользуется. Моделирование конфликтных ситуаций в экономике Пример (Принцип доминирования, продолжение). Аi\Bj B1 B2 B4 А1 -2 1 0 А2 -1 -4 -1 А3 1 -5 3 3. Если сравнить столбцы В1 и В4, то видно, что а14>а11, a24=a21, a43>a31, т.е. в столбце В4 содержатся элементы, которые либо строго больше элементов столбца В1, либо равны соответствующим элементам столбца В1. В этом случае говорят, что столбец (стратегия) В4 не строго доминирует столбец (стратегию) В1. Столбец (стратегию) В4 можно исключить из рассмотрения, т.к. эта стратегия приносит не меньший проигрыш, что и стратегия В1. Моделирование конфликтных ситуаций в экономике Пример (Принцип доминирования, продолжение). Аi\Bj А1 B1 -2 B2 1 А2 -1 -4 А3 1 -5 В результате рассмотрения неэффективности стратегий игрока В, удалось игру размерностью 3×5 уменьшить до размера 2×3. С аналогичных позиций можно рассмотреть эффективности стратегий игрока А, т.е. выявить дублирующие, строго и не строго доминирующие строки (стратегии) игрока А. Вывод. Прежде, чем начинать решение игры, следует по возможности уменьшить ее размерность. Одним из приемов понижения размерности является принцип доминирования. Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. Ai\Bj B1 B2 A1 a11 a12 A2 a21 a22 Общий вид матрицы игры 2×2 Решению такой игры можно дать наглядную геометрическую интерпретацию. Метод базируется на том, что множество всех смешанных стратегий игроков можно представить в виде отрезка [0,1]. Учитывая минимальную размерность игры, все смешанные стратегии обоих игроков можно разместить на одном отрезке [0,1]. Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. Пусть игрок А имеет смешанную стратегию Р={p1, p2}. Обозначим p2 через p, учитывая, что p1+p2=1, получим p1=1-p, или P={(1-p), p}. При р=0 Р={1,0} – стратегия А1, при р=1 P={0,1} – стратегия А2. Если точка 0 соответствует стратегии А1, а точка 1 стратегии А2, то устанавливается взаимно однозначное соответствие между точками отрезка [0,1] и множеством смешанных стратегий игрока А. А1 0 А2 р2=р р р1=1-р 1 Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. Пусть игрок А выбирает свою смешанную стратегию P={1-p, p}, а игрок В чистую стратегию В1. Тогда выигрыш игрока А есть: H(P,B1) = Σpiai1 = p1a11+p2a21=(1-p)a11+pa21= = p(a21-a11)+a11 (6.1) В системе координат (p,H) зависимость (6.1) представляет собой отрезок прямой, заданный на отрезке [0,1], проходящий через точки (0,а11) и (1, а21) Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. Пусть для определенность а11<а21. а21 H(P) а11 Если игрок В придерживается своей чистой стратегии В1, то выигрыш игрока А при всех его смешанных стратегиях будет лежать на отрезке [a11,a21]. Пусть игрок В придерживается чистой стратегии В2. Тогда выигрыш игрока А есть: 0(А1) 1(А2) H(P,B2)=Σpiai2 = p1a12 + p2a22 = (1-p)a12+pa22 = p(a22-a12)+a12 Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. H(P) а21 а12 а22 а11 0(А1) 1(А2) Зависимость H(P,B2)=H(P) есть отрезок между точками (0,a12) и (1,a22). Пусть а12>а22. Вопрос. Как определить оптимальную смешанную стратегию игрока А? Показатель эффективности смешанной стратегии P={1-p,p} есть min{H(P,B1),H(P,B2). Графически это нижняя огибающая отрезков а11-а21 и а12-а22. Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. а21 H(P) а12 V N а22 α =а11 0(А1) p 1(А2) Оптимальной стратегии игрока А соответствует max α(P) или наивысшая точка на огибающей. В данном случае это точка N пересечение отрезков а11-а21 и а12а22. Абсцисса точки N соответствует оптимальной стратегии P0={1pN,PN} игрока А. Ордината точки N – цена игры V. Показатель эффективности стратегии А1 - α(A1)=min a11,a12=a11, показатель эффективности стратегии А2 - α(A2)=min (a22,a21)=a22. Нижняя цена игры – min(α(A1), α(A2))=a11 Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. А21=β H(P) а12 V N а22 α =а11 0(А1) p 1(А2) Оптимальные стратегии игрока В лежат на верхней огибающей отрезков а11-а21 и а12-а22. Соответственно неэффективности стратегий игрока В и верхняя цена игры соответственно есть: β(В1)=max (a11,a21)=a21, β(В2)=max(a12,a22)=a12, β=min(β(В1),β(В2))=a12. Для нахождения оптимальной смешанной стратегии игрока В необходимо вспомнить, что В=-АТ и провести аналогичные построения. Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. H(P) a22=β а11 N а21=α а11 H(P) а11 а12 а12 α=β а21 N a22 а21 а12 p a11 =a21 a22 p P0={0,1} α=β=a12 P0={1,0} Положение оптимальной стратегии зависит от соотношений между компонентами платежной матрицы. Моделирование конфликтных ситуаций в экономике 2.1 Решение игры 2×N Игрок А имеет SA={A1, A2} Игрок В имеет SB={B1,B2,B3,…,Bn} Тогда получим: H(P,B1)=(1-p)a11+pa21=p(a21-a11)+a11 H(P,B2)=(1-p)a12+pa22=p(a22-a12)+a12 H(P,Bn)=(1-p)a1n+pa2n=p(a2n-a1n)+a1n Получаем N отрезков в координатах (р,Н), строим огибающую, ищем наивысшею точку на ней. Моделирование конфликтных ситуаций в экономике 3. Аналитическое решение игры 2×2. Рассмотрим случай, когда матрица игры не имеет седловой точки. Тогда решение можно получить исходя из геометрического решения. Имеем: H(P,B1) = Σpiai1 = p(a21-a11)+a11 (7.3) H(P,B2)=Σpiai2 = p(a22-a12)+a12 (7.4) Условие наличия цены игры V есть: H(P,B1) = H(PB2) Моделирование конфликтных ситуаций в экономике 3. Аналитическое решение игры 2×2. Приравняв выражения (7.3) и (7.4), получим уравнение, из которого легко вычислить значение р=Р20: p(a22-a12)+a12 = p(a21-a11)+a11 или р(а11+а22-а12-а21)= а11-а12 Откуда следует: р2 = р = 0 а11 – а12 (а22 + а11) – (а12 + а21) р1 = 1-р = 0 а22 – а21 (а22 + а11) – (а12 + а21) Моделирование конфликтных ситуаций в экономике 3. Аналитическое решение игры 2×2. Соответственно для игрока В получим: H(Q,A1)=q1a11+q2a12 = q(a12-a11)+a11 H(Q,A2)=q1a21+q2a22 = q(a22-a21)+a21 Откуда следует: q2 0 = q = a11 – a21 (а22 + а11) – (а12 + а21) V= q10 =1- q = a11a22 – a12a21 (а22 + а11) – (а12 + а21) a22 – a12 (а22 + а11) – (а12 + а21) Моделирование конфликтных ситуаций в экономике 3. Аналитическое решение игры 2×2. Вопрос. При каком условии справедливы полученные соотношения? Очевидно, когда знаменатель не равен 0. (а22 + а11) – (а12 + а21) ≠ 0 (7.5) Равенство нулю выражения (7.5) является необходимым условием наличия седловой точки в матрице игры. Моделирование конфликтных ситуаций в экономике 4. Матричные игры и задачи линейного программирования. Между матричными играми и линейным программированием существует взаимосвязь, которая состоит в том, что решение любой матричной игры можно свести к решению пары двойственных задач линейного программирования специального вида и, наоборот, любая задача линейного программирования, которая имеет решение, может быть сведена к матричной игре специального вида. Моделирование конфликтных ситуаций в экономике 4. Матричные игры и задачи линейного программирования. Теорема. Решение матричной игры m×n c матрицей А, элементы которой aij>0, эквивалентно решению следующей пары двойственных задач линейного программирования: m  x  min i 1 i m  aij x  1 i 1 i n y j 1 j  max n  aij y j 1 1 j Моделирование конфликтных ситуаций в экономике 4. Матричные игры и задачи линейного программирования. Поясним теорему, опуская доказательство. Пусть имеем матрицу игры m×n. Оптимальная стратегия P={p1,p2,…,pm} обеспечивает ему выигрыш H(P,Q)≥ V. Если игрок В выбирает чистую стратегию Вj, то выигрыш игрока А есть: H(P,Bj)=Σaijpi=a1jp1+a2jp2+…+amjpm≥ V; Σpi = 1 Получим систему из n неравенств. Моделирование конфликтных ситуаций в экономике  p1 a11  p2 a21  ...  pn an1  V p  1 a12  p2 a22  ...  pn an 2  V  .......... .......... .......... .......   p1 a1n  p2 a2n  ...  pn ann  V p1  p2  ...  pn  1 (7.6) Если V>0, то все неравенства можно разделить на V. Условие V>0 легко достигается путем прибавления к каждому элементу aij константы r>0. Эта операция приведет к смещению цены игры V на r, но не повлияет на выбор оптимальных стратегий. Моделирование конфликтных ситуаций в экономике 4. Матричные игры и задачи линейного программирования. В результате получим: p2 pn  p1   ...  a n1  1  V a11 V a21 V p p p  1 a12  2 a22  ...  n an 2  1 V V V .......... .......... .......... .......   p1 a1n  p2 a2n  ...  pn ann  1  V V V p1 p2 p 1   ...  n  V V V V (7.7) Моделирование конфликтных ситуаций в экономике 4. Матричные игры и задачи линейного программирования. Вводя переменные x1=p1/v, x2=p2/v,… и, учитывая, что игрок А стремится получить максимальный выигрыш (V=>max или 1/v=>min), получим задачу линейного программирования для игрока А: (Аналогичные рассуждения приводят к двойственной задачи для игрока В) x1+x2+x3+…+xm=>min a11x1+a21x2+…+am1xm ≥ 1 a12x1+a22x2+…+am2xm ≥ 1 y1+y2+y3+…+yn=>max a11y1+a12y2+…+a1nyn ≤ 1 a21y1+a22y2+…+a2nyn ≤ 1 a1nx1+a2nx2+…+amnxm ≥ 1 am1y1+am2y2+…+amnyn ≤ 1 Решения этих задач позволяет найти оптимальные смешанные стратегии игроков А и В. Моделирование конфликтных ситуаций в экономике Пример. Пусть исходная матрица игры имеет вид. А\В В1 В2 В3 αi А\В В1 В2 В3 αi А1 -3 4 4 -3 А1 1 8 8 1 А2 1 -2 1 -2 А2 5 2 5 2 А3 4 4 -2 -2 А3 8 8 2 2 βj 4 4 4 4\-2 βj 8 8 8 8\2 Задачи линейного программирования для игроков А и В имеют вид: Решение есть: Х1+х2+х3 => min y1+y2+y3=>max 1x1+5x2+8x3 ≥ 1 1y1+8y2+8y3≤ 1 8x1+2x2+8x3 ≥ 1 5y1+2y2+5y3≤ 1 8x1+5x2+2x3 ≥ 1 8y1+8y2+2y3≤ 1 Z=0.2045; V1=1/z=4.89; V=V1-4=0.89 x1=0.045; x2=0.106; x3=0.053; p1=0.222; p2=0.519; p3=0.259; q1=0.444; q2=0.037; q3=0.519

Методы решения игровых задач».

Related documents

Products

Support

Методы решения игровых задач».

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib