Uploaded by Artsiom Lipnitski

usr ekon-ka LIpnitski

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ
УО «БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ»
Кафедра математических методов в экономике
УСРС
по дисциплине: Эконометрика и экономико-математические методы и
модели
на тему: Матричные игры. Статистические игры
Студент
ФЭМ, 3-й курс, 18ДКУ-1
А.А. Липницкий
(подпись)
(дата)
Руководитель
доцент
(подпись)
(дата)
МИНСК 2020
Е.А. Шинкевич
Вариант 12
Задача 1.
1. Проверяем, имеет ли платежная матрица седловую точку.
Считаем, что игрок I выбирает свою стратегию так, чтобы получить
максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы
минимизировать выигрыш игрока I.
В1
4
10
12
3
12
А1
А2
А3
А4
max(Bi)
В2
7
5
4
3
7
В3
5
10
12
2
12
В4
8
6
5
4
8
min(Аi)
4
5
4
2
Нижняя цена игры a = max(ai) = 5, верхняя цена игры b = min(bj) = 7.
Что свидетельствует об отсутствии седловой точки, так как a ≠ b.
Находим решение игры в смешанных стратегиях.
2. Проверяем платежную матрицу на доминирующие строки и
доминирующие столбцы.
Стратегия A1 доминирует над стратегией A4 (все элементы строки 1
больше или равны значениям 4-ой строки), следовательно, исключаем 4-ую
строку матрицы. Вероятность p4 = 0.
С позиции проигрышей игрока В стратегия B1 доминирует над
стратегией B3 (все элементы столбца 1 меньше элементов столбца 3),
следовательно, исключаем 3-й столбец матрицы. Вероятность q3 = 0.
С позиции проигрышей игрока В стратегия B2 доминирует над
стратегией B4 (все элементы столбца 2 меньше элементов столбца 4),
следовательно, исключаем 4-й столбец матрицы. Вероятность q4 =
0.Преобразованная матрица имеет вид:
4
10
12
7
5
4
3. Находим решение игры в смешанных стратегиях графоаналитическим
методом:
Решим задачу графическим методом.
Решение игры проводим с позиции игрока B, придерживающегося
максиминной стратегии.
2
Выделяем верхнюю границу выигрыша A1NA2. Максиминной
оптимальной стратегии игрока B соответствует точка N, лежащая на
пересечении прямых A1A1 и A2A2, для которых можно записать следующую
систему уравнений:
y = 4 + (7 - 4)q2
y = 10 + (5 - 10)q2
Откуда
q1 = 1/4
q2 = 3/4
Цена игры, y = 25/4
Теперь можно найти минимаксную стратегию игрока A, записав
соответствующую систему уравнений, исключив стратегию A3, которая дает
явно больший проигрыш игроку A, и, следовательно, p3 = 0.
4p1+10p2 = y
7p1+5p2 = y
p1+p2 = 1
или
4p1+10p2 = 25/4
7p1+5p2 = 25/4
p1+p2 = 1
3
Решая эту систему, находим:
p1 = 5/8.
p2 = 3/8.
Ответ: q*=(1/4; 3/4; 0; 0); p*=(5/8; 3/8; 0; 0); v=25/4.
Задача 2. После нескольких лет эксплуатации промышленное
оборудование оказывается в одном из следующих состояний:
1) оборудование может использоваться в очередном году после
профилактического ремонта;
2) для безаварийной работы оборудования в дальнейшем следует
заменить отдельные его детали и узлы;
3) оборудование требует капитального ремонта или замены.
В зависимости от сложившейся ситуации руководство предприятия в
состоянии принять такие решения: 1) отремонтировать оборудование силами
заводских специалистов, что потребует, в зависимости от обстановки, затрат,
равных 13, 9 или а 15 ден. ед.; 2) вызвать специальную бригаду ремонтников,
расходы в этом случае составят 20, 12 или 11 ден. ед.; 3) заменить
оборудование новым, реализовав устаревшее оборудование по его остаточной
стоимости; совокупные затраты в результате этого мероприятия будут равны
соответственно 18, 10 или 14 ден. ед. Указанные выше расходы предприятия
включают кроме стоимости ремонта и заменяемых деталей и узлов убытки,
вызванные ухудшением качества выпускаемой продукции, простоем
неисправного оборудования, а также затраты на установку и отладку нового
оборудования. Требуется:
1) придать описанной ситуации игровую схему, установить характер игры
и выявить ее участников, указать возможные чистые стратегии сторон;
2) составить платежную матрицу;
3) выяснить, какое решение о работе оборудования в предстоящем году
целесообразно
рекомендовать
руководству
предприятия,
чтобы
минимизировать потери при cледующих предположениях:
а) накопленный на предприятии опыт эксплуатации аналогичного
оборудования показывает, что вероятности указанных выше состояний
оборудования равны соответственно 0,3, 0,45, 0,25;
б) имеющийся опыт свидетельствует о том, что все три возможных
состояния оборудования равновероятны;
в) о вероятностях состояний оборудования ничего определенного сказать
нельзя.
Указание. В п. 3 следует найти оптимальные чистые стратегии, пользуясь:
в п. 3) а) — критерием Байеса, в п. 3) б) — критерием Лапласа, в п. 3) в) —
критериями Вальда, Сэвиджа, Гурвица (значение параметра в критерии
Гурвица – 0,7).
Решение:
В игре участвуют 2 игрока, первый – предприятие, второй – природа.
Игра является статистической.
4
Возможные стратегии и рассчитанные элементы приведены в платежной
матрице:
П1
-3
-20
-18
0,3
А1
А2
А3
q
П2
-9
-12
-10
0,45
П3
-15
-11
-14
0,25
Критерий Байеса.
По критерию Байеса за оптимальные принимается та стратегия (чистая)
Ai, при которой максимизируется средний выигрыш a или минимизируется
средний риск r.
Считаем значения ∑(aijpj)
∑(a1,jpj) = 0*0.3 + 6*0.45 + 12*0.25 = 5.7
∑(a2,jpj) = 17*0.3 + 9*0.45 + 8*0.25 = 11.15
∑(a3,jpj) = 15*0.3 + 7*0.45 + 11*0.25 = 10.4
Ai
A1
A2
A3
pj
П1
0
5.1
4.5
0.3
П2
2.7
4.05
3.15
0.45
П3
3
2
2.75
0.25
∑(aijpj)
5.7
11.15
10.4
Выбираем из (5.7; 11.15; 10.4) максимальный элемент max=11.15
Вывод: выбираем стратегию N=2.
Критерий Лапласа.
Если вероятности состояний природы правдоподобны, для их оценки
используют принцип недостаточного основания Лапласа, согласно которого все
состояния природы полагаются равновероятными, т.е.:
q1 = q2 = ... = qn = 1/n.
qi = 1/3
Ai
A1
A2
A3
pj
П1
0
5.667
5
0.333
П2
2
3
2.333
0.333
П3
4
2.667
3.667
0.333
∑(aij)
6
11.333
11
Выбираем из (6; 11.33; 11) максимальный элемент max=11.33
Вывод: выбираем стратегию N=2.
5
Критерий Вальда.
По критерию Вальда за оптимальную принимается чистая стратегия,
которая в наихудших условиях гарантирует максимальный выигрыш, т.е.
a = max(min aij)
Критерий Вальда ориентирует статистику на самые неблагоприятные
состояния природы, т.е. этот критерий выражает пессимистическую оценку
ситуации.
Ai
A1
A2
A3
П1
0
17
15
П2
6
9
7
П3
12
8
11
min(aij)
0
8
7
Выбираем из (0; 8; 7) максимальный элемент max=8
Вывод: выбираем стратегию N=2.
Критерий Севиджа.
Критерий минимального риска Севиджа рекомендует выбирать в качестве
оптимальной стратегии ту, при которой величина максимального риска
минимизируется в наихудших условиях, т.е. обеспечивается:
a = min(max rij)
Критерий Сэвиджа ориентирует статистику на самые неблагоприятные
состояния природы, т.е. этот критерий выражает пессимистическую оценку
ситуации.
Находим матрицу рисков.
Рассчитываем 1-й столбец матрицы рисков.
r11 = 17 - 0 = 17; r21 = 17 - 17 = 0; r31 = 17 - 15 = 2;
2. Рассчитываем 2-й столбец матрицы рисков.
r12 = 9 - 6 = 3; r22 = 9 - 9 = 0; r32 = 9 - 7 = 2;
3. Рассчитываем 3-й столбец матрицы рисков.
r13 = 12 - 12 = 0; r23 = 12 - 8 = 4; r33 = 12 - 11 = 1;
Ai
A1
A2
A3
П1
17
0
2
П2
3
0
2
П3
0
4
1
Результаты вычислений оформим в виде таблицы.
6
Ai
A1
A2
A3
П1
17
0
2
П2
3
0
2
П3
0
4
1
max(aij)
17
4
2
Выбираем из (17; 4; 2) минимальный элемент min=2
Вывод: выбираем стратегию N=3.
Критерий Гурвица.
Критерий Гурвица является критерием пессимизма - оптимизма. За
оптимальную принимается та стратегия, для которой выполняется
соотношение:
max(si)
где si = y min(aij) + (1-y)max(aij)
При y = 1 получим критерий Вальде, при y = 0 получим –
оптимистический критерий (максимакс).
Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего
для человека поведения природы. Как выбирается y? Чем хуже последствия
ошибочных решений, тем больше желание застраховаться от ошибок, тем y
ближе к 1.
Рассчитываем si.
s1 =0.7*0+(1-0.7)*12=3.6
s2 =0.7*8+(1-0.7)*17=10.7
s3 = 0.7*7+(1-0.7)*15 = 9.4
Ai
A1
A2
A3
П1
0
17
15
П2
6
9
7
П3
12
8
11
min(aij)
0
8
7
max(aij)
12
17
15
y min(aij) + (1-y)max(aij)
3.6
10.7
9.4
Выбираем из (3.6; 10.7; 9.4) максимальный элемент max=10.7
Вывод: выбираем стратегию N=2.
Таким образом, в результате решения статистической игры по различным
критериям чаще других рекомендовалась стратегия A2.
7
Download