ФИО_____________________________ группа________ Экзаменационная работа по курсу

advertisement
ФИО_____________________________ группа________
Экзаменационная работа по курсу
«Теория игр и экономическое моделирование», 2007 год
Время выполнения: 2 час 50 минут.
Можно пользоваться всем, кроме средств связи и помощи друга.
Выходить из аудитории во время контрольной нельзя.
Ничего передавать друг другу нельзя.
За любые нарушения правил следует удаление без дополнительных предупреждений.
Желаю успехов в самостоятельном решении задач!
Задача 1. В армии А есть один самолет, с помощью которого можно атаковать одну из
трех целей 1, 2, или 3 армии Д. У армии Д есть только зенитная пушка, которую она
может установить для зашиты одной из трех целей. Армия А может уничтожить при атаке
только незащищенную цель. Для армии А выигрыш от уничтожения цели k равен k .
Аналогично, выигрыш армии Д от успешной защиты цели k равен k . При атаке на
защищенную цель выигрыш армии А равен нулю. При атаке на незащищенную цель
выигрыш армии Д равен нулю.
a) Приведите нормальную форму этой игры в матричном виде.
А\Д Д1 Д2 Д3
А1 0,1 1,0 1,0
А2 2,0 0,2 2,0
А3 3,0 3,0 0,3
б) Проведите последовательное исключение строго доминируемых стратегий, используя
смешанные стратегии.
Для армии А равновероятная атака на 2 и 3 доминирует атаку на 1, но не строго, если
Д защищает 3. Это легко поправить, взяв (3/5)А2+(2/5)А3. После исключения А1,
получим, что Д1 строго доминируется стратегией (1/2)Д1+(1/2)Д2. В оставшейся 2х2
матрице ничего стратегии не сравнимы по доминированию.
в) Найдите все равновесия Нэша (РН) (в чистых и смешанных стратегиях) в этой игре.
В чистых стратегиях РН нет. В смешанных стратегиях единственное РН легко
ищется по найденной в б) матрице 2х2: ( (3/5)А2+(2/5)А3 , (2/5)Д2+(3/5)Д3 ).
Задача 2. Рассмотрим следующую игру G в нормальной форме при 2  x  3 .
C1
C2
C3
C4
4,4 0,0 0,0 x,x
R2 0,0 -3,-3 0,0 0,0
R3 0,0 0,0 2,2 0,0
R4 x,x 0,0 0,0 1,1
В этой задаче ограничимся чистыми стратегиями.
а) Найдите совершенное по подыграм равновесие Нэша (СПРН) в игре G(3) (трехкратном
повторении исходной игры G ) , в котором в первом периоде игроки играют ( R2 , C2 ) .
В исходной игре есть два РН в чистых стратегиях: ( R1 , C1 ) и ( R3 , C3 ) . Построим
искомое СПРН в G(3) так: в периоде 1 оба играют ( R2 , C2 ) , а затем, если никто не
отклонился, то играем в периодах 2 и 3 стратегии ( R1 , C1 ) , а если отклонился, то ( R3 , C3 ) .
В периоде 2 отклоняться нет смысла, поскольку идет повторение РН. В периоде 1
отклоняться не выгодно, поскольку -3+4+4=5>0+2+2=4.
б) Пусть игра G повторяется бесконечное число раз. Можно ли на основе Народной
теоремы с помощью релейных стратегий построить в игре G (,  ) СПРН с выигрышами
(1,1) при некоторых условиях на коэффициент дисконтирования  , 0    1 ?
R1
В условиях Народной теоремы требуется, чтобы выигрыш каждого игрока в G (,  )
был больше, чем в некотором РН. Но у нас только два РН с выигрышами (4,4) и (2,2),
поэтому использовать релейные стратегии для построения РН не получится: не будет
выполнено условие отклонения.
в) Сконструируйте (на основе двухфазовых стратегий) в игре G (,  ) СПРН с
выигрышами (1,1) при некоторых допустимых параметрах 0    1 и 2  x  3 . Опишите
все множество допустимых параметров x и  , при котором сохраняется данное СПРН.
Возьмем две фазы: сотрудничество С= ( R4 , C4 ) и наказание Н= ( R2 , C2 ) . СПРН
начинается с сотрудничества, которое продолжается, пока кто-то от него не отклонится.
При отклонении наступает фаза наказания. Фаза наказания продолжается, пока в ответ не
будет наказания. Тогда Н меняется в следующем периоде на С.
Проверим устойчивость к отклонениям. Если повторяется С, то каждый (до
1
. Если отклониться и потом не
1 
x  0    0   2  ... . Условия невыгодности
нормировки выигрышей) получает 1  1   1  2  ... 
возвращаться в С через Н, то получим
1
. Если после отклонения вернуться к С через Н, то
1
получим выигрыш x  (3)    1   2  1   3 ... Условия невыгодности отклонения примут вид
x  (3)    1  1   x  1  4 . Если рассмотреть подыгру, начинающуюся с фазы Н, то при
отклонения получатся в виде x 
отклонении игрок получает 0 вместо -3 сейчас и 1 в оставшиеся периоды. Условия

3
невыгодности отклонения: 0  (3)  1    1  2  ... 
  .
1 
4
1
является следствием двух других, а
1
3
условие x  1  4 при 2  x  3 выполняется автоматически, если
  , поэтому все
4
Заметим, что первое условие отклонения x 
множество параметров, при которых данная конструкция дает СПРН описывается
неравенствами
3
   1.
4
Задача 3. Два участника аукциона конкурируют за покупку некоторого объекта. Ценности
объекта v1 и v2 для участников являются независимыми случайными величинами,
равномерно распределенными на отрезке [0,1]. Участник i имеет точною информацию
своем значении vi , но не знает v j . Участники делают ставки из диапазона [0,1]
одновременно и независимо друг от друга. В данном аукционе побеждает тот, кто
поставил большую ставку. При равенстве ставок бросается жребий. Каждый обязан
заплатить по средней ставке даже, если ему объект не достается! (Отказаться от
участия в этом аукционе нельзя.)
a) Выпишите функции выигрыша в данной игре.
bi  b j


, bi  b j 
 vi 
2


 vi bi  b j

ui (vi , bi , b j )   
, bi  b j 
2
2

 bi  b j

, bi  b j 
 
2


б) Найдите симметричное равновесие Байеса-Нэша (РБН) в данной игре в классе
квадратичных стратегий: bi (vi )  c  vi2  a , где c  0, a  0 .
Найдем ожидаемый выигрыш i при заданной стратегии b j (v j )  c  v 2j  a игрока j с
учетом того, что вероятность совпадения ставок при такой стратегии равна нулю. Ясно,
что при ставке bi  a игрок i всегда проигрывает, а поскольку платить надо и
проигравшему, то лучше уж делать нулевую ставку. При bi  a победа на аукционе игрока
bi  a
i определяется условием bi  b j (v j )  c  v 2j  a  v j 
b a
i
c
1
Ev j (ui (vi , bi , b j (v j ))   ui (vi , bi , b j (v j ))d v j  
0
 vi
bi  a
c

c
0
. Тогда
1
bi  b j (v j )
0
2
vi d v j   ( 
)d v j
bi
 const
2
Здесь под const понимается слагаемое, которое не зависит от vi и bi . Теперь при
фиксированном vi нужно найти максимум ожидаемого выигрыша по bi . Из условий 1-го
порядка получаем
vi
2 c bi  a

1
1
 bi  vi2  a . Итак, наилучший ответ на квадратичную
2
c
стратегию так же является квадратичным, поэтому РБН в этом классе искать можно.
Понятно, что при vi  0 наилучшей ставкой является bi  0 , поэтому в РБН должно быть
a  0 , а в симметричном равновесии c 
1
 c  1 . В итоге получаем единственное
c
квадратичное равновесие bi (vi )  vi2 , i  1,2 .
в) Покажите, что в этой игре нет других РБН с гладкими возрастающими b(vi ) .
Обозначим bj 1 (bi ) решение уравнения b j (v j )  bi . Тогда для ожидаемого выигрыша
получим выражение
1
bj 1 ( bi )
0
0
Ev j (ui (vi , bi , b j (v j ))   ui (vi , bi , b j (v j )) d v j  
 vi b j 1 (bi ) 
1
bi  b j (v j )
0
2
vi d v j   ( 
)dv j
bi
 const
2
Из условий 1-го порядка получаем
vi
1
 . Для симметричного РБН получаем
bj (vi ) 2
bi(vi )  2vi  bi (vi )  vi2  a ,
дифференциальное уравнение
т.е.
квадратичным стратегиям, а других гладких возрастающих РБН нет.
Задача 4. Рассмотрим следующую сигнальную игру.
опять
приходим
а) Найдите все выявляющие совершенные байесовские равновесия (СБР).
Потенциально есть два выявляющих равновесия со стратегиями LR или RL игрока 1.
Попробуем достроить LR до СБР. На LR игрок 2 ответит DU. Отклонения игрока 1 не
улучшают его выигрыша ни для одного из двух типов.
RL достраивается до СБР выбором DD за игрока 2 и проверкой невыгодности
отклонений для игрока 1.
Итого, есть два выявляющих СБР. Представления на информационных множествах
задаются автоматически.
б) Найдите все скрывающие СБР.
Попробуем построить LL СБР. D является в этом случае наилучшим ответом игрока
2, не зависимо от его представлений, при этом выигрыш игрока 1 будет равен 3 в обоих
случаях. Легко проверить, что при любом выборе U или D справа для одного из типов
игрока 1 при отклонении выигрыш будет больше 3. То же справедливо и для смешанной
стратегии, составленной из выбора U и D. Значит, такого СБР нет.
Попробуем построить RR СБР. u2 ( D)  0.8  2  0.2  0  1.6  u2 (U )  0.8  0  0.2 1  0.2 ,
поэтому справа игрок 2 сыграет D. Но слева игроку 2 всегда выгодно играть D, поэтому
типу t B игрока 1 выгодно отклониться, чтобы получить 3 вместо 1.
Итак, скрывающих СБР в этой игре нет.
в) Найдите СБР в смешанных стратегиях, в котором игрок 1 хотя бы одного типа
выбирает L и R с положительной вероятностью.
Поскольку на сигнал L игрок 2 всегда выбирает D, что дает игроку 1 выигрыш 3, то в
смешанном СБР ожидаемый выигрыш при выборе R должен быть таким же. Более того,
чтобы игрок 2 выбрал смешанную стратегию необходимо, чтобы ожидаемый выигрыш
для него от выбора U и D справа должен быть одинаковым:
1
0  q  1 (1  q)  2  q  0  (1  q)  q  .
3
Игрок 1 типа t A будет применять смешанную стратегию, если выигрыши при выборе
1
2
R и L совпадут, что возможно только при выборе U  D в ответ на R. Но тогда типу t B
3
3
следует играть R.
Если тип t A играет смешанную стратегию  R  (1   ) L , то согласование
представлений и стратегий по правилу Байеса дает связь
0.8
1
1
   .
0.8  0.2 3
8
1
8
7
8
1
3
2
3
1
3
Итак, получили СБР { R  L, R, D, U  D, p  1, q  } .
Задача 5. У предпринимателя есть рисковый проект, для реализации которого нужно
вложить 100,000. В случае успеха проект принесет доход 300,000, а в случае неудачи – 0.
Оба варианта считаются равновероятными. Предприниматель может быть либо богатым с
состоянием 1,000,000 или бедным с состоянием 0. В любом случае (в силу некоторых
причин) он не может инвестировать свои деньги в этот проект, но может взять кредит у
банка. Банк готов дать кредит под рисковый проект, но под специально назначенную им
процентную ставку  . Заняв 100,000, предприниматель по завершению проекта должен
вернуть банку 100000  (1   ) , если у него есть столько денег. В противном случае он
отдает все, что у него есть.
Порядок ходов
 Банк назначает ставку  .
 Предприниматель решает, брать ли кредит.
Если он берет 100,000, то вкладывает деньги в проект.

По завершению проекта становится известным, привел ли он к успеху и
происходит расплата м банком.
а) Найдите СПРН для случая полной информации о состоянии предпринимателя.
Богатый предприниматель всегда возвращает кредит, а его ожидаемая прибыль от
проекта
равна
0.5  300000  (1   ) 100000  0
при

1
,
2
поэтому
для
богатого
1
2
предпринимателя банк может назначить   .
Бедный предприниматель может вернуть деньги только в случае успеха проекта. Его
ожидаемый выигрыш равен 0.5  (300000  (1   ) 100000)  0 при   2 , поэтому для бедного
предпринимателя банк назначит   2 .
б) Пусть размер состояния предпринимателя – это его приватная информация. Банк не
знает точно размера состояния предпринимателя. Вероятность обращения в банк за
рисковым кредитом богатого предпринимателя оценивается величиной ¼ . Найдите СБР.
1
2
Богач будет брать кредит до ставки 0.5, а бедняк – до ставки 2. Если   , то
выигрыш банка будет
1
3 1
1
U ( )  100000  (1   )   (  100000  (1   )   0)  100000
4
4 2
2
5
5 3
1
  100000  (1   )  100000   100000  100000   100000  0
8
8 2
16
1
При    2 выигрыш банка составляет
2
3 1
1
3
U ( )   ( 100000  (1   )   0)  100000  (  1)100000 .
4 2
2
8
Максимум достигается при   2 . В итоге получаем не эффективное СБР: банк
назначает ставку 2, от которой богатый предприниматель отказывается, а бедный
соглашается, при этом ожидаемый выигрыш банка составляет 37500, что по доходности
меньше 50%, а вовсе не утроение капитала... Это пример «плохого отбора» в играх с
приватной информацией: банку хочется работать с богатым, а приходится с бедным.
Download