ПРИМЕНЕНИЕ ПРИНЦИПА СЖАТЫХ ОТОБРАЖЕНИЙ В ИНФОРМИРОВАННОСТИ ИГРОКОВ

УДК 519.862.8 А.В. Жариков ПРИМЕНЕНИЕ ПРИНЦИПА СЖАТЫХ ОТОБРАЖЕНИЙ В ЗАДАЧЕ УПРАВЛЕНИЯ ИГРЫ ДВУХ ЛИЦ ПРИ РАЗНОЙ ИНФОРМИРОВАННОСТИ ИГРОКОВ В данной статье рассмотрено применение принципа сжатых отображений при решении задачи управления игры двух лиц при разной информированности игроков. Рассмотрим оператор управления состояниями субъекта, который функционирует в динамической случайной среде. Управление проводится с использованием принципа осреднения входных переменных [2]. Предположим, что управление выбрано из условий максимизации некоторого критерия. Пусть x  ( x1, x2 ,..., xn ) – случайный вектор с функцией распределения    ( x1 ,..., xn ) , а множество S  {1,2,..., n} – индексы всех компонент вектора Si  S – множество совокупность индексов, определяющих x; информационную структуру i - й управляющей переменной, i  1,2,..., m . Введём также вектор управления (стратегии игроков) v  (v1, v2 ,..., vm ) , где vi  vi (di ), di  ( x j ) jS , i  I  {1,2,..., m} , I – множество игроков. Таким образом, задача примет вид (1) J i  M  Fi  x,V (di )   max, i  I , i vi где символ M  означает операцию вычисления математического ожидания, функционал Fi  x, v  – критерий максимизации, J i – интегральный выигрыш i - го игрока. Формализация условий разной информированности приводит к равенству нулю частной производной по соответствующей переменной [7]: vi (di ) (2)  0. x j Рассмотрим задачу (1) при n  m  2 . Тогда задача примет вид M  F1  x, y, u ( y ), v( x)    max, u (3) M  F2  x, y, u ( y ), v( x)    max, v при условиях u v (4)  0,  0 . x y Возьмём конкретный вид функционалов F1  A(u, v, x, y),(u, v, x, y) ,  44 , F2  B(u, v, x, y),(u, v, x, y) , где A  AT  aij B  BT   bij  44 , т.е. F1 , F2 – квадратичные формы с переменными u, v, x, y . Пусть информационный 1 вектор ( x, y) распределён на квадрате [a, b]  [a, b] с плотностью ( x, y ) . Считаем, что ( x, y ) обладает стандартными свойствами плотности распределения. Задача (3) при условиях (4) примет вид bb   J1   a11u 2  2a12uv  2a13ux  ...  a44 y 2  ( x, y )dxdy  max, aa bb   uU (5) J 2   b11u 2  2b12uv  2b13ux  ...  b44 y 2  ( x, y )dxdy  max. aa vV Задача (3) при условиях (4), по сути, является игрой двух лиц, где J1 (u, v), J 2 (u, v) – функции выигрыша, а u, v – стратегии игроков. Множество допустимых стратегий U , V будут произведением пространств 1 1 C ([a, b]  [a, b])  C ([a, b]  [a, b]) . Нахождение решения игры зависит от понимания рациональности и оптимальности поведения игроков. Предположим, что игроки имеют непротивоположные интересы. Одной из распространённых концепций решения некооперативных игр является ситуация равновесия по Нэшу [6,7,9], суть которой заключается в невозможности увеличения выигрыша игрока при его отклонении от данного равновесия. Определение 1. Ситуация x*  ( x1* , x2* ,..., xn* ) называется ситуацией равновесия по Нэшу, если для всех xi  X i , i {1,..., n} справедливо неравенство Ki ( x1* , x2* ,..., xn* )  Ki ( x1* ,..., xi*1 , xi , xi*1,..., xn* ) . Для задачи (5) определение 1 представится в виде неравенств J1 (u , v )  J1 (u  , v ) ; J 2 (u  , v)  J 2 (u  , v ) , где u* , v* – ситуация равновесия по Нэшу. Был найден в [3,4] конкретный вид решения задачи (5),(4) в концепции равновесии по Нэшу, когда входные переменные x и y являлись независимыми случайными величинами. Наряду со случаем независимых x и y можно рассматривать и общий случай зависимости x и y . Необходимые условия существования решений, согласно [1,3,4], при этом не изменятся. Тогда нахождение u  и v  будет зависеть от разрешимости системы интегральных уравнений b b b b  a11u  ( x, y )dx  a12  v( x)( x, y )dx  a13  x( x, y )dx  a14 y  ( x, y )dx  0,  a a a a (6)  b b b b  b22v  ( x, y )dy  b12  u ( y )( x, y )dy  b23 x  ( x, y )dy  b24  y( x, y )dy  0. a a a a  Вопрос существования решения (6) не является очевидным и требует 2 некоторых пояснений. Для начала определим тип данной системы. Путём несложных преобразований система (6) сводится к виду b b   u ( y )    v( x) K1 ( x, y )dx  f1 ( y ), u ( y )    v( x) K1( x, y )dx  f1( y ),   a a  (6)   b b   v ( x )   u ( y ) K ( x , y ) dy  f ( x ), 2 2   v( y )    u ( x) K 2 ( y, x)dx  f 2 ( y ), a a   b ( x, y ) a11( x, y ) где , , K1 ( x, y )  b22 K 2 ( x, y )  b b21  ( x, y )dx a12  ( x, y )dy a b f1 ( y )  a b a13  x ( x, y )dx  a14 y  ( x, y )dx a a b a11  ( x, y )dx b , f 2 ( x)  b23x  ( x, y )dy  b24  y( x, y )dy a a , b b22  ( x, y )dy a  b a a12 b12  . Данное преобразование допустимо в силу свойств ( x, y ) . a11 b22 0  K ( x, y )   u( y)  Введём обозначения: K ( x, y )   1 ,  ( y)    , 0 K ( y , x ) v ( y )   2    f1 ( y )   , тогда система (6) может быть записана в векторной форме  f2 ( y)   ( y)   b  ( y )    K ( x, y ) ( x)dx   ( y ) . (7) a Уравнение (7) является уравнением Фредгольма второго рода, записанное в векторной форме. Согласно существующей теории, можно выделить несколько путей для доказательства условий существования и единственности решения интегральных уравнений. ПРИНЦИП СЖАТЫХ ОТОБРАЖЕНИЙ Большое достоинство этого принципа состоит в том, что он не только гарантирует при определённых условиях однозначную разрешимость уравнения, но и может служить для получения приближённых решений [5,6,10]. Пусть  есть пространство C [a, b],R 2 . Предположим, что ядро   K ( x, y) непрерывно в замкнутом квадрате D  {( x, y) : ( x, y) [a, b]  [a, b], a, b  R} и, следовательно, ограничено на нём, т.е. K ( x, y) f  M f  f  , где M – норма оператора K ( x, y) . Тогда 3 K  sup Kx x  1   sup ( K1x1, K 2 x2 )  , где x – непрерывная на квадрате D x  1 вектор-функция. Напомним, что x   max x12 ( x, y )  x22 ( x, y ) . Зафиксируем x, y x1 и x2 , в силу непрерывности x на прямоугольнике D . Тогда условие x   1 примет вид x12  x22  1 . Таким образом, K  sup ( K1x1, K 2 x2 ) x  x 1 2 1 2 2   sup  max K12 ( x, y ) x12  K 22 ( y, x) x22    x  x 1  x , y 2 1 2 2  sup  max K12 ( x, y ) x12  K 22 ( y, x)(1  x12 )   max  K1 ( x, y ) , K 2 ( y, x)    x, y x  x 1  x , y (8) K  max  K1 ( x, y) , K 2 ( y, x)  . 2 1 2 2 x, y Полученное выражение (8) опирается на следующую лемму. f ( x, y) Лемма 1. Пусть определена на множествах x  ( x1, x2 )  K1, y  ( y1, y2 )  K 2 , где sup sup f ( x, y )  sup sup f ( x, y) . xK1 yK 2 K1 , K 2 – компакты в R 2 . Тогда yK 2 xK1 Доказательство. Рассмотрим функцию g ( y )  sup f ( x, y ) . Очевидно, xK1 что f ( x, y) является равномерно непрерывной функцией, т.к. K1 , K 2 – компакты в R 2 . Покажем, что g ( y ) является непрерывной функцией по y . Запишем условие равномерной непрерывности f ( x, y) :   0,   0 : x  x   , y  y    f ( x, y)  f ( x, y)   / 2 для любых x, x, y, y . Пусть x  x  x , тогда неравенство перепишется в виде f ( x, y)  f ( x, y)   / 2  f ( x, y)   / 2  f ( x, y)  f ( x, y)   / 2 . Возьмем от обеих частей имеем sup , xK1 g ( y)   / 2  g ( y)  g ( y)   / 2  g ( y)  g ( y)   / 2   . Из последнего g, неравенства следует непрерывность функции значит, sup g ( y )  sup sup f ( x, y)  N . Обозначим через M  sup f ( x, y ) . Ясно, y yK 2 xK1 x , yK1K 2 что M  f ( x, y)  M  N . По определению M    f ( x, y) , следовательно M    f ( x, y )  sup f ( x, y )  sup sup f ( x, y)  N  M  N . Из последнего xK1 yK 2 xK1 неравенства следует, что M  N . Аналогично sup f ( x, y )  sup sup f ( x, y) . Лемма доказана. x , yK1K 2 показывается, что xK1 yK 2 Пусть  ( x)  . Тогда решение (7) будем искать среди элементов пространства  . При этом, как и в одномерном случае, решением интегрального уравнения (7) будем называть произвольную функцию  0 ( y )   , подстановка которой в уравнение (7) обращает его в истинное 4 тождество для любого y [a, b] : b 0 ( y )    K ( x, y ) 0 ( x)dx   ( y) . (9) a Ясно, что при   0 уравнение (9) имеет единственное непрерывное решение  0 ( y )   ( y ) . Покажем, что уравнение (7) однозначно разрешимо для всех  , достаточно малых по абсолютной величине. Введём следующий оператор A , определённый в пространстве  , b A    K ( x, y ) ( x)dx   ( y) . (10) a Оператор (10) переводит функцию  ( y)  в некоторую функцию  ( y ) , определённую на том же отрезке [a, b] . Тогда существование решения  0 ( y ) уравнения (7) сводится к вопросу о наличии у оператора A неподвижной точки, т.е. такой функции  0 ( y ) , которая при действии оператором A переходит в саму себя: A 0   0 . Покажем, что оператор A , действует из полного пространства  опять в  , т.е., если g ( y)  A ( y) , где  ( y)  , то и g ( y)  . Для этого возьмём произвольную точку y [a, b] , и пусть y – любое, лишь бы выполнялось y  y [a, b] . Имеем g ( y  y )  g ( y )  ( y )    b b a a    K ( x, y  y ) ( x)dx   ( y  y )    K ( x, y ) ( x)dx  b  K ( x, y  y)  K ( x, y)   ( x)  dx   ( y  y)  ( y)  . a  (11)  Из условия  ( x)  C [a, b],R 2 следует, что для любого   0 , 1  0 такое, что  при y : y  1 . (12) 2 Ядро K ( x, y) непрерывно в замкнутом квадрате D и, значит, равномерно непрерывно в D . Следовательно, по выбранному   0 найдётся  2  0 такое, что  ( y  y)   ( y)   K ( x, y  y )  K ( x, y )    2  ( y)  (b  a)  (13) при y   2 и любом x [a, b] . Возьмём   min{1,  2} . Тогда при y таких, что y   , будут одновременно выполняться неравенства (12) и (13) и, учитывая неравенство (11), получим, g ( y  y )  g ( y )    y : y   , 5 что и доказывает непрерывность функции g ( y ) в любой точке y [a, b] . Итак, A C [a, b],R 2   C [a, b],R 2 .     Выясним теперь, при каких условиях оператор A будет сжимающим. Для этого определим расстояние между двумя элементами  как норму разности данных элементов, т.е. x, y   C [a, b],R 2 ,  ( x, y )  x  y  .   Данное определение уместно в силу нормированности пространства C [a, b],R 2 . Имеем    ( A1, A 2 )  A1  A 2 b  b    K ( x, y)1 ( x)dx    K ( x, y) 2 ( x)dx a a   b   K ( x, y)(1 ( x)   2 ( x))dx   M (b  a) 1 ( x)   2 ( x)    M (b  a)  (1, 2 ) . a  Перепишем данное неравенство в следующем виде:  ( A1, A 2 )   M (b  a)  (1, 2 ) , (14) 1 откуда видно, что при   оператор A будет сжимающим. M (b  a) Из принципа сжатых отображений заключаем, что для любого  такого, что  M (b  a)  1 , (15) уравнение Фредгольма в векторной форме (7) с непрерывным ядром K ( x, y) и непрерывным свободным членом  ( y ) имеет единственное решение. С другой стороны, из уравнения (9) следует, что     a12 ( x, y ) b12 ( x, y )    M (b  a)  1  (b  a) max  b , b   1 . (15') x, y  a11   ( x, y )dx b22   ( x, y )dy    a a   Последовательные приближения 0 ( y ),..., n ( y ),... к этому решению определяются из соотношений b  n1 ( y )    K ( x, y ) n ( x)dx   ( y ), n  0,1,... , a где в качестве  0 ( y ) можно взять любую непрерывную вектор-функцию на [a, b] . Данный итерационный процесс является сходящимся к некоторой функции, которая и будет являться решением уравнения (9). Также можно найти решение, используя резольвенту ядра. Для этого приведём вспомогательные сведения . 6 Теорема 1. Пусть А – линейный ограниченный оператор, отображающий банахово пространство E в себя, и A  q  1. Тогда оператор ( I  A) , где I – единичный оператор, имеет обратный линейный ограниченный оператор. Доказательство теоремы можно найти, например в работе [6]. В результате получим, что ( I  A) 1 – линейный ограниченный оператор. При этом ( I  A) 1  I  A  A2  A3  ...  (1) n An  ... (16) Применим результат теоремы к интегральному уравнению (9). Положим b A    K ( x, y ) ( x)dx . a Тогда уравнение (9) перепишем в виде (17)    A    ( I   A )   . Используя приведённую теорему, получим, что если  A  1, то уравнение (9) имеет единственное решение, которое определяется равенством   ( I   A ) 1     A   2 A 2   3 A 3  ...   n A n  ... (18) Полученный нами ряд называется рядом Неймана. Выясним, при каких значениях  ряд (18) сходится. Для этого рассмотрим неравенство  A  1. Учитывая изложенный выше результат (8) оценки нормы ядра K , получим условие (15). Далее, будем считать, что выполняется условие (15) для  . Выясним, что представляют в рассматриваем случае степени оператора A . Имеем b b b b    2 A   A ( A )   K (t , s)   K ( s, ) ( )d  ds     K (t , s) K ( s, )d  ( )ds .  a   a a a Обозначим b  K (t , s) K (s, )hds  K 2 (t, )h , a   где вектор h является пробным вектором из C [a, b],R 2 . Оператор K 2 (t , ) называется повторным ядром, или второй итерацией ядра K (t , s) . b Следовательно, A    K 2 ( x, y ) ( x)dx . 2 Аналогично проделывая a процедуру для произвольной степени оператора, имеем b A    K n ( x, y ) ( x)dx, n (19) a где K n ( x, y ) – n-я итерация ядра K ( x, y) , определяемая формулой 7 b K n ( x, y )h   K ( x, ) K n1 ( , y )hd . a Заметим, что все итерированные ядра непрерывного ядра K ( x, y) также непрерывны. Решение уравнения (7) запишем в следующем виде: b  ( y )   ( y)    K1 ( x, y) ( x)dx  ...   a b n  K n ( x, y) ( x)dx  ... (20) a Причём, данный ряд сходится равномерно при выполнении условия     a  ( x , y ) b  ( x , y )  1. 12  M (b  a)  1  (b  a) max  b12 , b  x, y  a11   ( x, y )dx b22   ( x, y )dy    a a   Запишем полученное решение в более компактной форме. Рассмотрим ряд K1 ( x, y )   K 2 ( x, y )  ...   n1K n ( x, y )  ... Этот ряд также равномерно сходится при условии  M (b  a)  1 . Действительно, предположим, что h  (21)  1 , получим b K 2 ( x, y )   K ( x, ) K ( , y ) d  M 2 (b  a ) ; a b K3 ( x, y )   K ( x, ) K 2 ( , y ) d  M 3 (b  a) 2 , и вообще, a b K n ( x, y )   K ( x, ) K n1 ( , y ) d  M n (b  a) n1 . a Отсюда  n1K n ( x, y)   n1 M n (b  a)n1  Mq n1, где q   M (b  a)  1 . Таким образом, члены ряда (21) по абсолютной величине не превосходят членов сходящегося числового ряда   qn , откуда следует n1 сходимость ряда (21). Введём новый оператор R( x, y,  ) : R( x, y,  )  K1 ( x, y )   K 2 ( x, y )  ...   n1K n ( x, y )  ... Умножим обе части на  и, интегрируя ряд почленно, получим (22) b  ( x)   ( x)    R( x, y,  ) ( y )dy . (23) a 8 В результате приведённых выкладок пришли к существованию решения задачи (5), при условии     a12 ( x, y ) b12 ( x, y )   (b  a ) max  , b b   1. x, y  a11   ( x, y )dx b22   ( x, y )dy    a a   Сформулируем данный результат в виде утверждения. Утверждение 1. Решение задачи (5) при условиях (4) в концепции равновесия Нэша существует и единственно, если выполняются условия: 1. a11 , b22  0 .   a12 ( x, y ) b12 ( x, y ) , 2. (b  a ) max  b b x, y  a11   ( x, y )dx b22   ( x, y )dy  a a      1.     9 ЛИТЕРАТУРА 1. Гельфанд И.М., Фомин С. В. Вариационное исчисление. – М., 1961. 2. Гермейер Ю.Б. Введение в теорию исследования операций. – М., 1973. 3. Жариков А.В. О решении задачи управления в концепции теории игр при разной информированности игроков // Материалы девятой региональной конференции по математике «МАК–2006». – Барнаул, 2006. 4. Жариков А.В., Максимов А.В. О решении частной задачи управления в случае разной информированности субъектов // Известия АлтГУ. N1. – Барнаул, 2006. 5. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. – М., 1968. 6. Краснов М.Л. Интегральные уравнения. (Введение в теорию). – М.,1975. 7. Максимов А.В., Оскорбин Н.М. Многопользовательские информационные системы: основы теории и методы исследования. – Барнаул 2005. 8. Оуэн Г. Теория игр. – М., 1971. 9. Теория игр. Петросян Л.А., Зенкевич Н.А., Семина Е.А. – М., 1998. 10.Полянин А.Д., Манжиров А.В. Справочник по интегральным уравнениям. – М., 2003. 10

ПРИМЕНЕНИЕ ПРИНЦИПА СЖАТЫХ ОТОБРАЖЕНИЙ В ИНФОРМИРОВАННОСТИ ИГРОКОВ

Related documents

Products

Support

ПРИМЕНЕНИЕ ПРИНЦИПА СЖАТЫХ ОТОБРАЖЕНИЙ В ИНФОРМИРОВАННОСТИ ИГРОКОВ

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib