ПРИМЕНЕНИЕ ПРИНЦИПА СЖАТЫХ ОТОБРАЖЕНИЙ В ИНФОРМИРОВАННОСТИ ИГРОКОВ

advertisement
УДК 519.862.8
А.В. Жариков
ПРИМЕНЕНИЕ ПРИНЦИПА СЖАТЫХ ОТОБРАЖЕНИЙ В
ЗАДАЧЕ УПРАВЛЕНИЯ ИГРЫ ДВУХ ЛИЦ ПРИ РАЗНОЙ
ИНФОРМИРОВАННОСТИ ИГРОКОВ
В данной статье рассмотрено применение принципа сжатых
отображений при решении задачи управления игры двух лиц при разной
информированности игроков.
Рассмотрим оператор управления состояниями субъекта, который
функционирует в динамической случайной среде. Управление проводится с
использованием принципа осреднения входных переменных [2].
Предположим, что управление выбрано из условий максимизации
некоторого критерия.
Пусть x  ( x1, x2 ,..., xn ) – случайный вектор с функцией распределения
   ( x1 ,..., xn ) , а множество S  {1,2,..., n} – индексы всех компонент вектора
Si  S –
множество
совокупность
индексов,
определяющих
x;
информационную структуру i - й управляющей переменной, i  1,2,..., m .
Введём также вектор управления (стратегии игроков) v  (v1, v2 ,..., vm ) , где
vi  vi (di ), di  ( x j ) jS , i  I  {1,2,..., m} , I – множество игроков. Таким
образом, задача примет вид
(1)
J i  M  Fi  x,V (di )   max, i  I ,
i
vi
где символ M  означает операцию вычисления математического ожидания,
функционал Fi  x, v  – критерий максимизации, J i – интегральный выигрыш
i - го игрока. Формализация условий разной информированности приводит к
равенству нулю частной производной по соответствующей переменной [7]:
vi (di )
(2)
 0.
x j
Рассмотрим задачу (1) при n  m  2 . Тогда задача примет вид
M  F1  x, y, u ( y ), v( x)    max,
u
(3)
M  F2  x, y, u ( y ), v( x)    max,
v
при условиях
u
v
(4)
 0,  0 .
x
y
Возьмём конкретный вид функционалов F1  A(u, v, x, y),(u, v, x, y) ,
 44 ,
F2  B(u, v, x, y),(u, v, x, y) , где A  AT  aij
B  BT   bij 
44
, т.е. F1 , F2 –
квадратичные формы с переменными u, v, x, y . Пусть информационный
1
вектор ( x, y) распределён на квадрате [a, b]  [a, b] с плотностью ( x, y ) .
Считаем, что ( x, y ) обладает стандартными свойствами плотности
распределения.
Задача (3) при условиях (4) примет вид
bb


J1   a11u 2  2a12uv  2a13ux  ...  a44 y 2  ( x, y )dxdy  max,
aa
bb


uU
(5)
J 2   b11u 2  2b12uv  2b13ux  ...  b44 y 2  ( x, y )dxdy  max.
aa
vV
Задача (3) при условиях (4), по сути, является игрой двух лиц, где
J1 (u, v), J 2 (u, v) – функции выигрыша, а u, v – стратегии игроков. Множество
допустимых стратегий U , V
будут произведением пространств
1
1
C ([a, b]  [a, b])  C ([a, b]  [a, b]) . Нахождение решения игры зависит от
понимания рациональности и оптимальности поведения игроков.
Предположим, что игроки имеют непротивоположные интересы.
Одной из распространённых концепций решения некооперативных игр
является ситуация равновесия по Нэшу [6,7,9], суть которой заключается в
невозможности увеличения выигрыша игрока при его отклонении от данного
равновесия.
Определение 1. Ситуация x*  ( x1* , x2* ,..., xn* ) называется ситуацией
равновесия по Нэшу, если для всех xi  X i , i {1,..., n} справедливо
неравенство
Ki ( x1* , x2* ,..., xn* )  Ki ( x1* ,..., xi*1 , xi , xi*1,..., xn* ) .
Для задачи (5) определение 1 представится в виде неравенств
J1 (u , v )  J1 (u  , v ) ;
J 2 (u  , v)  J 2 (u  , v ) ,
где u* , v* – ситуация равновесия по Нэшу.
Был найден в [3,4] конкретный вид решения задачи (5),(4) в концепции
равновесии по Нэшу, когда входные переменные x и y являлись
независимыми случайными величинами.
Наряду со случаем независимых x и y можно рассматривать и общий
случай зависимости x и y . Необходимые условия существования решений,
согласно [1,3,4], при этом не изменятся. Тогда нахождение u  и v  будет
зависеть от разрешимости системы интегральных уравнений
b
b
b
b

a11u  ( x, y )dx  a12  v( x)( x, y )dx  a13  x( x, y )dx  a14 y  ( x, y )dx  0,

a
a
a
a
(6)

b
b
b
b

b22v  ( x, y )dy  b12  u ( y )( x, y )dy  b23 x  ( x, y )dy  b24  y( x, y )dy  0.
a
a
a
a

Вопрос существования решения (6) не является очевидным и требует
2
некоторых пояснений.
Для начала определим тип данной системы. Путём несложных
преобразований система (6) сводится к виду
b
b


u ( y )    v( x) K1 ( x, y )dx  f1 ( y ),
u ( y )    v( x) K1( x, y )dx  f1( y ),


a
a

(6)


b
b


v
(
x
)


u
(
y
)
K
(
x
,
y
)
dy

f
(
x
),
2
2


v( y )    u ( x) K 2 ( y, x)dx  f 2 ( y ),
a
a


b ( x, y )
a11( x, y )
где
,
,
K1 ( x, y )  b22
K 2 ( x, y ) 
b
b21  ( x, y )dx
a12  ( x, y )dy
a
b
f1 ( y ) 
a
b
a13  x ( x, y )dx  a14 y  ( x, y )dx
a
a
b
a11  ( x, y )dx
b
, f 2 ( x) 
b23x  ( x, y )dy  b24  y( x, y )dy
a
a
,
b
b22  ( x, y )dy
a

b
a
a12 b12
 . Данное преобразование допустимо в силу свойств ( x, y ) .
a11 b22
0
 K ( x, y )

 u( y) 
Введём обозначения: K ( x, y )   1
,  ( y)  

,
0
K
(
y
,
x
)
v
(
y
)


2


 f1 ( y ) 
 , тогда система (6) может быть записана в векторной форме
 f2 ( y) 
 ( y)  
b
 ( y )    K ( x, y ) ( x)dx   ( y ) .
(7)
a
Уравнение (7) является уравнением Фредгольма второго рода,
записанное в векторной форме.
Согласно существующей теории, можно выделить несколько путей для
доказательства условий существования и единственности решения
интегральных уравнений.
ПРИНЦИП СЖАТЫХ ОТОБРАЖЕНИЙ
Большое достоинство этого принципа состоит в том, что он не только
гарантирует при определённых условиях однозначную разрешимость
уравнения, но и может служить для получения приближённых решений
[5,6,10].
Пусть  есть пространство C [a, b],R 2 . Предположим, что ядро


K ( x, y)
непрерывно
в
замкнутом
квадрате
D  {( x, y) : ( x, y) [a, b]  [a, b], a, b  R} и, следовательно, ограничено на нём,
т.е. K ( x, y) f  M f  f  , где M – норма оператора K ( x, y) . Тогда
3
K  sup Kx
x  1

 sup ( K1x1, K 2 x2 )  , где x – непрерывная на квадрате D
x  1
вектор-функция. Напомним, что x

 max x12 ( x, y )  x22 ( x, y ) . Зафиксируем
x, y
x1 и x2 , в силу непрерывности x на прямоугольнике D . Тогда условие
x

 1 примет вид x12  x22  1 . Таким образом,
K  sup ( K1x1, K 2 x2 )
x  x 1
2
1
2
2

 sup  max K12 ( x, y ) x12  K 22 ( y, x) x22  

x  x 1  x , y
2
1
2
2
 sup  max K12 ( x, y ) x12  K 22 ( y, x)(1  x12 )   max  K1 ( x, y ) , K 2 ( y, x)  
 x, y
x  x 1  x , y
(8)
K  max  K1 ( x, y) , K 2 ( y, x)  .
2
1
2
2
x, y
Полученное выражение (8) опирается на следующую лемму.
f ( x, y)
Лемма 1.
Пусть
определена
на
множествах
x  ( x1, x2 )  K1, y  ( y1, y2 )  K 2 , где
sup sup f ( x, y )  sup sup f ( x, y) .
xK1 yK 2
K1 , K 2
– компакты в
R 2 . Тогда
yK 2 xK1
Доказательство. Рассмотрим функцию g ( y )  sup f ( x, y ) . Очевидно,
xK1
что f ( x, y) является равномерно непрерывной функцией, т.к. K1 , K 2 –
компакты в R 2 . Покажем, что g ( y ) является непрерывной функцией по y .
Запишем условие равномерной непрерывности f ( x, y) :
  0,   0 : x  x   , y  y    f ( x, y)  f ( x, y)   / 2
для
любых x, x, y, y . Пусть x  x  x , тогда неравенство перепишется в виде
f ( x, y)  f ( x, y)   / 2  f ( x, y)   / 2  f ( x, y)  f ( x, y)   / 2 . Возьмем от
обеих
частей
имеем
sup ,
xK1
g ( y)   / 2  g ( y)  g ( y)   / 2  g ( y)  g ( y)   / 2   . Из последнего
g,
неравенства
следует
непрерывность
функции
значит,
sup g ( y )  sup sup f ( x, y)  N . Обозначим через M  sup f ( x, y ) . Ясно,
y
yK 2 xK1
x , yK1K 2
что M  f ( x, y)  M  N . По определению M    f ( x, y) , следовательно
M    f ( x, y )  sup f ( x, y )  sup sup f ( x, y)  N  M  N . Из последнего
xK1
yK 2 xK1
неравенства следует, что M  N . Аналогично
sup f ( x, y )  sup sup f ( x, y) . Лемма доказана.
x , yK1K 2
показывается,
что
xK1 yK 2
Пусть  ( x)  . Тогда решение (7) будем искать среди элементов
пространства  . При этом, как и в одномерном случае, решением
интегрального уравнения (7) будем называть произвольную функцию
 0 ( y )   , подстановка которой в уравнение (7) обращает его в истинное
4
тождество для любого y [a, b] :
b
0 ( y )    K ( x, y ) 0 ( x)dx   ( y) .
(9)
a
Ясно, что при   0 уравнение (9) имеет единственное непрерывное
решение  0 ( y )   ( y ) .
Покажем, что уравнение (7) однозначно разрешимо для всех  ,
достаточно малых по абсолютной величине. Введём следующий оператор
A , определённый в пространстве  ,
b
A    K ( x, y ) ( x)dx   ( y) .
(10)
a
Оператор (10) переводит функцию  ( y)  в некоторую функцию
 ( y ) , определённую на том же отрезке [a, b] . Тогда существование решения
 0 ( y ) уравнения (7) сводится к вопросу о наличии у оператора A
неподвижной точки, т.е. такой функции  0 ( y ) , которая при действии
оператором A переходит в саму себя: A 0   0 .
Покажем, что оператор A , действует из полного пространства  опять
в  , т.е., если g ( y)  A ( y) , где  ( y)  , то и g ( y)  . Для этого возьмём
произвольную точку y [a, b] , и пусть y – любое, лишь бы выполнялось
y  y [a, b] . Имеем
g ( y  y )  g ( y )
 ( y )



b
b
a
a
   K ( x, y  y ) ( x)dx   ( y  y )    K ( x, y ) ( x)dx 
b
 K ( x, y  y)  K ( x, y)   ( x)  dx   ( y  y)  ( y)  .
a

(11)

Из условия  ( x)  C [a, b],R 2 следует, что для любого   0 , 1  0
такое, что

при y : y  1 .
(12)
2
Ядро K ( x, y) непрерывно в замкнутом квадрате D и, значит,
равномерно непрерывно в D . Следовательно, по выбранному   0 найдётся
 2  0 такое, что
 ( y  y)   ( y)  
K ( x, y  y )  K ( x, y )



2  ( y)  (b  a) 
(13)
при y   2 и любом x [a, b] .
Возьмём   min{1,  2} . Тогда при y таких, что y   , будут
одновременно выполняться неравенства (12) и (13) и, учитывая неравенство
(11), получим,
g ( y  y )  g ( y )    y : y   ,
5
что и доказывает непрерывность функции g ( y ) в любой точке
y [a, b] .
Итак,
A
C [a, b],R 2 
 C [a, b],R 2 .




Выясним теперь, при каких условиях оператор A будет сжимающим.
Для этого определим расстояние между двумя элементами  как норму
разности данных элементов, т.е. x, y   C [a, b],R 2 ,  ( x, y )  x  y  .


Данное определение уместно в силу нормированности пространства
C [a, b],R 2 . Имеем


 ( A1, A 2 )  A1  A 2
b

b
   K ( x, y)1 ( x)dx    K ( x, y) 2 ( x)dx
a
a


b
  K ( x, y)(1 ( x)   2 ( x))dx   M (b  a) 1 ( x)   2 ( x)    M (b  a)  (1, 2 ) .
a

Перепишем данное неравенство в следующем виде:
 ( A1, A 2 )   M (b  a)  (1, 2 ) ,
(14)
1
откуда видно, что при  
оператор A будет сжимающим.
M (b  a)
Из принципа сжатых отображений заключаем, что для любого 
такого, что
 M (b  a)  1 ,
(15)
уравнение Фредгольма в векторной форме (7) с непрерывным ядром K ( x, y)
и непрерывным свободным членом  ( y ) имеет единственное решение. С
другой стороны, из уравнения (9) следует, что




a12 ( x, y )
b12 ( x, y ) 

 M (b  a)  1  (b  a) max  b
,
b
  1 . (15')
x, y
 a11   ( x, y )dx b22   ( x, y )dy 


a
a


Последовательные приближения 0 ( y ),..., n ( y ),... к этому решению
определяются из соотношений
b
 n1 ( y )    K ( x, y ) n ( x)dx   ( y ), n  0,1,... ,
a
где в качестве  0 ( y ) можно взять любую непрерывную вектор-функцию на
[a, b] . Данный итерационный процесс является сходящимся к некоторой
функции, которая и будет являться решением уравнения (9).
Также можно найти решение, используя резольвенту ядра. Для этого
приведём вспомогательные сведения .
6
Теорема 1. Пусть А – линейный ограниченный оператор,
отображающий банахово пространство E в себя, и A  q  1. Тогда оператор
( I  A) , где I – единичный оператор, имеет обратный линейный
ограниченный оператор.
Доказательство теоремы можно найти, например в работе [6]. В
результате получим, что ( I  A) 1 – линейный ограниченный оператор. При
этом
( I  A) 1  I  A  A2  A3  ...  (1) n An  ...
(16)
Применим результат теоремы к интегральному уравнению (9).
Положим
b
A    K ( x, y ) ( x)dx .
a
Тогда уравнение (9) перепишем в виде
(17)
   A    ( I   A )   .
Используя приведённую теорему, получим, что если  A  1, то
уравнение (9) имеет единственное решение, которое определяется
равенством
  ( I   A ) 1     A   2 A 2   3 A 3  ...   n A n  ...
(18)
Полученный нами ряд называется рядом Неймана.
Выясним, при каких значениях  ряд (18) сходится. Для этого
рассмотрим неравенство  A  1. Учитывая изложенный выше результат (8)
оценки нормы ядра K , получим условие (15). Далее, будем считать, что
выполняется условие (15) для  . Выясним, что представляют в
рассматриваем случае степени оператора A . Имеем
b
b b
b



2
A   A ( A )   K (t , s)   K ( s, ) ( )d  ds     K (t , s) K ( s, )d  ( )ds .
 a


a
a
a
Обозначим
b
 K (t , s) K (s, )hds  K 2 (t, )h ,
a


где вектор h является пробным вектором из C [a, b],R 2 . Оператор K 2 (t , )
называется повторным ядром, или второй итерацией ядра K (t , s) .
b
Следовательно,
A    K 2 ( x, y ) ( x)dx .
2
Аналогично
проделывая
a
процедуру для произвольной степени оператора, имеем
b
A    K n ( x, y ) ( x)dx,
n
(19)
a
где K n ( x, y ) – n-я итерация ядра K ( x, y) , определяемая формулой
7
b
K n ( x, y )h   K ( x, ) K n1 ( , y )hd .
a
Заметим, что все итерированные ядра непрерывного ядра K ( x, y) также
непрерывны.
Решение уравнения (7) запишем в следующем виде:
b
 ( y )   ( y)    K1 ( x, y) ( x)dx  ...  
a
b
n
 K n ( x, y) ( x)dx  ...
(20)
a
Причём, данный ряд сходится равномерно при выполнении условия




a

(
x
,
y
)
b

(
x
,
y
)
 1.
12
 M (b  a)  1  (b  a) max  b12
,
b

x, y
 a11   ( x, y )dx b22   ( x, y )dy 


a
a


Запишем полученное решение в более компактной форме. Рассмотрим
ряд
K1 ( x, y )   K 2 ( x, y )  ...   n1K n ( x, y )  ...
Этот ряд также равномерно сходится при условии  M (b  a)  1 .
Действительно, предположим, что h

(21)
 1 , получим
b
K 2 ( x, y )   K ( x, ) K ( , y ) d  M 2 (b  a ) ;
a
b
K3 ( x, y )   K ( x, ) K 2 ( , y ) d  M 3 (b  a) 2 , и вообще,
a
b
K n ( x, y )   K ( x, ) K n1 ( , y ) d  M n (b  a) n1 .
a
Отсюда
 n1K n ( x, y)   n1 M n (b  a)n1  Mq n1,
где q   M (b  a)  1 .
Таким образом, члены ряда (21) по абсолютной величине не
превосходят членов сходящегося числового ряда

 qn ,
откуда следует
n1
сходимость ряда (21). Введём новый оператор R( x, y,  ) :
R( x, y,  )  K1 ( x, y )   K 2 ( x, y )  ...   n1K n ( x, y )  ...
Умножим обе части на  и, интегрируя ряд почленно, получим
(22)
b
 ( x)   ( x)    R( x, y,  ) ( y )dy .
(23)
a
8
В результате приведённых выкладок пришли к существованию
решения задачи (5), при условии




a12 ( x, y )
b12 ( x, y ) 

(b  a ) max 
,
b
b
  1.
x, y
 a11   ( x, y )dx b22   ( x, y )dy 


a
a


Сформулируем данный результат в виде утверждения.
Утверждение 1. Решение задачи (5) при условиях (4) в концепции
равновесия Нэша существует и единственно, если выполняются условия:
1. a11 , b22  0 .


a12 ( x, y )
b12 ( x, y )
,
2. (b  a ) max 
b
b
x, y
 a11   ( x, y )dx b22   ( x, y )dy

a
a



  1.




9
ЛИТЕРАТУРА
1. Гельфанд И.М., Фомин С. В. Вариационное исчисление. – М.,
1961.
2. Гермейер Ю.Б. Введение в теорию исследования операций. – М.,
1973.
3. Жариков А.В. О решении задачи управления в концепции теории
игр при разной информированности игроков // Материалы девятой
региональной конференции по математике «МАК–2006». –
Барнаул, 2006.
4. Жариков А.В., Максимов А.В. О решении частной задачи
управления
в
случае
разной
информированности
субъектов // Известия АлтГУ. N1. – Барнаул, 2006.
5. Колмогоров А.Н., Фомин С.В. Элементы теории функций и
функционального анализа. – М., 1968.
6. Краснов М.Л. Интегральные уравнения. (Введение в теорию). –
М.,1975.
7. Максимов А.В.,
Оскорбин Н.М.
Многопользовательские
информационные системы: основы теории и методы исследования.
– Барнаул 2005.
8. Оуэн Г. Теория игр. – М., 1971.
9. Теория игр. Петросян Л.А., Зенкевич Н.А., Семина Е.А. – М., 1998.
10.Полянин А.Д., Манжиров А.В. Справочник по интегральным
уравнениям. – М., 2003.
10
Download