кооперативное решение - Новая Экономическая Ассоциация

advertisement
ПРОБЛЕМА ВРЕМЕННОЙ СОСТОЯТЕЛЬНОСТИ ДОЛГОСРОЧНЫХ
ЭКОНОМИЧЕСКИХ РЕШЕНИЙ
Петросян Л.А.
СОДЕРЖАНИЕ
ВВЕДЕНИЕ ............................................................................................................................... 6
1. КООПЕРАТИВНЫЕ РЕШЕНИЯ В СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ СИСТЕМАХ 8
2. ПРОБЛЕМА ВРЕМЕННОЙ СОСТОЯТЕЛЬНОСТИ ...................................................... 13
КООПЕРАТИВНЫХ РЕШЕНИЙ ......................................................................................... 13
2.1. Динамическая устойчивость решения задачи оптимального управления. ............ 13
2.2. Временная состоятельность Парето оптимального решения в задаче управления по
нескольким целевым показателям. ................................................................................... 16
2.3. Временная несостоятельность кооперативного решения, построенного на механизме
выбора конкретного Парето оптимального решения. Теоретико-игровой анализ. ..... 19
3. РЕГУЛЯРИЗАЦИЯ КООПЕРАТИВНОГО ПРИНЦИПА ОПТИМАЛЬНОСТИ ......... 23
3.1. Моделирование долгосрочного кооперативного поведения дифференциальной
неантагонистической игрой.. ............................................................................................. 23
3.2. Динамика дележей в кооперативной игре................................................................. 25
3.3. Динамически устойчивое (состоятельное во времени) кооперативное решение . 26
3.4. Процедура распределения дележа ............................................................................. 27
4. ДИНАМИЧЕСКАЯ МОДЕЛЬ СОВМЕСТНОГО ............................................................ 28
ПРЕДПРИЯТИЯ ..................................................................................................................... 28
4.1. Выигрыши коалиций ................................................................................................... 29
4.2. Компенсация переходных изменений ....................................................................... 31
4.3. Кооперативная модель совместного предприятия ................................................... 32
ЗАКЛЮЧЕНИЕ ....................................................................................................................... 35
СПИСОК ЛИТЕРАТУРЫ ...................................................................................................... 36
ВВЕДЕНИЕ
Для оценки качества менеджмента и выработки методологии его оптимизации используются методы математического и компьютерного моделирования.
В том случае, когда управленческие решения принимаются одним лицом и их результат не зависит от действий других сторон, в качестве аппарата математического моделирования может быть с успехом использована теория оптимального управления и оптимизации. В
то же время в подавляющем большинстве случаев даже, когда можно условно предположить
что менеджмент осуществляется одним лицом, нельзя гарантировать что его результат не
будет зависеть от действий других сторон или лиц так или иначе заинтересованных в результатах этого менеджмента.
В этом случае необходимо учитывать наличие несовпадающих, а в ряде случаев и
конфликтующих интересов у сторон, заинтересованных в результатах менеджмента.
Игнорирование этого обстоятельства может привести, и в действительности приводит,
к невозможности полной реализации управленческих решений, а, следовательно, и к недостижению результатов, на которые эти управленческие решения были направлены.
Поэтому при попытках моделирования подобных ситуаций пользуются методами и
подходами теории игр. Однако подавляющее большинство исследований в области теории
игр касается, так называемых, однократных или мгновенных игр, в которых конфликт между
сторонами происходит мгновенно и таким образом совершенно не учитывается временной
фактор. В то же время совершенно очевидно, что реальные процессы принятия решений (реальный менеджмент) происходят на достаточно большом временном интервале, где приходится в каждый текущий момент времени учитывать результаты предыдущих решений и
только на этой основе вырабатывать соответствующее управление. Именно поэтому приходится констатировать, что подходящими математическими моделями подобных процессов
могут быть динамические и дифференциальные игры, которые с одной стороны учитывают
конфликтность процесса принятия решений, а с другой необходимость его моделирования на
достаточно продолжительном временном интервале.
На практике долгосрочные управленческие решения вырабатываются на основе рекомендаций и потребностей, выявляемых на всех уровнях системы управления, в результате из
большого числа возможных вариантов, на основе некоторого трудно формализуемого алгоритма, выбирается одно единственное решение, подлежащее дальнейшей реализации. Этот
плохо формализуемый и трудно улавливаемый алгоритм выбора по существу является реализацией установившегося в данной системе менеджмента принципа оптимальности, осмысливание и научный анализ которого иногда может привести к обескураживающим выводам.
Здесь мы сталкиваемся с интересной проблемой – восстановлением принципа оптимальности, лежащего в основе принятия решений по наборам конкретно выработанных решений.
Независимо от того в какой степени мы сумеем продвинуться в решении этой проблемы, сам
факт наличия такого принципа оптимальности не вызывает сомнения. В то же время свойства этого принципа оптимальности мы можем наблюдать и без проведения глубокого исследования. Отметим два, на наш взгляд, наиболее важных свойства присутствующих и довлеющих на принятие долгосрочных решений (долгосрочный менеджмент). Первое – необходимость проверки качества принимаемого решения по нескольким критериям. Второе –
различная оценка качества решения различными сторонами, участвующими в выработке решения. Это наводит нас на мысль о том, что неуловимый принцип оптимальности, лежащий
в основе выбора решения, имеет теоретико-игровой, конфликтный характер, поскольку также как и в теоретико-игровых моделях, здесь мы имеем несколько сторон, влияющих на
принятие решения, в соответствии со своими не обязательно совпадающими интересами.
Прогресс в технологиях, коммуникациях, промышленной организации, международной торговле, экономической интеграции и политических реформах способствовал созданию
быстро развивающихся социально-экономических связей включающих межрегиональную и
6
межгосударственную деятельность, а также взаимодействие задействованных объектов и
субъектов. С точки зрения современного менеджмента исключительно важно осознать и реально использовать взаимосвязь и взаимозависимость принимаемых решений в подобных
обстоятельствах. Стратегический аспект принятия решений особенно важен в таких областях
как торговые переговоры, иностранные и национальные капиталовложения, международный
контроль состояния окружающей средой, интеграция и развитие рынков, технологические и
продуктовые исследования и разработки, маркетинг, региональная кооперация, политика в
области обороны и контроль над вооружениями.
Теория игр существенно подняла наш уровень понимания процессов принятия решений. Однако усложнение социально-экономических и политических проблем требует нахождения новых аналитических методов и методологических подходов, как в самой теории, так
и при исследовании отдельных задач и в приложениях. Социальные науки, экономика и финансы и есть те области, в которых использование методологии теории игр может дать значительную отдачу именно из-за конфликтного характера возникающих здесь проблем. Исследования следует направить на более реалистический и релевантный анализ процессов
принятия решений в социально-экономической сфере, при этом теоретико-игровой подход
поможет особенно эффективно исследовать и решать задачи и проблемы менеджмента.
Как мы замечали ранее при моделировании конфликтно-управляемых процессов в социально-экономической сфере и менеджменте наиболее реалистичными являются математические модели, базирующиеся на теории динамических и дифференциальных игр.
Теория дифференциальных игр возникла в пятидесятые годы прошлого века. Основополагающей работой в этой области считается монография Р.Айзекса “Дифференциальные
игры”, вышедшая в свет в 1965г. ([Isaacs, 1965]). Первые отечественные работы появились в
1965г. ([Красовский, 1966; Петросян, 1965; Понтрягин, 1967]). Однако до середины шестидесятых годов исследовались лишь антагонистические дифференциальные игры, моделирующие конфликт между двумя сторонами, имеющими прямо противоположные интересы. Понятно, что антагонистические дифференциальные игры могли иметь приложения лишь в
ограниченном классе задач, возникающих при военном столкновении сторон (перехват летательных аппаратов, обнаружение и уничтожение подводных подвижных объектов, оптимизация распределения ресурсов при локальных военных столкновениях и т.п.).
Для моделирования социально-экономических процессов необходимо было разработать теорию неантагонистических дифференциальных игр. Первые работы в этой области
появились в конце шестидесятых годов ([Петросян, Мурзов, 1967; Case 1967; Starr, Ho,
1969a, 1969b]). В этих работах исследовались неантагонистические некооперативные дифференциальные игры со многими участниками, и поэтому в качестве принципа оптимальности
использовалось равновесие по Нэшу. В последующих работах полученные результаты применялись для исследования различных задач социально-экономического характера ([Haurie,
Krawczyk, Roche, 1976; Jorgensen, 1985; Jorgensen, Sorger, 1990; Jorgensen, Zaccour, 2002;
Kaitala, 1993; Sorger, 1989; Yeung, 1992, 1994] и др.).
Однако в указанных работах не рассматривалась возможность кооперации участников
конфликтно-управляемого процесса с целью достижения более высоких показателей. И хотя
статическая (мгновенная) теория таких игр была хорошо развита, динамическому аспекту
кооперативного поведения не было уделено должного внимания. Теория кооперативных игр
дает возможность выработки социально-оптимальных коалиционно-эффективных решений в
задачах, включающих стратегически обусловленные действия. Формализация условий кооперации и связанного с этим оптимального поведения участников конфликтноуправляемого процесса (игроков) является фундаментальным элементом этой теории. Однако для сохранения кооперации и принятых соглашений требуется выполнение более жесткого условия: в процессе реализации решения принцип оптимальности, на основе которого вырабатывалось первоначальное решение, должен оставаться состоятельным в течении всего
игрового процесса (генерировать в определенном смысле адекватные решения в текущих
подзадачах), т. е. в каждый момент времени вдоль определенной заранее оптимальной траек7
тории процесса. Это условие носит название “динамической устойчивости” или “состоятельности во времени”. Иными словами, свойство динамической устойчивости решения (состоятельности во времени или временной состоятельности) кооперативной динамической игры
означает, что когда игра развивается вдоль кооперативной траектории, игроки следуют одному и тому же принципу оптимальности в каждый момент времени (в каждой подзадаче с
начальными условиями на этой оптимальной траектории) и поэтому не имеют побуждения
отклониться от первоначально выбранного оптимального решения в течение всей игры.
При исследовании кооперативных дифференциальных игр в конце 70-х годов нами
было обнаружено и математически строго доказано, что если специальным образом не производить регуляризацию принципа оптимальности, то выбранное в начале процесса “оптимальное решение” в ходе его реализации почти всегда теряет свою “оптимальность” и поэтому не может оставаться основополагающим принципом дальнейшего развития. Данное
явление имеет место даже без каких-либо внешних воздействий или изменения интереса
участников. Это и есть нарушение динамической устойчивости или временной состоятельности. Несколько позже это обстоятельство было обнаружено при решении одной специальной задачи зарубежными авторами Ф. Кидландом и Е. Прескоттом ([Kydland, Prescott, 1977]),
получившими Нобелевскую премию в области экономики в 2004 г.
Таким образом, чтобы долгосрочный менеджмент сохранял свою оптимальность в
процессе реализации, необходимо, чтобы заложенный при его выработке принцип оптимальности обладал свойством динамической устойчивости или временной состоятельности,
хотя как нами строго доказано это может происходить лишь в вырожденных тривиальных
случаях. Нарушение временной состоятельности рано или поздно приводит к ревизии стратегий менеджмента, колоссальным материальным и моральным потерям. И здесь мы оказываемся в порочном кругу. Для определения того является ли выбранный принцип оптимальности состоятельным во времени или нет (если нет, то нами предложены методы его регуляризации, приводящие к состоятельному принципу оптимальности) необходимо его точное
математическое описание. Однако при существующих схемах принятия решений сделать это
практически невозможно. Поэтому мы наблюдаем вопиющие примеры потери временной
состоятельности (поворот сибирских рек, строительство дамбы в Ленинграде, война в Ираке,
международные проекты по разработке российских нефтегазовых месторождений на основе
соглашения о разделе продукции и др.).
Динамическая устойчивость (временная состоятельность) принципов оптимальности в
дифференциальных играх подробно исследовалась в работах специалистов по теории игр.
А.Ори ([Haurie, 1976]) заметил временную несостоятельность арбитражной схемы
Нэша при ее использовании в качестве принципа оптимальности в дифференциальной игре.
Л.А. Петросян ([Петросян, 1977]) математически формализовал понятие динамической
устойчивости (временной состоятельности), ввел “понятие процедуры распределения дележа” для кооперативных решений ([Петросян, Данилов, 1979]). В работе [Tolwinski, Haurie,
Leitmann, 1986] исследовано кооперативное равновесие в дифференциальных играх, когда
система угроз обеспечивает развитие игры по кооперативному пути. В дальнейшем, в работах [Petrosjan, 1993; Petrosjan, Zenkevich, 1996] проведен подробный анализ динамической
устойчивости в кооперативных дифференциальных играх и предложен метод регуляризации
для построения динамически устойчивых (состоятельных во времени) решений.
1. ОПРЕДЕЛЕНИЕ КООПЕРАТИВНОГО РЕШЕНИЯ
Естественно начать изложение содержание работы с определения базовых понятий, в
том числе понятия кооперативного решения. Поскольку речь идет о менеджменте, то естественно рассматривать неантагонистические конфликты, соответствующие им модели и решения.
В широком смысле под кооперативным решением мы понимаем решение нескольких
участников (сторон, лиц, игроков) объединенных необходимостью или желанием принятия
8
решения по актуальной проблеме, требующее согласования их интересов и закрепленное соглашением. Таким образом, в широком смысле речь идет фактически о любом согласованном
решении заинтересованных сторон. Заметим, что рассматриваемая проблема временной состоятельности относится к долгосрочному решению именно в таком широком контексте.
Проблемы принятия кооперативных решений возникают в различных областях менеджмента и теории менеджмента. В первую очередь отметим проблему подписания контракта как результата согласования интересов сторон. В стратегическом менеджменте – это,
например, соглашения по слиянию или поглощению, соглашения по образованию стратегических альянсов и другие типы соглашений по межфирменной кооперации. На уровне фирмы – долгосрочные соглашения между собственниками и менеджерами о распределении
прибыли. В финансовом менеджменте – это, например, инвестиционные решения. Можно
привести и много других примеров. При этом кооперативные решения могут быть в форме
юридического контракта или соглашения, законные и незаконные, с явными или тайными
целями. Возможны и более сложные варианты кооперативного соглашения.
При анализе и принятии кооперативного решения обычно рассматривается несколько
аспектов. Во-первых, какая имеется у заинтересованных сторон мотивация для принятия согласованного решения? Если таковая имеется, то является ли она достаточной? Часто в качестве такой мотивации выступают категории выгодности и справедливости согласованного
решения. Во-вторых, какое согласованное решение следует выбрать в качестве оптимального
(какой выбрать принцип оптимальности)? Как выбрать оптимальное решение (каков механизм выбора решения)? В-третьих, как реализовать процесс выполнения решения во времени
так, чтобы достичь результатов кооперации? В этой работе нас будет интересовать поведение кооперативного решения во времени (в ходе его реализации), поэтому ключевым является последний из рассмотренных аспектов проблемы принятия решений.
Кооперативные решения в широком смысле делятся на статические и динамические.
В статическом случае решение принимается один раз, мгновенно реализуется, и игроки сразу
получают выигрыш от его реализации. Несмотря на кажущуюся простоту такого подхода,
классическая теория игр занимается в основном изучением именно таких моделей. Однако
менеджмент и теория менеджмента имеет дело с управлением, а поэтому – с процессами (в
нашем случае с конфликтными процессами). Однако для понимания концепции кооперативного решения мы традиционно начнем рассмотрение со статической модели игры.
Под игрой n лиц в нормальной форме понимается модель  вида:
  N ,U i  ,Ki i 1 ,
n
n
i 1
где N  1,
, n – множество игроков, U i – множество стратегий, ui U i – стратегия,
Ki (u1 , , un ) – функция выигрыша игрока i  N .
Что же следует понимать под решением игры  ? Ответ на поставленный вопрос дают
концепции (принципы) оптимальности, сформулированные в определениях. Во всех случаях
понятно, что под решением следует понимать некоторый набор стратегий (u1 , , un ) всех
игроков, удовлетворяющий требуемому свойству оптимальности. Наиболее распространенной концепцией оптимальности игры многих лиц является равновесие по Нэшу.
Определение 1. [Nash, 1951]. Набор стратегий (u1 ,
, un ) называется равновесием по
Нэшу, если следующие неравенства выполняются для всех стратегий ui U и всех игроков
iN :
i
Ki (u1 ,
, ui 1 , ui , ui 1 ,
, un )  K i (u1,
9
, ui 1, ui , ui 1,
, un ) .
Равновесие по Нэшу (NE – решение) является кооперативным решением в широком
смысле, поскольку выбор такого решения требует согласованного поведения игроков. Действительно, NE – решение представляет собой набор стратегий, удовлетворяющий указанной
системе неравенств. Поэтому игроки, по крайней мере, должны договориться, что они будут
придерживаться именно такого способа поведения. Последнее обстоятельство особенно
важно, если в игре имеется несколько NE – решений. В этом случае игроки должны договориться еще и какое равновесие они будут реализовывать.
Определение 2. Набор стратегий (u1 ,
, un ) называется оптимальным по Парето,
если не существует другого набора стратегий (u1 , , un ) , для которого следующие неравенства выполняются для всех i  N :
Ki (u1 ,
, ui ,
, un )  K i (u1,
, ui ,
, un )
и хотя бы для одного j  N оно выполняется строго:
K j (u1, , u j , , un )  K j (u1, , u j , , un ) .
Оптимальное по Парето решение (PO – решение) является кооперативным решением
в широком смысле, поскольку принятие такого решения требует согласованного выбора
стратегий всеми игроками и обладает свойством групповой рациональности при стратегическом поведении игроков. Концепция оптимальности по Парето справедлива как для игр с
трансферабельными, так и для игр с нетрансферабельными выигрышами (такие выигрыши
игроки не могут передавать друг другу).
Характерным представителем оптимального по Парето решения является арбитражное решение Нэша. Арбитражное решение Нэша (u1, , un ) является решением следующей
оптимизационной задачи [Nash, 1950]:
n
max   Ki (u1 ,
u1 , ,un
i 1
n
un )  Ki0     Ki (u1,
i 1
un )  Ki0 
при ограничениях
Ki (u1 ,
un )  Ki0 , i  N .
0
, un0 ) - некоторое заданное «эталонное решение», определяющее точку «статус0
0
0
0
0
0
0
кво» K  ( K1 , , Ki , , K n ) , Ki  Ki (u1 , un ), i  N . Арбитражное решение Нэша
Здесь (u1 ,
(NB – решение) является кооперативным решением в широком смысле случай Парето оптимального решения.
Другим представителем оптимального по Парето решения является арбитражное
решение Калаи-Смородинского.
Арбитражное решение Калаи-Смородинского (u1, , un) является решением следующей оптимизационной задачи [Kalai, Smorodinskiy, 1975]:
max 
[0,1]
10
при ограничениях
K i  K i0   ( Kˆ i  K i0 ), i  N ,
Ki  Ki (u1 , un ), ui U i , i  N ,
0
, un0 ) – некоторое заданное «эталонное решение», определяемое точкой «статус0
0
0
0
0
0
0
кво» K  ( K1 , , Ki , , K n ) , Ki  Ki (u1 , un ),
i  N и «идеальной» точкой
Kˆ  ( Kˆ , , Kˆ , , Kˆ ) , Kˆ  max K (u , u ), i  N .
здесь (u1 ,
1
i
n
i
u1 , ,un
i
1
n
Идеальную точку K̂ обычно невозможно получить при каком-либо решении (иначе
она и была бы оптимальным решением), т.е. она не принадлежит множеству возможных оценок. Поэтому геометрически решение Калаи-Смородинского определяется точкой пересечения отрезка, соединяющего точку «статус-кво» и «идеальную» точку с границей множества
возможных оценок. Заметим, что арбитражное решение Калаи-Смородинского (KS – решение), также является кооперативным решением в широком смысле как частный случай оптимального по Парето решения.
При заданной арбитражной схеме в задаче можно реализовать практически любое Парето оптимальное решение за счет выбора точки «статус-кво». Таким образом, арбитражная
схема регламентирует лишь механизм (правила), на основе которого предполагается выбрать
оптимальное решение.
Все указанные выше принципы оптимальности являются стратегическими в том
смысле, что построены на основе согласованного или совместного выбора стратегий игроками.
Рассмотрим теперь понятие кооперативного решения в узком смысле. Такая концепция кооперативного решения предполагает двойную кооперацию: по совместному выбору
стратегий и дележу общего выигрыша от кооперации.
Напомним, что под кооперативной игрой в форме характеристической функции понимается модель  v вида:
v  N , v ,
, n – множество игроков, v(S )  0, S  N , v()  0 - характеристическая
где N  1,
функция, обладающая свойством супераддитивности:
v(S  T )  v(S )  v(T ), S  T   .
Значение характеристической функции v( S ) часто интерпретируется как максимальный гарантированный выигрыш коалиции S  N . Из свойства супераддитивности характеристической функции следует, что v( S )  v ( S ) , для S   S  N . Поэтому игрокам выгодно создавать максимальную коалицию N для получения максимально возможного суммарного выигрыша v( N ) в процессе игры.
Пусть  v – кооперативная игра, построенная на структуре игры  (с трансферабельными выигрышами), в которой игроки действуют в соответствии с некоторым заранее принятым принципом оптимальности [Петросян, Зенкевич, Семина, 1998]. Тогда, как было отмечено ранее, величина v( S ) понимается как максимальный гарантированный выигрыш коалиции S , т.е. максимальный выигрыш коалиции S , в случае, когда оставшиеся игроки образуют коалицию N / S для игры против этой коалиции S .
11
Соглашение о том, как именно осуществлять кооперацию и разделить полученный в
результате кооперативный выигрыш и составляет принцип оптимальности решения кооперативной игры. В частности, решением для кооперативной игры  v является:
 Соглашение о множестве кооперативных стратегий направленных на получение максимального выигрыша от кооперации
 Механизм распределения общего максимального выигрыша между игроками.
Множество всевозможных распределений максимального суммарного выигрыша
называется множеством дележей. Обозначим через i выигрыш игрока i  N при кооперации, если общий выигрыш от кооперации равен v( N ) .
Вектор (распределение суммарного выигрыша)
  (1 ,  2 ,...,  n ) ,
называется дележом в игре  v , если выполняются условия:
i  v({i}) , i  N ,
(ii)   i  v ( N ) .
(i)
iN
В этом определении условие (i ) определения гарантирует индивидуальную рациональность дележа в том смысле, что каждый игрок получает в условиях дележа, по меньшей
мере, такой же выигрыш, который он или она получит, играя против всех остальных игроков.
Условие (ii ) гарантирует Парето оптимальность дележа, а поэтому и групповую рациональность.
Обозначим множество дележей в игре  v через Ev . Под кооперативным принципом
оптимальности Wv в игре  v понимается правило, по которому каждой игре  v ставится в
соответствие некоторое подмножество Wv  Ev из множества дележей, т.е. механизм распределения суммарного выигрыша от кооперации. Если принцип оптимальности Wv выбран,
то дележ
  (1 ,  2 ,..., n ) Wv – называется оптимальным в соответствии с данным прин-
ципом оптимальности Wv . Это и есть определение кооперативного решения в узком смысле.
Приведем некоторые широко известные определения кооперативных решений.
Определение 3. Будем говорить, что дележ   (1 ,  2 ,...,  n ) принадлежит ядру игры
 v , если для каждой коалиции S  N выполняется следующее условие:

iS
i
 v( S ) .
Множество всех дележей из ядра обозначается Cv . Смысл кооперативного решения
из ядра понятен: если выбран в качестве оптимального дележ из ядра, то при таком дележе
каждая коалиция получает не меньший выигрыш от кооперации, чем она может получить
самостоятельно.
Определение 4. [Shapley, 1953]. Дележ
Фv ( x0 ,T  t0 )  (Ф1v , ,Фiv , ,Фnv )
12
называется вектором Шепли, если он определяется по формуле:
Фiv 
(n  s )!( s  1)!
[v( S )  v( S \ i )] , i  1,..., n.
n!
S  N ( iS )

Существуют и другие признанные концепции кооперативных принципов оптимальности, например, решение по Нейману-Моргенштерну, N-ядро. Все ниже перечисленные принципы оптимальности определяют кооперативные решения в узком смысле.
2. ПРОБЛЕМА ВРЕМЕННОЙ СОСТОЯТЕЛЬНОСТИ
КООПЕРАТИВНЫХ РЕШЕНИЙ
В предыдущем разделе мы рассмотрели статические концепции кооперативного решения. Однако менеджмент и теория менеджмента имеет дело с управлением, а поэтому с
процессами (в нашем случае с конфликтными процессами). Управление выбирается в
начальный момент управления и реализуется в течение некоторого временного промежутка.
Мы намерены показать, что в динамике кооперативное решение должно обладать обязательным свойством, называемым динамической устойчивостью или временной состоятельностью (time-consistency).
Под свойством динамической устойчивости (временной состоятельности) кооперативного решения будем понимать свойство сохранения оптимальности в каждой подзадаче
с начальными условиями на оптимальной траектории, построенной в начальный момент.
Поясним на стилизованных модельных примерах концепцию «динамической устойчивости» (временной состоятельности) принципа оптимальности.
2.1. Динамическая устойчивость решения задачи оптимального управления.
Пример 1. Совместное производство автомобильных двигателей1. В 1971 г. компании
Peugeot, Renault и Volvo договорились о создании альянса PRV с целью производства 6цилиндровых двигателей V6. С этой целью было решено создать совместное предприятие,
которое являлось бы совместным филиалом каждой из компаний. После образования совместного предприятия и запуска в производство двигателей V6 каждый из партнеров альянса
запустил в серийное производство свой автомобиль, который являлся прямым конкурентом
автомобилям высокого класса других партеров. Несмотря на это альянс был успешным, было
создано мощное совместное производство двигателей.
Попробуем прояснить причины успешности альянса. С одной стороны, мы имеем дело с интеграционным альянсом конкурирующих фирм, а поэтому фирмы-партнеры являются
фирмами-конкурентами. Однако ни одна из фирм не располагала достаточно большим рынком сбыта автомобилей высокого класса, укомплектованных такими двигателями. Кроме того, ни одна из фирм была не в состоянии самостоятельно производить двигатель, а закупать
его у сторонней фирмы было не выгодно в связи с высокими с транзакционными затратами и
риском попасть в зависимость от поставщика.
Приведенный анализ показывает, что, несмотря на конфликтный характер проблемы,
задача создания и функционирования совместного предприятия в данном случае может рассматриваться как задача оптимального управления.
Гарретт Б., Дюссон П. Стратегические альянсы: Пер. с англ. – М.: ИНФА-М, 2002.–
ХХ – (Серия «Менеджмент для лидера»), стр.54-56.
1
13
Пусть точка M  R определяет некоторое идеальное состояние системы (в нашем
примере – состояние совместного предприятия). Рассмотрим классическую задачу теории
управления. Пусть задана управляемая система дифференциальных уравнений
n
x(t )  f ( x(t ), u (t )), x  R m , u U  R l
(1)
x(t0 )  x0 , t  [t0 , T ],
где вектор x(t ) описывает состояние системы, вектор u (t ) – управление, выбираемое в
каждый момент времени t .
Процесс происходит на конечном интервале времени [t0 , T ] . Целью управления является перевод точки x0 (состояния системы в начальный момент времени t 0 ) в некоторое состояние x (T ) (в момент окончания процесса T ), при котором достигается минимум расстоn
яния  ( x(T ), M ) до некоторой фиксированной точки M  R .
Таким образом, математически задачу можем сформулировать так: найти такое
управление u (t ), t  [t0 , T ] , которое переводит точку x0 в точку x (T ) в силу системы (1),
наиболее близко расположенную к точке M .
Построим множество C ( x0 , T  t0 ) , называемое множеством достижимости системы
(1). Это множество тех точек x (T ) , в которое может перейти система из x0 в точности в
момент времени T , в соответствии с некоторым выбранным правилом управления
u (t ), t [t0 , T ] . Понятно, что при различных правилах управления (управляющих функциях, или «программных стратегиях») u (t ) точки x (T ) будут различны.
Обозначим также нашу задачу минимизации расстояния  ( x(T ), M )
через
( x0 , T  t0 ) , подчеркивая её зависимость от начального состояния x0 и времени процесса
T  t0 .
Предположим для простоты, что точка M не принадлежит C ( x0 , T  t0 ) , то есть что
M  C ( x0 , T  t0 )   . Это означает, что достижение точки M за время T  t0 из состояния x0 невозможно. Принципом оптимальности в данной задаче является минимизация расстояния между точкой x (T ) и точкой M .
Очевидно, что «оптимальное движение» или «оптимальная траектория» должна переводить точку x0 в точку M  ( x(t0 )  t0 , x(T )  M  ) наиболее близко расположенную в
множестве C ( x0 , T  t0 ) от точки M . Обозначим через x (t ) траекторию, соединяющую x0
с M  , реализованную при каком-то фиксированном (оптимальном) программном управлении u (t ) , т.е.
x  f ( x (t ), u (t )), x(t0 )  x0 , x(T )  M  .
Пусть процесс развивается вдоль оптимальной траектории x (t ) , как это показано на
  [t0 , T ] и пусть мы пожелали в
этот момент проверить: будет ли точка M  оставаться ближайшей к M в подзадаче
( x ( ), T   ) с начальным условием x ( ) на оптимальной траектории и продолжительностью T   ? Совершенно очевидно, что ответ – положительный, то есть можно утверждать,
что продолжение движения вдоль x (t ) при t   будет оптимальным движением в подзадаче ( x ( ), T   ) (рис. 1). Это и означает динамическую устойчивость или временную состоятельность оптимальной траектории x (t ) . Этот принцип был впервые сформулирован Р.
рис. 1. Рассмотрим некоторый промежуточный момент
14
Беллманом в 1957 г. ([Bellman, 1957]) и лёг в основу теории динамического программирования. Он практически всегда выполняется в однокритериальных классических задачах оптимального управления.
Заметим, что в рассматриваемом случае имеет место и более сильное условие (кстати,
незамеченное Р. Беллманом). В задаче ( x ( ), T   ) может возникнуть и другое программное управление u (t ), t [ , T ), u (t )  u (t ) и соответствующая траектория x(t ) , переводящая точку
x ( ) в M  и, следовательно, также оптимальное в подзадаче
( x ( ), T   ) . Интересно заметить, что управление вида
u (t ), t  [t0 ,  )
u (t )  
u (t ), t  [ , T ]
переводит точку x0 в M  в задаче ( x0 , T  t0 ) , то есть также является оптимальным в задаче ( x0 , T  t0 ) .
Рис. 1. Динамическая устойчивость оптимального управления
15
Таким
образом, оказывается, что любое оптимальное продолжение в подзадаче
( x ( ), T   ) вместе с начальным оптимальным движением на отрезке [t0 ,  ) в задаче
( x0 , T  t0 ) будет оптимальным в исходной задаче ( x0 , T  t0 ) . Это свойство называется
сильной динамической устойчивостью управления.
Пример 1. Выводы. Если говорить о совместном производстве автомобилей в примере
1, то мы склонны утверждать, что именно динамическая устойчивость кооперативного решения по образованию альянса (при условии выполнения других предположений кейса) является ключевой причиной его успешности.
К сожалению, условие сильной динамической устойчивости перестает выполняться
при рассмотрении более сложных задач оптимизации. Это имеет место в случае многокритериальной оптимизации.
2.2. Временная состоятельность Парето оптимального решения в задаче многокритериального оптимального управления.
Когда мы говорим о проблемах временной состоятельности кооперативного решения
между конкурирующими игроками, следует анализировать не только результаты кооперации, но и каждого игрока в отдельности. Заметим, что подобные проблемы учета взаимоотношений между соперничеством и сотрудничеством имеют место и при кооперативных решениях конкурирующих фирм по образованию стратегического альянса, при этом альянс
может охватывать как отдельный этап производства, так и целый ряд этапов изготоᐲления
продукции на партнерских предприятиях и поставлять на рынок совместно произведенную
продукцию. Понятно, что в ходе реализации кооперативного проекта у партнеров остаются
свои личные интересы.
Пример 2. Совместное производство самолетов2. Зададимся вопросом, что произошло
бы с альянсом PRV, если бы каждый из участников альянса имел свое видение на двигатель
V6 и стремился достичь своего результата в ходе процесса кооперации? В этом случае проблема создания совместного предприятия может быть сформулирована как задача многокритериального управления.
Аналогичная ситуация происходит, когда создается совместное предприятие с целью
поставки на рынок совместно произведенной продукции. Проиллюстрируем этот случай на
примере организации объединения экономических интересов (ОЭИ) Airbus Industrie, созданное в 1970 году с целью координации деятельности партнеров в рамках программы сотрудничества по созданию и реализации произведенных самолетов. Образование ОЭИ завершило
образование концерна Airbus. В состав концерна Airbus вошли четыре партнера со следующим распределением акционерного капитала: компания Aerospatiale – 37,9%, компания DASA – 37,9%, английского концерна British Aerospace – 20% и испанской компании CASA –
4,2%. За четверть века своего существования (1969-1994) компании Airbus удалось продать
более 1800 самолетов общей стоимостью 80 млрд. долл.
Это пример, несомненно, успешной работы по реализации кооперативного решения.
Таких результатов удалось достичь за счет разделения ответственности за производство исследовательских и конструкторских работ между участниками проекта (без дублирования), а
также четкой их специализации при производстве самолетов. Вместе с тем коммерческие
операции концерна по маркетингу, продаже и обслуживанию самолетов были поручены
Гарретт Б., Дюссон П. Стратегические альянсы: Пер. с англ. – М.: ИНФА-М, 2002.–
ХХ – (Серия «Менеджмент для лидера»), стр.263-274.
2
16
ОЭИ Airbus Industrie, которое является единственным средством связи партнерской команды
с рынком.
Проблема создания и работы ОЭИ Airbus Industrie и может быть исследована в рамках
модели многокритериального управления.
Пусть задана управляемая система дифференциальных уравнений (1):
x(t )  f ( x(t ), u (t )), x  R m , u U  R l ,
x(t0 )  x0 , t  [t0 , T ],
где, также как и в предыдущем случае, вектор x(t ) описывает состояние системы, вектор
u (t ) – управление, выбираемое в каждый момент времени t из некоторого множества U .
Процесс происходит на конечном интервале времени [t0 , T ] . По сравнению с предыдущим случаем каждый из участников l стремится к тому, чтобы достичь своей целевой
точки M l . Целью кооперативного управления является перевод точки x0 в некоторое состояние x (T ) , при котором минимизируется расстояние до точек M 1 ,..., M k , то есть задача заключается в нахождении минимума векторного критерия
[  ( x(T ), M 1 ),...,  ( x(T ), M l ),...,  ( x(T ), M k )] ,
где M l  R ,
n
l  1,2,..., k .
Математически задачу можно сформулировать так: найти такое управление u (t ) , которое переводит точку x0 в x (T ) в силу системы (1) , наиболее близко расположенную к
системе точек M 1 ,..., M k .
Поскольку данная задача является задачей многокритериального оптимального
управления, то в качестве принципа оптимальности естественно рассматривать множество
оптимальных по Парето решений.
Пусть, как и раньше множество C ( x0 , T  t0 ) есть множество достижимости системы (1), и обозначим через ( x0 , T  t0 ) нашу задачу многокритериального оптимального
управления, подчеркивая в этом обозначении зависимость от начального состояния x0 и
времени процесса T  t0 .
Обозначим через M̂ выпуклую оболочку точек M 1 ,..., M k .
Предположим для простоты, что
Mˆ  C ( x0 , T  t0 )   .
Можно показать (при условии выпуклости множества (см. [Петросян, Захаров,
1997])), что множество оптимальных по Парето управлений в этой задаче состоит из программных управлений u (t ) , переводящих точку x0 в некоторую точку M  , принадлежащую проекции множества M̂ на множество C ( x0 , T  t0 ) .
17
Обозначим через x (t ) траекторию, соединяющую x0 с некоторой точкой M  , принадлежащей проекции M̂ на C ( x0 , T  t0 ) , и пусть u (t ) – соответствующее программное
управление.
Траекторию x (t ) назовем оптимальной траекторией. Понятно, что данная задача может иметь бесконечное число оптимальных траекторий, поскольку проекция множества M̂
на множество C ( x0 , T  t0 ) , в общем случае, представляет собой замкнутое множество, содержащее более одной точки.
Рассмотрим некоторый промежуточный момент времени   [t0 , T ] , и пусть мы по-
желали в этот момент проверить: будет ли точка M  концом оптимальной по Парето траектории в подзадаче ( x ( ), T   ) с начальным условием x ( ) на оптимальной траектории
и продолжительностью T   ?
Рис. 2. Нарушение сильной динамической устойчивости Парето оптимального решения.
Как и в задаче оптимального управления, ответ – положительный, то есть можно
утверждать, что продолжение движения вдоль траектории x (t ) при t   будет оптимальным движением в подзадаче ( x ( ), T   ) . Это и означает динамическую устойчивость
или временную состоятельность оптимальной по Парето траектории x (t ) .
В то же время, как это видно из рис. 2, само Парето оптимальное множество программных управлений и соответствующие им траектории в подзадаче ( x ( ), T   ) , отли18
чается от Парето оптимального множества в задаче ( x0 , T  t0 ) , поскольку множество концов оптимальных по Парето траекторий в задаче ( x0 , T  t0 ) совпадает с дугой AB , а
множество концов Парето оптимальных траекторий в задаче ( x ( ), T   ) совпадает с дугой AB , которая является проекцией множества M̂ на множество C ( x ( ), T   ) .
В общем случае множества AB и AB имеют одну общую точку M  . Поэтому мы
видим, что в подзадаче ( x ( ), T   ) возникают новые оптимальные по Парето траектории, переводящие точку x ( ) в силу системы (1) в одну из точек M  дуги AB , несовпадающей с точкой M  .
Рассмотрим следующее программное управление
u (t ), t  [t0 ,  ),
u (t )  
u (t ), t  [ , T ],
где u (t ) –оптимальное по Парето программное управление, переводящее точку x ( ) в силу
системы (1) в точку M  на отрезке времени [ , T ] .
Поскольку точка M  не принадлежит дуге AB , программное управление u (t ) не
является Парето оптимальным в первоначальной задаче ( x0 , T  t0 ) .
Таким образом, мы приходим к выводу, что в задачах многокритериального управления не всякое оптимальное продолжение движения в подзадачах с начальными условиями на
оптимальной траектории первоначально поставленной задачи ( x0 , T  t0 ) является Парето
оптимальным в этой задаче. Это и означает нарушение сильной динамической устойчивости
или сильной состоятельности во времени Парето оптимальных решений в задачах многокритериального управления.
При переходе от однокритериальных задач оптимального управления к многокритериальным задачам, мы сталкиваемся с потерей сильной динамической устойчивости принципов оптимальности.
Само по себе это обстоятельство уже делает весьма проблематичным реализацию на
практике принципа оптимальности в подобных задачах, поскольку в промежуточные моменты времени возникает возможность пересмотра первоначально выбранного решения с заменой его на оптимальное в таком же смысле решение, однако общее развитие процесса при
этом оказывается неоптимальным в первоначальном смысле. Данное обстоятельство порождает естественную неуверенность у лица, принимающего управленческое решение, в выполнении первоначально задуманных планов и проектов.
2.3. Временная несостоятельность кооперативного решения, построенного на механизме выбора конкретного Парето оптимального решения. Теоретико-игровой анализ.
Значительно более неприятной оказывается ситуация с выбором конкретного Парето
оптимального решения. Большинство принципов оптимальности (пусть даже в неигровых
задачах), регламентирующие выбор конкретного Парето оптимального решения из множества всех Парето оптимальных решений не только, как мы уже видели, не являются сильно
динамически устойчивыми (сильно состоятельными во времени), но и не являются динамически устойчивыми (состоятельными во времени).
19
Пример 3. Проект «Сахалин-2». Важной формой международных стратегических альянсов в российском нефтегазовом комплексе (НГК) России являются международные консорциумы по разработке и реализации проектов на основании соглашений о разделе продукции (СРП). Так в консорциуме по СРП «Сахалин-2» представлены только три иностранных
ТНК, имеющих свои доли в его акционерном капитале: Royal Dutch/Shell – 55%, Mitsui –
25% и Mitsubishi – 20%, которые осуществляют финансирование проекта за счет собственных средств3.
Общий доход Российской стороны, согласно схеме раздела продукции складывается
из платы за пользования недрами («роялти»), доли Государства от прибыльных углеводородов, налога на прибыль инвестора, бонусов и других платежей.
Участием в проекте заинтересован «Газпром» (монополист вел долгие переговоры с
Shell о вхождении в проект в обмен на долю в ЗАО «Заполярье-Неоком», закончившиеся отрицательно).
18 сентября 2006 г. Минприроды отменило положительное заключение государственной экологической экспертизы второго этапа проекта "Сахалин-2".
В сентябре 2006 года Sakhalin Energy, оператор проекта "Сахалин-2", заявила, что затраты, которые может понести проект из-за отмены заключения экологической экспертизы
Минприроды, пойдут в категорию возмещаемых. Кроме того, летом 2005 года компания увеличила размер инвестиций во второй этап проекта с 12 до 20 миллиардов долларов. Эти действия снижают прибыль РФ от проекта "Сахалин-2".
Российское руководство в лице Президента РФ, ответственных работников аппарата
Президента неоднократно заявили, что российская сторона не согласится с увеличением издержек проекта "Сахалин-2", поскольку это сократит прибыли России, предусмотренные соглашением о разделе продукции (СРП).
При анализе возникших проблем при реализации проекта «Сахалин-2» нам важно не
насколько справедливы претензии российской стороны (это предмет отдельного разговора),
а насколько кооперативное решение, принятое на основе схемы СРП состоятельно во времени. Кстати, на основе СРП работают Харьягинский проект, «Сахалин-1», «Сахалин-2»4.
Поскольку СРП – арбитражное решение, то можно предположить, что кооперативное
решение принято на основе применения одной из арбитражных схем.
Существует много подходов к выбору конкретного Парето оптимального решения из
множества всех Парето оптимальных решений. К сожалению наиболее нетривиальные и
обоснованные из них являются динамически неустойчивыми (несостоятельными во времени). Покажем это на примере. Рассмотрим для этого выбор Парето оптимального решения по
принципу Калаи – Смородинского. Парето оптимальное решение, выбранное таким образом,
как мы указывали ранее, носит название – решение Калаи – Смородинского, или KS – решение.
В отличие от предыдущих двух случаев, мы будем считать, что правая часть системы
(1) зависит от нескольких управляющих воздействий, то есть:
x(t )  f ( x(t ), u1 (t ),..., un (t )), ui U i , x(t0 )  x0 , x  R m , t [t0 ,T ]
(2)
При этом каждое из управляющих воздействий ui выбирается различными сторонами, которые мы будем называть игроками.
Для простоты будем предполагать, что каждый из «игроков» i  N заинтересован в
некотором выигрыше, который имеет вид:
3
4
Эксперт.-2003.-№7
“BusinessWeek”, №37/9 октября 2006 г.
20
T
Ki ( x0 , T  t0 ; u1 ,..., un )   g i ( x(t ))dt  q i ( x(T )), i  N ,
t0
где
x(t ) решение системы (2), соответствующее управляющим воздействиям
u ()  (u1 (),..., un ()) , выбираемых игроками как функции текущих состояний и времени
(позиционные стратегии), и начальному условию x(t0 )  x0 . В результате мы получаем некоторую дифференциальную игру, которую обозначим через ( x0 , T  t0 ) .
Обозначим также через  ( x0 , T  t0 ) множество всех возможных значений вектора
[ K1 ( x0 , T  t0 ; u1 ,..., un ),..., K i ( x0 , T  t0 ; u1 ,..., un ),..., K n ( x0 , T  t0 ; u1,..., un )]
при различных управляющих воздействиях u1 ,..., un (множество возможных оценок проекта).
Пусть  ( x0 , T  t0 )   ( x0 , T  t0 ) Парето оптимальное множество векторовоценок в  ( x0 , T  t0 ) . При определении различных схем выбора конкретного Парето оп0
тимального решения важную роль играет точка «статус–кво». Пусть Ki есть то значение
максимального выигрыша, которое игрок i может обеспечить себе в наихудшем случае, если
все остальные игроки будут действовать против него (то есть вместо того, чтобы стремиться
максимизировать свой выигрыш, направят все усилия на минимизацию выигрыша игрока i ).
Обозначим точку «статус-кво» следующим образом:
K 0 ( x0 , T  t0 )  [ K10 ( x0 , T  t0 ),..., K n0 ( x0 ,T  t0 )]   ( x0 ,T  t0 )
Конечно, она зависит от начального условия x0 и продолжительности игры T  t0 . Обозначим
Kˆ i ( x0 , T  t0 )  max Ki ( x0 , T  t0 ; u1,..., un ) .
u1 ,...,un
Точка
Kˆ ( x0 , T  t0 )  [ Kˆ 1 ( x0 , T  t0 ),..., Kˆ i ( x0 , T  t0 ),..., Kˆ n ( x0 , T  t0 )]
как и ранее называется «идеальной» точкой и имеет смысл максимальных значений выигрыша игроков. Вообще говоря,
Kˆ ( x0 , T  t0 )   ( x0 , T  t0 ) ,
так как в противном случае точка K̂ и определяла бы решение задачи.
Проведем геометрический анализ проблемы временной состоятельности KS - решения. Для нахождения KS - решения проведем отрезок L , соединяющий точки
K 0 ( x0 , T  t0 ) и Kˆ ( x0 , T  t0 ) . Поскольку K 0 ( x0 , T  t0 )   ( x0 , T  t0 ) , а также
Kˆ ( x0 , T  t0 )   ( x0 , T  t0 ) , то существует точка M пересечения границы множества
 ( x0 , T  t0 ) и отрезка L . Если такая точка единственна, то она называется KS -решением.
Если точка M не единственна, то в качестве KS -решения можем взять точку пересечения

отрезка L с множеством  ( x0 , T  t0 ) наиболее удаленную от  ( x0 , T  t0 ) . Если множество  ( x0 , T  t0 ) выпукло, то KS - решение всегда принадлежит множеству Парето оптимальных точек. Однако легко видеть, что KS - решение не является динамически устойчивым (состоятельным во времени).
Проиллюстрируем это обстоятельство на числовом примере. Пусть система (2) имеет
вид:
21
z  u  v, | u1 | 1, | u2 | 1, z  R 2 ; u1, u2  R 2 ,
z0  (6,3), t [0,2], z  ( x, y),
K1 ( z0 ,2; u1, u2 )   x(2), K 2 ( z0 ,2; u1, u2 )   | y(2) |
Покажем временную несостоятельность решения Калаи – Смородинского. Здесь точка
0
«статус-кво» в задаче ( z0 ,2) равна K ( z0 , 2)  (6,3) и соответствует начальному состоянию z0  (6,3) . Идеальная точка этой задачи равна Kˆ ( z0 , 2)  (2,0) и соответствует
точке zˆ( z0 ,2)  (2,0) , поскольку max K1  2, max K 2  0 . Множество достижимости
C 2 (6,3) есть круг с центром в точке (6,3) и радиусом 4. Оптимальная траектория соответствует движению по прямой от точки z0  (6,3) по направлению к точке zˆ( z0 ,2)  (2,0) до
2
пересечения с большей окружностью C (6,3) . Точка пересечения и определяет KS решение в задаче ( z0 ,2) (рис. 3).
Мы видим, что при движении вдоль оптимальной траектории z (t ) соединяющий
точку z 0 с KS -решением задачи ( z0 ,2) , в подзадаче ( z (1),1) возникает новое KS - решение отличное от KS - решения
основной задачи, т.е.
Рис. 3. Временная несостоятельность KS - решения.
22
KS ( z0 ,2)  KS ( z (1),1) .
что и означает временную несостоятельность (динамическую неустойчивость) KS - решения.
Пример 3. Продолжение. Нарушение временной состоятельности кооперативного решения по схеме СРП и является объективной причиной возникающих проблем в проекте
«Сахалин-2». Это обстоятельство приводит к необходимости проведения тяжелых продолжительных переговоров по согласованию интересов сторон в ходе реализации подобных
проектов и, в конечном счете, к недостижению результатов, предполагаемых при открытии
проекта.
3. РЕГУЛЯРИЗАЦИЯ КООПЕРАТИВНОГО ПРИНЦИПА ОПТИМАЛЬНОСТИ
Предыдущие рассмотрения показывают, что абсолютное большинство кооперативных
решений в широком смысле не являются состоятельными во времени, а поэтому их реализация связана с серьезными проблемами и, в конечном счете, с недостижением результатов кооперации в том смысле, как это предполагалось при принятии кооперативного решения. Динамически устойчивыми являются лишь решения задачи оптимального управления и равновесие по Нэшу в условиях одинакового дисконта у всех игроков (дисконтирование ведется
по одинаковой процентной ставке). Имеется ли выход из создавшегося положения? К счастью, можно дать положительный ответ на поставленный вопрос. Решение проблемы возможно в классе кооперативных решений в узком смысле, т.е. когда задача формализуется как
кооперативная игра.
3.1. Определение кооперативной дифференциальной игры.
Рассмотрим общую дифференциальную игру n лиц с уравнениями движения:
x(t )  f [t , x(t ), u1 (t ), u2 (t ),..., un (t )] , x(t 0 )  x0 .
(3)
Игра происходит на промежутке [t0 , T ] . Выигрыш игрока i определяется по формуле:
T
 g [s, x(s), u (s), u (s),..., u (s)]ds  q ( x(T )),
i
i
1
2
n
g i  0, q i  0 ,
(4)
t0
где x(t )  X  R - позиционная переменная игры, определяющая её текущее состояние,
ui  U i – управляющее воздействие игрока i  N . В рассматриваемом случае будем считать, что выигрыши игроков трансферабельные.
m
Мы предполагаем, что игроки перед началом игры приняли решение максимизировать
суммарный выигрыш. Пусть c ( x0 , T  t 0 ) – кооперативная игра, построенная на структу-
ре игры ( x0 , T  t 0 ) , в которой игроки действуют в соответствии с некоторым заранее
принятым принципом оптимальности. Соглашение о том, как именно осуществлять кооперацию и разделить полученный в результате кооперативный выигрыш и составляет принцип
23
оптимальности решения кооперативной схемы.
Принцип оптимальности решения должен оставаться действенным на всем периоде
кооперации. Кроме того, принцип групповой рациональности требует, чтобы игроки выбирали кооперативные стратегии (управления) из Парето оптимального множества. В дополнение к этому, принцип распределения полученного суммарного выигрыша должен быть индивидуально-рациональным в том смысле, что в результате кооперации ни один из игроков не
получил бы меньше, чем без кооперации.
Для выполнения условия групповой рациональности в случае трансферабельных выигрышей, игроки стремятся максимизировать суммарный выигрыш
T
N 



   g [ s, x( s), u1 ( s), u2 ( s),...,un ( s), ]ds  q ( x(T ))

j 1 
t 0
j
j
(5)
при ограничении (3).
Для
нахождения
соответствующих
максимизирующих
управлений
u* ( s)  [u1* ( s), u2* ( s),...,un* ( s)] можно использовать принцип максимума Понтрягина или
уравнение Беллмана. Подставляя полученные оптимальные управления в (3), получаем оп* T
тимальную траекторию {xs }
, которая определяется соотношением
s t 0
t
x (t )  x0   f [ s, x* ( s), u * ( s)]ds, t  [t0 , T ] .
*
(6)
t0
Для удобства обозначений в дальнейшем изложении мы будем чередовать использо*
*
вание символов x (t ) и xt .
Обозначим выражение
T
N 



   g [ s, x ( s), u ( s)]ds  q ( x (T ))

j 1 
t 0
j
*
*
j
*
через v( N ; x0 , T  t 0 ) . Пусть S  N и v( S ; x0 , T  t 0 ) означает выигрыш коалиции S
(значение характеристической функции).
Будем использовать обозначение v ( x0 , T  t 0 ) для определения дифференциальной
игры в форме характеристической функции v( S ; x0 , T  t 0 ) , S  N .
Обозначим через
 ( x0 , T  t0 )  [1 ( x0 , T  t0 ),  2 ( x0 , T  t0 ),...,  n ( x0 , T  t0 )]
произвольный дележ, Cv ( x0 , T  t0 ) - ядро, Ф ( x0 , T  t0 ) - вектор Шепли в игре
v ( x0 , T  t0 ) .
v
24
3.2. Динамика дележей в кооперативной игре
В динамических и дифференциальных играх дележи, входящие в решение, естественным образом находятся в поле зрения игроков при их движении вдоль оптимальной траекто* T
рии {xs }
. В этом разделе мы обратим основное внимание на динамику распределения
s t0
дележа, обусловленного выбранным принципом оптимальности.
Итак, пусть в игре v ( x0 , T  t 0 ) выбран некоторый принцип оптимальности реше-
ния Wv ( x0 , T  t0 ) . Решение игры строится в начальном состоянии x (t 0 )  x0 на основе
данного принципа оптимальности и представляет собой некоторое подмножество множества
дележей Wv ( x0 , T  t0 )  Ev ( x0 , T  t0 ) , а также условно-оптимальную траекторию
{x*s }Ts t , максимизирующую суммарный выигрыш:
0
T
N



   g [ s, x ( s), u ( s)]ds  q ( x (T )) .

j 1
t0
j
*
*
j
*
* T
Определение 5. Любая траектория {xs }
являющаяся решением системы (3) и таs t0
кая, что
T
N 



   g [ s, x ( s), u ( s)]ds  q ( x (T )) v( N ; x0 ,T  t0 )

j 1 
t 0
j
*
*
j
*
называется условно-оптимальной траекторией в игре v ( x0 , T  t 0 ) .
Из определения 5 следует, что вдоль условно-оптимальной траектории игроки получают
максимальный суммарный выигрыш. Рассмотрим поведение множества Wv ( x0 , T  t0 )
* T
вдоль условно-оптимальной траектории {xs }
. Для каждого текущего состояния
s t0
x* (t )  xt* определяем текущую подыгру v ( xt* ,T  t ) с характеристической функцией
v( N ; xt* ,T  t ) и множеством дележей Ev ( xt* ,T  t ) .
Рассмотрим семейство текущих игр
{v ( xt* , T  t ), t0  t  T } ,
*
*
и их решения Wv ( xt , T  t )  Ev ( xt , T  t ) , порожденные тем же принципом оптимальности, что и решения Wv ( x0 , T  t 0 ) .
*
*
Понятно, что множество Wv ( xT ,0) есть решение текущей игры v ( xT ,0) в момент
T и состоит из единственного дележа
q( x* (T ))  [q1 ( x* (T )), q 2 ( x* (T )),..., q n ( x* (T ))]  [q1 ( xT* ), q 2 ( xT* ),..., q n ( xT* )].
25
3.3. Динамически устойчивое (состоятельное во времени) кооперативное решение
Определение оптимального поведения игроков является основным вопросом в теории
кооперативных игр. Поведение игроков, удовлетворяющее некоторому принципу оптимальности, и составляет решение игры. Для динамических игр требуется выполнение ещё одного
дополнительного условия (динамической устойчивости или состоятельности во времени):
выбранный принцип оптимальности должен оставаться оптимальным в каждой подыгре с
начальными условиями на оптимальной траектории, построенной в начальный момент. К
сожалению, все основные кооперативные принципы оптимальности в узком смысле являются динамически неустойчивыми (несостоятельными во времени).
*
Пусть существуют решения Wv ( xt , T  t )   , t 0  t  T вдоль оптимальной тра* T
ектории {xs }
. Предположим, что в момент времени t 0 в состоянии x 0 игроки согласиs t0
лись на дележ
 ( x0 , T  t0 )  [1 ( x0 , T  t0 ),  2 ( x0 , T  t0 ),..., n ( x0 , T  t0 )]  Wv ( x0 , T  t0 )].
Это означает, что игроки согласились на такой дележ суммарного выигрыша, при котором доля игрока i на отрезке времени [t0 , T ] в точности равна  i ( x0 , T  t 0 ) . Если, в со-
 ( x0 , T  t0 ) , игрок i предполагает получить выигрыш равный
i [ ( x0 ,T  t0 ); x* (), t  t0 ] на временном интервале [t0 , t ] , то на оставшемся интервале
[t , T ] его выигрыш должен быть равен:
ответствии с дележом
i [ ( x0 ,T  t0 ); x* (t ),T  t ]  i ( x0 ,T  t0 )  i [ ( x0 ,T  t0 ); x* (), t  t0 ] . (7)
Для того чтобы первоначальное соглашение о дележе (а именно о дележе
 ( x0 , T  t0 ) ) сохранялось в силе в момент t , существенно, чтобы вектор
[ ( x0 ,T  t0 ); x* (t ),T  t ] Wv ( xt* ,T  t ),
(8)
*
то есть [ ( x0 , T  t0 ); x (t ), T  t ] должен быть действительно решением текущей игры
v ( xt* , T  t ) . Если указанное условие выполняется в каждый момент времени
t  [t0 , T ] вдоль оптимальной траектории {x*s }Ts t , тогда дележ  ( x0 , T  t0 ) динамиче0
ски устойчив.
Динамическая устойчивость или состоятельность во времени решения  ( x0 , T  t0 )
гарантирует, что продолжение решения в подыграх, начинающихся на оптимальной траектории, должно оставаться оптимальным. Кроме того, групповая и индивидуальная рациональность должна выполняться на всем временном интервале.
К сожалению, все основные кооперативные принципы оптимальности в узком смысле
являются динамически неустойчивыми (несостоятельными во времени). Однако выход из
положения есть. Необходимо специальным образом определить механизм выплат, который
бы обеспечил устойчивую реализацию таких дележей.
26
3.4. Процедура распределения дележа
Процедура распределения дележа, впервые предложенная в [Петросян, Данилов,
1979], будет построена таким образом, чтобы динамическая устойчивость дележей могла
быть реализована для конкретного кооперативного решения. Представим выигрыш игрока i ,
получаемый им на временном интервале [t 0 , t ] , в виде:
t
i [ ( x0 (), T  t0 ); x (), t  t0 ]   Bi ( s)ds ,
*
(9)
t0
где
 B j (s)   g j [s, x* (s), u* (s)] ,
jN
jN
при t0  s  t  T и
i [ ( x0 ,T  t0 ); x* (t ),T  t ]  i  i ( x,T  t0 ) .
Отсюда получаем
Bi (t )  
di
di
или
 Bi (t ) ,
dt
dt
(10)
где  Wv ( xt , T  t ) .
*
Величина Bi (t ) может быть проинтерпретирована как мгновенный выигрыш игрока
i в момент t . Очевидно, что вектор B(t )  [ B1 (t ), B2 (t ),..., Bn (t )] предписывает распределение суммарного выигрыша между членами коалиции N . Выбирая B(t ) , t  [t 0 , T ] игроки
могут гарантировать желаемый исход, а именно, в каждый момент t  [t 0 , T ] у них не будет
оснований против реализации первоначального дележа  ( x0 , T  t0 ) как показано на рис. 4,
т.е. дележ
 ( x0 , T  t0 ) динамически устойчив.
Кооперативная дифференциальная игра v ( x0 , T  t 0 ) имеет динамически устойчивое решение Wv ( x0 , T  t 0 ) , если все его дележи  ( x0 , T  t0 )  Wv ( x0 , T  t0 ) динамически устойчивые. Условно-оптимальная траектория, вдоль которой существует динамически-устойчивое решение игры v ( x0 , T  t 0 ) , называется оптимальной траекторией.
Нами при достаточно общих предположениях доказано, что процедура выбора
B(t ) , t  [t0 , T ] (процедура распределения дележа), приводящая к динамически устойчивому кооперативному решению существует и реализуема [Petrosjan, Zenkevich, 1996].
27
Рис. 4. Динамически устойчивое кооперативное решение
Пример 3. Проект «Сахалин-2». Выводы. В соответствии с приведенными результатами исследований в случае проектов типа «Сахалин-2» мы предлагаем использовать двухэтапную модель принятия решения. На первом этапе выбирается кооперативный дележ в соответствии с выбранным принципом оптимальности. На втором этапе необходимо регуляризовать данное решение, используя специальную процедуру распределения дележа. В результате формируется система выплат, которая должна реализовываться в ходе выполнения проекта. Итоговое кооперативное решение будет обладать свойством динамической устойчивости.
4. ДИНАМИЧЕСКАЯ МОДЕЛЬ СОВМЕСТНОГО
ПРЕДПРИЯТИЯ
Рассмотрим совместное предприятие, функционирующее на временном интервале
[t0 , T ] , образованное n фирмами. Уравнения движения имеют вид:
xi ( s)  fi i [ s, xi ( s), ui ( s)], xi (t0 )  xi0 , i N ,
(11)
где xi  X i  R i есть переменная состояния фирмы i , ui U - есть вектор управлений
фирмы i . Состояние фирмы i включает её основной капитал, уровень технологий, дополни28
m
i
тельные навыки и производственные ресурсы. Целью фирмы i является максимизация выигрыша:
 s

 T
 i
g
[
s
,
x
(
s
),
u
(
s
)]exp

r
(
y
)
dy
ds

exp

r
(
y
)
dy



 q ( xi (T )) ,
i
i
t


0
 t0

 t0

T
i
 s

i
i
где exp    r ( y ) dy  есть дисконт, g [ s, xi ( s), ui ( s)] – мгновенный доход, и q ( xi (T )) –
 t0

терминальный платеж фирмы i  N .
Рассмотрим совместное предприятие, состоящее из подмножества предприятий
K  N . Подмножество K состоит из k фирм. Участвующая фирма может получить основные навыки и технологии, которые было бы очень сложно получить в одиночку, следовательно, динамика состояний фирмы i в коалиции K имеет вид:
xi ( s )  fi K  s, xK ( s ), ui ( s)  , xi (t0 )  xi0 , i  K
где
xK ( s )
есть
совокупность
векторов
x j (s)
для
(12)
jK .
В
частности,
fi K [s, xi , uK ] u j  0, для j  i . Таким образом, положительный эффект в фиксированном
состоянии фирмы i может быть получен при использованием технологий других фирм, входящих в коалицию.
4.1. Выигрыши коалиций
В момент времени t 0 доход совместного предприятия K имеет вид:
 s

 T
 j


g
s
,
x
(
s
),
u
(
s
)
exp

r
(
y
)
dy
ds

exp

r
(
y
)
dy



 q ( x j (T ))

j
t 


 j

j

K
j

K
0
 t0

 t0

T
j
(13)
Для того чтобы вычислить выигрыш совместного предприятия K , мы должны рассмотреть задачу оптимального управления максимации (13) при условии (12).
Для удобства обозначений представим (12) в виде
xK ( s)  f K  s, xK ( s), u K ( s)  , xK (t0 )  xK0 ,
где u K - совокупность управлений u j , j  K ; f
K
тами f j
t, xK , uK  ,
K
(14)
t , xK , uK  - вектор-столбец с компонен-
jK .
Используя методику динамического программирования, решение задачи может быть
(t ) K
описано следующим образом. Обозначим через  j 0  (t , xK ) оптимальное управление фирмы j (в смысле максимизации суммарного выигрыша коалиции) в коалиции K . В случае,
когда все n фирм участвуют в совместном предприятии, то есть K  N , оптимальное
управление имеет вид:
29
 N(t ) N ( s, xN ( s))   1(t ) N ( s, xN ( s)), 2(t ) N ( s, xN ( s)),
0


0
0
,  N(t0 ) N ( s, xN ( s)) 

Оптимальная траектория удовлетворяет системе уравнений:
x j ( s )  f jN  s, xN ( s ), (jt0 ) N ( s, xN ( s))  , x j (t0 )  x 0j , j  N ,
которая также может быть представлена в виде:
xN ( s )  f N  s, xN ( s), N(t0 ) N ( s, xN ( s))  , xN (t0 )  xN0 .
Пусть xN (t )   x1 (t ), x2 (t ),




тория xN (t )
T
t  t0


(15)
, xn (t )  обозначает решение (15). Оптимальная траек-
характеризует состояние фирм-партнеров в период кооперации. Будем ис-
пользовать x j для обозначения состояния x j (t ) в момент времени t  t0 ,T  .

t
Рассмотрим приведенную выше модель совместного предприятия, включающего n
фирм. Предположим, что фирмы-участники максимизируют свой совместный доход и распределяют его в соответствии с вектором Шепли. Проблема дележа полученного дохода возникает практически в каждом совместном предприятии. Вектор Шепли один из наиболее часто используемых механизмов в статических кооперативных играх с трансферабельными доходами. Кроме того, обладая свойствами индивидуальной и групповой рациональности, вектор Шепли всегда единственный. Единственность делает вектор Шепли более привлекательным кооперативным решением относительно других, например, ядра и НМ-решения. Кроме
того, вектор Шепли дает правило распределения для дележа кооперативного дохода среди
участников коалиции в виде:
iv 
где K \ i
(k  1)! n  k !
 v( K )  v( K \ i )  , i  N ,

n!
K N
(16)
есть дополнительная коалиция i в K , v( K ) - доход коалиции K , и
v( K )  v( K \ i) - маргинальный вклад фирмы i
в коалицию K .
Для того, чтобы максимизировать доход совместного производства, фирмы будут ис-
пользовать вектор управлений

( t0 ) N 
N

(t , xNt )
T
t  t0
на промежутке t0 , T  , получая в резуль-
тате соответствующие (15) оптимальные траектории
x (t )

N
T
t  t0
. В момент t 0 и состоянии
x Nt0 фирмы договариваются, что доля дохода фирмы i будет:
v(t0 )i (t0 , xN0 ) 
для i  N .
(k  1)! n  k ! (t0 ) K
W
(t0 , xK0 )  W (t0 ) K \i (t0 , xK0 \i )  , (17)

n!
K N
30
Однако вектор Шепли должен поддерживаться на всем промежутке производства
t0 ,T  . В частности, в момент времени  t0 ,T  и состоянии xN должно быть выполнено
следующее соотношение:
v( )i ( , xN ) 
(k  1)! n  k ! ( ) K
W ( , xK )  W ( ) K \i ( , xK\i )  ,
n!
K N

(18)
где i  N и   t0 , T  .
Отметим, что v
( )
( , xN )  v ( )1 ( , xN ), v ( )2 ( , xN ),
, v ( ) n ( , xN )  , полученный
по формулам (18), удовлетворяет свойствам дележа.
Более того, если условие (18) выполнено, то принцип оптимальности решения – дележ
доходов в соответствии с вектором Шепли – сохраняется в любой момент времени на протяжении всей игры вдоль оптимальной траектории, выбранной в начальный момент. Следовательно, временная состоятельность имеет место, и ни одна из фирм не будет иметь причин
отклониться от первоначально выбранного кооперативного решения. Таким образом, динамический принцип дележа, удовлетворяющий (18), динамически устойчив или состоятелен
во времени.
Ключевой момент анализа – формирование механизма распределения дележа, который обеспечивал бы выполнение условия (18).
4.2. Компенсация переходных изменений
Здесь будет показан механизм распределения прибыли, с целью компенсации переходных изменений так, чтобы значение вектора Шепли поддерживалось на всем промежутке
кооперации. Для этого должна быть сформулирована процедура распределения дележа (аналогичная рассмотренной в работах [Petrosyan, Zaccour, 2003; Yeung, Petrosyan, 2004]), для
того чтобы схема распределения в условии (18) была реализуема. Пусть Bi (t ) есть платеж,
получаемый фирмой i  N в момент t  t0 ,T  , предписываемый функцией v
частности,
v(t0 )i (t0 , xN0 ) 
( t0 ) i
(t0 , xN0 ) . В
(k  1)! n  k ! (t0 ) K
W
(t0 , xK0 )  W (t0 ) K \i (t0 , xK0 \i )  
n!
K N

 s

 T

i

  Bi ( s )exp    r ( y ) dy  ds  q ( xi (T ))exp    r ( y ) dy  .
t0
 t0

 t0

T
(19)
Следующая формула определяет Bi ( ) – правило распределения вектора Шепли во
времени, обеспечивающее динамическую устойчивость вектора Шепли.
Bi ( ) 
(k  1)! n  k !
Wt ( ) K (t , xK ) |t    Wt ( ) K \i (t , xK\i ) |t  

n!
K N

31


 Wx() K (t , xK ) |t    Wx() K \i (t , xK\i ) |t  
 N
  N

 f N  , xN , N( ) N  ( , xN )  ,
(20)
или
Bi ( ) 
(k  1)! n  k !
Wt ( ) K (t , xK ) |t    Wt ( ) K \i (t , xK\i ) |t  

n!
K N

  Wx() K (t , xK ) |t   f jN  , xN , (j ) N ( , xN ) 
 j

jK

  Wx() K \i ( , xK\i ) |t   f hN  , xN , h( ) N ( , xN )   
 h

hK \i

(k  1)! n  k !
Wt ( ) K (t , xK ) |t    Wt ( ) K \i (t , xK\i ) |t  
n!
K N


 Wx() K (t , xK ) |t   f KN  , xN , K( ) N ( , xN ) 
 K

 Wx() K \i ( , xK\i ) |t   f KN\i  , xN , K(\)i N ( , xN )  ,
 K \i


f KN  , xN , K( ) N ( , xN ) 
где
есть
вектор-столбец
с
компонентами
fi N  , xN , i( ) N ( , xN )  , i  K .
Вектор B( ) служит уравновешивающей компенсацией изменений, которая гарантирует реализуемость дележа согласно вектору Шепли на всем протяжении игры. Отметим, что
мгновенный доход Bi ( ) , предлагаемый игроку i в момент  , зависит от текущего состоя
 . Представим Bi ( ) как функцию двух переменных
Bi ( , xN ) . Таким образом, мгновенные выплаты Bi ( , xN ) игроку i  N обеспечивают ди-
ния xN и текущего момента времени
намическую устойчивость кооперативного решения в совместном предприятии.
4.3. Кооперативная модель совместного предприятия
Рассмотрим частный случай, когда в совместном предприятии участвуют 3 компании.
Плановый период кооперации t0 , T  . Доход компании i составляет
T
 P  x ( s) 12  c u ( s)  exp  r ( s  t ) ds  exp r (T  t ) q  x (T ) 12 ,(21)
i i
0
0
i
i
  i i

t0
где i  N ; Pi , ci и qi – положительные константы, r – процентная ставка, xi (t )  R


–
уровень технологий компании i в момент t и ui (t )  R – инвестиции в технологическое
32
развитие. Слагаемое Pi  xi (t )
1
2
есть чистая операционная прибыль компании i при техно-
логическом уровне xi (t ) , и ciui – затраты на инвестиции, qi  xi (T )
1
2
– это ликвидационная
стоимость технологий компании i в момент T .
Технологический уровень компании i эволюционирует в соответствии с динамикой:
1
xi ( s)   i ui ( s) xi ( s) 2   xi ( s)  , xi (t0 )  xi0  X i , xi (t0 )  xi0  X i , (22)


где i ui ( s) xi ( s) 2 – улучшение в технологии, полученное при инвестировании ui ( s ) ,  –
скорость устаревания.
Рассмотрим случай, когда все три фирмы соглашаются образовать совместное предприятие и разделить совместный доход в соответствии с динамическим вектором Шепли.
Благодаря обмену знаниями, фирмы–участники могут приобрести основные навыки и технологии, которые бы с трудом они могли получить в одиночку. Эволюция технологического
уровня компании i в условиях совместного предприятия принимает вид:
1
xi ( s )   i ui ( s) xi ( s)  2  bj

1
j ,i 
 x j ( s) xi ( s) 
1
2
 bk
k ,i 
 xk (s) xi (s) 2   xi (s) 
1
xi (t0 )  xi0  X i для i, j, k  N  1,2,3 и i  j  k ,
 j ,i 
где b j
 k ,i 
и bk
(23)
 j ,i 
– неотрицательные константы. В частности, b j u j ( s ) представляет эффект
передачи технологий в условиях совместного предприятия для фирмы i осуществляемый
технологиями фирмы j .
Прибыль совместного предприятия представляет собой сумму прибылей фирм - партнеров:
T
 P  x ( s)  12  c u ( s )  exp r ( s  t ) ds

j j
0 
t 
 j  j 

j

1
0
3
3
 exp  r (T  t0 ) q j  x j (T ) 
1
2
.
(24)
j 1
В совместном предприятии фирмы действуют совместно, чтобы максимизировать (24)
при условии (23).
Опуская технические выкладки, получаем, что
fi1,2,3  , x1  , x2 , x3  , i( )1,2,3 ( , x1  , x2 , x3  )  
=
i2
4ci
Ai1,2,3 ( )  xi   2  bj
1
j ,i 
 xj  xi  
для i 1,2,3 .
33
1
2
 bk
k ,i 
 xk  xi  
1
2
  xi 
(25)
  

Обозначив  x1 , x2 , x3  через x1,2,3 , имеем:




1,2,3
( )1,2,3
( )1,2,3




f{i , j}   , x1,2,3
 , x1,2,3
 , x1,2,3
 , i
 , j
 =

 f 1,2,3  , x  , ( )1,2,3  , x   
i
1,2,3  
 1,2,3 i



( )1,2,3
1,2,3 



f

,
x
,


,
x
 j
1,2,3  
 1,2,3 j





для i, j 1,2,3 и i  j ,
 

f1,2,3
  , x1,2,3 , 1
( )1,2,3
1,2,3
 , x   ,

1,2,3
( )1,2,3
2
 , x   , 

1,2,3



 f 1,2,3  , x  , ( )1,2,3  , x 
1,2,3
 1,2,3 1
 1



  f 21,2,3  , x1,2,3
, 2( )1,2,3  , x1,2,3






 f31,2,3  , x1,2,3
, 3( )1,2,3  , x1,2,3




( )1,2,3
3
 , x   =
 
  .


 


  A11,2,3 ( )  x1   2  A21,2,3 ( )  x2  

t 
1
A31,2,3 ( )  x3   2  C 1,2,3 ( ) 

1
1
r  A11,2,3 ( )  x1   2  A21,2,3 ( )  x2   2

1
 A31,2,3 ( )  x3   2  C 1,2,3 ( ) 

Wt
( )i , j
t, x  

i, j
t 
1
1
2

 Ai , j ( ) x  12  Ai , j ( ) x  12  C i , j ( ) 
i
 j
j
 i

1
1
r  Aii , j ( )  xi   2  Aji , j ( )  xj   2  C i , j ( )  ,


для i, j 1,2,3 и i  j .
Wt ( )i  t , xi  
t 
  Aii ( ) xi   C i ( )   r  Aii ( ) xi   C i ( )  ,
34
1,2,3
(26)
После аналитических преобразований получаем выражения:

Wt ( )1,2,3 t , x1,2,3


для i 1,2,3 .
Wx() K  t , xK 
i
t 

1
1 K
Ai ( )  xi   2 ,
2
(27)
для i  K  1,2,3 .
Заметим, что коэффициенты Ai , C j получаются из решения линейных систем дифференциальных уравнений. Окончательный вид коэффициентов опустим из-за их громоздкого
вида.
Из (25) – (27) и формулы (20) получаем выражение для Bi ( ) . Выплата Bi ( ) , предложенная игроку i 1,2,3 в момент времени   t0 , T  , приведет к реализуемости динамического вектора Шепли. Таким образом, в результате получим динамически устойчивое
развитие совместного производства.
ЗАКЛЮЧЕНИЕ
В работе исследованы долгосрочные кооперативные решения в широком смысле (основанные на согласовании интересов) и узком смысле (требующие стратегической кооперации по максимизации суммарного выигрыша и механизма распределения этого выигрыша).
На основе ранее проведенных исследований показано, что основные кооперативные
принципы оптимальности не обладают свойством динамической устойчивости (временной
состоятельности), требующим сохранения свойства оптимальности на промежутке его реализации вдоль оптимальной траектории. Нами предложен метод регуляризации (ПРД), основанный на введении нового управления на оптимальной траектории. Результатом применения этого метода в конкретной задаче динамической кооперации является построение управления в виде функции специальных выплат, реализуемого на оптимальной траектории. Таким образом, мы получаем двухэтапную задачу: принятия кооперативного решения в рамках
выбранного принципа оптимальности и построение управления для данного кооперативного
решения на основе применения ПРД. Кооперативное решение, полученное в результате решения этой двухэтапной задачи, будет обладать свойством динамической устойчивости.
В частном случае исследована модель динамической кооперации при создании совместного предприятия. Получено теоретическое решение задачи. В плане ближайшей перспективы предполагается завершить количественное моделирование на основе полученных
теоретических результатов в кооперативной модели создания совместного предприятия.
Дальнейшее исследование предполагается проводить в нескольких направлениях:




развитие методологии исследования кооперативных решений в стратегическом менеджменте для случайной кооперативной динамики,
развитие методологии исследований с целью применения её для анализа стратегических альянсов,
разработка моделей динамической кооперации и их решение для различных областей
стратегического менеджмента,
разработка математического обеспечения для количественного моделирования динамической кооперации в стратегическом менеджменте.
35
СПИСОК ЛИТЕРАТУРЫ
Красовский, Н.Н. 1967. К задаче об игровой встрече движений. Докл. АН СССР, т. 27,
№2
Петросян, Л. А. 1965. Дифференциальные игры на выживание со многими участниками.
Докл. АН СССР, т.161, № 2, с. 285-287.
Петросян, Л. А. 1977. “Устойчивость решений в дифференциальных играх со многими
участниками”, Вестник Ленинградского университета, № 19, с. 46-52.
Петросян, Л. А. 1978. “Неантагонистические дифференциальные игры”, в кн.: Вопросы
механики процессов управления. Управление динамическими системами. Л. с. 173181
Петросян Л.А., Данилов Н.Н. 1979 “Устойчивость решений в неантагонистических дифференциальных играх с трансферабельными выигрышами”, Вестник Ленинградского университета, №1, с. 52-59
Петросян Л.А., Данилов Н.Н. 1985. Кооперативные дифференциальные игры и их приложения. Томск: Изд-во Томск. ун-та – 260 с.
Петросян, Л. А., Мурзов Н.В. 1967. “Игры на перетягивание со многими участниками”,
Вестник Ленинградского университета, № 13, с. 125-129.
Петросян, Л.А., Захаров, В.В. 1997. Математические модели в экологии, СПб.: Изд-во С.Петерб. Ун-та., 250 с.
Петросян, Л.А., Зенкевич, Н.А., Семина Е.А. 1998. Теория игр. М.: Высш. Шк., Книжный
дом «Университет» – 304 с.
Понтрягин Л. С. 1966. К теории дифференциальных игр. УМН, 21, №46, с. 219-274.
Bellman, R. Dynamic programming. 1957. Princeton University Press, Princeton, New Jersey –
220 p. (Русский перевод: Беллман Р. Динамическое программирование, 1960, ИЛ)
Case, J.H. 1967. Equilibrium points of n-person differential games. Ph. D. Thesis, University pf
Michigan, Ann Arbor, MI, Department of Industrial Engineering, Tech. Report No. 19671
Haurie, A. 1976. “A note on nonzero-sum differential games with bargaining solutions”, Journal of optimization theory and application, Vol. 18, pp. 31-39.
Haurie, A., Krawczyk, J.B., Roche, M. 1976. “Monitoring cooperative equilibria in a stochastic
differential game”, Journal of optimization theory and applications, Vol. 81, pp. 73-95.
Isaacs, R. Differential Games. 1965. Wiley, New York. (Русский перевод: Айзекс, Р. Дифференциальные игры, 1967, М.: МИР – 480 с.)
Jorgensen, S., 1985. “An exponential differential games which admits a simple Nash solutions”,
Journal of Optimization Theory and Applications, Vol. 45, pp. 383-396.
Jorgensen, S., Sorger, G. 1990. “Feedback Nash equilibria in a problem of optimal fishery management”, Journal of Optimization Theory and Applications, Vol. 64, pp.293-310.
Jorgensen, S., Zaccour, G. 2001. “Time consistent side payment in a dynamic game in downstream pollution”, Journal of economic dynamics and control, Vol. 25, pp. 1973-1987.
Jorgensen, S., Zaccour, G. 2002. “Time consistency in cooperative differential games”, In:
Zacour, Georges (ed) Decision and control in management sciences: essays in honor of
Alan Haurie. Kluwer Science Publisher, London, pp. 349-366.
Kaitala, V. 1993. “Equilibria in a stochastic resource management game under imperfect information”, European Journal of Operational Research, Vol. 71, pp. 439-453.
Kalai, E., Smorodinskiy, M. 1975. “Other solutions to Nash’s bargaining problem”, Econometrica, Vol. 43, pp. 513-518.
Kydland, F.E., Prescott E.C. 1977. “Rules rather than discretion: the inconsistency of optimal
plans”, Journal of political economy, Vol. 85, pp. 473-490
Nash, J.F. 1950. “The bargaining problem”, Econometrica, Vol. 18, № 2, pp. 155-162.
Nash, J.F., 1951. “Non-cooperative games”, Ann. Math., Vol. 54, N2, pp. 286-295.
36
Neumann, J. von, Morgenstern, O. Theory of games and economic behavior. 1944. Princeton,
Princeton University Press – 625 p. (Русский перевод: Нейман, Дж., Моргенштерн, О.
Теория игр и экономическое поведение, 1970. М.: Наука – 708 с.)
Petrosjan, L.A. 1993. Differential games of pursuit. World Scientific Publishing Co. Pte. Ltd,
Singapore – 302 p.
Petrosjan, L.A. 2003. “Bargaining in dynamic games.” In: Petrosjan, L., Yeung, D. (ed) ICM
Millennium Lectures on Games. Springer-Verlag, Berlin, 139-143 p.
Petrosjan, L., Zaccour, G. 2003. “Time-consistent Shapley value allocation of pollution cost reduction”, Journal of economic dynamics and control, Vol. 27, No. 3, pp. 381-398.
Petrosjan, L.A., Zenkevich, N. A. 1996. Game Theory. World Scientific Publishing Co. Pte.
Ltd, Singapore – 332 p.
Petrosjan L.A., Yeung D.W.K. Subgame Consistent Economic Optimization, Springer, 2012,
396p.
Shapley, L.S. 1953. “A value for n-person games”, In Contributions to the Theory of Games,
Princeton, Princeton University Press II, pp. 307-317.
Sorger, G. 1989. “Competitive dynamic advertising: a modification of the case games”, Journal
of Economic Dynamics and Control, Vol. 13, pp. 55-80.
Starr, A.W., Ho, Y.C. 1969a. “Further properties of nonzero-sum differential games”. Journal
of Optimization Theory and Applications, Vol. 3, pp. 207-219
Starr, A.W., Ho, Y.C. 1969b. “Nonzero-sum differential games”, Journal of Optimization Theory and Applications, Vol. 3, pp.184-206.
Tolwinski, B., Haurie, A., Leitmann, G. 1986. “Cooperative equilibria in differential games”,
Journal of Mathematical Analysis and Applications, Vol. 119, pp. 182-202.
Yeung, D.W.K. 1992. “A differential game of industrial pollution management”, Annals of Operation Research, Vol. 37, pp. 297-311.
Yeung, D.W.K. 1994 “On differential games with a feedback Nash equilibrium”, Journal of Optimization Theory and Applications, Vol. 82, No. 1, pp. 181-188.
Yeung D.W.K., Petrosyan L.A. Cooperative stochastic differential games. 2006. Springer – 242
p.
Zenkevich, N.A. 2001. “Auction games and integrative imputations”, In: International yearbook
on game theory and applications, Vol. 6, Nova Science Publ.: New York, pp. 192 – 203.
(Русский перевод: Зенкевич, Н.А. 2004. “Интеграционные дележи и решения игр
аукционов”, в сборнике Численные и качественные методы прикладной математики,
под ред. С.В. Чистякова. – СПб, изд-во С.-Петерб. ун-та. – с. 41-54)
37
Download