Uploaded by Maxim Gubin

Выдержки изт учебника ТОУ(5с)

advertisement
89
2.4. Формализованная производственно-технологическая
модель экономики
Производственно-технологическая схема экономики (рис. 2.7) устанавливает связь между факторами производства [10].
Рис. 2.7. Производственно-технологическая схема экономики
Само производство определим производственной функцией F с арS
гументами: природные ресурсы W , производственное потребление W ,
основные производственные фонды K и трудовые ресурсы L . Значением
этой функции будет валовый продукт X .
S
Обратим внимание на то, что природные ресурсы W , где s - это среда,
в которой функционирует экономика (см. рис. 2), и производственное
потребление W имеют схожие обозначения. Это объясняется тем, что между
ними нет четкой грани. Например, после предварительной обработки на
предприятии (обогащения) ископаемые превращаются в руду, которую
можно считать и природным ресурсом, и производственным потреблением.
Понятие валового продукта X также рассматривается как искусственно
введенное для обобщения некоторого этапа производственного цикла.
Поэтому валовый продукт X разделяется ( P X на рис. 2.7) на конечный
продукт Y и производственное потребление W :
X W Y .
90
Производственное потребление W является той частью валового
продукта X , которая возвращается в производство для выпуска валового
продукта X . Например, часть произведенных инжекторов поступает для
выпуска двигателей автомобилей.
Долю валового продукта X , поступающего в производство в качество
производственного потребления W , определяют с помощью коэффициента
прямых материальных производственных затрат a (обычно используют
название - коэффициент прямых затрат):
W  aX .
Конечный продукт Y - это та часть валового продукта, которая
используется вне сферы производства, т.е. не как предметы труда, а для
реализации в непроизводственной сфере или как средства труда и т.п.
Разделяется ( PY на рис. 2.7) конечный продукт Y на валовые
капитальные вложения I (инвестиции) и на непроизводственное
потребление C :
Y I C.
Доля конечного продукта Y , определяющая объем валовых
капитальных вложений I , устанавливается нормой накопления  :
I   Y .
Валовые капитальные вложения I разделяются ( PI на рис. 2.7) на
амортизационные отчисления A и на чистые капитальные вложения V :
I  A V .
Амортизационные отчисления A используются для поддержания
работоспособного состояния основных производственных фондов K (ОПФ
на рис. 2.7). Величина этих отчислений определяется как доля ОПФ с
помощью коэффициента амортизации  :
A   K .
Чистые капитальные вложения V служат для развития ОПФ.
Естественно, что ввод в действие V производится постепенно (см. рис. 2.7).
(Например, сначала строится производственное здание, а потом в нем
устанавливают технику.) Поэтому ввод в действие ОПФ осуществляется
наращиванием K (см. рис. 2.7). Тогда чистые капитальные вложения V
пропорциональны приросту ОПФ:
dK
V q
dt .
Наращивание ОПФ приводит к приросту валового продукта,
следовательно, валовые капитальные вложения пропорциональны этому
приросту:
dX
I b
dt ,
91
где b - коэффициент приростной фондоемкости.
Таким образом, установлены взаимоотношения между факторами
производства в производственно-технологической схеме экономики.
2.5. Задачи оптимизации и оптимального управления в экономике
Рассмотрим один их центральных блоков в производственнотехнологической схеме экономики (см. рис. 2.7) - производство. Его можно
представить производственной функцией F , значение которой определяет
S
валовый продукт X , а аргументами являются природные ресурсы W ,
производственное потребление W , трудовые ресурсы L и основные
производственные фонды (ОПФ) K :
X  F (W S ,W , L, K ) .
Объединяя природные ресурсы и производственное потребление в один
аргумент - ресурсы W и считая трудовые ресурсы и ОПФ постоянными
величинами, можно сформулировать следующую задачу оптимизации:
X  max F (W )
W
.
В этой задаче максимизируется значение валового продукта X путем
выбора значения ресурсов W как аргумента производственной функции F .
Причем никаких ограничений на значение W не накладывается, поэтому
такую задачу называют задачей безусловной оптимизации. Оптимальное


значение функции X достигается при оптимальном решении W , для
которого в данной задаче максимизации одновременно выполняются два
условия:
F (W )  F (W  )
и
W W .
Если на выбираемые значения W накладываются некоторые
ограничения, то рассматриваемая задача приобретает вид:
X  maxогр F (W )
W W
.
Такую задачу называют задачей условной оптимизации и обычно
записывают в виде:
X  F (W )  max
при ограничениях
G(W )  B .
92
В приведенной записи функция G и действительное значение B
представляют ограничения на значения W , а функция F называется целевой
функцией.

Здесь оптимальное значение целевой функции X достигается при

оптимальном решении W , для которого в данной задаче максимизации
одновременно выполняются четыре условия:
F (W )  F (W  ) ,
W W 
и
G(W )  B ,
G (W  )  B .
Как правило, в реальных задачах ограничения меняются во времени. Т.е.
в рассматриваемой задаче действительное значение B , определяющее запасы
ресурсов W , будет зависеть от времени. В этом случае и значение
производственной функции X также будет зависеть от времени.
Обозначим:
X t  - состояние производства,
Bt  - управление производством.
Тогда необходимо выбрать такое управление производством, при
котором его состояние будет соответствовать требуемому.
Так формулируется задача оптимального управления, в которой нужно

определить оптимальную траекторию управления B t  , приводящую к

оптимальной траектории состояния X t  . Это требование выражается
целевым функционалом (когда аргументы функции сами являются
функциями):
t1
J   Ф X t , Bt , t dt  T  X t 1 , t 1   max
t0
,
где t 0 - начальный, а t 1 - конечный момент времени периода управления
t 0 , t 1  , а T  - терминальный член. Необходимо также уравнение движения,
связывающее между собой функции состояния X t  и управления Bt  :
dX t 
   X t , Bt , t 
dt
.
Таким образом, в приведенной задаче оптимального управления
требуется выбрать в качестве решения такую функцию Bt  , определяющую
запасы ресурсов в любой момент времени периода управления, которая бы
позволила максимизировать функцию валового продукта X t  также в
любой момент времени периода управления.
93
Приведенная выше задача оптимизации является статической, т.е. ее
решение отражает состояние в определенный момент времени, а задача
оптимального управления - динамической, т.е. ее решение соответствует
процессу в определенный период времени. Вот почему и вид решений у них
разный: решение задачи оптимизации - численные значения, решение задачи
оптимального управления - функции от времени.
Рассмотренная выше (1.3) межотраслевая (межпродуктовая) балансовая
модель является статической, т.е. такой, в которой все зависимости отнесены
к одному моменту времени. Эта модель может разрабатываться лишь для
отдельно взятых периодов, причем в ее рамках на устанавливается связь с
предыдущими и последующими периодами. Следовательно, в статических
межотраслевых (межпродуктовых) моделях не могут анализироваться
распределение, накопление и эффективное потребление капитальных
вложений. Капиталовложения вынесены из сферы производства в сферу
конечного использования вместе с предметами потребления и
непроизводственными затратами, т.е. включены в конечный продукт.
В отличие от статических динамические модели призваны отразить не
состояние, а процесс развития экономики, установить непосредственную
взаимосвязь между предыдущими и последующими этапами развития и тем
самым приблизить анализ к реальным условиям развития экономической
системы.
Рассмотрим динамическую модель, являющуюся развитием статической
межотраслевой (межпродуктовой) модели, в которой производственные
капитальные вложения выделяются из состава конечной продукции,
исследуются их структура и влияние на рост объема производства [17].
Вернемся к балансовому соотношению распределения продукции (1.3)
модели межотраслевого баланса - межпродуктовому балансу:
X  AX  Y ,
или
n
X i   a i j X j  Yi
, i  1, n .
В этом статистическом балансе потоки капиталовложений не
дифференцируются по отраслям-потребителям и отражаются общей
величиной в составе конечной продукции Yi каждой i -ой отрасли. В
j 1
динамической схеме распределим конечный продукт Yi на валовые
капитальные вложения I i и непроизводственное потребление C i (2.4):
Yi  I i  C i .
Валовые капитальные вложения i -ой отрасли
межотраслевыми потоками капитальных вложений:
n
Yi    I i j  C i
j 1
,
Ii
представим
94
I i j
- количество продукции i -ой отрасли, направленное в текущем
периоде в j -ую отрасль в качестве производственных капитальных
вложений в ее основные фонды. Материально это выражается в приросте в
потребляющих отраслях производственного оборудования, сооружений,
производственных площадей, транспортных средств и др.
x  ai j X j
В отличие от потоков текущих затрат ( i j
) межотраслевые
потоки капитальных вложений связаны не со всей величиной выпуска
X
X j
продукции j в j -ой отрасли, а обусловливают прирост продукции
.
Причем допущений о том, что в рассматриваемой модели прирост
продукции текущего периода обусловлен вложениями, произведенными в
этом же периоде. Если текущий период обозначить через t , то прирост
X j
продукции
равен разности абсолютных уровней производства в период
t и в предыдущий ( t  1 )-ый период:
X j  X j t   X j t 1 
.
Полагая, что прирост продукции пропорционален приросту
производственных фондов, можно записать:
I i j  bi j X j i , j  1, n
;
.
где
Здесь пропорциональность выражают коэффициенты:
I i j
bi j 
X j i , j  1, n
;
.
Экономический смысл этих коэффициентов заключается в том, что они
показывают, какое количество продукции i -ой отрасли должно быть
вложено в j -ую отрасль для увеличения производственной мощности этой
отрасли на единицу продукции. Предполагается, что производственные
мощности используются полностью и прирост продукции равен приросту
b
мощности. Коэффициенты i j называются коэффициентами вложений
(приростной фондоемкости).
Используя полученные зависимости, преобразуем систему уравнений
распределения
продукции
модели
межотраслевого
баланса
–
межпродуктовый баланс:
n
X i   a i j X j  Yi
j 1
, i  1, n ;
n
n
j 1
j 1
n
n
j 1
j 1
X i   a i j X j  i  I i j  C i
, i  1, n ;
X i   a i j X j  i  bi j X j  C i
, i  1, n .
95
Полученная система представляет собой систему линейных разностных
уравнений первого порядка. Ее можно привести к обычной системе
линейных уравнений, если учесть, что все объемы валовой и конечной
продукций относятся к некоторому периоду t , а прирост валовой продукции
определен в сравнении с ( t  1 )-ым периодом:
X i t    a i j X j t    bi j  X j t   X j t 1    C i t 
n
n
, i  1, n .
Отсюда, можно записать следующие соотношения:
j 1
j 1
X i   a i j  bi j X j   bi j X j t 1   C i t 
t 
n
j 1
t 
n
j 1
, i  1, n .
Пусть нам известны уровни валовой продукции X jt 1 , j  1, n , всех
отраслей в предыдущем ( t  1 )-ом периоде и непроизводственное
t 
потребление C i , i  1, n , в t -ом периоде. Тогда очевидно, что полученные
соотношения представляют собой систему n линейных уравнений с n
t 
X j t 
X
i
неизвестными уровнями производства
(
) в t -ом периоде. Таким
образом, решение такой системы линейных уравнений позволяет определить
выпуск продукции в последующем периоде в зависимости от уровня,
достигнутого в предыдущем периоде. Связь между периодами
b
устанавливается через коэффициенты вложений i j , характеризующие
фондоемкость единицы прироста продукции.
Переходя от дискретного анализа к непрерывному, будем иметь в
пределе:
n
n
dX j t 
X i t    a i j X j t   i  bi j
 C i t 
dt
j 1
j 1
, i  1, n .
Полученные соотношения представляют собой систему n линейных
дифференциальных уравнений первого порядка с постоянными
a
коэффициентами. Для ее решения помимо коэффициентов прямых затрат i j
b
и коэффициентов вложений (капитальных затрат) i j необходимо знать
уровни валового выпуска X i  0  ( X j  0  ) в начальный момент времени t  0 и
закон изменения величины непроизводственного потребления, т.е. вида
функции Ci t  . На основе этих данных путем решения получившейся задачи
Коши для приведенной системы дифференциальных уравнений можно найти
уровни валового выпуска X i  t  теоретически для любого момента времени.
Вопросы для самопроверки
Какие две главные подсистемы включает экономика?
96
Какие действия реализует экономическая система при выполнении своей
основной функции?
Что составляют средства производства?
Как называется совокупность конечного продукта и производственного
потребления?
С помощью какого коэффициента определяют производственное
потребление?
Что представляют собой в совокупности валовые капитальные вложения
и непроизводственное потребление?
Чем устанавливается доля конечного продукта, определяющая объем
валовых капитальных вложений?
На какие составные части разделяются валовые капитальные вложения?
Как определяется величина амортизационных отчислений?
Какой зависимостью описываются чистые капитальные вложения и
прирост основных производственных фондов?
Как описывается прирост валового продукта через валовые капитальные
вложения?
Чем отличается задача оптимального управления от задачи
оптимизации?
Как называется уравнение, связывающее между собой функции
состояния и управления?
Какой
зависимостью
определяются
коэффициенты
вложений
(приростной фондоемкости)?
97
3. МОДЕЛИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В
ЭКОНОМИКЕ
3.1. Задача оптимального управления развитием
экономики
Предлагается оценивать развитие экономики объемом валового
продукта X .
Чем больше будет валового продукта X , судя по производственнотехнологической схеме экономики (см. рис. 2.7), тем больше его пойдет на
производственное потребление W , тем больше будет конечного продукта Y ,
а следовательно, увеличатся и непроизводственное потребление С , и
валовые капитальные вложения I . Последнее будет способствовать через
чистые капитальные вложения V росту ОПФ и, в итоге, опять-таки валового
продукта X .
Воспользуемся приведенными (2.4) соотношениями для представления
зависимостей валового продукта X .
Валовый продукт X разделяется на производственное потребление W и
конечный продукт Y :
X W Y .
Производственное потребление W выражается через валовый продукт
X с помощью коэффициента прямых материальных затрат a :
W a X .
Тогда
X a X Y .
Конечный продукт Y разделяется на валовые капитальные вложения I
и непроизводственное потребление С :
Y I C.
Подставляя это выражение, получаем:
X a X  I C.
Для упрощения будем рассматривать так называемую открытую модель
Леонтьева, в которой не учитываются амортизационные отчисления A ,
составляющие совместно с чистыми капитальными вложениями V валовые
капитальные вложения I :
I  A V .
Тогда валовые капитальные вложения I пропорциональны приросту
валового продукта X с коэффициентом приростной фондоемкости b :
X
.
I  b
t
Подставляя эту зависимость, получаем:
98
X
C.
t
После элементарных преобразований итоговое выражение примет вид
дифференциального уравнения:
X 1  a
1

 X  C.
t
b
b
В этом уравнении устанавливается связь во времени t между валовым
продуктом как функцией времени X t 
и непроизводственным
потреблением также как функцией времени C t  .
Если функция валового продукта X t  устанавливает состояние
развития экономики, то тогда функция непроизводственного потребления
C t  может служить управлением развития экономики.
Исходя из этого, может быть сформулирована постановка задачи
оптимального управления развитием экономики.
Суть этой задачи сводится к тому, что необходимо выбрать вид функции
непроизводственного потребления C t  , устанавливающей его объем в
каждый момент времени, которая бы определяла вид функции валового
продукта X t  , характеризующей развитие экономики. Указанный выбор
должен соответствовать критерию оптимальности управления развитием
экономики.
Установим промежуток времени (период) управления от начального
момента времени t 0 по конечный момент времени t 1 :
X  a X  b
t0  t  t1 .
Будем характеризовать состояние функцией валового продукта X t  , а
управление - функцией непроизводственного потребления C t  .
Зададим начальное состояние валового продукта X t 0  и пределы
возможного управления непроизводственным потреблением:
C min  C t   C max .
Используя результаты предыдущих рассуждений, опишем связь
состояния и управления так называемым уравнением движений:
X t  1  a
1

 X t    C t  .
t
b
b
В качестве критерия оптимальности состояния за счет использования
оптимального управления выберем следующий максимизируемый показатель:
t1
J    e t  C t dt  X t 1   max
t0
.
99
По существу это целевая функция задачи оптимизации, аргументами
которой служат функции состояния - валового продукта X t  и управления непроизводственного потребления C t  . Поэтому она называется целевым
функционалом.
Целевой функционал включает два слагаемых. Первое слагаемое
состоит из суммарного (интеграл) дисконтированного непроизводственного
потребления за весь период управления:
t1
e
t0
t
 C t dt
.
 t
В этом слагаемом e - взвешиваемая функция дисконтирования с
коэффициентом дисконтирования  .
Второе слагаемое, называемое терминальным членом целевого
функционала, состоит из величины объема выпуска валового продукта X t 1 
в конечный момент времени t 1 периода управления.

Весовые коэффициенты 
и
определяют
непроизводственного потребления и валового продукта:
    1.
приоритеты
Целевой функционал выражается числовым значением, которое
максимизируется за счет выбора соответствующего вида функции
управления - непроизводственного потребления C t  и получаемого при
этом с помощью уравнения движения вида функции состояния - валового
продукта X t  .
Таким образом, постановка задачи оптимального управления развитием
экономики сводится к установлению периода управления (начального и
конечного моментов времени), к определению, что будет являться
состоянием (валовый продукт) и управлением (непроизводственное
потребление), к заданию начального состояния (объема валового продукта в
начальный момент времени периода управления) и пределов изменения
управления (минимального и максимального объемов непроизводственного
потребления), к аналитическому описанию связи (уравнения движения)
состояния (валового продукта) и управления (непроизводственного
потребления), и наконец, к выбору показателя оптимальности (целевого
функционала).
Поставленная задача оптимального управления развитием экономики
является математической моделью развития экономики.
3.2. Модель развития экономики: магистральная теория
Исходя из соотношений поставленной выше задачи оптимального
управления
развитием
экономики,
уменьшение
значения
100
непроизводственного потребления C t  способствует увеличению значения
валового продукта X t  . Однако низкий уровень непроизводственного
потребления C t  приводит к снижению прироста валового продукта X t  .
Это объясняется, например, недостаточностью подготовки трудовых
ресурсов L , которая способствует увеличению коэффициента приростной
фондоемкости b , и в итоге, неудовлетворительной эффективности валовых
капитальных вложений I .
Таким образом, на определенном уровне развития экономики
существует
некоторая
постоянная
величина
непроизводственного
потребления C t   Const , обеспечивающая приемлемый прирост валового
продукта X t  , и такое управление развитием экономики в этом периоде
времени близко к оптимальному. Полученные соотношения на данном
периоде времени называются магистралью.
Магистрали предшествует период времени и заканчивается она
периодом времени, в которых величина непроизводственного потребления
C t  находится на низком уровне, что соответствует оптимальному
управлению в эти периоды.
Сошлемся на образное представление сути магистрали и магистрального
функционирования экономики [10], поясняющее это название. Допустим, что
мы находимся в начальном пункте и нам нужно на автомобиле переехать в
конечный пункт. Неподалеку от начального и конечного пунктов проходит
автотрасса - аналог в данном случае магистрали. Мы оптимальным образом
от начального пункта по местной дороге доезжаем до автотрассы, далее
въезжаем на магистраль и едем по ней до местной дороги, ближайшей к
конечному пункту, после чего съезжаем с магистрали и по местной дороге
добираемся до конечного пункта. Эта интерпретация дает интуитивное
представление об оптимальном развитии экономики.
3.3. Задача оптимального управления распределением
валовых капитальных вложений
Вернемся к рассмотрению производственно-технологической схемы
экономики (см. рис. 2.7). По этой схеме рост ОПФ K t  происходит за счет
валовых капитальных вложений I t  (инвестиций). Причем часть этих
инвестиций представляет собой амортизационные отчисления At  :
I t   At   V t  ,
где At     K t  ,

- коэффициент амортизации.
А чистые капитальные вложения V t  пропорциональны приросту
ОПФ K t  :
101
dK t 
dt .
Последнее соотношение учитывает естественную постепенность ввода в
действие инвестиций. В совокупности все эти соотношения представляют
следующую зависимость:
dK t 
I t     K t  
dt ,
или
V t   q 
dK t 
    K t   I t 
dt
.
Полученное дифференциальное уравнение описывает связь между ОПФ
K t  и инвестициями (валовыми капитальными вложениями) I t  . Если
теперь считать ОПФ K t  состоянием, а валовые капитальные вложения
I t 
- управлением, то можно сформулировать постановку задачи
оптимального управления распределением валовых капитальных вложений.
Пусть
интервал
времени
управления
t0  t  t1
будет
продолжительностью от начального момента времени t 0 по конечный
момент времени t 1 .
Состояние описывается функцией ОПФ K t  , а управление - функцией
валовых капитальных вложений I t  .
Тогда начальное состояние представляет собой величину K t 0  , а
допустимое управление ограничивается минимальной I min и максимальной
I max величинами возможных валовых капитальных вложений I t  :
I min  I t   I max .
В качестве уравнения движения (связь состояния - ОПФ K t  и
управления - валовых капитальных вложений I t  ) будем использовать
выведенное выше соотношение:
dK t 
    K t   I t 
dt
.
Целевой функционал (целевая функция от функции управления и от
функции состояния) представим в виде:
t1
J    I t dt  K t 1   min
t0
,
где  и  - весовые коэффициенты,     1 , устанавливающие
приоритеты требований, составляющих цель управления.
102
Экономический смысл представленного целевого функционала
раскрывается при рассмотрении следующих крайних случаев:
- при   1 и   0 целевой функционал отражает минимизацию
суммарного (интеграл) расходования инвестиций, т.е. максимально
экономного распределения валовых капитальных вложений;
- при   0 и   1 целевой функционал (его терминальный член)
выражает стремление максимизировать величину ОПФ к концу периода
управления.
Таким образом, в целевом функционале заложены два противоположных
требования, служащих одной и той же цели - оптимальному управлению
распределением валовых капитальных вложений I t  для достижения
оптимального состояния ОПФ K t  .
3.4. Общий вид задачи оптимального управления
Рассмотрев две классические задачи оптимального управления - задачу
оптимального управления развитием экономики и задачу оптимального
управления распределением валовых капитальных вложений, представим
общий вид задачи оптимального управления в экономике. Для этого введем
обозначения:
x t  - состояние экономической системы в момент времени t ,
ut  - управление экономической системой в момент времени t .
Тогда в общем виде задача оптимального управления примет вид:
- период управления
t0  t  t1 ,
- состояние
x t  ,
- управление
ut  ,
- начальное состояние
xt 0  ,
- допустимое управление
umin  ut   umax ,
- уравнение движения
dx t 
 g  x t , ut , t 
dt
,
- целевой функционал
J
t1
 p xt , ut , t dt  f  xt , t   maxmin  .
1
t0
1
103
Напомним, что в целевом функционале (функции от функций) элемент
f  xt 1 , t 1  называется терминальным членом.
Решением такой задачи оптимального управления является выбранный
вид функции управления ut  , для которого на всем периоде управления
t 0  t  t 1 выполняется условие допустимого управления umin  ut   umax и
по уравнению движения определяется вид функции состояния x t  . Тогда

оптимальным решением этой задачи будут такие функции управления u t 

и состояния x t  , которые являются решением и обеспечивают заданное
экстремальное ( max или min ) значение целевого функционала.
3.5. Метод решения задачи оптимального управления
Определив выше, что является решением задачи оптимального

управления, укажем способ нахождения оптимальной траектории u t 

(оптимального управления), приводящей к оптимальной траектории x t 
(оптимальному состоянию). Для этого воспользуемся методом множителей
Лагранжа, а затем ниже рассмотрим принцип максимума Понтрягина как
необходимое условие, позволяющее выявить неоптимальные траектории. В
совокупности комплексным методом решения задачи оптимального
управления является так называемый метод Лагранжа-Понтрягина.
Рассматривая общий вид задачи оптимального управления, представим
уравнение движения в однородном виде:
dx t 
g  x t , ut , t  
0
dt
.
Тогда задачу оптимального управления, являющуюся задачей условной
оптимизации, можно с помощью метода множителей Лагранжа представить
задачей безусловной оптимизации. Для чего введем функцию множителя
Лагранжа  t  и составим функцию Лагранжа из целевого функционала
задачи оптимального управления и ее однородного уравнения движения:
t1
Lut ,  t    p x t , иt , t dt  f  x t1 , t1  
t0
dx t  

   t  g  x t , ut , t  
dt
dt 

t0
.
t1
Оптимальным решением уже такой задачи, кстати, совпадающим с
оптимальным решением исходной задачи оптимального управления, является


седловая точка u t ,  t  , для которой выполняется неравенство:
Lut ,   t   Lu  t ,   t   Lu  t ,  t  .
104
Нахождение оптимального управления u t  гарантирует нахождение

оптимального состояния x t  по уравнению движения. Поэтому ниже

рассмотрим условие нахождения оптимального управления u t  .

3.6. Принцип максимума Понтрягина
Необходимые условия для решения задачи оптимального управления
(3.5) дает принцип максимума Понтрягина [7]. Согласно этому принципу


седловая точка, точнее, траектория, u t , t  определяется как решение
неравенства:
Lut ,  t   Lu  t ,  t   Lu  t , t  .



Если u t , t  - седловая точка, то u t  - оптимальное управление,
т.е. решение рассматриваемой задачи оптимального управления. Это
подтверждается рассмотрением неравенств правого и левого.
Правое неравенство:
Lu  t ,  t   Lu  t , t 
или
Lu  t ,  t   Lu  t , t   0
Оно всегда выполняется, т.е. выполняется при любом множителе

Лагранжа  t  и  t  , т.к. на оптимальной траектории выполняется
уравнение движения:
dx * t 
g x t , u t , t  
0
dt
.
Следовательно:
*

*


  px t , и t , t dt  f x t , t   J u t 
L u t ,  t   L u t ,  t  



t1
*
*
*
*
1
1
t0
.
Рассмотрим левое неравенство:
Lut ,  t   Lu  t ,  t  .
Из него следует:
t1
dx t  

*
J ut     * t  g  x t , ut , t  
dt  J u t 
dt 

t0
.
Поэтому для всех управлений ut  , для которых выполняется уравнение
движения, выполняется также:
J ut   J u t  ,
105
*
т.е. действительно u t  - оптимальное управление (решение) задачи
оптимального управления.


*
Таким образом, если u t ,  t  - седловая точка, то u t  оптимальное решение задачи оптимального управления. Поэтому
необходимые условия существования седловой точки являются
одновременно и необходимыми условиями максимума задачи оптимального
управления.
Принцип максимума дает лишь необходимые условия оптимальности.
Действительно, оптимальная траектория состоит из некоторых участков
управляющих траекторий, определенных по этому принципу [7].
3.7. Синтез оптимального управления
Решение поставленной задачи оптимального управления рассматривалось при заданных начальных условиях, в частности, для определенного периода управления:
t0  t  t1 .
Однако можно потребовать решить задачу оптимального управления для
любых начальных условий - в общем случае. Такое общее решение можно
будет конкретизировать для любого заданного периода управления.
Таким образом, указываются два вида управления:
- управление по разомкнутому контуру;
- управление по замкнутому контуру (с обратной связью).

Оптимальное управление u t  по разомкнутому контуру полностью
определяется в начальный момент времени t 0 , а фазовая траектория

оптимального состояния x t  отыскивается по уравнению движения при
фиксированных начальных условиях.

Оптимальное управление u  xt , t  по замкнутому контуру (с обратной
связью) определяется как функция текущих фазовых координат состояния
x t  и времени t , т.е. решение принимается не заранее, а по мере получения
информации о текущих фазовых координатах.
Задача определения оптимального управления по замкнутому контуру (с
обратной связью) называется задачей синтеза.

Очевидно, поиск синтеза оптимального управления u  xt , t 

значительно более трудоемкая процедура по сравнению с решением u t 
обычной задачи оптимального управления. С математической точки зрения
отыскание синтеза оптимального управления сводится к решению
нелинейного дифференциального уравнения с частными производными,
называемого уравнением Гамильтона-Якоби-Беллмана.
106
Вопросы для самопроверки
Какой функцией выражается состояние экономики в задаче оптимального управления развитием экономики?
Какой функцией выражается управление в задаче оптимального управления развитием экономики?
Что описывает уравнение движения в задаче оптимального управления
развитием экономики?
Что выражают слагаемые целевого функционала задачи оптимального
управления развитием экономики?
Приоритеты чего устанавливают весовые коэффициенты в целевом
функционале задачи оптимального управления развитием экономики?
Какие соотношения величины непроизводственного потребления и валового продукта в задаче оптимального управления развитием экономики
называются магистралью?
Чем характеризуется оптимальное управление в периоды времени,
предшествующие и последующие магистрали в задаче оптимального управления развитием экономики?
Какой функцией выражается состояние в задаче оптимального управления распределением валовых капитальных вложений?
Какой функцией выражается управление в задаче оптимального управления распределением валовых капитальных вложений?
Что описывает уравнение движения в задаче оптимального управления
распределением валовых капитальных вложений?
Что выражают слагаемые целевого функционала задачи оптимального
управления распределением валовых капитальных вложений?
Из каких параметров, уравнения и функционала состоит задача оптимального управления в общем виде?
Какой элемент целевого функционала задачи оптимального управления
развитием экономики, задачи оптимального управления распределением валовых капитальных вложений и задачи оптимального управления в общем
виде называется терминальным членом?
Что является решением задачи оптимального управления развитием
экономики, задачи оптимального управления распределением валовых капитальных вложений и задачи оптимального управления в общем виде?
Что является оптимальным решением задачи оптимального управления
развитием экономики, задачи оптимального управления распределением валовых капитальных вложений и задачи оптимального управления в общем
виде?
В чем состоит суть комплексного метода Лагранжа-Понтрягина решения
задачи оптимального управления?
Необходимые или достаточные условия оптимальности устанавливает
принцип максимума Понтрягина?
107
Чем различаются управления по разомкнутому и по замкнутому контурам?
Какая задача определения оптимального управления называется задачей
синтеза?
К решению какого уравнения сводится отыскание синтеза оптимального
управления?
Примеры решения задач
1. Какое должно быть непроизводственное потребление С t  на
интервале времени 0  t  1 для того, чтобы рост валового продукта
t
N
определялся зависимостью X t   e ?
Решение.
Используем уравнение движения:
dX t  1  a
1

X t   C t  .
dt
b
b
Производная функции валового продукта:
 Nt
d  e


dX t
 
dt
dt


  t
  eN



t

1 N
  e .

N

Подставим в уравнение движения:
1 N 1 a N 1
e 
e  C t  .
N
b
b
t
t
Выразим функцию непроизводственного потребления:
1
1 a N 1 N
C t  
e  e ,
b
b
N
t
t
t
b N 
b N
N
C t   1  a e  e   1  a  e .
N
N

t
b N

Ответ: C t    1  a  e .
N

t
t
2. Во сколько раз увеличится непроизводственное потребление C (t ) в
конечный момент времени t  1 по сравнению с начальным моментом
времени t  0 , если рост валового продукта определяется зависимостью
t
N
X t   e ?
Решение.
108
Функция непроизводственного потребления при
b

C 1   1  a  e N .
N

t  1:
1
Функция непроизводственного потребления при
b

C 0   1  a  e
N

0
N
 1 a 
t  0:
b
.
N
Тогда:
b

 1  a  e N
1
C 1 
N
N

e .
b
C 0 
1 a 
N
1
1
N
Ответ: e .
3. Какие нужны капитальные вложения I t  на интервале времени
0  t  1 для того, чтобы воспроизводство основных производственных
t
N
фондов (ОПФ) определялось зависимостью K t   e ?
Решение.
Используем уравнение движения:
dK t 
  K t   I t  .
dt
Производная функции ОПФ:
 Nt
d  e
dK t 
 
dt
dt


  t
  eN



t

1 N
  e .

N

Подставим в уравнение движения:
t
t
1 N
e   e N  I t  .
N
Выразим функцию валовых капитальных вложений:
1
1

I t   e  e N     e N .
N
N

t
1 N

e .
Ответ: I t     
N


t
N
t
t
109
4. Рассчитайте значение целевого функционала, определяющего
качество изменения ОПФ на интервале времени 0  t  1 , при найденной в
задаче 3 функции
Решение.
I (t ) .
1
 1

J    I t dt   K 1      e N dt   e N 

0
0 N
t
1
1
0
 1
1 N
 1
  N
N
N
       e dt   e      N  e  e
N
0
N
 
1
1
t
1
1

N
  e 


1
 N1

N
  1  N  e  1    e .


1
 N1

N


Ответ: J   1  N  e  1    e .


5. Во сколько раз нужно увеличить капитальные вложения
I (t )
в ко-
нечный момент времени t  1 по сравнению с начальным моментом времени t  0 для того, чтобы воспроизводство основных производственных
t
N
фондов (ОПФ) определялось зависимостью K t   e ?
Решение.
Функция валовых капитальных вложений (см. задачу 3) при
1

I 1     e .
N

t  1:
1
N
Функция валовых капитальных вложений (см. задачу 3) при
1

I 0     e
N

0
N

Тогда:
1

   e N
1
I 1 
N
N

e .
1
I 0 

N
1
1
N
Ответ: e .
1
.
N
t  0:
110
6. Рассчитать значение целевого функционала в задаче оптимального
управления развитием экономики на интервале управления 0  t  1 при
X t   e
t
bN
.
Решение.
Используем уравнение движения:
dX t  1  a
1

X t   C t  .
dt
b
b
Производная функции валового продукта:
 bNt
d  e
dX t 
 
dt
dt


  t
   e bN



t

1 bN
 
 bN e .

Подставим в уравнение движения:
1 bN 1  a bN 1
e 
e  C t  .
bN
b
b
t
t
Выразим функцию непроизводственного потребления:
1
1  a bN
1 bN
C t  
e 
e ,
b
b
bN
t
t
t
1 bN 
1  bN
bN
C t   1  a e  e   1  a  e .
N
N

t
t
Расчет значения целевого функционала:
1
J   e
 t
1
C t dt   X 1   e
0
 t
0
 1

  t

 bN

1
1

 1  a  e bN dt   e bN 
N

1 1

   1  a   e
dt   e bN 
N 0

1

  1  a     1  1  1   0 
1
N    bN 

 bN
 
bN

e
e
 e 


1



bN
1

1  a   1
1

N   bN 


 1    e bN .
e
1



bN
1
t
1
111

Ответ: J  
1
 1
1

N   bN 
bN

 1  e .
e
1



bN
1  a 
7. Рассчитать значение целевого функционала в задаче оптимального
управления распределением капитальных вложений на интервале управления

0  t  1 при K t   e .
N
t
Решение.
Используем уравнение движения:
dK t 
  K t   I t  .
dt
Производная функции основных производственных фондов (ОПФ):
 N t 
d  e 

 N t 
dK t 
 N t



  e   e .
dt
dt
N


Подставим в уравнение движения:

N


e N   e N  I t  .
t
t
Выразим функцию валовых капитальных вложений:

I t  
N

e
N
t
 e

N
t



 t
 1
 t
    e N     1 e N .
N

N

Расчет значения целевого функционала:


1
 1
 t
J    I t dt   K 1      1 e N dt   e N 
N

0
0


 1
1 N t
    1   e dt   e N 
N
0



0
 1
 N  N 1
N 
N
    1   e  e    e 
N


1
1

 N

N
  1  N  e  1    e .



 N

N
Ответ: J   1  N  e  1    e .


112
8.
Для
роста
валового
продукта,
определяемого
зависимостью
t
N
X t   e , рассчитано, что непроизводственное потребление, т.е. управление в задаче оптимального управления развитием экономики, должно быть
b

C t    1  a  e N . Требуется определить, во сколько раз нужно увелиN

t
чить непроизводственное потребление, т.е. изменить управление в задаче оптимального управления развитием экономики, для того, чтобы рост валового
продукта увеличился в
Решение.
e
1
N
раз.
При росте валового продукта в
дет иметь вид:
t
N
X Б t   e  e
1
N
e
t 1
N
e
1
N
раз функция валового продукта бу-
.
Используем уравнение движения:
dX Б t  1  a
1

X Б t   C Б t  .
dt
b
b
Производная функции валового продукта:
 tN1 
d  e 

t 1
 tN1 
dX Б t 
1 N



  e   e .
dt
dt
N


Подставим в уравнение движения:
1
e
N
t 1
N
1 a

e
b
t 1
N
1
 C Б t  .
b
Выразим функцию непроизводственного потребления:
1
1 a
C Б t  
e
b
b
C Б t   1  a e
t 1
N
t 1
N
t 1
1
 eN,
N
t 1
t 1
b N 
b N
 e   1  a  e .
N
N

Нужно увеличить непроизводственное потребление в такое количество
раз:
t 1
b

 1  a  e N
1
C Б t  
N
N

e .
t
C t 
b N

 1  a  e
N

113
1
N
Ответ: e .
9. Во сколько раз нужно уменьшить валовые капитальные вложения
(инвестиции) I t для того, чтобы основные производственные фонды

t
N

 1

   t
N

уменьшились с K t   e
до K t  e
в задаче оптимального
управления распределением капитальных вложений?
Решение.
При K t   e
t
N
функция валовых капитальных вложений (см. задачу 3)
1

I t      e N .
N

t
При
K М t   e
 1

   t
N


функция валовых капитальных вложений опре-
деляется следующим образом.
Используем уравнение движения:
dK М t 
  K М t   I М t  .
dt
Производная функции ОПФ:
  N1    t 
 
d  e
 1


   1    t 
  t
dK М t 
1




N
N




     e

 e
.

 N
dt
dt



Подставим в уравнение движения:
 1

 1

  t
 1
  N    t
N



e



e
 I М t  .


N


Выразим функцию валовых капитальных вложений:
 1

 1

 1

  t
1   t
 1
   t
I М t      e  N   e  N   e  N  .
N
N

Нужно уменьшить валовые капитальные вложения в такое количество
раз:
114
 1

 1  1
   e N

 N   N     t
I t   N



 1  N e  
 1  N e  t .
 1

I М t 
1  N    t
e
N
Ответ: 1  N e  t .
t
Задания для самостоятельной работы
1. Какое должно быть непроизводственное потребление С t  на
интервале времени 0  t  1 для того, чтобы рост валового продукта
Nt
определялся зависимостью X t   e ?
2. Во сколько раз увеличится непроизводственное потребление C (t ) в
конечный момент времени t  1 по сравнению с начальным моментом
времени t  0 , если рост валового продукта определяется зависимостью
X ( t )  e Nt ?
3. Какие нужны капитальные вложения I t  на интервале времени
0  t  1 для того, чтобы воспроизводство основных производственных
фондов (ОПФ) определялось зависимостью K t   e ?
Nt
4. Рассчитайте значение целевого функционала, определяющего
качество изменения основных производственных фондов (ОПФ).
5. Во сколько раз нужно увеличить капитальные вложения
I (t )
в ко-
нечный момент времени t  1 по сравнению с начальным моментом времени t  0 для того, чтобы воспроизводство основных производственных
фондов (ОПФ) определялось зависимостью K ( t )  e
Nt
?
6. Рассчитать значение целевого функционала в задаче оптимального
управления развитием экономики на интервале управления 0  t  1 при
X t   e
N
t
b
.
115
7. Рассчитать значение целевого функционала в задаче оптимального
управления распределением капитальных вложений на интервале управления
0  t  1 при K t   e Nt .
8.
Для
роста
валового
продукта,
определяемого
зависимостью
X t   e Nt , рассчитано, что непроизводственное потребление, т.е. управление в задаче оптимального управления развитием экономики, должно быть
C t   1  a  bN e Nt . Требуется определить, во сколько раз нужно увеличить непроизводственное потребление, т.е. изменить управление в задаче оптимального управления развитием экономики, для того, чтобы рост валового
продукта увеличился в
eN
раз.
9. Во сколько раз нужно уменьшить валовые капитальные вложения
(инвестиции) I t для того, чтобы основные производственные фонды
 N   t
Nt
уменьшились с K t   e
до K t  e
в задаче оптимального
управления распределением капитальных вложений?


116
2.1. Построение сетевого графика экономического процесса
Целенаправленную экономическую деятельность можно моделировать с
помощью сетевого графика. Рассмотрим определения, связанные с этим
понятием.
Наглядно граф можно представить как некоторое множество вершин и
множество ребер, соединяющих все или некоторые из этих вершин.
Если на ребре указано направление связи между вершинами, то оно
называется дугой.
Если все соединения в графе изображаются дугами, то граф называется
ориентированным, или орграфом.
Последовательность дуг, в которой конец каждой предыдущей дуги
совпадает с началом следующей, называется путем в орграфе.
Путь, у которого начальная вершина совпадает с конечной, называется
контуром.
Контур с одной вершиной - петля.
Вершина, из которой дуги только выходят, но не входят, называется
истоком.
Вершина, в которую дуги только входят, но не выходят, называется
стоком.
Любой путь от истока к стоку называется полным.
Если дугам (ребрам) графа сопоставлены какие-то числовые
характеристики, то граф называется взвешенным, а числовые характеристики
- весами.
Вершина x i ("предок") предшествует в графе вершине x j ("потомок"),
если существует путь из x i в x j .
Граф является упорядоченным, если в нем порядковый номер "предка"
всегда меньше порядкового номера "потомка".
Графический способ упорядочения графа реализуется по алгоритму
Фалкерсона:
1-ый шаг) выделяем вершины, не имеющие "предков", и
последовательно нумеруем их в произвольном порядке;
2-ой шаг) мысленно вычеркиваем из графа все вершины, имеющие
номера, и дуги, из них выходящие;
3-ий шаг) в получившемся графе повторяем процедуры 1-ого и 2-ого
шагов до тех пор, пока все вершины не будут пронумерованы.
Граф называется связанным, если две любые его вершины можно
соединить путем, в котором не учитывается ориентация дуг.
Сетевой график - это связанный упорядоченный взвешенный орграф
без контуров (петель).
На изображении с помощью сетевого графика основано сетевое
планирование и управление (СПУ).
117
Основными понятиями СПУ являются работа и событие.
Под работой понимаются действия, связанные с затратами ресурсов и
приводящие к определенным результатам. Работы обозначаются на сетевом
графике дугами.
Под событием понимают результат завершения одной или нескольких
работ. События обозначаются на сетевом графике вершинами.
Подготовка исходных данных для построения сетевого графика
включает:
- определение начального и конечного событий;
- составление перечня всех событий, следующих за начальным и без которых не может произойти конечное событие;
- составление списка работ, соединяющих намеченные события;
- определение продолжительности выполнения каждой работы.
При построении сетевого графика для СПУ должны учитываться
следующие четыре правила:
- график должен иметь только одно начальное событие (исток) и только
одно конечное событие (сток);
- ни одно событие не может произойти до тех пор, пока не будут закончены все входящие в него работы;
- ни одна работа, выходящая из какого-либо события, не может начаться
до тех пор, пока не произойдет данное событие;
- график должен быть упорядоченным.
2.2. Расчет параметров сетевого графика
Основными параметрами сетевого графика являются:
- критический путь;
- резервы времени событий;
- резервы времени работ.
Критическим называется наиболее продолжительный из полных путей.
Критический путь определяет достаточно необходимое время
выполнения всех работ, называемое критическим сроком.
Работы и события, лежащие на критическом пути, называются
критическими.
Пример
Определение критического пути в сетевом графике:
118
Полные пути и их продолжительности:
1)
1 - 2 - 3 - 4 - 5  2+3+5+6=16;
2)
1 - 2 - 4 - 5  2+9+6=17;
 критический срок (путь)
3)
1 - 3 - 4 - 5  4+5+6=15.
119
5.1. Матричная игра с нулевой суммой
Экономико-математическое моделирование осуществляется в условиях:
- определенности;
- риска;
- неопределенности.
Моделирование в условиях определенности предполагает наличие всех
необходимых для этого исходных нормативных данных (матричное
моделирование, сетевое планирование и управление).
Моделирование в условиях риска проводится при стохастической
неопределенности, когда значения некоторых исходных данных случайны и
известны законы распределения вероятностей этих случайных величин
(регрессионный анализ, теория массового обслуживания).
Моделирование в условиях неопределенности соответствует полному
Математические модели принятия оптимальных решений в
конфликтных ситуациях строятся в условиях неопределенности.
В теории игр оперируют следующими основными понятиями:
- ход;
- стратегия;
- функция выигрыша.
Ходом будем называть выбор и осуществление игроком одного из
предусмотренных правилами игры действий.
Стратегия - это технология выбора варианта действий при каждом
ходе в зависимости от сложившейся ситуации.
Функция выигрыша служит для определения величины платежа
проигравшего игрока выигравшему.
В матричной игре функция выигрыша
платежной матрицы:
 a1 1 a1 2    a1 j    a1 n 


 a2 1 a2 2    a2 j    a2 n 


 

Am ,n  
 a i j  ,
 ai 1 ai 2    ai j    ai n 


                      


 am 1 am 2    am j    am n 
представляется
в
виде
где a i j - величина платежа игроку I, выбравшему ход i , от игрока II,
выбравшего ход j .
В такой парной игре значения функций выигрыша обоих игроков в
каждой ситуации i , j  равны по величине и противоположны по знаку, т.е.
 a i j  a i j  0 и такую игру называют с нулевой суммой.
120
Процесс "игры в матричную игру" представляется следующим образом:
- задается платежная матрица Am ,n  ;
- игрок I независимо от игрока II выбирает одну из m строк этой матрицы, например, i -ую;
- игрок II независимо от игрока I выбирает один из n столбцов этой
матрицы, например, j - ый ;
- элемент a ij матрицы Am .n  определяет, сколько получит игрок I от игрока II. Разумеется, если aij  o , то речь идет о фактическом проигрыше игрока I.
Антагонистическую парную игру с платежной матрицей Am ,n  будем
называть игрой m  n .
Пример
Рассмотрим игру 3  3 .
Задана платежная матрица:
3 1 2


A3 ,3    5 6 7  .
4 9 9


Пусть игрок I независимо от игрока II выбирает 3-ю строку этой
матрицы, а игрок II независимо от игрока I выбирает 2-ой столбец этой
матрицы:
3 1 2


5 6 7 
4 9 9 I



II
Тогда игрок I получит 9 единиц от игрока II.
5.2. Оптимальная чистая стратегия в матричной игре
Оптимальной стратегией называется такая стратегия игрока I, при
которой он не уменьшит своего выигрыша при любом выборе стратегии
игроком II, и такая стратегия игрока II, при которой он не увеличит своего
проигрыша при любом выборе стратегии игроком I.
Выбирая в качестве хода i -ую строку платежной матрицы, игрок I
обеспечивает себе выигрыш не менее величины min a i j в наихудшем
j  1 ,n
случае, когда игрок II будет стараться минимизировать эту величину.
Поэтому игрок I выберет такую i -ую строку, которая обеспечит ему
максимальный выигрыш:
121
α  max  min a i j  .
i  1 ,m  j  1 ,n

Игрок II рассуждает аналогично и может наверняка обеспечить себе
минимальный проигрыш:
β  min max a i j  .
j  1 ,n  i  1 ,m

Всегда справедливо неравенство:
max  min a i j   min max a i j 
i  1 ,m  j  1 ,n

 j 1 ,n  i 1 ,m
или
α  β.
Величину α  max  min a i j  называют нижней ценой игры.
i  1 ,m  j  1 ,n

Величину β  min max a i j  называют верхней ценой игры.
j  1 ,n  i  1 ,m

Оптимальные стратегии i0 и j0 называются чистыми, если для них
выполняются равенства:
α  max  min a i j   a i0 j0 ,
i  1 ,m  j  1 ,n

β  min max a i j   a i0 j0 .
j  1 ,n  i  1 ,m

Величину v называют чистой ценой игры, если α  β  v .
Оптимальные чистые стратегии i0 и j0 образуют седловую точку i0 , j0 
платежной матрицы Am ,n  .
Для седловой точки выполняются условия:
a i j0  a i0 j0 для i  1 , m ;
ai 0 j0  ai 0 j для j  1 , n ,
т.е. элемент a i 0 j0 является наименьшим в строке и наибольшим в
столбце.
Таким образом, если платежная матрица имеет седловую точку, то
можно найти оптимальные чистые стратегии игроков.
Чистая стратегия i0 игрока I может быть представлена упорядоченным
набором m чисел (вектором), в котором все числа равны нулю, кроме числа,
стоящего на i0 - ом месте, которое равно единице.
Чистая стратегия j0 игрока II может быть представлена упорядоченным
набором n чисел (вектором), в котором все числа равны нулю, кроме числа,
стоящего на j0 - ом месте, которое равно единице.
Пример
Рассмотрим игру 3  3 , заданную платежной матрицей:
122
3 1 2


A3 ,3    5 6 7  .
4 9 9


Выбирая в качестве хода какую-нибудь строку платежной матрицы,
игрок I обеспечивает себе выигрыш в наихудшем случае не менее величины
в столбце, обозначенном " min" :
min
 3 1 2  1


5
6
7

 5
4 9 9 4


Поэтому игрок I выберет 2-ую строку платежной матрицы,
обеспечивающую ему максимальный выигрыш независимо от хода игрока II,
который будет стараться минимизировать эту величину:
min
 3 1 2  1


5 6 7  5  m a x
4 9 9 4


Игрок II рассуждает аналогично и выберет в качестве хода 1-ый столбец:
3 1 2


5 6 7 
4 9 9


 
max 5 9 9

min
Таким образом, имеется седловая точка платежной матрицы:
3 1 2 



6 7,


4 9 9 


соответствующая оптимальной чистой стратегии 0 , 1 , 0 для игрока I и
1 , 0 , 0 для игрока II, при которой игрок I не уменьшит своего выигрыша
при любом изменении стратегии игроком II и игрок II не увеличит своего
проигрыша при любом изменении стратегии игроком I.
5
123
5.3. Оптимальная смешанная стратегия в матричной игре
Если платежная матрица не имеет седловой точки, то любому игроку
нерационально использовать одну чистую стратегию. Выгоднее использовать
"вероятностные смеси" чистых стратегий. Тогда в качестве оптимальных
определяются уже смешанные стратегии.
Смешанная стратегия игрока характеризуется распределением
вероятности случайного события, заключающегося в выборе этим игроком
хода.
Смешанной стратегией игрока I называют такой упорядоченный набор
m чисел p1 , p2 ,..., pm (вектор), который удовлетворяет двум условиям:
1)
pi  0 для i  1 , m , т.е. вероятность выбора каждой строки платежной матрицы неотрицательна;
m
 pi  1 , т.е. выбор каждой из
2)
m строк платежной матрицы в со-
i 1
вокупности представляет полную группу событий.
Смешенной стратегией игрока II будет упорядоченный набор n чисел
u 1 , u2 ,..., un (вектор), удовлетворяющий условиям:
1) u j  0 для j  1 , n ;
n
2)
 uj  1.
j 1
Величина платежа игроку I, выбравшему смешанную стратегию
p m  p1 , p2 ,..., pi ,..., pm ,
от игрока II, выбравшему смешанную стратегию
u n  u1 , u2 ,...,u j ,...,un ,
представляет собой среднюю величину


m
v p m ,u n  
i 1
n
 aij  pi  u j .
j 1
Оптимальными называют смешанные стратегии
p m  p1 , p2 ,..., pm и un  u1 , u2 ,...,un ,
если для любых произвольных смешанных стратегий
pm
и un
выполняется условие:
v p m , un  v pm , un  v pm , u n ,

 
 

т.е. при оптимальной смешанной стратегии выигрыш игрока I
наибольший, а проигрыш игрока II наименьший.
Если в платежной матрице нет седловой точки, то
max min  a i j   min max  a i j  ,
i 1,m
j 1,n
j 1,n
i 1,m
т.е. существует положительная разность (нераспределенная разность)
124
min max
j 1,n
i 1,m
 a  - max
i j
i 1,m
min
j 1,n
 a   0,
i j
и игрокам нужно искать дополнительные возможности для уверенного
получения в свою пользу большей доли этой разности.
Пример
Рассмотрим игру 3  3 , заданную платежной матрицей:
6 1 2
A3 , 3    5 6 7  .
 4 9 9


Определим, есть ли седловая точка:
6 1 2
 5 6 7
 4 9 9


min
 
 6 1 2  1
 5 6 7   5  m a x , max 6 9 9 .

 4 9 9 4


min
Оказывается, что в платежной матрице нет седловой точки и
нераспределенная разность равна 6  5  1 :
6 1 2 


A3 , 3    5 6 7  .
4 9 9 


5.6. Решение игр m×n
Если матричная игра не имеет решения в чистых стратегиях (т.е. нет
седловой точки) и из-за большой размерности m  n платежной матрицы не
может быть решена графически, то для получения решения используют
метод линейного программирования.
Пусть задана платежная матрица размерности m  n :
 a 11 a 12 ... a 1 n 


a
a
...
a
 21 22

2n
Am ,n   
.



a

 m 1 a m 2 ... a m n 
Необходимо найти вероятности p   p1 , p2 ..., pm , с которыми игрок I
должен выбирать свои ходы для того, чтобы данная смешанная стратегия
гарантировала ему выигрыш не менее величины v I независимо от выбора
ходов игроком II.
Для каждого выбранного хода игроком II выигрыш игрока I
определяется зависимостями:
125
a11 p1  a 21 p2  ...  a m 1 pm  v I ,
a12 p1  a 22 p2  ...  a m 2 pm  v I ,
                                
a1n p1  a 2 n p2  ...  a mn pm   I ,
 p1 
p2  ... 
pm  1;

 pi  0 при i  1, m .
Разделим обе части неравенств на v I  0 и введем новые обозначения:
pi
 xi , i  1 , m .
vI
p1 
p2  ... 
pm  1
Равенство
примет вид:
или
p1 / v I 
p2 / v I  ... 
pm / v I  1 / v I ,
x1  x 2  ...  xm  1 / v I .
Поскольку игрок I стремится максимизировать выигрыш v I , то
обратную величину 1
нужно минимизировать. Тогда задача линейного
vI
программирования для игрока I примет вид:
z  x1  x2  ...  xm  min
при ограничениях
a x  a x  ...  a x  1,
a11 x1  a21 x2  ...  am 1 xm  1,
22 2
m2 m
 12 1
                              
a1n x1  a 2 n x 2  ...  a mn x m  1,
 x i  0, i  1, m .

Аналогично строится задача для игрока II как двойственная:
z   y1  y2  ...  yn  max
при ограничениях
a y  a y  ...  a y  1 ,
12 2
1n n
 11 1
a 21 y1  a 22 y 2  ...  a 2 n y n  1 ,

                             
a y  a y  ...  a y  1 ,
m2 2
mn n
 m1 1
 y j  0 , j  1,n.

Решая задачи симплекс-методом, получаем:
126
v I  v II 
pi 
xi
m
 xi
1
z min

1
,
z max
при i  1 , m ;
i 1
uj 
yj
n
 yj
при j  1 , n .
j 1
Примеры решения задач
1. В платежной матрице указаны величины прибыли предприятия при
реализации им разных видов изделий (столбцы) в зависимости от
установившегося спроса (строки). Необходимо определить оптимальную
стратегию предприятия по выпуску изделий разных видов и
соответствующий максимальный (в среднем) доход от их реализации.
2,00
-5,00
0,00
-1,00
3,00
-1,00
0,00
3,00
7,00
2,00
3,00
1,00
0,00
5,00
-5,00
-2,00
6,00
4,00
1,00
2,00
0,00
3,00
-1,00
2,00
3,00
Решение
Обозначим заданную матрицу через A5 ,5  и введем переменные X 5 ,1 .
Будем также использовать матрицу (вектор) 1  15 ,1 . Тогда A  X  1 и
A1  A  X  A1  1 , т.е. X  A1  1 .
Рассчитывается обратная матрица A1 :
0,26
-0,15
0,20
-0,03
-0,08
0,05
0,13
0,01
0,05
-0,05
0,11
0,02
0,10
0,01
-0,05
Находятся значения:
 1   0 ,53 
 1  0 ,13


1
1  
X  A  1  A  1   0 ,19  .
 1  0 ,07

 1  
   0 , 22 
Рассчитываются вероятности:
0,14
0,09
0,19
-0,07
0,03
0,09
0,10
-0,19
0,06
0,13
127
 0 ,46 
 0 ,11 
xi


pi  m , P5 , 1    0 ,17  .
 xi
 0 ,06 
i 1
 0 ,19 
Определяется средний доход от реализации:
1
 m
 0 ,87 .
 xi
i 1
Рассчитываются вероятности:
 0 ,46 
 0 ,11 
xi


pi  m , P5 , 1    0 ,17  .
 xi
 0 ,06 
i 1
 0 ,19 
Определяется средний доход от реализации:
1
 m
 0 ,87 .
 xi
i 1
2. Фирма «Фармацевт» - производитель медикаментов и биомедицинских изделий в регионе. Известно, что пик спроса на некоторые лекарственные препараты приходится на летний период (препараты сердечнососудистой группы, анальгетики), на другие – на осенний и весенний периоды (антиинфекционные, противокашлевые).
Затраты на 1 усл. ед. продукции за сентябрь-октябрь составили: по
первой группе (препараты сердечно-сосудистые и анальгетики) – 20 р.; по
второй группе (антиинфекционные, противокашлевые препараты) – 15 р.
По данным наблюдений за несколько последних лет службой
маркетинга фирмы установлено, что она может реализовать в течение
рассматриваемых двух месяцев в условиях теплой погоды 3050 усл. ед.
продукции первой группы и 1100 усл. ед. продукции второй группы; в
условиях холодной погоды – 1525 усл. ед. продукции первой группы и
3690 усл. ед. второй группы.
В связи с возможными изменениями погоды ставится задача –
определить стратегию фирмы в выпуске продукции, обеспечивающую
максимальный доход от реализации при цене продажи 40 р. за 1 усл. ед.
продукции первой группы и 30 р. – второй группы.
РЕШЕНИЕ. Фирма располагает двумя стратегиями:
A1 - в этом году будет теплая погода;
A2 - погода будет холодная.
128
Если фирма примет стратегию A1 и в действительности будет теплая
погода (стратегия природы B1 ), то выпущенная продукция (3050 усл. ед.
препаратов первой группы и 1100 усл. ед. второй группы) будет полностью
реализована и доход составит
3050(40-20)+1100(30-15)=77500 р.
В условиях прохладной погоды (стратегия природы B2 ) препараты
второй группы будут проданы полностью, а первой группы только а
количестве 1525 усл. ед. и часть препаратов останется нереализованной.
Доход составит
1525(40-20)+1100(30-15)-20(3050-1525)=16500 р.
Аналогично, если форма примет стратегию A2 и в действительности
будет холодная погода, то доход составит
1525(40-20)+3690(30-15)=85850 р.
При теплой погоде доход составит
1525(40-20)+1100(30-15)-(3690-1100) 15=8150 р.
Рассматривая фирму и погоду в качестве двух игроков, получим
платежную матрицу
B1
B2
A1 77500 16500  ,
A2  8150 85850 
Затраты на 1 усл. ед. продукции за сентябрь-октябрь составили: по
первой группе (препараты сердечно-сосудистые и анальгетики) – 20 р.; по
второй группе (антиинфекционные, противокашлевые препараты) – 15 р.
По данным наблюдений за несколько последних лет службой
маркетинга фирмы установлено, что она может реализовать в течение
рассматриваемых двух месяцев в условиях теплой погоды 3050 усл. ед.
продукции первой группы и 1100 усл. ед. продукции второй группы; в
условиях холодной погоды – 1525 усл. ед. продукции первой группы и
3690 усл. ед. второй группы.
В связи с возможными изменениями погоды ставится задача –
определить стратегию фирмы в выпуске продукции, обеспечивающую
максимальный доход от реализации при цене продажи 40 р. за 1 усл. ед.
продукции первой группы и 30 р. – второй группы.
РЕШЕНИЕ. Фирма располагает двумя стратегиями:
A1 - в этом году будет теплая погода;
A2 - погода будет холодная.
Если фирма примет стратегию A1 и в действительности будет теплая
погода (стратегия природы B1 ), то выпущенная продукция (3050 усл. ед.
препаратов первой группы и 1100 усл. ед. второй группы) будет полностью
реализована и доход составит
3050(40-20)+1100(30-15)=77500 р.
129
В условиях прохладной погоды (стратегия природы B2 ) препараты
второй группы будут проданы полностью, а первой группы только а
количестве 1525 усл. ед. и часть препаратов останется нереализованной.
Доход составит
1525(40-20)+1100(30-15)-20(3050-1525)=16500 р.
Аналогично, если форма примет стратегию A2 и в действительности
будет холодная погода, то доход составит
1525(40-20)+3690(30-15)=85850 р.
При теплой погоде доход составит
1525(40-20)+1100(30-15)-(3690-1100) 15=8150 р.
Рассматривая фирму и погоду в качестве двух игроков, получим
платежную матрицу
B1
B2
A1 77500 16500  ,
A2  8150 85850 
Download