2.1 Достаточные условия существования решений - G

advertisement
ТЕОРИЯ ПАРАМЕТРИЧЕСКОГО РЕГУЛИРОВАНИЯ
МАКРОЭКОНОМИЧЕСКИХ СИСТЕМ И ЕЕ ПРИЛОЖЕНИЯ
Часть 2. Математические основы теории параметрического регулирования
А.А. Ашимов, Ж.М. Адилов, Р.А. Алшанов, Ю.В. Боровский, Б.Т. Султанов
КазНТУ им. К.И. Сатпаева
Содержание
2.1 Достаточные условия существования решений задач по синтезу и выбору
оптимальных законов параметрического регулирования
2.1.1 Условия существования решения задачи вариационного исчисления по
синтезу оптимального закона параметрического регулирования непрерывной
динамической системы
2.1.2 Условия существования решения задачи вариационного исчисления по
выбору (в среде заданного конечного набора алгоритмов) оптимального закона
параметрического регулирования непрерывной динамической системы
2.1.3 Условия существования решения задачи вариационного исчисления по
синтезу оптимального закона параметрического регулирования дискретной
динамической системы
2.1.4 Условия существования решения задачи вариационного исчисления по
выбору (в среде заданного конечного набора алгоритмов) оптимального закона
параметрического регулирования дискретной динамической системы
2.1.5. Условия существования решения задачи вариационного исчисления по
синтезу оптимального закона параметрического регулирования дискретной
стохастической динамической системы
2.1.6. Условия существования решения задачи вариационного исчисления по
выбору (в среде заданного конечного набора алгоритмов) оптимального закона
параметрического регулирования дискретной стохастической динамической
системы
2.2 Достаточные условия непрерывной зависимости оптимальных значений
критериев задач параметрического регулирования от неуправляемых функций
2.3 Достаточные условия существования точек бифуркации экстремалей задач по
выбору оптимальных законов параметрического регулирования
References
2.1 Достаточные условия существования решений задач по синтезу и выбору
оптимальных законов параметрического регулирования
2.1.1 Условия существования решения задачи вариационного исчисления по
синтезу оптимального закона параметрического регулирования непрерывной
динамической системы
Рассмотрим непрерывную управляемую систему*
x (t )  f ( x(t ), u (t ), a(t )), t  [0, T ],
x(0)  x0 ,
(2.1)
(2.2)
1
_________________
* Все сформулированные в этой части результаты для неавтономных динамических
систем остаются справедливыми и для автономных динамических систем, если
экзогенную векторную функцию a(∙) принять за постоянную.
где
t
–

время;

x  x(t )  x1 (t ),..., x m (t )
u  u (t )  u1 (t ),..., u q (t )

–

–
вектор-функция


вектор-функция
управления;
состояния

системы;
a  a(t )  a1 (t ),..., a s (t )

–
известная вектор-функция; x0  x10 ,..., x0m – начальное состояние системы, известный
вектор; f – известная вектор-функция своих аргументов.
Задача синтеза оптимальных значений экономических инструментов заключается в
нахождении экстремума следующего критерия
T
K   F (t , x(t ))dt ,
(2.3)
0
где F – известная функция, при фазовых ограничениях
x(t )  X (t ), t  [0, T ] ,
(2.4)
где X(t) – заданное множество и при явных ограничениях на управление:
u (t ) U (t ), t  [0, T ] ,
(2.5)
где U(t) – заданное множество.
Сформулируем задачу вариационного исчисления по синтезу оптимальных законов
параметрического регулирования для непрерывной динамической системы.
Задача 2.1. При известной функции a() найти управление u(), удовлетворяющее
условию (2.5), чтобы соответствующее ему решение динамической системы (2.1), (2.2)
удовлетворяло условию (2.4) и доставляло максимум (минимум) функционалу (2.3).
Для доказательства разрешимости Задачи 2.1 нам, прежде всего, потребуется
однозначная разрешимость задачи Коши (2.1), (2.2). Для получения этого свойства
воспользуемся известным результатом из теории обыкновенных дифференциальных
уравнений. Пусть заданы: число T > 0, метризуемый компакт U и непрерывная функция
φ: [0, 𝑇] × 𝑅 𝑚 × 𝑈 → 𝑅 𝑚 такие, что для любого ρ ≥ 0 существует такое σ ≥ 0, что
справедливо неравенство
|φ(𝑡, 𝑦, 𝑢) − φ(𝑡, 𝑦′, 𝑢)| ≤ σ|𝑦 − 𝑦 ′ | ∀𝑡 ∈ [0, 𝑇], 𝑦, 𝑦 ′ ∈ ρ𝐵, 𝑢 ∈ 𝑈,
(2.6)
где В есть единичный шар в 𝑅 𝑚 и существует такая константа η ≥ 0 что справедливо
неравенство
|𝑦φ(𝑡, 𝑦, 𝑢)| ≤ η(1 + |𝑦|2 ) ∀𝑡 ∈ [0, 𝑇], 𝑦 ∈ 𝑅 𝑚 , 𝑢 ∈ 𝑈.
(2.7)
Рассматривается задача Коши
𝑦̇ (𝑡) = φ(𝑡, 𝑦(𝑡), 𝑢(𝑡)) ∀𝑡 ∈ (0, 𝑇),
(2.8)
у(0)  у0 ,
(2.9)
2
где 𝑦0 ∈ 𝑅 𝑚 . Справедливо следующее утверждение ([1], Lemma 4.1):
Лемма 2.1. При вышеуказанных ограничениях (2.6), (2.7) для любого измеримого
отображения 𝑢: [0, 𝑇] → 𝑈 задача (2.8), (2.9) имеет единственное решение 𝑦: [0, 𝑇] → 𝑅 𝑚 ,
удовлетворяющее оценке

y (t )  y0  2T
2

1/2
eT t  [0, T ].
(2.10)
Справедливо следующее утверждение.
Теорема 2.2. Пусть функция а(∙) непрерывна на отрезке [0, T ] , U есть компакт в
𝑞
𝑅 , функция f непрерывна, для любого ρ ≥ 0 существует такое σ ≥ 0, что справедливо
неравенство
|𝑓(𝑥, 𝑢, 𝑎(𝑡)) − 𝑓(𝑥′, 𝑢, 𝑎(𝑡))| ≤ σ|𝑥 − 𝑥 ′ | ∀𝑡 ∈ [0, 𝑇], 𝑥, 𝑥 ′ ∈ ρ𝐵, 𝑢 ∈ 𝑈
(2.11)
и существует такая константа η ≥ 0 что справедливо неравенство
|𝑥𝑓(𝑥, 𝑢, 𝑎(𝑡))| ≤ η(1 + |𝑥|2 ) ∀𝑡 ∈ [0, 𝑇], 𝑥 ∈ 𝑅 𝑚 , 𝑢 ∈ 𝑈.
(2.12)
Тогда для любого измеримого отображения 𝒖: [𝟎, 𝑻] → 𝑼, задача Коши (2.1), (2.2) имеет
единственное решение 𝒙: [𝟎, 𝑻] → 𝑹𝒎 , удовлетворяющее оценке

х(t )  х0  2T
2

1/2
eT t  [0, T ].
(2.13)
Доказательство. Введем обозначение:  (t , х, и)  f  х, и, a(t )  . Из непрерывности
функций а и f следует непрерывность функции φ. Справедливость неравенств (2.6), (2.7)
следует из соотношений (2.11), (2.12). Тогда утверждения теоремы вытекают из Леммы
2.1. Теорема доказана.
Для доказательства разрешимости Задачи 2.1 мы воспользуемся известным
результатом из теории оптимального управления для систем, описываемых
дифференциальными
уравнениями.
Зададим
замкнутое
подмножество
𝑚
𝐸 ⊂ [0, 𝑇] × 𝑅 × 𝑈. Рассмотрим систему, описываемую задачей Коши (2.8), (2.9) при
выполнении условий Леммы 2.1, причем под управлением понимается измеримое
отображение 𝑢: [0, 𝑇] → 𝑈. Допустимой парой для рассматриваемой системы является
такая пара «состояние – управление», которая удовлетворяет соотношениям (2.8), (2.9) и
включению
t, x(t ), u(t )   E.
(2.14)
Зададим функцию Каратеодори Ф с неотрицательными значениями на множестве
T
[0, 𝑇] × (𝑅 × 𝑈). Зададим функционал I     t , x(t ), u (t )  dt.
𝑚
0
Задача 2.2. Найти минимум функционала I на множестве допустимых пар системы
(2.8), (2.9).
Для любой точки (𝑡, 𝑥) ∈ [0, 𝑇] × 𝑅 𝑚 определим сечение 𝐸𝑡,𝑥 = {𝑢 ∈ 𝑈: (𝑡, 𝑥, 𝑢) ∈ 𝐸}.
Зададим множество Γ𝑡,𝑥 = {φ(𝑡, 𝑥, 𝑢): (𝑡, 𝑥, 𝑢) ∈ 𝐸𝑡,𝑥 )} и функцию 𝑔: [0, 𝑇] × 𝑅 𝑚 × 𝑅 𝑚 → 𝑅
с помощью равенства g (t , x, y )  min (t , x, u ) (t , x, u )  E ,  (t , x, u )  y.
3
Известно следующее утверждение о разрешимости оптимизационной задачи ([1],
Statement 4.2), где под 𝑅̅ понимается множество действительных чисел, дополненное
величинами - и +:
Лемма 2.3. Пусть при выполнении условий Леммы 2.1 множество  t , x выпукло для
всех 𝑡 ∈ [0, 𝑇], 𝑥 ∈ 𝑅 𝑚 , а функция 𝑔(𝑡, 𝑥,∙): 𝑅 𝑚 → 𝑅̅ выпукла для всех (𝑡, 𝑥) ∈ [0, 𝑇] × 𝑅 𝑚 .
Тогда Задача 2.2 имеет решение.
Пусть Х есть замыкание объединения
Х (t ) . Справедливо следующее
t[0,T ]
утверждение.
Лемма 2.4. Пусть Х – компакт, функция F непрерывна на [0, 𝑇] × 𝑋. Тогда функция
Ф, задаваемая равенством (t , x, u)  F0  F (t , x), где F0 есть максимум функции F на
множестве [0, T ]  X , удовлетворяет условиям Леммы 2.3.
Доказательство. Существование максимума F0 следует из теоремы Вейерштрасса.
Не отрицательность определенной выше функции Ф очевидна. Она является функцией
Каратеодори в силу непрерывности F. Наконец, выпуклость функции 𝑔(𝑡, 𝑥,∙) для всех
(𝑡, 𝑥) ∈ [0, 𝑇] × 𝑅 𝑚 реализуется, поскольку функция F не зависит от управления u. Лемма
доказана.
Пусть U есть замыкание объединения ⋃𝑡∈[0,𝑇] 𝑈(𝑡). Для сведения ограничений (2.4),
(2.5) к виду (2.14) зададим множество 𝐸 ⊂ [0, 𝑇] × 𝑅 𝑚 × 𝑈 таким образом, чтобы
выполнялось соотношение: Et0   t , x, u   E t  t0  X (t0 ) U (t0 ), t0  [0, T ].


Лемма 2.5. Пусть отображения t  X (t ), t  U (t ) являются непрерывными в
каждой точке t  [0, T ] в следующем смысле: если справедливы включения xk  X (tk ),
uk U (tk ), где tk  [0, Т ] , k  1, 2,... и выполняется сходимость последовательностей
tk  t , xk  x, uk  u , то справедливы включения x  X (t ), u  U (t ). Тогда множество
Е замкнуто.
Доказательство. Рассмотрим такую последовательность  tk , uk , хk  элементов
множества Е, что имеет место сходимость
tk , uk , хk   Е
tk , uk , хk   t, u, х  .
Из включения
в силу определения множества Е следуют включения tk  [0, Т ] , xk  X (tk ),
uk U (tk ). Из замкнутости отрезка [0, T ] следует включение t  [0, T ] . Пользуясь
условиями леммы, установим, что x  X (t ), u  U (t ). Таким образом, справедливо
включение  t , u, х   Е , т.е. множество Е замкнуто. Лемма доказана.
Убедимся, что условия леммы не являются чрезмерно ограничительными.
Рассмотрим, к примеру, типичную ситуацию для скалярного случая, когда задано
множество X (t )   x a (t )  x  b(t ) , t  [0, Т ], где функции а и b непрерывны. Пусть
выполняются включения xk  X (tk ), где tk  [0, Т ] , k  1, 2,... и сходимость tk  t , xk  x.
Тем самым справедливы неравенства a(tk )  xk  b(tk ), k  1, 2,... . Переходя здесь к пределу
с учетом непрерывности функций а и b, получаем результат a(t )  x  b(t ), откуда
следует, что x  X (t ). Таким образом, отображение 𝑡 → 𝑋(𝑡) непрерывно в отрезке [0, T].
Аналогичным образом устанавливается справедливость условий Леммы 2.5 и в
более общих случаях, когда границы множеств допустимых значений управления и
состояния являются непрерывными функциями времени.
Для сведения уравнения (2.1) к виду (2.8) достаточно определить
 (t, х, и)  f  х, и, a(t ) . Тогда фигурирующее в условиях Леммы 2.2 множество  t , x
определяется следующим образом
4


t , x  f  x, w, a(t )  w U (t ) .
(2.15)
Обозначим через Vа множество допустимых пар «состояние – управление»
рассматриваемой системы (2.1), (2.2) при заданной известной функции а, т.е. таких пар
вектор-функций ( x, u ), которые удовлетворяют соотношениям (2.1), (2.2), (2.4), (2.5). Из
Леммы 2.3 непосредственно следует следующее утверждение.
Теорема 2.6. Пусть функция а() непрерывна на отрезке [0, T ] , U - компакт в Rq,
функция f непрерывна в X × U × A и для любого ρ ≥ 0 существует такое σ ≥ 0, что
справедливо неравенство
f ( x, u, a(t ))  f ( x, u, a(t ))  σ x  x , x, x  ρB , u U
(2.16)
и существует такая константа η ≥ 0, что справедливо неравенство

xf ( x, u, a(t ))  η 1  x
2

t  [0, T ] , x  R , u U .
m
(2.17)
Пусть X – компакт, функция F непрерывна на [0,T] × X. Пусть, кроме того,
отображения t → X(t), t → U(t) являются непрерывными для t ∈ [0,T] в следующем
смысле: если справедливы включения xk ∈ X(tk), uk ∈ U(tk), где tk ∈ [0,T], k = 1, 2,… и имеет
место сходимость последовательностей
tk → t, xk → x, uk → u, то справедливы
включения x ∈ X(t), u ∈ U(t). Тогда, в случае непустоты множества Va и выпуклости
множества Γt,x для всех t ∈ [0,T], x ∈ X(t) Задача 2.1 имеет решение в классе измеримых
функций.
2.1.2 Условия существования решения задачи вариационного исчисления по
выбору (в среде заданного конечного набора алгоритмов) оптимального закона
параметрического регулирования непрерывной динамической системы
Рассматривается непрерывная управляемая система (2.1), (2.2). Управление и здесь
выбирается из семейства заданных законов регулирования:
u j (t )  G j  v, x(t )  , t  (0, Т ), j  1,..., r .
Здесь G j
(2.18)
– известная вектор-функция своих аргументов; v   v1 ,..., v l  – вектор
управляющих параметров. На управляющие параметры налагаются ограничения вида
v V ,
(2.19)
где V – некоторое подмножество пространства 𝑅 𝑙 . Кроме того предполагается, что
управляющие параметры должны быть такими, чтобы соответствующий закон
регулирования (2.18) удовлетворял условию (2.5), т.е. выполнялось бы включение
G j  v, x(t )  U (t ), t  (0, Т ),
где U (t ) – заданное множество. Имеются фазовые ограничения на систему:
5
(2.20)
x(t )  X (t ), t  (0, Т ),
(2.21)
где X (t ) – заданное множество.
Рассмотрим критерии оптимальности
T
K j  K j (a, v)   F t , x j (t ) dt ,
(2.22)
0
где x j  x j (t )   x1j (t ),..., x mj (t )  – решение задачи Коши (2.1), (2.2) при заданных функции
а(·) и управлении u  u j (t )   u1j (t ),..., u qj (t )  , т.е. для выбранного j-го закона регулирования
(2.26).
Рассмотрим следующую вспомогательную экстремальную задачу:
Задача 2.3*. При заданной функции а(·) для каждого из r законов регулирования
найти такой вектор управляющих параметров v, чтобы соответствующее ему решение
x  x j задачи (2.1), (2.2) с законом регулирования u  u j , определяемым по формуле
(2.18), удовлетворяло условиям (2.19) - (2.21) и доставляло максимум функционалу (2.22).
Сформулируем следующую задачу вариационного исчисления по выбору (в среде
заданного конечного набора алгоритмов) оптимального закона параметрического
регулирования для неавтономной непрерывной системы.
Задача 2.3. При известной функции а(·) среди всех оптимальных законов
регулирования в смысле Задачи 2.3* выбрать тот, который соответствует
максимальному значению критерия оптимальности (2.22).
Подставив в уравнение (2.1) значение управления из формулы (2.18), получим
x(t )  f  x(t ), G j  v, x(t )  , a (t )  , t  (0, T ),
(2.23)
где для краткости мы опускаем индекс j при обозначении функции состояния системы,
𝒋
соответствующей данному закону регулирования. Обозначим через 𝑾𝒂 множество
допустимых пар «состояние – управляющий параметр» рассматриваемой системы, т.е.
таких пар ( x, v) , которые удовлетворяют равенствам (2.23), (2.2), а также включениям
(2.19) - (2.21). Таким образом, Задача 2.3* сводится к максимизации функционала
𝑻
𝒋
𝑲 = ∫𝟎 𝑭[𝒕, 𝒙(𝒕)]𝒅𝒕 на множестве 𝑾𝒂 .
Установим сначала разрешимость задачи Коши (2.23), (2.2). Из Леммы 2.1
непосредственно следует следующая теорема.
Теорема 2.7. Предположим, что функция а(·) непрерывна на отрезке [0, T ] ,
множества
G j непрерывны, для любого
ρМесто для формулы. ≥ 0 существуют такие σ ≥ 0, χ ≥ 0, что справедливы неравенства
U
и
V
компактны,
функции
f
и
|𝑓(𝑥, 𝑢, 𝑎(𝑡)) − 𝑓(𝑥 ′ , 𝑢′, 𝑎(𝑡))| ≤ σ(|𝑥 − 𝑥 ′ | + |𝑢 − 𝑢′ |) ∀𝑡 ∈ [0, 𝑇], 𝑥, 𝑥 ′ ∈ ρ𝐵, 𝑢, 𝑢′ ∈ 𝑈,
(2.24)
G j  v, x   G j  v, x    x  x x, x   B, v V ,
(2.25)
и существует такая константа η ≥ 0 что справедливо неравенство
|𝑥𝑓(𝑥, 𝐺𝑗 (𝑣, 𝑥), 𝑎(𝑡))| ≤ η(1 + |𝑦|2 ) ∀𝑡 ∈ [0, 𝑇], 𝑥 ∈ 𝑅 𝑚 , 𝑣 ∈ 𝑉.
6
(2.26)
Тогда для любого v V задача (2.23), (2.2) имеет единственное решение
𝒙: [𝟎, 𝑻] → 𝑹𝒎 , удовлетворяющее оценке

х(t )  х0  2T
2

1/2
eT t  [0, T ].
(2.27)
Установим разрешимость Задачи 2.3*. Справедлива следующая теорема:
Теорема 2.8. Предположим, что при выполнении условий теоремы 2.7 для заданной
функции а(·) и заданного значения 𝑗 ∈ {1, … , 𝑟} множество Wa j не пусто, множества V,
U, X компактны, множества 𝑋(𝑡), 𝑈(𝑡) компактны для всех t  [0, T ] , а функция F
непрерывна. Тогда Задача 2.3* имеет решение.
Доказательство. Из условия (2.21) и непрерывности функции F следует, что эта
функция ограничена. Тогда в силу непустоты множества Wa j существует верхняя грань
supK функции K на множестве допустимых пар Wa j рассматриваемой системы. Тогда
существует такая последовательность
( xk , vk )
элементов множества Wa j , что имеет
T
место сходимость (здесь K k   F t , xk (t ) dt. )
0
K k  sup K ,
(2.28)
Включение ( xk , vk )  Wa j предполагает справедливость следующих соотношений
xk (t )  f  xk (t ), G j  vk , xk (t )  , a(t )  , t  (0, T ),
(2.29)
xk (0)  x0 ,
(2.30)
xk (t )  X (t ), t  (0, Т ),
(2.31)
vk V ,
(2.32)
G j  vk , xk (t )  U (t ), t  (0, Т ),
(2.33)
Из Теоремы 2.7 следует оценка
1
|𝑥𝑘 (𝑡)| ≤ (|𝑥0 |2 + 2𝜂𝑇)2 𝑒 𝜂𝑇 ∀𝑡 ∈ [0, 𝑇].
(2.34)
Тогда, пользуясь теоремой Больцано – Вейерштрасса с учетом ограниченности
множества V, после выделения подпоследовательности получаем сходимости
хk (t )  х(t ) t [0, T ],
vk  v.
(2.35)
(2.36)
В силу замкнутости множества V и условия (2.32) предельное значение v
удовлетворяет включению (2.19). Пользуясь условиями (2.35), (2.36) и непрерывностью
функции G j , получим сходимость
7
G j  vk , xk (t )   G j  v, x(t )  , t  (0, T ).
(2.37)
Тогда из условия (2.33) в силу замкнутости множества U (t ) следует справедливость
включения (2.20). Из условий (2.35) и (2.37) в силу непрерывности функции f имеем
сходимость
f  xk (t ), G j  vk , xk (t )  , a(t )   f  x(t ), G j  v, x(t )  , a(t )  , t  (0, T ).
(2.38)
Функция хk удовлетворяет интегральному соотношению
t
xk (t )  х0   f  xk ( ), G j  vk , xk ( )  , a ( )  d , t  (0, T ).
(2.39)
0
Переходя здесь к пределу с учетом условий (2.35), (2.38), получим равенство
t
x(t )  х0   f  x( ), G j  v, x( )  , a ( )  d , t  (0, T ).
(2.40)
0
Дифференцируя обе части равенства (2.40) по t, установим справедливость
уравнения (2.1). В результате, переходя к пределу в равенстве (2.30) с учетом условия
(2.35), установим справедливость начального условия (2.2), Таким образом, предельная
пара ( x, v) является допустимой.
В силу непрерывности функции F из условия (2.35) следует сходимость
F t , xk (t )  F t , x(t ) , t  [0, T ],
(2.41)
а значит,
T
T
 F t , xk (t )dt   F t , x(t )dt.
0
(2.42)
0
T
Из (2.42) и (2.28) следует равенство
 F t , x(t )dt  supK .
Таким образом, нашлась
0
пара ( x, u )  Wa j , для которой достигается верхняя грань функционала K на множестве
всех допустимых пар рассматриваемой системы. Теорема доказана.
Очевидно, что Задача 2.3 сводится к поиску максимума функции
Φ𝑎 (𝑗) = max 𝑗 𝐾𝑗 на конечном множестве {1, … , 𝑟} при заданной функции а(·). В правой
(𝑥,𝑣)∈𝑊𝑎
части предшествующего равенства стоит максимальное значение рассматриваемого
функционала при данной функции а(·) и j-м законе регулирования. Существование этого
значения доказано в теореме 2.8. Поскольку максимум функции на конечном множестве
достигается всегда, получаем следующее утверждение.
Теорема 2.9. При выполнении условий Теоремы 2.8 Задача 2.3 имеет решение.
2.1.3 Условия существования решения задачи вариационного исчисления по
синтезу оптимального закона параметрического регулирования дискретной
динамической системы
Рассмотрим дискретную неавтономную управляемую систему
8
x(t  1)  f ( x(t ), u (t ), a(t )), t  0,1,..., n  1 ,
(2.43)
x(0)  x0 ,

где t – время. Здесь x  x(t )  x1 (t ),..., x m (t )
дискретного
аргумента;

(2.44)

– вектор-функция состояния системы
u  u (t )  u (t ),..., u (t )

1
q


–
управление,
вектор-функция
дискретного аргумента; a  a(t )  a (t ),..., a (t ) – известная вектор-функция дискретного


1
s
аргумента; x0 
– начальное состояние системы, известный вектор; f – известная
вектор-функция своих аргументов.
Задача выбора оптимальных значений экономических инструментов заключается в
нахождении экстремума следующего критерия
x10 ,..., x0m
K   F t , x(t )  max (min) ,
n
(2.45)
t 1
где F – известная функция, при фазовых ограничениях на решения системы (2.43) - (2.44)
вида
(2.46)
x(t )  X (t ), t  1,..., n ,
где X(t) заданное множество, и следующих при ограничениях на управление:
u (t )  U (t ), t  0, 1,..., n  1 ,
(2.47)
где U(t) – заданное множество.
Сформулируем задачу вариационного исчисления по синтезу оптимальных законов
параметрического регулирования для дискретной динамической системы.
Задача 2.4. При известной функции a() найти управление u(), удовлетворяющее
условию (2.47), чтобы соответствующее ему решение динамической системы (2.43),
(2.44) удовлетворяло условию (2.46) и доставляло максимум (минимум) функционалу
(2.45).
Обозначим через Va множество допустимых пар «состояние – управление»
рассматриваемой системы при заданной известной функции a(), т.е. таких пар векторфункций (x, u), которые удовлетворяют соотношениям (2.43), (2.44), (2.46), (2.47). Введем
обозначения: X 
n
n 1
t 1
t 0
 X (t ) , U  U (t ) .
Справедливо следующее утверждение.
Теорема 2.10. Предположим, что при известной функции 𝑎(∙) множество Va не
пусто; множества X(t) и U(t – 1) замкнуты и ограничены для всех t = 1, …, n;
отображение f непрерывно по первым двум аргументам на множестве X × U, а функция
F непрерывна по второму аргументу на множестве X. Тогда Задача 2.4 имеет решение.
Доказательство этой теоремы основано на свойствах функций непрерывных на
компакте.
2.1.4 Условия существования решения задачи вариационного исчисления по
выбору (в среде заданного конечного набора алгоритмов) оптимального закона
параметрического регулирования дискретной динамической системы
9
Рассмотрим дискретную неавтономную управляемую систему (2.43), (2.44). На эту
систему наложены фазовые ограничения:
x(t )  X (t ), t  1,..., n,
(2.48)
где X(t) – заданное множество. Входящее в уравнение (2.43) управление и выбирается из
семейства заданных законов регулирования:
u j (t )  G j  v, x(t )  , t  1,..., n, j  1,..., r ,
где
Gj
– известная вектор-функция своих аргументов,
управляющих
ограничения
параметров.
На
управляющие
параметры
v V ,
(2.49)
v   v1 ,..., v l 
налагаются
– вектор
следующие
(2.50)
где V – некоторое подмножество пространства 𝑅 𝑙 . Кроме того, будем предполагать, что
управляющие параметры должны быть такими, чтобы соответствующий закон
регулирования (2.49) удовлетворял условию
G j  v, x(t )  U (t ), t  0,..., n 1,
(2.51)
где U (t ) – заданное множество.
Рассмотрим следующие критерии оптимальности:
n
K j  K j (a, v)   F t , x j (t ) ,
(2.52)
t =1
где x j  x j (t )   x1j (t ),..., x mj (t )  – решение задачи (2.43), (2.44) при заданной функции а(·) и
управлении u  u j (t )   u1j (t ),..., u qj (t )  , т.е. для выбранного j-го закона регулирования.
Сформулируем вначале следующую вспомогательную экстремальную задачу:
Задача 2.5*. При известной функции а(·) для каждого из r законов регулирования
найти такой вектор управляющих параметров v, чтобы соответствующее ему решение
x  x j задачи (2.43), (2.44) с законом регулирования u  u j , определяемым по формуле
(2.49), удовлетворяло условиям (2.48), (2.50), (2.51) и доставляло максимум функционалу
(2.52).
Следующая задача называется задачей вариационного исчисления по выбору в среде
заданного конечного набора алгоритмов оптимальных законов параметрического
регулирования для дискретной неавтономной системы.
Задача 2.5. При известной функции а(·) среди всех оптимальных законов
регулирования в смысле Задачи 2.5* найти тот, который соответствует
максимальному значению критерия оптимальности (2.52).
Установим сначала разрешимость Задачи 2.5* для фиксированного закона
регулирования. Подставив в уравнение (2.43) значение управления из формулы (2.49),
получим
x(t  1)  f  x(t ), G j  v, x(t )  , a (t )  , t  0,1,..., n  1,
10
(2.53)
где для краткости мы опускаем индекс j при обозначении функции состояния системы,
соответствующей j-му закону регулирования. Обозначим через Wa j множество
допустимых пар «состояние – управляющий параметр» рассматриваемой системы, т.е.
таких пар ( x, v) , которые удовлетворяют равенствам (2.44), (2.53), а также включениям
(2.48), (2.49), (2.50). Таким образом, Задача 2.5* сводится к максимизации функционала
𝐾𝑗 = ∑𝑛𝑡=1 𝐹[𝑡, 𝑥𝑗 (𝑡)] на множестве Wa j . Пусть множества Х и U определены с помощью
соотношений X 
n
n 1
t 1
t 0
 X (t ) , U   U (t ) . Справедлива следующая теорема.
Теорема 2.11. Пусть при известной функции а(·) и j-м законе регулирования
множество Wa j не пусто, множества V, X (t ) и U (t  1) замкнуты и ограничены для всех
t  1,..., n , функция f непрерывна по первым двум аргументам на множестве X  U ,
функция G j непрерывна на множестве V  X , а функция F непрерывна по второму
аргументу на множестве Х. Тогда Задача 2.5* имеет решение.
Доказательство этой теоремы основано на свойстве непрерывной на компакте
функции достигать своих наибольшего и наименьшего значений. Поскольку на конечном
множестве максимум функции достигается всегда, получаем следующее утверждение.
Теорема 2.12. При выполнении условий Теоремы 2.11 Задача 2.5 имеет решение.
2.1.5. Условия существования решения задачи вариационного исчисления по
синтезу оптимального закона параметрического регулирования дискретной
стохастической динамической системы
Рассмотрим дискретную стохастическую управляемую систему вида
𝑥(𝑡 + 1) = 𝑓(𝑥(𝑡), 𝑢(𝑡), 𝑎) + ξ(𝑡), 𝑡 = 0, 1, … , 𝑛 − 1,
(2.54)
𝑥(0) = 𝑥0
(2.55)
Здесь 𝑥 = 𝑥(𝑡) ∈ 𝑅 𝑚 – функция состояния системы (2.54), (2.55), случайная векторфункция дискретного аргумента (векторный случайный процесс); 𝑥0 – начальное
состояние системы, детерминированный вектор; 𝑢 = 𝑢(𝑡) ∈ 𝑅 𝑞 – вектор управляемых
параметров, вектор-функция дискретного аргумента; 𝑎 ∈ 𝑅 𝑠 – вектор неуправляемых
параметров, 𝑎 ∈ 𝐴; 𝐴 ⊂ 𝑅 𝑠 – заданное множество. ξ = ξ(𝑡) = (ξ1 (𝑡), … , ξ𝑚 (𝑡)) –
известный векторный случайный процесс, выражающий помехи (в качестве такового
может выступать, например, гауссовский шум); 𝑓 – известная вектор-функция своих
аргументов.
Задается критерий оптимальности, подлежащий максимизации, для данной задачи
имеет вид
𝐾 = E{∑𝑛𝑡=1 𝐹𝑡 (𝑥(𝑡))}
(2.56)
Здесь 𝐹𝑡 – известные функции, E – математическое ожидание.
Имеются фазовые ограничения на систему:
E[𝑥(𝑡)] ∈ 𝑋(𝑡),
где 𝑋(𝑡) – заданное множество.
11
𝑡 = 1, … , 𝑛
(2.57)
В рассматриваемых далее задачах сохраняются определенные ранее ограничения на
управление:
𝑢(𝑡) ∈ 𝑈(𝑡), 𝑡 = 0, … , 𝑛 − 1,
(2.58)
где 𝑈(𝑡) ⊂ 𝑅 𝑞 – заданное множество.
Сформулируем следующую вариационную задачу, называемую задачей
вариационного исчисления по синтезу оптимального закона параметрического
регулирования дискретной стохастической динамической системы.
Задача 2.6. При известном векторе неуправляемых параметров 𝑎 ∈ 𝐴 найти закон
параметрического регулирования 𝑢, удовлетворяющий условию (2.58), чтобы
соответствующее ему решение динамической системы (2.54), (2.55) удовлетворяло
условию (2.57) и доставляло максимум функционалу (2.56).
Определим множество допустимых управлений 𝑈ad для исследуемой системы в виде
совокупности таких законов регулирования 𝑢(𝑡), удовлетворяющих ограничению (2.58),
для которых математическое ожидание E[𝑥(𝑡)] соответствующего решения
стохастической системы удовлетворяет включению (2.57).
Справедлива следующая теорема.
Теорема 2.13. Пусть в задаче 2.6 при 𝑎 ∈ 𝐴 для любого 𝑡 = 1, … , 𝑛 случайные
величины ξ(𝑡) являются абсолютно непрерывными и обладают нулевыми
математическими ожиданиями, множества 𝑋(𝑡), 𝑈(𝑡) – замкнуты и ограничены для
всех 𝑡, функция 𝑓 удовлетворяет условию Липшица, а функции 𝐹𝑡 – непрерывны по
Липшицу. Функции 𝑓 (для 𝑢 ∈ 𝑈 и 𝑎 ∈ 𝐴) и 𝐹𝑡 по модулю не превосходят некоторых
линейных относительно |x| функций. Тогда, если множество допустимых управлений 𝑈ad
не пусто, то задача 2.6 разрешима.
Доказательство. Согласно теореме Вейерштрасса непрерывная функция на
непустом замкнутом ограниченном множестве достигает своего максимума. Таким
образом, достаточно показать, что определенная с помощью (2.56) функция многих
переменных 𝐾 = 𝐾(𝑢) непрерывна, а множество 𝑈ad – замкнуто и ограничено. Его
непустота входит в состав условий теоремы.
Покажем, что существуют математические ожидания величин, входящих в фазовое
ограничение (2.57). Действительно, согласно уравнению (2.54), имеем
E[𝑥(𝑡 + 1)] = E[𝑓(𝑥(𝑡), 𝑢(𝑡), 𝑎)] + E[ξ(𝑡)].
Второе слагаемое в правой части этого равенства имеет смысл в силу условий теоремы, а
первое вычисляется по формуле
E[𝑓(𝑥(𝑡), 𝑢(𝑡), λ)] = ∫ 𝑓(ω, 𝑢(𝑡), 𝑎)𝑝𝑥(𝑡) (ω)𝑑 ω,
𝑅𝑛
если последний интеграл абсолютно сходится (здесь через 𝑝𝑥(𝑡) обозначена плотность
распределения вероятностей случайной величины 𝑥(𝑡)). Последний факт действительно
имеет место в силу ограничений на рост функции 𝑓 и наличия математического ожидания
величины 𝑥(𝑡) для любого 𝑡 = 1, … , 𝑛 (этот факт проверяется с помощью метода
математической индукции).
Существование математического ожидания в правой части равенства (2.56) следует
из ограничений на рост функции 𝐹𝑡 и существования математического ожидания
величины 𝑥(𝑡). Пусть имеет место сходимость векторов 𝑢𝑘 → 𝑢, 𝑢𝑘 ∈ 𝑈ad . Из уравнения
(2.54) следует равенство
12
|𝑥𝑘 (𝑡 + 1) − 𝑥(𝑡 + 1)| = |𝑓(𝑥𝑘 (𝑡), 𝑢𝑘 (𝑡), 𝑎) − 𝑓(𝑥(𝑡), 𝑢(𝑡), 𝑎)|
где 𝑥𝑘 и 𝑥 есть решения задачи (2.54), (2.55) при управлениях 𝑢𝑘 и 𝑢 соответственно.
Тогда справедливо соотношение
|𝑥𝑘 (𝑡 + 1) − 𝑥(𝑡 + 1)| ≤ 𝐿𝑓 [|𝑥𝑘 (𝑡) − 𝑥(𝑡)| + |𝑢𝑘 (𝑡) − 𝑢(𝑡)|],
где 𝐿𝑓 есть константа Липшица функции 𝑓. Повторяя аналогичные рассуждения и
учитывая, что, в силу условия (2.55), 𝑥𝑘 (0) = 𝑥(0) будем иметь
|𝑥𝑘 (𝑡 + 1) − 𝑥(𝑡 + 1)| ≤ (𝐿𝑓 )2 |𝑥𝑘 (𝑡 − 1) − 𝑥(𝑡 − 1)| +
+(𝐿𝑓 )2 |𝑢𝑘 (𝑡 − 1) − 𝑢(𝑡 − 1)|+𝐿𝑓 |𝑢𝑘 (𝑡) − 𝑢(𝑡)| ≤
𝑡
≤ ∑(𝐿𝑓 )𝑠+1 |𝑢𝑘 (𝑡 − 𝑠) − 𝑢(𝑡 − 𝑠)| ≤ ε𝑘 ,
𝑠=0
где ε𝑘 → 0 при 𝑘 → ∞.
Обозначив через 𝐿𝐹 максимальную из констант Липшица функций 𝐹𝑡 , для 𝑡 = 1, … , 𝑛
получаем оценку
|𝐹𝑡 [𝑥𝑘 (𝑡)] − 𝐹𝑡 [𝑥(𝑡)]|≤𝐿𝐹 εk .
Вычислив математические ожидания от обеих частей этого неравенства, получим
неравенство
Е{|𝐹𝑡 [𝑥𝑘 (𝑡)] − 𝐹𝑡 [𝑥(𝑡)]|}≤𝐿𝐹 ε𝑘 .
Отсюда следует, что Е{|𝐹𝑡 [𝑥𝑘 (𝑡)] − 𝐹𝑡 [𝑥(𝑡)]|}→0 и сходимость рассматриваемой
последовательности Е{𝐹𝑡 [𝑥𝑘 (𝑡)]}→E{𝐹𝑡 [𝑥(𝑡)]}. Отсюда в силу (2.56) следует
непрерывность функции 𝐾 = 𝐾(𝑢).
Ограниченность множества 𝑈ad следует из ограниченности множества 𝑈(𝑡).
Замкнутость множества 𝑈ad следует из непрерывности отображения 𝑈ad → 𝑋, задаваемого
с помощью определения множества 𝑈ad и компактности множества 𝑋 (теорема о
замкнутости полного прообраза компакта при непрерывном отображении). Теперь
существование решения исследуемой задачи вытекает из теоремы Вейерштрасса.
Теорема доказана.
2.1.6. Условия существования решения задачи вариационного исчисления по
выбору (в среде заданного конечного набора алгоритмов) оптимального закона
параметрического регулирования дискретной стохастической динамической
системы
В следующей задаче параметрического регулирования дискретной динамической
системы вновь рассматривается управляемая дискретная динамическая система с
заданным аддитивным шумом, описываемая уравнениями (2.54), (2.55) при наличии
фазовых ограничений (2.57). В этой задаче управление выбирается из семейства заданных
законов регулирования:
𝑢𝑗 (𝑡) = 𝐺𝑗 (𝑣, 𝑥(𝑡)), 𝑡 = 0, … , 𝑛 − 1, 𝑗 = 1, … , 𝑟,
13
(2.59)
где 𝐺𝑗 – известная вектор-функция своих аргументов, 𝑣 = (𝑣 1 , … , 𝑣 𝑙 ) – вектор параметров
закона регулирования 𝐺𝑗 .
На настраиваемые коэффициенты 𝑣 налагаются ограничения
𝑣∈𝑉
(2.60)
где 𝑉 – компактное пространства 𝑅 𝑙 . Кроме того предполагается, что параметры закона
управления должны быть такими, чтобы соответствующий закон регулирования (2.59)
удовлетворял условию (2.58), т.е. выполнялось бы включение
E [𝐺𝑗 (𝑣, 𝑥𝑗𝑣 (𝑡))] ∈ 𝑈(𝑡),
𝑡 = 0, … , 𝑛 − 1.
(2.61)
Здесь 𝑥𝑗𝑣 – решение задачи (2.54), (2.55) при выбранных значениях коэффициента 𝒗,
неуправляемого параметра 𝑎 и j-ом законе параметрического регулирования.
Рассматриваются критерии оптимальности
𝐾𝑗 = 𝐾𝑗 (𝑣, 𝑎) = E{∑𝑛𝑡=1 𝐹𝑡 (𝑥𝑗𝑣 (𝑡))}
(2.62)
Сформулируем следующую вариационную задачу, называемую задачей
вариационного исчисления по выбору оптимального закона параметрического
регулирования дискретной стохастической динамической системы.
Задача 2.7. При известном векторе неуправляемых параметров 𝑎 ∈ 𝐴 для каждого
из r законов регулирования найти такой вектор настраиваемых коэффициентов 𝑣,
чтобы соответствующее ему решение 𝑥 = 𝑥𝑗 задачи (2.54), (2.55) с законом
регулирования 𝑢 = 𝑢𝑗 , определяемого по формуле (2.59), удовлетворяло условиям (2.60),
(2.61) и доставляло максимум функционалу (2.62) с последующим выбором наилучшего из
найденных оптимальных законов регулирования, т.е. такого, которому соответствует
наибольшее значения критерия оптимальности.
Получим теперь достаточные условия существования решения задачи 2.7.
Обозначим через 𝑥𝑗𝑣 решение системы (2.54), (2.55) для выбранного j-го закона
параметрического регулирования (2.59), его настраиваемого коэффициента 𝑣 и параметра
𝑎:
𝑥𝑗𝑣 (𝑡 + 1) = 𝑓 (𝑥𝑗𝑣 (𝑡), 𝐺𝑗 (𝑣, 𝑥𝑗𝑣 (𝑡)) , 𝑎) + 𝜉(𝑡), 𝑡 = 0, 1, … , 𝑛 − 1,
(2.63)
𝑥𝑗𝑣 (0) = 𝑥0 .
(2.64)
Для рассматриваемой задачи определим множество допустимых значений
𝑗
настраиваемых коэффициентов 𝑉ad как множество, состоящее из таких значений 𝑣 ∈ 𝑉
удовлетворяющих условию (2.60), для которых соответствующее решение задачи (2.63),
(2.64) удовлетворяет включениям
E [𝐺𝑗 (𝑣, 𝑥𝑗𝑣 (𝑡))] ∈ 𝑈(𝑡),
E[𝑥𝑗𝑣 (𝑡)] ∈ 𝑋(𝑡),
𝑡 = 0, 1, … , 𝑛 − 1,
𝑡 = 1, … , 𝑛.
(2.65)
(2.66)
𝑗
Задачу 2.7 будем называть нетривиальной, если соответствующее ей множество 𝑉ad
не пусто и содержит некоторое открытое множество для каждого 𝑗 = 1, … , 𝑟.
14
Теорема 2.14. Пусть в Задаче 2.7 𝑎 ∈ 𝐴, множества 𝑈(𝑡), 𝑋(𝑡), 𝑉 компактны,
функции 𝑓, 𝐺𝑗 , 𝐹𝑡 удовлетворяют условию Липшица. Эти функции удовлетворяют также
следующим ограничениям на рост: функции |𝑓(𝑥, 𝐺𝑗 (𝑣, 𝑥), 𝑎)|, |𝐹𝑡 (𝑥)| не превосходят
линейных относительно |𝑥| функций равномерно по 𝑣 ∈ 𝑉. Случайная величина 𝜉(𝑡)
является абсолютно непрерывной и имеет нулевое математическое ожидание. Тогда в
𝑗
случае непустоты множеств 𝑉ad Задача 2.7 имеет решение.
Доказательство. Достаточно установить, что все функции (2.62) 𝐾𝑗 непрерывны, а
𝑗
все множества 𝑉𝑎𝑑 замкнуты и ограничены, где 𝑗 = 1, … , 𝑟. Существование всех
используемых ниже математических ожиданий доказывается так же, как и при
доказательстве теоремы 2.13.
Учитывая аддитивность математического ожидания, найдем значения
𝑛
𝐾𝑗 = 𝐾𝑗 (𝑣) = ∑ E{𝐹𝑡 [𝑥𝑗𝑣 (𝑡)]}
𝑡=1
𝑗
откуда следует неравенство для 𝑣, 𝑤 ∈ 𝑉𝑎𝑑
|𝐾𝑗 (𝑣) − 𝐾𝑗 (𝑤)| = |∑𝑛𝑡=1 E{𝐹𝑡 [𝑥𝑗𝑣 (𝑡)]} − ∑𝑛𝑡=1 E{𝐹𝑡 [𝑥𝑗𝑤 (𝑡)]}|
≤ ∑𝑛𝑡=1|E{𝐹𝑡 [𝑥𝑗𝑣 (𝑡)]} − E{𝐹𝑡 [𝑥𝑗𝑤 (𝑡)]}|.
Из соотношений (2.63), (2.64) следует, что
|𝑥𝑗𝑣 (𝑡 + 1) − 𝑥𝑗𝑤 (𝑡 + 1)| = |𝑓 (𝑥𝑗𝑣 (𝑡), 𝐺𝑗 (𝑣, 𝑥𝑗𝑣 (𝑡)) , 𝑎) − 𝑓 (𝑥𝑗𝑤 (𝑡), 𝐺𝑗 (𝑤, 𝑥𝑗𝑤 (𝑡)) , 𝑎)|
≤ 𝐿𝑓 [|𝑥𝑗𝑣 (𝑡) − 𝑥𝑗𝑤 (𝑡)| + |𝐺𝑗 (𝑣, 𝑥𝑗𝑣 (𝑡)) − 𝐺𝑗 (𝑤, 𝑥𝑗𝑤 (𝑡))|], 𝑡 = 0, 1, … , 𝑛 − 1,
где 𝐿𝑓 есть константа Липшица функции 𝑓. Обозначив через 𝐿𝐺 максимальную из
констант Липшица функции 𝐺𝑗 , получим неравенство
|𝑥𝑗𝑣 (𝑡 + 1) − 𝑥𝑗𝑤 (𝑡 + 1)| ≤ 𝐿𝑓 (1 + 𝐿𝐺 )|𝑥𝑗𝑣 (𝑡) − 𝑥𝑗𝑤 (𝑡)| + 𝐿𝑓 𝐿𝐺 |𝑣 − 𝑤|, 𝑡 = 0, 1, … , 𝑛 − 1
Учитывая равенство |𝑥𝑗𝑣 (0) − 𝑥𝑗𝑤 (0)| = 0, получаем оценку
𝑙
𝑗
|𝑥𝑗𝑣 (𝑡 + 1) − 𝑥𝑗𝑤 (𝑡 + 1)| ≤ 𝐿𝑓 𝐿𝐺 ∑𝑡𝑙=0[𝐿𝑓 (1 + 𝐿𝐺 )] |𝑣 − 𝑤| ≤ β|𝑣 − 𝑤| ∀𝑣, 𝑤 ∈ 𝑉𝑎𝑑 ,
где
𝑙
β = 𝐿𝑓 𝐿𝐺 ∑𝑡𝑙=0[𝐿𝑓 (1 + 𝐿𝐺 )] .
Обозначив через 𝐿𝐹 максимальную из констант Липшица функции 𝐹𝑡 , будем иметь
𝑗
|𝐹𝑡 [𝑥𝑗𝑣 (𝑡)] − 𝐹𝑡 [𝑥𝑗𝑤 (𝑡)]| ≤ 𝐿𝐹 |𝑥𝑗𝑣 (𝑡) − 𝑥𝑗𝑤 (𝑡)| ≤ 𝐿𝐹 β|𝑣 − 𝑤| ∀𝑣, 𝑤 ∈ 𝑉𝑎𝑑 .
Итак, в случае достаточной малости разности настраиваемых коэффициентов 𝑣 и 𝑤
значения 𝑥𝑗𝑣 (𝑡) и 𝑥𝑗𝑤 (𝑡) (а так же 𝐹𝑡 [𝑥𝑗𝑣 (𝑡)] и 𝐹𝑡 [𝑥𝑗𝑤 (𝑡)]) будут сколь угодно близки друг к
другу. Определим сходящуюся последовательность 𝑤 = 𝑣𝑘 → 𝑣. Тогда, найдя
15
математические ожидания от левой и правой частей последнего неравенства, получим
следующее неравенство:
𝑣
E [|𝐹𝑡 [𝑥𝑗𝑣 (𝑡)] − 𝐹𝑡 [𝑥𝑗 𝑘 (𝑡)]|] ≤ 𝐿𝐹 β|𝑣 − 𝑣𝑘 |.
Отсюда следует сходимость
𝑣
E {𝐹𝑡 [𝑥𝑗 𝑘 (𝑡)]} → E{𝐹𝑡 [𝑥𝑗𝑣 (𝑡)]}
из которой следует непрерывность функции 𝐾𝑗 (𝑣).
𝑗
𝑗
𝑗
Поскольку 𝑉𝑎𝑑 ⊂ 𝑉, то все множества 𝑉𝑎𝑑 ограничены. Замкнутость множеств 𝑉𝑎𝑑
следует из замкнутости множеств 𝑈(𝑡), 𝑋(𝑡 + 1), доказанной выше непрерывности
𝑗
отображений 𝑣 → E[𝑥𝑗𝑣 (𝑡 + 1)], 𝑣 → E[𝐺𝑗 (𝑣, 𝑥𝑗𝑣 (𝑡))] и определения множества 𝑉𝑎𝑑 как
полного прообраза указанных множеств при непрерывных отображениях. Утверждение
теоремы следует из теоремы Вейерштрасса о достижении непрерывной на компакте
функции своей верхней грани.
2.2 Достаточные условия непрерывной зависимости оптимальных значений
критериев задач параметрического регулирования от неуправляемых функций
В рамках разработки 4 компоненты теории параметрического регулирования в этом
разделе выводятся достаточные условия непрерывной зависимости от неуправляемых
функций а(·) оптимальных значений критериев всех рассмотренных выше задач
параметрического регулирования неавтономных детерминированных динамических
систем и достаточные условия непрерывной зависимости от неуправляемых параметров
оптимальных значений критериев рассмотренных выше задач параметрического
регулирования автономных стохастических динамических систем. Все сформулированные
для неавтономных систем результаты остаются справедливыми и для автономных
динамических систем, где экзогенная векторная функция a(∙) принята постоянной.
Следующая теорема устанавливает достаточные условия непрерывной зависимости
оптимальных значений критерия для задачи 2.4.
Теорема 2.15. Предположим, что при выполнении условий теоремы 2.10 в
окрестности (в евклидовой топологии) функции а(·) функция f непрерывна по третьему
аргументу и удовлетворяет условию Липшица по первому аргументу на Х равномерно по
второму и третьему аргументам. Тогда оптимальное значение критерия для задачи 2.4
непрерывно зависит от неуправляемой функции в точке а(·).
Доказательство. Пусть имеет место сходимость
ak  a в Rsn.
(2.67)
Согласно теореме 2.10 задача 2.4 при значениях неуправляемых функций а и ak имеет
решение, которое обозначим, соответственно, через и и иk. Обозначим через x b, w
решение уравнений состояния (2.43), (2.44), соответствующие неуправляемой функции b и
управлению w. Тем самым функция x b, w удовлетворяет соотношениям
x b, w (t  1)  f  x b, w (t ), w(t ), b(t )  , t  0,1,..., n  1,
x b, w (0)  x0 .
16
(2.68)
(2.69)
Тогда справедливы неравенства
0  К  x  а, uk   К  x  а, u  , К  x  аk , uk   К  x  аk , u   0,
где через K ( y ) обозначено значение критерия K при данном значении состояния системы
у. В результате получаем соотношения:

 

0  К  x  а, u    К  x  а , u k    К  x  а , u    К  x  аk , u   + К  x  а k , u    К  x  а k , u k   +


 К  x  аk , uk   К  x  а, uk   2sup К  x  а, w  К  x аk , w .
(2.70)
wU
Из условий (2.68) выводим неравенства
x  аk , w (t  1)  x  а, w (t  1)  f  x  аk , w (t ), w(t ), аk (t )   f  x  а, w  (t ), w(t ), а (t )  
 f  x  аk , w (t ), w(t ), аk (t )   f  x  аk , w (t ), w(t ), а (t )  
 f  x  аk , w (t ), w(t ), а(t )   f  x  а, w (t ), w(t ), а (t )  
 sup
уX ,U
f  y,  , аk (t )   f  y,  , а(t )   L x  аk , w (t )  x  а, w (t ) , t  0,1, ..., n  1,
где L есть константа Липшица функции f по первому аргументу, которая не зависит от w.
В результате получаем неравенство
 k (t  1)  k  L  k (t ) , t  0,1,..., n 1,
где
 k (t )  x  аk , w (t )  x  а, w (t ), t  0,1,..., n  1,
k  max
sup
t  0,1,..., n 1 уX ,U
f  y,  , аk (t )   f  y,  , а(t )  .
Далее установим соотношения
|ψ𝑘 (𝑡 + 1)| ≤ η𝑘 + 𝐿|ψ𝑘 (𝑡)| ≤ η𝑘 + 𝐿(η𝑘 + 𝐿|ψ𝑘 (𝑡 − 1)|) = (1 + 𝐿)η𝑘 + 𝐿2 |ψ𝑘 (𝑡 − 1)| ≤
(1 + 𝐿)η𝑘 + 𝐿2 (η𝑘 + 𝐿|ψ𝑘 (𝑡 − 2)|) = (1 + 𝐿 + 𝐿2 )η𝑘 + 𝐿3 |ψ𝑘 (𝑡 − 2)| ≤ ⋯ ≤
𝑡
∑ 𝐿𝑟 η𝑘 + 𝐿𝑡+1 |ψ𝑘 (0)|, 𝑡 = 0, 1, … , 𝑛 − 1.
𝑟=0
Из начального условия (2.69) следует, что |ψ𝑘 (0)| = 0. Тогда справедлива оценка
𝑛
|ψ𝑘 (𝑡 + 1)| ≤ η𝑘 ∑ 𝐿𝑟 , 𝑡 = 0, 1, … , 𝑛 − 1,
𝑟=0
из которой следует, что
17
𝑛
|𝑥[𝑎𝑘 , 𝑤](𝑡 + 1) − 𝑥[𝑎, 𝑤](𝑡 + 1)| ≤ η𝑘 ∑ 𝐿𝑟 , 𝑡 = 0, 1, … , 𝑛 − 1.
𝑟=0
Отметим, что правая часть этого неравенства не зависит от w.
Из условия (2.67) в силу непрерывности функции f по третьему аргументу, а также
замкнутости и ограниченности множеств X и U следует сходимость η𝑘 → 0. Тогда из
последнего неравенства выводим, что
x  аk , w (t )  x а, w (t ) равномерно по w, t  1,..., n .
Отсюда в силу непрерывности функции F следует, что
F t , x  аk , w (t )   F t , x  а, w (t )  равномерно по w, t  1,..., n .
а значит,
𝐾(𝑥[𝑎𝑘 , 𝑤]) → 𝐾(𝑥[𝑎, 𝑤]) равномерно по w,
откуда следует сходимость
sup К  x  а, w  К  x  аk , w  0.
(2.71)
wU
Переходя к пределу в неравенстве (2.70) с учетом условия (2.58), будем иметь
К  x  а, uk   К  x  а, u  .
(2.72)
Справедлива оценка
К  x  аk , uk   К  x  а, u   К  x  аk , uk   К  x  а, uk   К  x а, uk   К  x а, u  .
Переходя здесь к пределу с учетом условий (2.71), (2.72) установим сходимость
К  x  аk , uk   К  x  а, u  .
Отсюда в силу определения управлений и и иk следует, что максимальное значение
критерия K, соответствующее неуправляемой функции ak, сходится к его максимуму,
соответствующему предельному значению а неуправляемой функции. Теорема доказана.
Установим теперь достаточные условия непрерывной зависимости от
неуправляемых функций оптимальных значений критерия задачи 2.5 вариационного
исчисления по выбору (в среде заданного конечного набора алгоритмов) оптимальных
законов параметрического регулирования на базе дискретной неавтономной
динамической системы.
Установим сначала соответствующий результат для задачи 2.5*.
Теорема 2.16. Предположим, что при выполнении условий теоремы 2.11 в
окрестности точки а функция f непрерывна по третьему аргументу и удовлетворяет
условию Липшица по первым двум аргументам на X U равномерно по третьему
18
аргументу, а функция G j удовлетворяет условию Липшица по второму аргументу на Х
равномерно по первому аргументу. Тогда оптимальное значение критерия для задачи 2.5*
непрерывно зависит от неуправляемой функции в точке а.
Доказательство. Пусть имеет место сходимость
ak  a в Rsn.
(2.73)
Согласно теореме 2.11 задача 2.5* при значениях неуправляемых функций а и ak имеет
решение, которое обозначим, соответственно, через v и vk. Обозначим через x b, w
решение уравнений состояния (2.53), (2.44), соответствующие неуправляемой функции
b(∙) и управляемому параметру w. Тем самым функция x b, w удовлетворяет
соотношениям


x b, w (t  1)  f x b, w (t ), G j  v, x b, w (t )  , b(t ) , t  0,1,..., n 1,
x b, w (0)  x0 .
(2.74)
(2.75)
По аналогии с неравенством (2.70) устанавливается соотношение
0  К  x  а, v   К  x  а, vk   2sup К  x  а, w  К  x  аk , w .
(2.76)
wV
Обозначив
х  x а, w , хk  x аk , w ,
из равенств (2.74) выводим неравенства
xk (t  1)  x(t  1)  f  xk (t ), G j  w, xk (t )  , аk (t )   f  x(t ), G j  w, x(t )  , а(t )  
 f  xk (t ), G j  w, xk (t )  , аk (t )   f  xk (t ), G j  w, xk (t )  , а (t )  
 f  xk (t ), G j  w, xk (t )  , а(t )   f  x(t ), G j  w, x(t )  , а(t )  
 sup
уX ,U
f  y,  , аk (t )   f  y,  , а(t )   L  xk (t )  x(t )  G j  w, xk (t )   G j  w, x(t )   
 sup
уX ,U
f  y,  , аk (t )   f  y,  , а(t )   L(1  М ) xk (t )  x(t ) , t  0,1,..., n  1,
где L есть константа Липшица функции f по первым двум аргументам, а М – константа
Липшица функции G j по второму аргументу. В результате получаем неравенство
 k (t  1)  k  N  k (t ) , t  0,1,..., n 1,
где
N  L(1  М ),
 k (t )  xk (t )  x(t ), t  0,1,..., n  1,
k  max
sup
t  0,1,..., n 1 уX ,U
f  y,  , аk (t )   f  y,  , а(t )  .
19
Пользуясь методикой, описанной при доказательстве теоремы 2.15, установим оценку
n
 k (t  1)  k  N r , t  0,1,..., n  1
r 0
и сходимость k  0. Таким образом,  k (t )  0, t  1,..., n, а значит,
x  аk , w (t )  x а, w (t ) равномерно по w, t  1,..., n .
Отсюда в силу непрерывности функции F следует, что
F t , x  аk , w (t )   F t , x  а, w (t )  равномерно по w, t  1,..., n .
а значит,
К  x  аk , w  К  x  а, w равномерно по w.
Тогда в силу конечномерности пространства управлений и ограниченности множества U
получаем
(2.77)
sup К  x  а, w  К  x  аk , w  0.
wV
Переходя к пределу в неравенстве (2.76) с учетом условия (2.77), будем иметь
К  x  а, vk   К  x  а, v  .
(2.78)
Справедлива оценка
К  x  аk , vk   К  x  а, v   К  x  аk , vk   К  x  а, vk   К  x  а, vk   К  x  а, v  .
Переходя здесь к пределу с учетом условий (2.77), (2.78), установим сходимость
К  x  аk , vk   К  x  а, v  .
Отсюда в силу определения управляющих параметров v и vk следует, что максимальное
значение критерия K, соответствующее неуправляемой функции ak, сходится к его
максимуму, соответствующему предельному значению а неуправляемой функции.
Теорема доказана.
Поскольку максимум двух (а значит, и любого конечного числа) непрерывных
функций является непрерывным, то из теоремы 2.16 следует аналогичный результат для
задачи 2.5.
Теорема 2.17. Предположим, что при выполнении условий теоремы 2.11 в
окрестности точки а функция f непрерывна по третьему аргументу и удовлетворяет
условию Липшица по первым двум аргументам на X U равномерно по третьему
аргументу, а функция G j удовлетворяет условию Липшица по второму аргументу на Х
равномерно по первому аргументу. Тогда оптимальное значение критерия для задачи 2.5
непрерывно зависит от неуправляемой функции в точке а.
Целью следующего исследования является установление достаточных условий
непрерывной зависимости от неуправляемых функций оптимальных значений критерия
задачи 2.1. на базе непрерывной неавтономной динамической системы.
20
Теорема 2.18. Предположим, что при выполнении условий Теоремы 2.6 в окрестности
точки а функция f непрерывна по второму аргументу и удовлетворяет условию Липшица
по первому и третьему аргументам на Х  А равномерно по второму аргументу. Тогда
оптимальное значение критерия для Задачи 2.1 непрерывно зависит от неуправляемой
функции в точке а.
Доказательство. Пусть имеет место сходимость
ak  a в (C[0,T])s.
(2.79)
Согласно теореме 2.6 задача 2.1 при значениях неуправляемых функций а и ak имеет
решения, которые обозначим, соответственно, через и и иk. Обозначим через x b, w
решение уравнений состояния (2.1), (2.2), соответствующие неуправляемой функции b и
управлению w. Тем самым функция x b, w удовлетворяет соотношениям
x b, w (t )  f  х b, w , w(t ), b(t )  , t  (0, T ),
(2.80)
x b, w (0)  x0 .
(2.81)
Тогда, повторяя рассуждения из доказательства теоремы 2.13, по аналогии с
соотношением (2.70) установим неравенство
0  К  x  а, u   К  x  а, uk   2sup К  x  а, w  К  x  аk , w .
(2.82)
wU
Обозначив
х  x а, w , хk  x аk , w ,
из условий (2.80) выводим равенства
xk (t )  x(t )  f  xk (t ), w(t ), аk (t )   f  x(t ), w(t ), а(t )  , t  (0, T ).
Интегрируя по t с учетом равенства (2.81), получаем
t
xk (t )  x(t )   f  xk ( ), w( ), аk ( )   f  x( ), w( ), а( )  d 
0
t
t
t
0
0
0
 L  xk ( )  x( ) d L  аk ( )  а( ) d  L  xk ( )  x( ) d LT аk  а  , t  (0, T ),
где L есть константа Липшица функции f, не зависящая от w. Применяя лемму Гронуолла,
будем иметь
xk (t )  x(t )  с аk  а  , t  (0, T ),
где положительная константа с зависит только от L и от Т.
Пользуясь условием (2.79), получаем, что
xk (t )  x(t ) , t  (0, T ),
21
а значит,
x  аk , w (t )  x а, w (t ) равномерно по w, t  (0, T ).
Отсюда в силу непрерывности функции F следует сходимость
F t , x  аk , w (t )   F t , x  а, w (t )  равномерно по w, t  (0, T ).
А, значит, справедлива сходимость
К  x  аk , w  К  x  а, w равномерно по w.
В результате получаем
sup К  x  а, w  К  x  аk , w  0.
(2.83)
wU
Переходя к пределу в неравенстве (2.82) с учетом условия (2.83), будем иметь
К  x  а, uk   К  x  а, u  .
(2.84)
Справедлива оценка
К  x  аk , uk   К  x  а, u   К  x  аk , uk   К  x  а, uk   К  x а, uk   К  x а, u  .
Переходя здесь к пределу с учетом условий (2.83), (2.84), получим сходимость
К  x  аk , uk   К  x  а, u  .
Отсюда в силу определения управлений и и иk следует, что максимальное значение
критерия K, соответствующее неуправляемой функции ak, сходится к его максимуму,
соответствующему предельному значению неуправляемой функции а. Теорема доказана.
Определим достаточные условия непрерывной зависимости от неуправляемых
функций оптимальных значений критерия задачи вариационного исчисления по выбору (в
среде заданного конечного набора алгоритмов) оптимальных законов параметрического
регулирования на базе непрерывной неавтономной динамической системы.
Теорема 2.19. Предположим, что при выполнении условий теоремы 2.8 в
окрестности точки а функция f удовлетворяет условию Липшица на множестве
𝑋 × 𝑈 × 𝐴, а функция G j удовлетворяет условию Липшица по второму аргументу на Х
равномерно по первому аргументу. Тогда оптимальное значение критерия для Задачи 2.3*
непрерывно зависит от неуправляемой функции в точке а.
Доказательство. Пусть имеет место сходимость
ak  a в (C[0,T])s.
(2.85)
Согласно теореме 2.8 задача 2.3* при значениях неуправляемых функций а и ak имеет
решение, которое обозначим, соответственно, через v и vk. Обозначим через x b, w
22
решение уравнений состояния (2.23), (2.2), соответствующие неуправляемой функции b и
управлению w. Тем самым функция x b, w удовлетворяет соотношениям
x b, w (t )  f  x b, w (t ), G j  w, x(t )  , b(t )  , t  (0, T ),
x b, w (0)  x0 .
(2.86)
(2.87)
Тогда, повторяя рассуждения из доказательства теоремы 2.15, по аналогии с
соотношением (2.70) установим неравенство
0  К  x  а, u   К  x  а, uk   2sup К  x  а, w  К  x  аk , w .
(2.88)
wV
Обозначив
х  x а, w , хk  x аk , w ,
из условий (2.86) выводим неравенства
xk (t )  x(t )  f  xk (t ), G j  w, xk (t )  , аk (t )   f  x(t ), G j  w, x(t )  , а(t )  , t  (0, T ).
Интегрируя по t с учетом равенства (2.87), получаем
t
xk (t )  x(t )   f  xk ( ), G j  w, xk ( )  , аk ( )   f  x( ), G j  w, x( )  , а( )  d 
0
t
 L   xk ( )  x( )  G j  w, xk ( )   G j  w, x( )   аk ( )  а( )  d 
0
t
 L(1  М )  xk ( )  x( ) d LT аk  а  , t  (0, T ),
0
где L есть константа Липшица функции f, а М – константа Липшица функции G j по
второму аргументу. Применяя лемму Гронуолла, будем иметь
xk (t )  x(t )  с аk  а  , t  (0, T ),
где положительная константа с зависит только от L и от Т.
Пользуясь условием (2.85), получаем, что
x  аk , w (t )  x а, w (t ) равномерно по w, t  (0, T ).
Отсюда в силу непрерывности функции F следует, что
F t , x  аk , w (t )   F t , x  а, w (t )  равномерно по w, t  (0, T ).
а значит,
К  x  аk , w  К  x  а, w равномерно по w.
В результате получаем
23
sup К  x  а, w  К  x  аk , w  0.
(2.89)
wV
Переходя к пределу в неравенстве (2.88) с учетом условия (2.89), будем иметь
К  x  а, uk   К  x  а, u  .
(2.90)
Справедлива оценка
К  x  аk , uk   К  x  а, u   К  x  аk , uk   К  x  а, uk   К  x а, uk   К  x а, u  .
Переходя здесь к пределу с учетом условий (2.89), (2.90) установим сходимость
К  x  аk , uk   К  x  а, u  .
Отсюда в силу определения управлений и и иk следует, что максимальное значение
критерия К, соответствующее неуправляемой функции ak, сходится к его максимуму,
соответствующему предельному значению а. Теорема доказана.
Пользуясь теоремой 2.19 по аналогии с теоремой 2.17 (непрерывность системы при
этом принципиальной роли не играет), приходим к следующему утверждению:
Теорема 2.20. При выполнении для всех 𝑗 = 1, … , 𝑟 условий теоремы 2.19
оптимальное значение критерия для задачи 2.3 непрерывно зависит от неуправляемой
функции в точке а.
Приведем формулировки теорем о непрерывной зависимости от неуправляемого
параметра оптимальных значений критерия задач параметрического регулирования
стохастических динамических систем. Доказательства этих теорем аналогичны
приведенным выше.
Теорема 2.21. Пусть при любом 𝑎 ∈ 𝐴 выполняются условия теоремы 2.13. Тогда
оптимальные значения критерия задачи 2.6 являются непрерывной функцией параметра
𝑎 ∈ 𝐴.
Исследуем теперь условия непрерывной зависимости оптимальных значений
критерия задач вариационного исчисления по выбору законов параметрического
регулирования от неуправляемых параметров.
Теорема 2.22. Пусть при любом 𝑎 ∈ 𝐴 выполняются условия теоремы 2.14. Тогда
для выбранного значения номера закона j оптимальные значения критерия 𝐾𝑗 задачи 2.7
являются непрерывной функцией параметра 𝑎 ∈ 𝐴.
Следствие 2.23. При выполнении условий теоремы 2.22 для всех 𝑗 = 1, … , 𝑟
оптимальные значения критерия 𝐾 = 𝑚𝑎𝑥 𝐾𝑗 задачи 2.7 являются непрерывными
𝑗=1,…,𝑟
функциями параметра 𝑎 ∈ 𝐴.
Полученные результаты будут использоваться в следующем разделе при
доказательстве существования соответствующих точек бифуркации экстремалей
вариационных задач.
2.3 Достаточные условия существования точек бифуркации экстремалей задач
по выбору оптимальных законов параметрического регулирования
Введем понятие точки бифуркации экстремалей задачи вариационного исчисления
по выбору (в среде заданного конечного набора алгоритмов) оптимальных законов
параметрического регулирования. Наличие такой точки бифуркации для некоторой
24
неуправляемой функции а(·) означает, что в ее окрестности для рассматриваемой задачи
происходит переход от одного оптимального закона параметрического регулирования к
другому.
Рассмотрим абстрактную задачу вариационного исчисления по выбору (в среде
заданного конечного набора алгоритмов) оптимальных законов параметрического
регулирования, обобщающую задачи 2.3, 2.5, 2.7.
Даны: множество неуправляемых функций (или параметров) А, семейство множеств
𝑗
допустимых управлений (значений настраиваемых коэффициентов) 𝑉𝑎 , a  A, j  1,..., r и
𝑗
семейство функционалов (критериев оптимальности) 𝐾𝑗 = 𝐾𝑗 (𝑎, 𝑣) где 𝑣 ∈ 𝑉𝑎 , 𝑎 ∈ 𝐴, 𝑗 =
1, … , 𝑟. Дадим определение точки бифуркации экстремалей для семейства задач
максимизации заданных функционалов на соответствующих множествах допустимых
управлений, т.е. абстрактной задачи вариационного исчисления по выбору в среде
заданного конечного набора алгоритмов оптимальных законов параметрического
регулирования.
Определение. Значение a  A назовем точкой бифуркации экстремалей для
задачи максимизации отображений 𝑣 → 𝐾𝑘 (𝑎, 𝑣) на множествах 𝑉𝑎𝑘 , 𝑘 = 1, … , 𝑟, если
существуют два различных номера i, j 1,..., r таких, что справедливо соотношение
max𝑖 𝐾𝑖 (𝑎, 𝑣) = max𝑗 𝐾𝑗 (𝑎, 𝑣) = max max𝑘 𝐾𝑘 (𝑎, 𝑣)
𝑣∈𝑉𝑎
𝑘=1,…,𝑟 𝑣∈𝑉𝑎
𝑣∈𝑉𝑎
причем в любой окрестности точки а найдется такая точка b  A, для которой
величина
max max 𝐾𝑗 (𝑏, 𝑣)
𝑘=1,…,𝑟 𝑣∈𝑉 𝑗
𝑏
достигается для единственного значения k.
Теорема 2.24. Предположим, что при выполнении условий теорем 2.17 (или 2.20, или
2.23), А есть связное множество, и существуют два различных значения a0 , a1  A ,
таких, что максимальные значения по j  1,..., r максимумов функций v  K j (a, v) на
𝑗
множествах 𝑉𝑎 достигаются для различных значений j0 , j1 , то есть справедливы
неравенства:
max max 𝐾𝑗 (𝑎0 , 𝑣) < max
𝐾𝑗0 (𝑎0 , 𝑣),
𝑗
𝑗=1,…,𝑟 𝑣∈𝑉 𝑗
𝑎0
𝑗≠𝑗0
𝑣∈𝑉𝑎 0
0
max max 𝐾𝑗 (𝑎1 , 𝑣) < max
𝐾𝑗1 (𝑎1 , 𝑣).
𝑗
𝑗=1,…,𝑟 𝑣∈𝑉 𝑗
𝑎1
𝑗≠𝑗1
𝑣∈𝑉𝑎 1
1
Тогда существует точка 𝑎 ∈ 𝐴 бифуркации экстремалей задачи 2.3 (или 2.5, или 2.7) по
выбору (в среде заданного конечного набора алгоритмов) оптимального закона
параметрического регулирования.
Доказательство. В силу связности множества А точки a0 , a1 можно соединить
непрерывной линией a  a ( s ) , s  [0,1] , лежащей в множестве А, причем справедливы
равенства
a(0)  a0 , a(1)  a1.
Обозначим
25
𝐾𝑗 (𝑠) = max
𝐾𝑗 (𝑎(𝑠), 𝑣) , 𝑠 ∈ [0, 1].
𝑗
𝑣∈𝑉𝑎(𝑠)
Из теорем 2.17 (или 2.20, или 2.23) следует непрерывность функций s  K j ( s ) на отрезке
[0,1] , а значит, и
𝐾 ∗ (𝑠) = max 𝐾𝑗 (𝑠).
непрерывность на этом отрезке функции 𝐾 ∗ = 𝐾 ∗ (𝑠), где
𝑗=1,…,𝑟
Определим множество
( j )  s  [0,1] K j ( s)  K * ( s) , j  1,..., r.
Оно является замкнутым, будучи полным прообразом замкнутого множества, состоящего
из единственной точки (нуля) для непрерывной функции
где
y  y ( s ),
y(s)  K j (s)  K * (s). Таким образом, отрезок [0,1] представим в виде следующего
объединения
[0,1] 
( j ),
j 1,..., r
состоящего, согласно условиям теоремы, как минимум, из двух непустых замкнутых
множеств.
Из условий теоремы следуют также соотношения:
0  ( j0 ), 1 ( j0 ).
Тогда множество граничных точек множества ( j0 ), находящихся на интервале
(0,1), не пусто. Следовательно, существует нижняя грань s0 таких граничных точек. Это
значение является также граничной точкой некоторого другого множества ( j2 ) и
принадлежит ему. Таким образом, при a  a(s0 ) максимум по
j  1,..., r величины
max
𝐾𝑗 (𝑎(𝑠), 𝑣) достигается, как минимум, для двух различных номеров j0 и j2 . В то же
𝑗
𝑣∈𝑉𝑎(𝑠)
время при 0  s  s0 этот максимум достигается для единственного значения j0 . Таким
образом, a(s0) действительно соответствует искомой точкой бифуркации. Теорема
доказана.
Следующее утверждение является непосредственным следствием теоремы 2.24.
Следствие 2.25. Предположим, что при выполнении условий теорем 2.17 (или 2.20,
или 2.23), А есть связное множество, и при значении 𝑎 = 𝑎0 регулирование с помощью
закона 𝐺𝑗0 дает решение задачи 2.3 (или 2.5, или 2.7), а при 𝑎 = 𝑎1 , (𝑎0 ≠ 𝑎1 ; 𝑎0 , 𝑎1 ∈ 𝐴)
регулирование с помощью этого закона не дает решение рассматриваемой задачи, то
есть справедливы неравенства
max max 𝐾𝑗 (𝑎0 , 𝑣) < max
𝐾𝑗0 (𝑎0 , 𝑣),
𝑗
𝑗=1,…,𝑟 𝑣∈𝑉 𝑗
𝑎0
𝑗≠𝑗0
𝑣∈𝑉𝑎 0
0
max max 𝐾𝑗 (𝑎1 , 𝑣) > max
𝐾𝑗0 (𝑎1 , 𝑣).
𝑗
𝑗=1,…,𝑟 𝑣∈𝑉 𝑗
𝑎1
𝑗≠𝑗0
𝑣∈𝑉𝑎 0
1
Тогда имеется хотя бы одна точка 𝑎 ∈ 𝐴 бифуркации экстремалей указанной задачи 2.3
(или 2.5, или 2.7).
В завершение приведем описание численного алгоритма нахождения
бифуркационного значения функции (или параметра) a одной из задач 2.3 или 2.5 или 2.7
по выбору (в среде заданного конечного набора алгоритмов) законов параметрического
регулирования и при выполнении условий теоремы 2.24.
26
Соединим точки 𝑎0 и 𝑎1 гладкой кривой 𝑆 ⊂ 𝐴. Разобьем эту кривую на 𝑛
равновеликих частей с достаточно малым шагом. Для полученных значений (точек) β𝑖 ∈
𝑆, 𝑖 = 0, … , 𝑛, β0 = 𝑎0 , β𝑛 = 𝑎1 определяются номера законов параметрического
регулирования - 𝑗𝑖 доставляющих решение задачи 2.3 или 2.5 или 2.7 при значении 𝑎 = β𝑖 .
Затем находится первое значение i, при котором соответствующий номер закона
отличается от 𝑗0 . В этом случае бифуркационное значение 𝑎 лежит на дуге (β𝑖−1 , β𝑖 )
кривой 𝑆.
Для найденного участка кривой алгоритм определения точки бифуркации с заданной
точностью ε состоит в применении метода половинного деления. В результате находится
точка γ ∈ (β𝑖−1 , β𝑖 ), с одной стороны от которой на этой дуге в пределах отклонения ε от
значения γ оптимальным законом является 𝐺𝑗0 , а с другой - в пределах отклонения ε от
значения γ этот закон оптимальным не является. Из следствия 2.25 следует, что точка
бифуркации экстремалей решаемой задачи лежит на указанной дуге, и в качестве ее
оценки можно принять любую точку дуги (β𝑖−1 , β𝑖 ).
References
1. Ekeland I., Temam R. Convex analysis and variational problems. Amsterdam: NordHolland publishing company, 1976.
27
Related documents
Download