Об одном методе построения подсистем для

advertisement
202
ТРУДЫ МФТИ. — 2009. — Том 1, № 4
УДК 517.977, 519.71
В.И. Елкин
Московский физико-технический институт (государственный университет)
Вычислительный центр им. А.А. Дородницына РАН
Об одном методе построения подсистем
для управляемых систем
Подсистема представляет собой ограничение управляемой системы на многообразие, лежащее в фазовом пространстве управляемой системы. Подсистема определяет
часть фазовых траекторий управляемой системы, которые лежат на соответствующем многообразии. Поэтому решение той или иной задачи управления, поставленной для управляемой системы, может быть сведено к решению аналогичной задачи для её подсистемы, фазовое пространство которой имеет меньшую размерность.
В статье предложен метод построения подсистем на заданном многообразии.
Ключевые слова: управляемая система, подсистема, многообразие, сужение, аффинное распределение.
Понятие подсистемы в теории управления возникает аналогично понятию линейного подпространства в теории линейных
пространств, понятию подгруппы в теории
групп и т. д. Таким образом, подсистема
представляет собой в определённом смысле сужение структуры исходной управляемой системы. Иначе говоря, подсистемы
определяют часть фазовых траекторий системы.
В данной работе рассматриваются
нелинейные системы, которые линейны по
управлениям, то есть системы вида
ẏ = f0 (y) + f (y)u, y ∈ M ⊂ Rn , u ∈ Rr .
(1)
Здесь y — фазовые переменные, u — управления, M — фазовое пространство системы, являющееся областью. Предполагается, что f0 — гладкое векторное поле; f —
n × r — матрица, столбцы которой fα ,
α = 1, ..., r, — гладкие векторные поля и rank f (y) = const. Решением или
фазовой траекторией системы (1) называется непрерывная кусочно-гладкая функция y(t), для которой существует такое
кусочно-непрерывное управление u(t), что
функции y(t), u(t) удовлетворяют соотношениям (1).
Подсистема представляет собой сужение системы (1) на элементарное многообразие, лежащее в фазовом пространстве. Элементарным m-мерным многообразием N ⊂ M называется множество,
диффеоморфное области в Rm . Это озна-
чает, что N является образом некоторой
области L ⊂ Rm при гладком отображении
χ : L → Rn , которое в координатах записывается так:
y i = χi (x1 , ..., xm ), i = 1, ..., n,
x = (x1 , ..., xm ) ∈ L ⊂ Rm .
При этом имеется гладкое отображение
χ−1 : χ(L) = N → L. Каждый такой диффеоморфизм χ называется параметризацией N, пара (L,χ) — картой N, обратный
диффеоморфизм χ−1 — системой координат на N, а точки x = (x1 , ..., xm ) —
координатами на N. Отметим, что многообразия часто задаются в неявном виде
как множество N точек области M ⊂ Rn ,
удовлетворяющих системе алгебраических
уравнений:
ψ k (y) = 0, k = 1, ..., q,
rank ∂ψ k /∂y i y∈N = q.
(2)
Соотношения (2), по крайней мере, локально задают элементарное многообразие размерности m = n − q. Действительно, по
теореме о неявной функции, эти соотношения можно разрешить относительно некоторых q переменных, например, следующим образом:
y a − θa (y 1, ..., y m) = 0, a = m + 1, ..., n,
y = (y 1, ..., y m) ∈ V ⊂ Rm .
(3)
Переменные y можно трактовать как координаты на многообразии. Параметризацией является отображение y → (y,θ(y)).
ТРУДЫ МФТИ. — 2009. — Том 1, № 4
Точное определение подсистемы заключается в следующем [1]. Рассмотрим для
некоторой карты (L,χ) многообразия N
управляемую систему:
ẋ = g0 (x) + g(x)v, x ∈ L ⊂ Rm , v ∈ Rs .
(4)
Пусть выполняется следующее свойство:
как только x(t) — решение системы (4),
то y(t) = χ(x(t)) — решение системы
(1). Тогда говорят, что система (1) допускает сужение на многообразие N, система (4) называется подсистемой системы (1), а многообразие N называется
P -многообразием. Если P -многообразие
является открытым множеством в M, то
подсистема называется открытой. Дадим
локальный вариант определения сужения.
Если N ⊂ M — многообразие, то многообразие W ∩ N, где W — область в M, называется открытым подмногообразием многообразия N. Будем говорить, что система
(1) допускает локальное сужение на многообразие N в точке y0 ∈ N, если система (1) допускает сужение на некоторое открытое подмногообразие многообразия N,
содержащее точку y0 . Дальнейшие результаты в основном носят локальный характер, то есть связаны с понятием локального сужения в точке. При этом явное упоминание точки, в которой система допускает
локальное сужение, и слово «локальное»
будут часто опускаться.
В силу того, что между точками L и
точками N имеется диффеоморфное соответствие, то можно говорить (допуская
вольность речи), что подсистема (4) задана на многообразии N. Из определения
подсистемы вытекает, что множество фазовых траекторий подсистемы (4) представляет собой, по существу (в координатах x1 , ..., xm ), часть фазовых траекторий
системы (1), лежащих на P -многообразии
N. Следует сказать, что, вообще говоря, не
все фазовые траектории системы (1), лежащие на N, определяются подсистемой
(4).
Знание части фазовых траекторий может быть достаточным для решения той
или иной задачи управления. Например,
в распространенной задаче терминального управления заданы точки y0 , y1 ∈ M
и требуется найти такое управление u(t),
t ∈ [t0 ,t1 ], и соответствующую фазовую
траекторию y(t), t ∈ [t0 ,t1 ], что y(t0 ) = y0 ,
203
y(t1 ) = y1 . Для произвольной нелинейной системы вида (1) эта задача может
быть достаточно сложной. С помощью понятия подсистемы решение этой задачи в
определённых случаях можно упростить.
Действительно, пусть система (4) является
подсистемой системы (1), причём соответствующее P -многообразие N проходит через точки y0 , y1 . Тогда очевидно, что исходная задача терминального управления сводится к аналогичной задаче для системы
(4) по переводу точки x0 = χ−1 (y0 ) в точку x1 = χ−1 (y1 ). Действительно, если x(t),
t ∈ [t0 ,t1 ], — такая фазовая траектория системы (4), что x(t0 ) = x0 , x(t1 ) = x1 , то
y(t) = χ(x(t)) — такая фазовая траектория
системы (1), что y(t0 ) = y0 , y(t1) = y1 . В [1]
приведены примеры решения задач терминального управления с помощью подходящих P -многообразий.
Задача нахождения всех P -многообразий и соответствующих подсистем весьма сложна. Достаточно сказать, что
она включает нахождение всех гладких
фазовых траекторий системы (1), ибо
очевидно, что они, точнее их носители, являются (по крайней мере локально) P -многообразиями. В данной работе
рассматривается следующая задача: как
узнать является или нет заданное многообразие P -многообразием системы (1)? Приведём ряд дифференциально-геометрических понятий, которые используются для
решения этой задачи.
Как известно, касательное пространство T My области M ⊂ Rn в точке y ∈ M
состоит из n-мерных векторов, исходящих из точки y, причём dim T My = n.
Касательным пространством m-мерного
многообразия N ⊂ M в точке y ∈ N
называется линейное подпространство
T Ny ⊂ T My , натянутое на m векторов
ηk = ∂χi /∂xk i=1, ..., n , k = 1, ..., m, где
χ — параметризация (производные вычисляются в точке x = χ−1 (y)). Поскольку
для гладкого многообразия векторы ηk
линейно независимы, то dim T Ny = m.
Распределением D (аффинным распределением A) на многообразии N называется отображение, ставящее в соответствие
каждой точке y ∈ N линейное подпространство D(y) ⊂ T Ny (аффинное подпространство A(y) ⊂ T Ny ). Величина
dim D(y) называется рангом распределения. Распределение D называется глад-
204
ким, если существует такое семейство
гладких векторных полей ξj , j ∈ J, на
N, что D(y) = span{ξj (y),j ∈ J}, y ∈ N.
Гладкие распределения постоянного ранга
называются регулярными. Примером регулярного распределения на N является касательное расслоение T N : y ∈ N $→ T Ny .
Регулярное распределение называется инволютивным, если порождающее его семейство векторных полей является алгеброй Ли, то есть оно является векторным пространством, замкнутым относительно образования коммутаторов.
Для регулярного распределения D ранга p > 0 существует (по крайней мере
локально) такое конечное семейство гладких векторных полей ζa , a = 1, ..., p,
что D(y) = span{ζa (y),a = 1, ..., p}. Такие семейства называются базисными. Отметим, что базисное семейство состоит
из полей, которые порождают линейно
независимые векторы в каждой точке,
то есть rank ζai (y) = p в каждой точке. Такие семейства называются линейно несвязанными. Очевидно, что базисное семейство можно выделить из любого семейства гладких векторных полей,
порождающих регулярное распределение.
Аффинное распределение A называется
гладким, если существуют такое гладкое
поле ζ и такое гладкое распределение D,
что A(y) = ζ(y) + D(y), y ∈ N. Распределение D в этом разложении определено однозначно. Оно называется направляющим распределением и обозначается
через LA . Величина dim LA (y) называется рангом аффинного распределения A.
Гладкие аффинные распределения постоянного ранга называются регулярными.
Семейство векторных полей, состоящее из
базисного семейства ζa , a = 1, ..., p распределения LA и любого гладкого поля ζ0 ,
такого, что A(y) = ζ0 (y) + LA (y), называется базисным семейством аффинного
распределения A.
Управляемой системе (1) сопоставляется в области M регулярное аффинное распределение F : y ∈ M $→
F (y) = f0 (y) + span{fα (y),α = 1, ..., r},
y ∈ M, которое называется ассоциированным аффинным распределением системы
(1). (В связи с этим системы вида (1) называют часто аффинными.) Векторные поля
fα (y),α = 0, 1, ..., r, называются ассоциированными полями системы (1).
ТРУДЫ МФТИ. — 2009. — Том 1, № 4
Вернемся к поставленной ранее задаче, в которой задано некоторое многообразие N ⊂ M и нужно ответить на вопрос: является или нет это многообразие P -многообразием системы (1)? Воспользуемся следующим утверждением работы [1].
Теорема. 1 Многообразие N тогда и
только тогда является P -многообразием
системы (1), когда на N существует такое регулярное аффинное раcпределение
A, что A(y) ⊂ F (y)∀y ∈ M, где F — ассоциированное аффинное распределение системы (1).
Каждое регулярное аффинное распределение A, удовлетворяющее условию
теоремы 1, будем называть аффинным
P -распределением системы (1). Согласно
теореме 1, для ответа на поставленный в
этой работе вопрос естественно построить
ограничение F на N, то есть отображение
y ∈ N $→ F |N (y) = F (y) ∩ T Ny . Каждое
аффинное P -распределение A, определённое на N, должно принадлежать F |N . Если F |N является регулярным аффинным
распределением, то соответствующую подсистему будем называть индуцированной.
Выделим важный частный случай,
когда ассоциированные векторные поля
fα (y),α = 0, 1, ..., r, касаются N, то есть
fα (y) ∈ T Ny в каждой точке y ∈ N. Заметим, что условия касания полями fα многообразия N, задаваемого соотношениями
(2), выглядят так:
n
fαi (∂ψ k /∂y i )|y∈N = 0, k = 1, ..., q. (5)
i=1
Геометрически это означает, что поля
fα (y),α = 0, 1, ..., r, должны быть ортогональны градиентам ∂ψ k /∂y i , k = 1, ..., q.
В случае касания ассоциированных
полей многообразия N аффинное распределение F |N является аффинным
P -распределением, порождаемым гладкими векторными полями, являющимися
ограничениями ассоциированных векторных полей fα (y),α = 0, 1, ..., r, на многообразие N. В этом случае многообразие N является локально инвариантным для системы (1). Это означает, что любое решение
y(t) системы (1), соответствующее некоторому управлению u(t), t ∈ [t0 ,t1 ], причём
y(t0 ) ∈ N, по крайней мере локально принадлежит N (то есть существует такой
ТРУДЫ МФТИ. — 2009. — Том 1, № 4
205
полуоткрытый справа интервал I ⊂ [t0 ,t1 ],
что y(t) ∈ N, t ∈ I). Между решениями
системы (1), лежащими на инвариантном
многообразии N, и решениями подсистемы по фазовым переменным, заданной на
этом многообразии, имеется взаимно однозначное соответствие, осуществляемое
диффеоморфизмом χ. Следовательно, вопрос о нахождении решений системы (1),
проходящих через инвариантное многообразие N, полностью сводится к вопросу о
нахождении решений подсистемы, т. е соответствующая подсистема описывает (по
крайней мере локально) все решения (1).
В общем случае, как уже отмечалось, подсистема описывает лишь часть решений
системы (1), лежащих на многообразии N.
Проведём вычисления по построению
F |N для m-мерного многообразия N, заданного в виде графика (3). Предполагается, что многообразие N является совершенно произвольным (в частности, оно
не обязано быть инвариантным). Согласно (5), векторы из F (y), принадлежащие
T Ny , соответствуют тем значениям u ∈ Rr ,
для которых
(Φa0 (y)
+
r
uα Φaα (y))|y∈N = 0,
(6)
α=1
a = m + 1, ..., n, α = 1, ..., r,
n
i
i a
a
где Φaβ (y) =
i=1 fβ ∂/∂y (y − θ (y)),
β = 0, 1, ..., r. Введём функциональa=m+1, ..., n
,
ную матрицу C(y) = caα (y)α=1,
..., r
где caα (y) = Φaα (y,θ(y)), и столбец
b(y) = ba (y), a = m + 1, ..., n, где
ba (y) = Φa0 (y,θ(y)). В этих обозначениях соотношения (6) представляют собой систему линейных алгебраических уравнений
относительно u:
C(y)u = b(y), y ∈ V ⊂ Rm .
(7)
Дадим следующее определение. Точку
y0 ∈ N будем называть регулярной точкой
многообразия N относительно системы
(1), если ранги матриц C(y), (C(y)|b(y))
постоянны в некоторой окрестности точки y 0 ∈ V ⊂ Rm (эта точка определяется
из условия y0 = (y 0 ,θ(y 0 ))). Очевидно, что
множество регулярных точек является открытым и всюду плотным подмножеством
многообразия N (в топологии N). Дальнейшие рассуждения носят локальный характер в окрестности регулярной точки
y0 многообразия N относительно системы
(1). Пусть в окрестности точки y 0
rank C(y) = rank(C(y)|b(y)).
(8)
Построим на некотором открытом подмногообразии N ⊂ N, содержащем y0 , аффинное распределение F |N , которое будет являться аффинным P -распределением системы (1). (Заметим, что N — m-мерное
многообразие, диффеоморфное некоторой
окрестности V ⊂ V точки y 0 .) В силу (8) в некоторой окрестности совместна система алгебраических уравнений (7).
Пусть rank C(y 0 ) = p. Тогда в окрестности
V ⊂ V общее решение системы (7) можно
представить в виде
u = λ0 (y) +
λβ (y)v β = λ0 (y) + λ(y)v,
где λ0 (y) — частное решение системы (7),
λβ (y), β = 1, ..., l, — фундаментальная
система решений однородной системы (7),
v ∈ Rl , l = n − p. Ранг матрицы λ(y) постоянен и равен l. Введём вектор-функции
h0 (y) = f0 (y) + f (y)λ0 (y),
(9)
hβ (y) = f (y)λβ (y), y ∈ N , β = 1, ..., l,
(10)
определённые в точках многообразия
N ⊂ N (соответствующего окрестности
V ⊂ V ). Из построения вытекает, что вектор-функции (9), (10) являются векторными полями на многообразии N , то есть
hβ (y) ∈ T Ny , y ∈ N . Ранг матрицы h,
столбцами которой являются поля (10), равен l. Следовательно, на многообразии N поля (9), (10) определяют регулярное аффинное распределение, которое, очевидно,
совпадает с F |N , то есть
F |N (y) = h0 (y) + span{hβ (y),β = 1, ..., l},
y ∈ N .
Аффинное распределение F |N является аффинным P -распределением системы
(1), которому соответствует индуцированная подсистема
ẏ = h0 (y) +
l
hβ (y)v β ,
β=1
y ∈ V ⊂ Rm , v ∈ Rl ,
k
где hβ (y) = hkβ (y,θ(y)).
(11)
206
Если (8) не выполняется, то очевидно, что аффинные P -распределения, определённые на открытых подмногообразиях
N ⊂ N, содержащих данную точку y0 ,
не существуют. Полученный в процессе построения подсистемы (11) результат сформулируем в виде теоремы.
Теорема. 2 Пусть y0 — регулярная точка многообразия (3) относительно системы
(1). Система (1) допускает локальное сужение на многообразие (3) в точке y0 тогда и
ТРУДЫ МФТИ. — 2009. — Том 1, № 4
только тогда, когда в некоторой окрестности точки y 0 выполняется (8).
Работа выполнена при финансовой поддержке РФФИ (грант №07–01–00217).
Литература
1. Елкин В.И. Подсистемы управляемых систем и задача терминального управления // Автоматика и телемеханика. —
1995. — № 1. — С. 21–29.
Поступила в редакцию 15.09.2009.
Download