ПРИНЦИП РАЗДЕЛЕНИЯ ДЛЯ АФФИННЫХ СИСТЕМ

advertisement
1
ПРИНЦИП РАЗДЕЛЕНИЯ ДЛЯ АФФИННЫХ СИСТЕМ
А.Е.Голубев, А.П.Крищенко, С.Б.Ткачев
Введение. При решении задач управления динамическими системами полный вектор состояния
системы часто неизвестен, а измерению доступны лишь некоторые функции переменных состояния —
выходы системы. Одним из путей получения оценки вектора состояния по выходам является построение
наблюдателя — специальной динамической системы, состояние которой с течением времени приближается
(асимптотически или экспоненциально) к состоянию исходной системы. Предположим, что для задачи
стабилизации положения динамической системы найдено решение в виде обратной связи по состоянию
и известна оценка состояния системы, полученная с помощью наблюдателя. Тогда можно рассмотреть
управление, которое получается из обратной связи заменой состояния системы на его оценку. Возникает
вопрос о том, будет ли полученное таким образом управление в виде обратной связи по оценке состояния
системы решением задачи стабилизации.
Для линейных стационарных систем ответ положителен и составляет содержание известного
принципа разделения [1, стр. 157]. Именно, если для линейной стационарной системы построен
экспоненциальный наблюдатель и найдена линейная обратная связь, глобально стабилизирующая
заданное положение при известном векторе состояния, то при соответствующей обратной связи по оценке
вектора состояния устойчивость положения равновесия сохраняется.
Для нелинейных систем в общем случае ответ отрицательный: известны примеры нелинейных
систем, к которым принцип разделения не применим [2].
Далее рассматривается задача глобальной стабилизации заданного положения равновесия аффинной
стационарной системы с выходом
ẋ = A(x) + B(x)u, y = h(x),
(1)
где x ∈ Rn — вектор состояния системы, A(x) и B(x) — гладкие векторные поля на Rn , y ∈ R1 — выход
системы, h(x) ∈ C ∞ (Rn ), u ∈ R1 — управление. При этом предполагается, что алгоритм управления,
стабилизирующего положение равновесия, может использовать лишь информацию о значениях выхода
аффинной системы.
В данной работе для систем вида (1), преобразуемых в Rn к каноническому виду для построения
наблюдателя [3, 4] и допускающих в Rn построение нелинейного экспоненциального наблюдателя в новых
переменных [4], при выполнении некоторых дополнительных условий доказана справедливость принципа
разделения. Доказано, что если при выполнении найденных условий непрерывно дифференцируемая
обратная связь по состоянию глобально экспоненциально стабилизирует преобразованную систему, то
соответствующая обратная связь по оценке состояния глобально асимптотически стабилизирует исходную
аффинную систему (1). При более жестких условиях, которые тем не менее выполнены, например, для
рассмотренной модели гибкого однозвенного робота, показано, что если непрерывно дифференцируемая
обратная связь по состоянию глобально экспоненциально стабилизирует аффинную систему (1), то
соответствующая обратной связь по оценке состояния глобально асимптотически стабилизирует эту же
систему.
Важную роль в теории аффинных и динамических систем с выходом играют их преобразования к
различным каноническим видам. В связи с рассматриваемой задачей стабилизации отметим следующие
два свойства преобразованной системы. Если две динамических системы ξ˙ = f1 (ξ, t) и η̇ = f2 (η, t)
связаны заменой переменных ξ = H(η), где H — диффеоморфизм Rn = {η} и Rn = {ξ}, то глобальная
асимптотическая устойчивость положения равновесия ξ∗ первой системы эквивалентна глобальной
асимптотической устойчивости соответствующего положения равновесия η∗ = H −1 (ξ∗ ) второй системы.
Если же отображения H и H −1 еще и глобально липшицевы, например, это линейные отображения,
то аналогичное утверждение верно для глобальной экспоненциальной устойчивости этих положений
равновесия. Последнее следует из неравенств
|η(t) − η∗ | = |H −1 (ξ(t)) − H −1 (ξ∗ )| ≤ L1 |ξ(t) − ξ∗ | ≤ L1 Be−at |ξ(0) − ξ∗ | =
= L1 Be−at |H(η(0)) − H(η∗ )| ≤ L1 L2 Be−at |η(0) − η∗ |,
где B, a, L1 , L2 – соответствующие положительные константы.
Построение наблюдателя. Рассмотрим систему (1) без управления:
ẋ = A(x),
y = h(x).
(2)
2
Систему (2) называют локально наблюдаемой в точке, если в некоторой окрестности этой точки ранг
матрицы наблюдаемости
n−1
∂h(x) ∂L h(x)
∂LA
h(x) T
A
(3)
W (x) =
,
, ...,
∂x
∂x
∂x
∂h
равен n, где LA h(x) =
A(x) — производная Ли функции h(x) по векторному полю A(x).
∂x
Для построения наблюдателя для системы (2) воспользуемся методом, основанном на ее
преобразовании к эквивалентной системе соответствующего канонического вида [3], [4]. На основе
результатов, приведенных в [4], сформулируем следующую теорему.
Теорема 1. Для того, чтобы локально наблюдаемая в точке динамическая система (2) в
некоторой окрестности этой точки была эквивалентна системе канонического вида для построения
наблюдателя
χ̇ = Dχ + ψ(χ1 ), y = H(χ1 ),
(4)
где χ = (χ1 , . . . , χn )T , D = (dij ) — квадратная матрица порядка n с элементами dij = 1, если j − i = 1,
и dij = 0, если j − i 6= 1, ψ(χ1 ) = (ψ1 (χ1 ), . . . , ψn (χ1 ))T , и допускала построение наблюдателя
χ̂˙ = Dχ̂ + G(χ̂1 − χ1 ) + ψ(χ1 ),
χ1 = H −1 (y),
(5)
где вектор G = (g1 , . . . , gn )T в наблюдателе задает динамику ошибки и выбран так, что при C =
(1, 0, . . . , 0) матрица D + GC имеет собственные числа только с отрицательными действительными
частями, необходимо и достаточно, чтобы существовала такая гладкая функция p(τ ), τ ∈ R, p(τ ) >
0, для которой векторное поле B1 (x), являющееся в окрестности рассматриваемой точки решением
уравнения
W (x)B1 (x) = (0, . . . , 0, p(h(x)))T ,
(6)
удовлетворяет в этой окрестности условиям
[adkA B1 (x), adk+1
A B1 (x)] = 0,
k = 0, n − 1.
(7)
Здесь W (x) — матрица (3) наблюдаемости системы (2), ad0A B1 (x) = B1 (x), adk+1
A B1 (x) =
[A(x), adkA B1 (x)] при k > 0, [., .] — коммутатор векторных полей.
При выполнении условий теоремы 1 существует локальная гладкая невырожденная замена
переменных x = Φ(χ), преобразующая систему (2) к виду (4). Она находится из следующих условий
[4], [5]:
Φ0 (χ) = B1 (x), −adA B1 (x), . . . , (−1)n−1 adn−1
,
(8)
A B1 (x) x=Φ(χ)
0
где Φ (χ) — матрица Якоби.
В некоторых случаях наблюдатель для аффинной системы (1) можно построить с помощью метода,
предложенного в [6]. Предположим, например, что для векторного поля B(x) аффинной системы (1)
справедливы равенства
i−1
[(−1)i−1 adA
B1 (x), B(x)] = 0, i = 1, n.
(9)
Тогда векторное поле B(x) в новых переменных χ постоянно. В этом случае система (1), записанная в
переменных χ, примет вид
χ̇ = Dχ + ψ(χ1 ) + Bu,
Покажем, что система
y = H(χ1 ),
χ̂˙ = Dχ̂ + G(χ̂1 − χ1 ) + ψ(χ1 ) + Bu,
B = const.
(10)
χ1 = H −1 (y)
(11)
является экспоненциальным наблюдателем для системы (10). Действительно, уравнение относительно
ошибки e = χ̂ − χ оценки наблюдателем (11) состояния системы (10) при любом (но одинаковом)
управлении в системах (10)–(11) имеет вид:
ė = (D + GC)e,
(12)
3
где матрицы C и G из формулировки теоремы 1. Поэтому ошибка оценки состояния не зависит от
управления и экспоненциально стремится к нулю.
Стабилизация с использованием наблюдателя. Предположим, что для динамической системы
(2), соответствующей аффинной системе (1), выполнены условия теоремы 1, причем замена переменных
x = Φ(χ), преобразует аффинную систему (1) к виду (10) и задает диффеоморфизм Rn = {χ} и Rn = {x}.
Пусть для системы (10) построено управление в виде такой непрерывно дифференцируемой
обратной связи u(χ), что система (10), замкнутая этим управлением, глобально экспоненциально
устойчива в точке χ = χ∗ . Поскольку вектор состояния системы точно неизвестен, ошибку e = χ̂ − χ
оценки вектора состояния системы с помощью наблюдателя будем интерпретировать как возмущение,
действующее на замкнутую систему (10) через управление u(χ + e) = u(χ̂). Справедливо следующее
утверждение.
Теорема 2. Пусть в системе (10)
1) вектор-функция ψ(χ1 ) гладкая и глобально липшицева;
2) существует непрерывно дифференцируемая обратная связь u(χ), глобально экспоненциально
стабилизирующая положение равновесия χ = χ∗ системы (10).
Тогда система (10), замкнутая управлением u(χ̂), где χ̂ – оценка вектора χ ее состояния,
получаемая с помощью наблюдателя (11), глобально асимптотически устойчива в точке χ = χ∗ .
Доказательство. Рассмотрим систему
χ̂˙ = Dχ̂ + GСe + ψ(χ̂1 − e1 ) + Bu(χ̂)
(13)
ė = (D + GC)e,
составленную из уравнения (11) наблюдателя, замкнутого обратной связью u(χ̂), и уравнения (12) на
ошибку оценки этим наблюдателем состояния системы (10) с управлением u(χ̂). Покажем, что положение
равновесия χ̂ = χ∗ , e = 0 системы (13) глобально экспоненциально устойчиво.
Согласно условиям теоремы система (10), замкнутая непрерывно дифференцируемой обратной
связью u(χ), глобально экспоненциально устойчива в точке χ = χ∗ . Так как правая часть этой замкнутой
системы непрерывно дифференцируема, то по теореме Н.Н. Красовского [7, стр. 72] существует функция
Ляпунова V1 (χ − χ∗ ), удовлетворяющая условиям:
2
2
c1 |χ − χ∗ | ≤ V1 (χ − χ∗ ) ≤ c2 |χ − χ∗ | ,
∂V (χ − χ ) 1
∗ ≤ c3 |χ − χ∗ |
∂χ
∂V1 (χ − χ∗ )
2
(Dχ + ψ(χ1 ) + Bu(χ)) ≤ −c4 |χ − χ∗ | ,
∂χ
(14)
(15)
где c1 , c2 , c3 , c4 – положительные константы, | · | – евклидова норма в Rn .
В силу выбора спектра матрицы D + GC положение равновесия e = 0 системы уравнений (12)
асимптотически устойчиво. Поэтому согласно [7, стр. 70] существует такая функция Ляпунова V2 (e) (в
виде квадратичной формы), что
2
2 ∂V2 (e) 2
l1 |e| ≤ V2 (e) ≤ l2 |e| , ≤ −l4 |e| ,
≤ l3 |e|, V̇2 (e)
∂e
(12)
(16)
где li , i = 1, 4 – некоторые положительные константы.
Заменим переменную χ в функции Ляпунова V1 (χ − χ∗ ) системы (10) на χ̂ и в качестве функции
Ляпунова для системы (13) возьмём функцию
V (χ̂ − χ∗ , e) = kV1 (χ̂ − χ∗ ) + V2 (e),
где k > 0 – некоторая константа, подлежащая определению. Производную функции V (χ̂ − χ∗ , e) в силу
системы (13) представим следующим образом:
V̇ (χ̂ − χ∗ , e)
+k
=k
(13)
∂V1 (χ̂ − χ∗ )
∂V1 (χ̂ − χ∗ )
(Dχ̂ + ψ(χ̂1 ) + Bu(χ̂)) − k
(ψ(χ̂1 ) − ψ(χ1 ))+
∂ χ̂
∂ χ̂
∂V1 (χ̂ − χ∗ )
GCe + V̇2 (e)|(12) .
∂ χ̂
4
Сделав в (14) — (16) ту же замену χ на χ̂ и учитывая полученные неравенства, находим, что
∂V (χ̂ − χ ) 1
∗ 2
≤ −kc4 |χ̂ − χ∗ | + k V̇ (χ̂ − χ∗ , e)
· |ψ(χ̂1 ) − ψ(χ1 )|+
∂
χ̂
(13)
∂V (χ̂ − χ ) 1
∗ 2
2
+k · |G| · |C| · |e| − l4 |e| ≤ −kc4 |χ̂ − χ∗ | +
∂ χ̂
2
+kc3 |χ̂ − χ∗ | · |ψ(χ̂1 ) − ψ(χ1 )| + kc3 |G| · |C| · |e| · |χ̂ − χ∗ | − l4 |e| .
Согласно условиям теоремы функция ψ(χ1 ) глобально липшицева. Следовательно, существует константа
L > 0 такая, что для любых χ = (χ1 , . . . , χn )T , χ̂ = (χ̂1 , . . . , χ̂n )T ∈ Rn
выполнено неравенство
|ψ(χ̂1 ) − ψ(χ1 )| ≤ L|χ̂1 − χ1 | ≤ L|χ̂ − χ| = L|e|. Поэтому можем записать:
2
2
≤ − kc4 |χ̂ − χ∗ | + (kc3 L + kc3 |G| · |C|)|e| · |χ̂ − χ∗ | − l4 |e| .
(17)
V̇ (χ̂ − χ∗ , e)
(13)
Рассмотрим правую часть неравенства (17) как квадратичную форму ν относительно двух
переменных |χ̂ − χ∗ | и |e|. Эта квадратичная форма отрицательно определена согласно критерию
4c4 l4
Сильвестра при k <
.
Следовательно, при такой положительной константе k
(c3L + c3 |G| · |C|)2
отрицательно определена во всем Rn и справедлива следующая оценка:
производная V̇ (χ̂ − χ∗ , e)
(13)
V̇ (χ̂ − χ∗ , e)
2
(13)
≤ λ|(χ̂ − χ∗ , e)T | ,
(18)
где (χ̂ − χ∗ , e)T ∈ R2n , λ < 0 — минимальное по модулю собственное число матрицы квадратичной формы
ν. Из неравенств (14) и (16) (с учетом замены χ на χ̂) следует, что
2
2
0
2
V (χ̂ − χ∗ , e) = kV1 (χ̂ − χ∗ ) + V2 (e) ≤ kc2 |χ̂ − χ∗ | + l2 |e| ≤ c2 |(χ̂ − χ∗ , e)T | ,
0
2
2
2
V (χ̂ − χ∗ , e) ≥ kc1 |χ̂ − χ∗ | + l1 |e| ≥ c1 |(χ̂ − χ∗ , e)T | ,
0
(19)
0
где c1 = min{kc1 , l1 }, c2 = max{kc2 , l2 }. Из полученных неравенств (18) — (19) согласно [7, стр. 70]
следует, что решение χ̂ = χ∗ , e = 0 системы (13) глобально экспоненциально устойчиво.
Линейной заменой переменных
χ̂ = χ̂, e = χ̂ − χ,
(20)
система (13) преобразуется в систему
χ̇ = Dχ + ψ(χ1 ) + Bu(χ̂)
χ̂˙ = Dχ̂ + GC(χ̂ − χ) + ψ(χ1 ) + Bu(χ̂),
(21)
состоящую из системы (10) и ее наблюдателя (11), замкнутых управлением u(χ̂). Выше было отмечено,
что при линейных заменах переменных свойство глобальной экспоненциальной устойчивости положения
равновесия сохраняется, поэтому положение равновесия χ = χ∗ , χ̂ = χ∗ системы (21) тоже глобально
экспоненциально устойчиво. Воспользовавшись этим фактом, получаем следующую оценку для решения
χ(t) системы (10)
|χ(t) − χ∗ | = |χ(t) − χ̂(t) + χ̂(t) − χ∗ | ≤ |χ̂(t) − χ∗ | + |χ̂(t) − χ(t)| ≤
≤ |(χ̂(t) − χ∗ , e(t))T | + |e(t)| ≤ β1 e−α1 t |(χ̂(0), e(0))T − (χ∗ , 0)T | + β2 e−α2 t |e(0)|.
p
Здесь α2 = l4 /(2l2 ) > 0, β2 = l2 /l1 > 0 [7, стр. 70]. Для этого решения χ(t) выполнено неравенство
|χ(t) − χ∗ | ≤ βe−αt , где β = max{β2 |e(0)|, β1 |(χ̂(0), e(0))T − (χ∗ , 0)T |}, α = min{α1 , α2 }. Следовательно,
система (10), замкнутая управлением u(χ + e), глобально асимптотически устойчива в точке χ = χ∗ , что
завершает доказательство теоремы 2.
Если отображение Φ является диффеоморфизм Rn = {χ} и Rn = {x}, то наблюдатель (11) аффинной
системы (10), записанный в переменных x̂ = Φ(χ̂), представляет собой асимптотический наблюдатель
для аффинной системы (1). Непосредственным следствием доказанных результатов являются следующие
утверждения.
5
Теорема 3. Если для аффинной системы (1)
1) выполнены условия теоремы 1;
2) соответствующая замена переменных x = Φ(χ) задает диффеоморфизм Rn = {χ} и Rn = {x};
3) в Rn справедливы равенства (9);
4) выполнены условия теоремы 2,
то аффинная система (1) с управлением u0 (x̂) = u(Φ−1 (x̂)), x̂ = Φ(χ̂), в виде обратной связи по
оценке ее состояния глобально асимптотически устойчива в точке x = х∗ = Φ(χ∗ ).
Теорема 4. Если для аффинной системы (1)
1) выполнены условия теоремы 1;
2) соответствующая замена переменных x = Φ(χ) задает диффеоморфизм Rn = {χ} и Rn = {x},
причем отображения Φ и Φ−1 глобально липшицевы;
3) в Rn справедливы равенства (9);
4) вектор-функция ψ(χ1 ) гладкая и глобально липшицева;
5) при непрерывно дифференцируемом управлении u(x) в виде обратной связи по состоянию
аффинная система (1) глобально экспоненциально устойчива,
то при управлении u(Φ−1 (x̂)), x̂ = Φ(χ̂), в виде обратной связи по оценке ее состояния эта
система глобально асимптотически устойчива.
Утверждение теоремы 4 является следствием теоремы 3, поскольку при глобально липшицевых
отображениях Φ и Φ−1 преобразованная система (10) при управлении по состоянию u(Φ(χ)) глобально
экспоненциально устойчива.
Рассмотрим теперь случай, когда для аффинной системы (1) из соотношений (9) справедливы
только первые n − 1 равенств, т.е.
[(−1)i−1 adi−1
A B1 (x), B(x)] = 0,
i = 1, n − 1.
(22)
В этом случае векторное поле B(x) в новых переменных χ зависит от переменной χ1 и имеет вид B(χ1 ).
Экспоненциальным наблюдателем для аффинной системы (1), записанной в переменных χ (т.е. для
системы (10), где B = B(χ1 )), является система (11) с B = B(χ1 ). Уравнение на ошибку оценки этим
наблюдателем состояния системы (10), где B = B(χ1 ), сохранится в виде (12). В этом случае справедливы
аналоги теорем 2 — 4 при условии, что векторное поле B(χ1 ) глобально липшицево, а управление в виде
обратной связи по состоянию ограничено.
Теорема 5. Пусть в системе (10), где B = B(χ1 )
1) вектор-функции ψ(χ1 ) и B = B(χ1 ) гладкие и глобально липшицевы;
2) существует ограниченная непрерывно дифференцируемая обратная связь u(χ), глобально
экспоненциально стабилизирующая положение равновесия χ = χ∗ системы (10), где B = B(χ1 ).
Тогда система (10), где B = B(χ1 ), замкнутая управлением u(χ̂), где χ̂ – оценка вектора χ
ее состояния, получаемая с помощью наблюдателя (11), где B = B(χ1 ), глобально асимптотически
устойчива в точке χ = χ∗ .
Доказательство этой теоремы повторяет доказательство теоремы 2 с учетом того, что производную
функции V (χ̂ − χ∗ , e) в силу системы (13), где B = B(χ1 ) можно представить в виде
∂V1 (χ̂ − χ∗ )
∂V1 (χ̂ − χ∗ )
(Dχ̂ + ψ(χ̂1 ) + B(χ̂1 )u(χ̂)) − k
(ψ(χ̂1 ) − ψ(χ1 ))−
∂ χ̂
∂ χ̂
∂V1 (χ̂ − χ∗ )
∂V1 (χ̂ − χ∗ )
−k
(B(χ̂1 ) − B(χ1 ))u(χ̂) + k
GCe + V̇2 (e)|(12) .
∂ χ̂
∂ χ̂
V̇ (χ̂ − χ∗ , e)
=k
(13)
Теорема 6. Если для аффинной системы (1)
1) выполнены условия теоремы 1;
2) соответствующая замена переменных x = Φ(χ) задает диффеоморфизм Rn = {χ} и Rn = {x};
3) в Rn справедливы равенства (22);
4) выполнены условия теоремы 5,
то аффинная система (1) с управлением u0 (x̂) = u(Φ−1 (x̂)), x̂ = Φ(χ̂), в виде обратной связи по
оценке ее состояния глобально асимптотически устойчива в точке x = х∗ = Φ(χ∗ ).
Теорема 7. Если для аффинной системы (1)
1) выполнены условия теоремы 1;
6
2) соответствующая замена переменных x = Φ(χ) задает диффеоморфизм Rn = {χ} и Rn = {x},
причем отображения Φ и Φ−1 глобально липшицевы;
3) в Rn справедливы равенства (22);
4) вектор-функции ψ(χ1 ) и B(χ1 ) гладкие и глобально липшицевы;
5) при непрерывно дифференцируемом управлении u(x) в виде ограниченной обратной связи по
состоянию аффинная система (1) глобально экспоненциально устойчива,
то при управлении u(Φ−1 (x̂)), x̂ = Φ(χ̂), в виде обратной связи по оценке ее состояния эта
система глобально асимптотически устойчива.
Пример. Рассмотрим гибкий однозвенный робот, уравнения движения которого имеют вид [9]:

  0 
x2
0 
 −M1 sin x1 − k1 (x1 − x3 )  

+
u = A(x) + Bu, y = h(x) = x1 ,
(23)
ẋ = 


  0 
x4

1
−b1 x4 + k2 (x1 − x3 )
J
где x1 , x2 — угловая координата и угловая скорость звена манипулятора соответственно; x3 , x4 — угловая
координата и угловая скорость вала двигателя; u — управляющий момент, создаваемый двигателем.
Константы M1 , b1 , k1 , k2 , J — положительны, причем M1 = M gL/I, k1 = k/I, k2 = k/J, b1 =
d/J, где I, J — моменты инерции звена манипулятора и ротора двигателя соответственно; k —
жесткость передаточного механизма; d — коэффициент демпфирования; M — масса звена манипулятора;
M gL sin x1 — момент сил тяжести, действующий на звено манипулятора.
Предполагается, что измерению доступна только угловая координата x1 звена манипулятора.
Требуется построить управление u в виде обратной связи, использующей только значения выхода системы,
стабилизирующее заданное значение y = y0 =const выхода системы (23).
Для рассматриваемой задачи номинальному значению выхода системы (23) соответствует
положение равновесия x = x∗ = (x1∗ , . . . , x4∗ )T , u = u∗ , где x1∗ = y0 , x2∗ = 0, x3∗ = M1 /k1 sin y0 + y0 ,
x4∗ = 0, u∗ = −Jk2 (y0 − x3∗ ). Стабилизировав глобально это положение равновесия, получим решение
рассматриваемой задачи стабилизации заданного значения выхода системы. Построим для аффинной
системы (23) наблюдатель и глобально стабилизирующее управление в виде обратной связи по оценке
состояния замкнутой системы построенным наблюдателем.
В соответствии с приведенным выше методом построения наблюдателя рассмотрим сначала систему
(23) без управления:


x2
 −M1 sin x1 − k1 (x1 − x3 ) 
 = A(x), y = h(x) = x1 .
ẋ = 
(24)


x4
−b1 x4 + k2 (x1 − x3 )
Проверим выполнение условий теоремы 1. Mатрица наблюдаемости системы (24) имеет вид:

 

∂h(x)/∂x
1
0
0 0
 ∂LA h(x)/∂x  
0
1
0 0 
 
.
W (x) = 
 ∂L2A h(x)/∂x  =  −M1 cos x1 − k1
0
k1 0 
∂L3A h(x)/∂x
x2 M1 sin x1
−M1 cos x1 − k1 0 k1
Ее ранг равен 4 во всем R4 и, следовательно, система (24) локально наблюдаема в R4 .
Для векторного поля B1 = (0, 0, 0, 1/k1 )T , являющегося решением уравнения W (x)B1 = (0, 0, 0, 1)T ,
(p(τ ) ≡ 1) имеем:


0
0
0
1
 0

0
1
−b1
.
(B1 (x), −adA B1 (x), ad2A B1 (x), −ad3A B1 (x)) = 
2
 0
1/k1
−b1 /k1
(b1 − k2 )/k1 
1/k1 −b1 /k1 (b21 − k2 )/k1 (2b1 k2 − b31 )/k1
Поскольку векторные поля B1 , −adA B1 , ad2A B1 , −ad3A B1 постоянные, соотношения (7) выполнены.
7
Согласно теореме 1 для системы (24) существует наблюдатель вида (5).
Замена переменных x = Φ(χ), Φ(0) = 0, приводящая систему (24) к каноническому виду (4) для
построения наблюдателя, находится из условий (8) и имеет вид
x1
x2
x3
x4
= χ1 ,
= χ2 − b1 χ1 ,
= χ3 /k1 − b1 χ2 /k1 + (b21 − k2 )χ1 /k1 ,
= χ4 /k1 − b1 χ3 /k1 + (b21 − k2 )χ2 /k1 + (2b1 k2 − b31 )χ1 /k1 .
(25)
Линейная замена переменных (25) задает диффеоморфизм R4 = {χ} и R4 = {x}. В новых переменных χ
аффинная система (23) запишется в виде
χ̇1 = χ2 − b1 χ1 ,
χ̇2 = χ3 − M1 sin χ1 − χ1 (k1 + k2 ),
χ̇3 = χ4 − b1 M1 sin χ1 − b1 k1 χ1 ,
χ̇4 = −k2 M1 sin χ1 + k1 u/J,
y = χ1 = [1, 0, 0, 0]χ = Cχ,
(26)
причем векторное поле при управлении постоянно и равно B = (0, 0, 0, k1 /J)T .
экспоненциальный наблюдатель для аффинной системы (26) имеет вид
χ̂˙ = Dχ̂ + GC(χ̂ − χ) + ψ(χ1 ) + Bu,
Следовательно,
χ1 = y,
(27)
где матрицы D, C и векторы χ, χ̂ соответствуют векторной форме записи системы (26), а
T
ψ(χ1 ) = (−b1 χ1 , −M1 sin χ1 − χ1 (k1 + k2 ), −b1 M1 sin χ1 − b1 k1 χ1 , −k2 M1 sin χ1 )
Вектор-функция ψ(χ1 ) глобально липшицева. Поэтому выполнено первое условие теоремы 2 и
остается найти для положения равновесия χ∗ = Φ(x∗ ), u∗ глобально экспоненциально стабилизирующее
непрерывно дифференцируемое управление в виде обратной связи по состоянию для преобразованной
системы (26).
Положение равновесия аффинной системы (26) (без выхода) во всем пространстве состояний можно
стабилизировать методом нелинейной стабилизации, предложенным в [8], поскольку эта система во всем
пространстве состояний эквивалентна регулярной системе канонического вида, тоже определенной во всем
ее пространстве состояний. Преобразование аффинной системы (26) к каноническому виду определяется
функцией φ(χ) = χ1 , которую можно найти, следуя работе [10]. Дифференцируя эту функцию в силу
аффинной системы (26), находим новые переменные для записи системы канонического вида:
z1 = χ1 ,
z2 = ż1 = χ2 − b1 χ1 ,
z3 = ż2 = χ3 − M1 sin χ1 − χ1 (k1 + k2 ) − b1 χ2 + b21 χ1 ,
z4 = ż3 = χ4 − M1 χ2 cos χ1 + b1 M1 χ1 cos χ1 − (k1 + k2 )χ2 + b1 k2 χ1 + b1 (k1 + k2 )χ1 −
−b1 χ3 + b21 χ2 − b31 χ1 .
(28)
Соотношение z = µ−1 (χ) (28) действительно представляет собой замену переменных, поскольку оно
разрешимо относительно χ, χ = µ(z).
В переменных z система (26) имеет канонический вид
ż1 = z2 , ż2 = z3 , ż3 = z4 ,
ż4 = f (z) + k1 u/J,
y = z1 ,
(29)
где f (z) = −k2 M1 sin z1 − M1 cos z1 (z3 + b1 z2 ) + M1 z22 sin z1 − (k1 + k2 )(z3 + b1 z2 ) + b1 k2 z2 − b1 z4 .
Заменам переменных z = µ−1 (χ) и χ = µ(z) соответствуют отображения, являющееся
диффеоморфизмами R4 = {z} и R4 = {χ}. Эти отображения глобально липшицевы. Поэтому задача
экспоненциальной стабилизации положения равновесия χ∗ , u = u∗ системы (26) эквивалентна аналогичной
задаче для положения равновесия z = z∗ = µ−1 (χ∗ ) = (y0 , 0, 0, 0)T , u = u∗ системы (29).
8
Непрерывно дифференцируемой обратной связью, глобально экспоненциально стабилизирующей
положение равновесия z∗ , u∗ , системы (29), является
u∗ (z) = Jk1−1 (−f (z) −
3
X
κi zi+1 + κ0 z∗1 ),
(30)
i=0
где κi – постоянные, i = 0, 3. Замкнутая этим управлением система (29) примет вид
ż1 = z2 , ż2 = z3 , ż3 = z4 , ż4 = −κ0 (z1 − z∗1 ) − κ1 z2 − κ3 z3 − κ4 z4 ,
y = z1 .
Постоянные κs , s = 0, 3 выбираются таким образом, чтобы z1 = z∗1 , z2 = 0, z3 = 0, z4 = 0 было
асимптотически устойчивым решением замкнутой системы.
Как уже отмечалось, из глобальной экспоненциальной устойчивости положения равновесия
системы (29), замкнутой управлением u∗ (z), следует глобальная экспоненциальная устойчивость
соответствующего положения равновесия χ∗ , u∗ системы (26), замкнутой управлением u0 (χ) = u∗ (µ−1 (χ)).
Следовательно, согласно теореме 2 управление u∗ (µ−1 (χ̂)), где χ̂ оценка вектора состояния системы (26),
получаемая с помощью наблюдателя (27), будет глобально асимптотически стабилизировать указанное
положение равновесия системы (26). Тогда согласно теореме 3 управление u0 (x̂) = u∗ (µ−1 (Φ−1 (x̂))),
x̂ = Φ(χ̂), глобально асимптотически стабилизирует положение равновесия x∗ , u∗ системы (23) и,
следовательно, заданное значение y0 выхода этой системы.
Замечание 2. Благодаря линейности замены переменных (25) согласно теореме 4 для нахождения
управления в виде обратной связи по состоянию можно было использовать исходную аффинную систему
(23).
Работа выполнена при финансовой поддержке РФФИ: грант 99 — 01 — 00863 и грант 00 — 15
— 96137 поддержки ведущих научных школ. Часть результатов была получена авторами во время
пребывания в Международном математическом центре С.Банаха (Варшава) с 17.04.01 по 2.05.01.
ЛИТЕРАТУРА
[1] Машиностроение. Энциклопедия. Автоматическое управление. Теория. T. 1-4. М.: Машиностроение,
2000.
[2] Freeman R. // IEEE Transactions on Automatic Control. 1995. V. 40, No 12. P. 2119 — 2122.
[3] Krener A.J., Respondek W. // SIAM J. Control and Optimization. 1985. V. 23, No 2. P. 197 — 216.
[4] Крищенко А.П., Ткачев С.Б. // Автоматика и телемеханика. 1995. No 2. C. 21-34.
[5] Krener A.J., Isidori A. // Systems and Control Letters. 1983. No 3. P. 47-52.
[6] Крищенко А.П., Ткачев С.Б. //Дифференц. уравнения. 1999. T. 35, No 5. C. 648 — 663.
[7] Красовский Н.Н. Некоторые задачи теории устойчивости движения. М., 1959.
[8] Крищенко А.П. //Известия АН. Техническая кибернетика. 1985. No 6. C. 108-112.
[9] Won-Kee Son, Oh-Kyu Kwon // Proceedings of the 14th IFAC. 1999. V. F. P. 103 — 108.
[10] Жевнин А.А., Крищенко А.П. // Доклады АН СССР. 1981. Т. 258, No 4. С. 805 — 809.
9
Download