§ 7. Построение системы асимптотической оценки по наблюдениям с запаздыванием

advertisement
§ 7. Построение системы асимптотической оценки
по наблюдениям с запаздыванием
1. Стабилизация системы с неполной информацией по n наблюдениям.
В предыдущем параграфе предполагалось, что для построения стабилизирующего
управления известны все компоненты векторов X (t ); X (t   );; X (t  n ) , т.е
рассматривалась задача построения управления в условиях полной информации. Изучим
теперь другой случай. Рассмотрим линейную стационарную управляемую систему
(1)
X  AX  BU ,
где размерность вектора состояний X равна n , а размерность вектора управлений U
равна r , причём r  n . Рассмотрим также систему наблюдений, которая доставляет
информацию о состояниях вектора X , предшествующих текущему моменту t . Пусть эта
система имеет вид
yi  R X (t  i ); i  1; n.
(2)
Здесь yi - скалярные величины; R - постоянная вектор-строчка; знак  обозначает
транспонирование;   0 - постоянное запаздывание.
Определение 1. Систему вида
n

Xˆ  AXˆ  BU   Li yi  R Xˆ (t  i )
(3)

i 1

будем называть системой асимптотической оценки для системы (1), если векторастолбцы Li выбраны так, что для решений систем (1) и (3) выполняется условие
Xˆ (t )  X (t )  0 при t   .
(4)
Выведем условия, при которых система асимптотической оценки (3) существует.
Введём новую переменную X (t )  Xˆ (t )  X (t ) . Для новой переменной условие (4)
перепишется в виде
(5)
X (t )  0 при t   .
Вычтем теперь почленно из системы (3) систему (1), тогда, с учётом (2), получим
n

Xˆ  X  X  AXˆ  BU  L y  R Xˆ (t  i )  AX  BU 
 
n

i 1
i

i

n
 A( Xˆ  X )   Li R X (t  i )  R Xˆ (t  i )  AX   Li R X (t  i )
i 1
(6)
i 1
Условие (5) означает, что вектора-столбцы Li выбираются так, чтобы система (6)
была асимптотически устойчивой.
Рассмотрим вспомогательную управляемую систему
Z  A Z  Rv ,
(7)
 
где v - скалярное управление, R  (R ) . Система (7) имеет ту же структуру, что и система
(1) предыдущего параграфа, поскольку R - вектор-столбец. Будем считать, что система (7)
удовлетворяет теореме из предыдущего параграфа, то есть является полностью
управляемой и собственные числа матрицы A подчинены условию Re  ( A)  1  . Тогда
для системы (7) существует стабилизирующее управление вида
v  C1 Z (t   )  C2 Z (t  2 )    Cn Z (t  n ) ,
(8)
которое можно построить по алгоритму, изложенному в параграфе 6. Пусть управление
(8) построено; подставим его во вспомогательную систему (7).
n
Z  A Z  R  Ci Z (t  i ) .
i 1
(9)
По построению управления (8), система (9) асимптотически устойчива, значит, все корни
её характеристического уравнения
n


(10)
det  E  A   RCie  i   0
i 1


имеют отрицательные вещественные части. Рассмотрим теперь характеристическое
уравнение системы (6)
n


(11)
det  E  A   Li Re  i   0 .
i 1


Если здесь выбрать Li  Ci ; i  1;; n , где Ci  (Ci ) , то матрицы в уравнениях (10) и
(11) будут взаимно транспонированы, следовательно, их собственные числа будут
совпадать (рассматриваются только вещественные матрицы). Но тогда и все корни
уравнения (11) будут иметь отрицательные вещественные части, т.е. условие (5) будет
выполнено. Следовательно, система
n

Xˆ  AXˆ  BU   Сi yi  R Xˆ (t  i )
(12)
i 1


будет являться системой асимптотической оценки.
Пример. Построить систему асимптотической оценки, если   1 2 и
   0  1
1
 X   u ,
 X  
1 2 
 2



 y  1  1X (t   )
 1
 y2  1  1X (t  2 )
Решение. Запишем систему (7). Получим
 0 1
1
 Z   v.
Z  
 1 2
  1
По алгоритму предыдущего параграфа построим управление вида
d
v  Q1   (t   )  Q0 (t  2 )  k1(t   )  k2 (t   )  k3 (t  2 ),
 dt 
стабилизирующее нулевое решение уравнения   2    v, к которому приводится
система. Оба собственных числа матрицы системы равны 1, так что условие
Re   1  выполнено. Рассмотрим уравнение   1  q1e   1  q2e  0. Пользуясь
рассуждениями параграфа 6, выберем, например, q1  q2  2 и вычислим коэффициенты
управления. Получим
v  4(t   )  4 (t   )  4 (t  2 ) . Далее, величина  и
  
z 
   ST 1  1 ,
Z
компоненты
вектора
связаны
соотношением
где
 
z
2


 
1

1
1

2




; T  
. Окончательно, стабилизирующее управление для исходной
S  

1

3
0
1




системы получится в виде v  2  2Z (t   )  1 1Z (t  2 ). Таким образом, для
искомой
системы асимптотической оценки
определены вектора-столбцы
  2
  1
L1   ; L2    .
 2 
  1



Покажем теперь, что вектор X̂ из системы (12) может быть использован для
построения управления, стабилизирующего систему (1).
Сделаем относительно системы (1) ещё одно предположение: пусть она
стабилизируема управлением U  MX (t ) , как система с полной информацией. Это
означает, что для матриц A и B существует такая постоянная матрица M , что все
собственные числа матрицы A  BM имеют отрицательные вещественные части.
Построим эту матрицу, и покажем, что управление
U (t ; Xˆ )  MXˆ (t )
(13)
стабилизирует систему (1). Сначала объединим системы (1) и (12) в общую систему
размерности 2n .
 X  AX  BU

n
(14)
 ˆ
ˆ  BU   C ( y  R Xˆ (t  i ))
X

A
X
i
i

i 1

Подставим в эту систему управление (13)
 X  AX  BMXˆ

n
.
(15)
 ˆ
 ˆ
ˆ
ˆ
 X  AX  BMX   Ci ( yi  R X (t  i ))
i 1

ˆ
Введём опять переменную X (t )  X (t )  X (t ) и исключим из системы (15) переменную
X̂ .


n

Xˆ  X  X  AXˆ  BM Xˆ   Ci yi  R Xˆ (t  i )  AX  BM Xˆ 
n

i 1

n
 A( Xˆ  X )   Ci R X (t  i )  R Xˆ (t  i )  AX   Ci R X (t  i ) .
i 1
(16)
i 1
Преобразованная система будет иметь вид
 X  ( A  BM ) X  BMX

n
.
(17)


X

A
X

C
R
X
(
t

i

)

i

i 1

Вектор X (t )  0 при t   по построению системы (16). Но и вектор X (t )  0 при
t   , по построению матрицы M . Итак, система, замкнутая управлением (13),
становится асимптотически устойчивой. Значит, управление (13) стабилизирует систему
(14), а следовательно, и систему (1), как её составную часть.
Доказана следующая теорема.
Теорема. Пусть для системы (1) выполнены следующие условия:
 Система (1) стабилизируема управлением U  MX (t ) , как система с полной
информацией.
 Re  ( A)  1  .
 Система (7) полностью управляема.
Тогда система (1) стабилизируема по наблюдениям (2), как система с неполной
информацией.
Следствие. Последнее условие теоремы может быть заменено на более
слабое.
Действительно, для решения задачи необходимо найти стабилизирующее
управление для системы (7); но это может быть сделано и в случае, когда система (7) не
является полностью управляемой. Пусть система (7) не полностью управляема, тогда
существует неособое линейное преобразование, которое разбивает эту систему на
полностью управляемую и неуправляемую части
1  A11 1  A12 2  R1v
.
(18)

 2  A22 2
Будем считать, что размерность управляемой части системы (18) равна p , а
неуправляемой - n  p . Пусть все собственные числа матрицы A22 имеют отрицательные
вещественные части, а собственные числа матрицы A11
удовлетворяют условию
Re  ( A11)  1  . Тогда система (18) стабилизируема управлением вида
v  C1 1 (t   )  C2 1 (t  2 )    Cp 1 (t  p ) .
(19)

j
Положим C  (0;;0) при j  p  1;; n . Проделывая теперь обратное преобразование,
т.е. переходя снова к переменной Z , построим управление, стабилизирующее систему (7),
которое может быть представлено в виде (8). Дальнейшие рассуждения и выбор величин
Li в системе (3) проводятся аналогично.
2. Стабилизация системы с неполной информацией по одному наблюдению.
Количество наблюдений в предыдущем пункте равнялось порядку системы (1), т.е.
было, вообще говоря, достаточно велико. Выясним, при каких условиях решается задача
построения стабилизирующего управления, когда есть только одно наблюдение.
Пусть для системы
X  AX  BU
(1)
наблюдение имеет вид
(20)
y  R X (t   ),

где y - скалярная величина, R - вектор-строчка. Как и в предыдущем пункте параграфа
найдём условия, при которых существует система асимптотической оценки. Её будем
искать теперь в следующем виде:

Xˆ  AXˆ  BU  L y  R X (t   )  ,
(21)
где вектор-столбец L нужно выбрать так, чтобы при всех начальных данных выполнялось
условие Xˆ (t )  X (t )  0 при t   . Введём опять переменную X (t )  Xˆ (t )  X (t ) и
после почленного вычитания системы (1) из системы (21) получим:
(22)
X  AX  LR X (t   ) ,
и условие X (t )  0 при t   . Рассуждая так же, как и в предыдущем пункте,
заключаем, что задача выбора столбца L эквивалентна задаче стабилизации
вспомогательной системы
Z  A Z  Rv
(23)
 
управлением, линейным относительно величины Z (t  h) . Здесь R  (R ) .
Пусть система (23) полностью управляема, и пусть характеристическое уравнение
для матрицы A имеет вид
n  a1n 1    an  0.
(24)
Введем две матрицы.

 
S  R; A R;; A
n 1

R;
  an 1  an  2  1 



1 0
  an  2
T 
.


0 


 1

0
0
0


При сделанных предположениях обе эти матрицы не особые. В системе (23) сделаем
замену переменных по формуле Z  ST , где  - новый искомый вектор.
Преобразованная система запишется в виде
  A0  b0v ,
(25)
матрица A0 и вектор b0 будут иметь следующий вид:
1  0
0
0


 
0  0
0
0
b0   .
A0  
;


  



 


a a
 a1 
1
n 1
 n
Замечание: у матрицы A0 все элементы над главной диагональю равны 1.
Будем теперь строить стабилизирующее управление для системы (25) в виде
(26)
v  N0 (t   )  n ; n 1;; 1  (t   ).
Подставим управление (26) с неопределёнными величинами  j в систему (25) и выпишем
характеристическое уравнение полученной замкнутой системы. Оно будет иметь вид:
ne  a1n 1e    ane  1n 1  2n  2    n  0.
(27)
Теперь нужно выбрать величины  j   j (a j ; ); j  1;; n так, чтобы все корни уравнения
(27) имели отрицательные вещественные части. Для этого рассмотрим произведение
полинома n  1 -го порядка и квазиполинома первого порядка
(e  e   )(n 1   2n  2     n )  0.
(28)
Раскрывая в этом произведении скобки, мы получим в левой части квазиполином той же
структуры, что и левая часть выражения (27). При этом коэффициенты квазиполиномов
(27) и (28) будут связаны следующими двумя системами соотношений
a1     2
a    
2
3
 2
(29)
a3   3   4


an   n
1  
  
2
 2



 3
3


 n   n
(30)
Выясним, в каком случае можно выбрать величины  ;  ;  2 ;;  n так, чтобы левые
части равенств (27) и (28) совпали. Из системы (29) получим:
an

 n  

  an 1  an
n 1
.
 2



  a2  a3    an
 2   2
 n 1
Но из первого уравнения системы (29) следует, что  2    a1 . Отсюда следует, что
a
a
a
  a1  2  32    nn1 , или  n  a1 n 1    an  0.
Таким образом число 
 

удовлетворяет уравнению (24), т.е. это собственное число матрицы A . Предположим,
1
что матрица A имеет вещественное собственное число, удовлетворяющее условию   .

Следовательно, всегда возможно найти вещественное число  , так что все корни
квазиполинома первого порядка
(e  e   )  0 будут иметь отрицательные
вещественные части. Будем считать, что числа  и  уже построены. Зная величины
 ; a1;; an , построим величины
 2 ;  3 ;;  n . Теперь рассмотрим полином
n 1   2n  2     n  0 и, пользуясь любым известным критерием устойчивости
полиномов, выясним, где расположены его корни. Если все они лежат в левой открытой
полуплоскости на комплексной плоскости, то по набору  2 ;  3 ;;  n и числу  найдём
числа  j , пользуясь соотношениями (30).
Заметим, что проведённое построение не является однозначным. Во-первых,
матрица A может иметь несколько вещественных собственных чисел, удовлетворяющих
1
условию   . Во-вторых, для каждого такого числа  существует целый интервал

значений числа  , для которых все корни квазиполинома первого порядка
(e  e   )  0 будут иметь отрицательные вещественные части.
Итак, пусть числа  j построены. Тогда квазиполином (27) можно представить в виде
произведения (28) устойчивого квазиполинома первого порядка и устойчивого полинома
n  1 -го порядка. Следовательно, все корни квазиполинома (27) будут иметь
отрицательные вещественные части. Это означает, что управление (26), стабилизирующее
1
систему (25) построено. Делая обратную замену переменных   ST  Z , получаем
искомое управление
(31)
v  K Z (t   ) ,
стабилизирующее систему (23). Итак, система
Z  AZ  RK Z (t   ) ,
(32)

R
где
- вектор-столбец, а K - вектор-строка, асимптотически устойчива. Её
характеристическое уравнение имеет вид
det E  A  RK e   0 .
(33)
Характеристическое уравнение системы (22) имеет вид
det E  A  LRe   0 .
(34)
 
Очевидно, если выбрать L  ( K )   K , то корни уравнений (33) и (34) совпадут. При
таком выборе вектора L для системы (22) будет выполнено условие X (t )  0 при
t   . Но тогда для системы



Xˆ  AXˆ  BU  K y  R  X (t   )
(35)
Xˆ (t )  X (t )  0 при t   . Значит, система
по построению будет выполнено условие
(35) будет являться системой асимптотической оценки для системы (1).
Пусть теперь собственные числа неуправляемой части матрицы A лежат в левой
открытой полуплоскости комплексной плоскости. Тогда построим матрицу M , такую
что все собственные числа матрицы A  BM имеют отрицательные вещественные части.
Покажем, что управление
U (t ; Xˆ )  MXˆ (t )
(36)
стабилизирует систему (1). Для этого объединим системы (1) и (35). Получим систему 2n
уравнений вида


 X  AX  BU
.
(36)

ˆ  AXˆ  BU  K y  R X (t   )

X

Подставим сюда управление (36), тогда получим

ˆ

 X  AX  BMX
.

ˆ  AXˆ  BMXˆ  K y  R X (t   )

X

Введём переменную X (t )  Xˆ (t )  X (t ) . Исключая из последней системы величину X̂ ,
получим
 X  ( A  BM ) X  BM X
.
(37)

 X  AX  K  RX (t   )
Если выполнены сделанные ранее предположения, то система (37) асимптотически
устойчива. Таким образом, вектор
X
   0 при t   .
X
Итак, задача стабилизации системы (1) по наблюдению (20) решена и доказана следующая
теорема
Теорема. Пусть для системы (1) выполнены следующие условия:
 Система (1) стабилизируема управлением U  MX (t ) , как система с полной
информацией.
 Матрица A имеет хотя бы одно вещественное собственное число,
удовлетворяющее условию Re   1  .
 Система (23) полностью управляема.
 Уравнение n 1   2n  2     n  0 не имеет корней в правой полуплоскости или
на мнимой оси.
Тогда система (1) стабилизируема по наблюдениям (20), как система с неполной
информацией.




Related documents
Download