Будем говорить, что рассматривается выходная ошибка, если

advertisement
Методы и алгоритмы
идентификации
систем.
Конспект лекций
С давних пор человечество затрачивает огромные усилия на установление
закономерностей происходящих в природе явлений. Первичным являются результаты
наблюдений. Они представляют собой отправной пункт к модели. Создание абстрактной
модели обычно связано со «сжатием» информации, содержащейся в результатах
наблюдений. Каждый отдельный результат наблюдений является случайным, поэтому
построение адекватной модели реального объекта может быть осуществлено только на
основе многократных наблюдений. Случайность каждого результата наблюдений
объясняется, с одной стороны, принципиальной невозможностью учесть все многообразие
факторов, действующих на объект, и сложными взаимосвязями этих факторов, а с ругой
стороны, несовершенством естественных или искусственных средств наблюдений.
Построение модели по результатам наблюдений представляет собой
формализацию, необходимую для определения основных признаков, связей и
закономерностей, присущих объекту-оригиналу, и отсеивания второстепенных признаков.
Для одного и того же объекта в зависимости от конкретных требований практики и типа
решаемой задачи может быть разработан ряд моделей, осуществлена формализация
различных функций этого объекта или внешних воздействий на этот объект.
Построение модели на основании наблюдений, полученных в условиях
функционирования объекта по его входным и выходным переменным, является одним из
важных направлений в теории управления. Это направление известно как идентификация
систем.
Задача идентификации может быть сформулирована следующим образом: по
результатам наблюдений над входными и выходными переменными системы должна быть
построена оптимальная в некотором смысле модель, то есть формализованное
представление этой системы.
В зависимости от априорной информации об объекте управления различают задачи
идентификации в узком и широком смысле. Задача идентификации в узком смысле
состоит в оценивании параметров и состояния системы по результатам измерений над
входными и выходными переменным, полученными в условиях функционирования
объекта. При этом известна структура объекта и задан класс моделей, к которому данный
объект относится. Априорная информация об объекте достаточно велика.
Априорная информация об объекте при идентификации в широком смысле
отсутствует или очень бедная, поэтому приходится решать большое число
дополнительных задач. К их числу относятся: выбор структуры системы и здание класса
моделей, оценивание степени стационарности и линейности объекта и действующих
переменных, оценивание степени и формы влияния входных переменных на выходные,
выбор информативных переменных и т.д.
Объект или систему можно рассматривать как элемент, определяющий связь
между входным и выходным сигналами в соответствии со структурой, показанной на
рис.1.
n(t)
u1(t)
:
:
un(t)
Динамика системы
z1(t)
:
:
zm(t)
Неизвестная система
Рисунок 1 – Динамическая система
Чтобы определить
неизвестные динамические характеристики объекта или
системы, необходимо математически представить связь между ее входными и выходными
сигналами.
Можно определить модель как изображение существенных сторон реальной
системы (или конструируемой системы), в удобной форме отражающее информацию о
системе.
Модель не должна быть описанием фактического устройства системы. Она может
имитировать систему или «подражать» ее поведению.
Модели бывают концептуальные, физические или математические в зависимости
от того, какая сторона явления наиболее существенна, от методов, которые модно
использовать при построении модели, от количества и качества имеющейся информации.
Информация должна быть представлена в удобной форме. Если модель слишком
сложна, ее полезность становится сомнительной. Относительная простота является
главной характеристикой модели.
Среди областей применения можно выделить следующие:
- интерпретацию прошлого поведения и обобщение имеющихся знаний;
- предсказание будущего поведения, включая прогнозирование, определение
тенденций, проверку стационарности;
- накопление старых и новых знаний, когда модель, основанная на априорной
информации, обновляется и улучшается путем использования новых
измерений;
- получение таких знаний о процессе или системе, которые необходимы для
автоматического управления ими.
Классическое определение идентификации (Заде, 1962): «Идентификация состоит в
отыскании по входным и выходным сигналам некоторой системы эквивалентной ей
системы из некоторого заданного класса». В этом аспекте предполагается, во-первых,
использование априорной информации при определении структуры модели, во-вторых,
обработку данных измерений для получения необходимой апостериорной информации об
исследуемой системе. Структура модели должна выбираться на основе глубокого
изучения интересующей системы. Принцип «черного ящика», предполагающий полное
отсутствие априорной информации в большинстве случаев не приемлем и не реалистичен.
Во многих случаях построение модели начинается с использования основных
физических законов для описания исследуемого объекта. Из этих законов следуют
различные соотношения между рассматриваемыми переменными. Если известно
состояние всех внешних и внутренних по отношению к системе условий и физическая
модель системы является полной, то, по крайней мере, в принципе можно определить
числовые значения всех коэффициентов уравнений.
Априорное знание об объекте обычно ограничено неопределенностью описания
среды и неполнотой физической модели объекта. В результате построение модели объекта
сводится к следующим этапам:
1. выбор структуры модели из физических соображений;
2. подгонка параметров к имеющимся данным (оценивание);
3. проверка и подтверждение модели (диагностическая проверка);
4. использование модели по ее назначению.
Используя формулировку Заде, необходимо определить:
1. класс систем   {S} ;
2. класс входных сигналов U ;
3. понятие «эквивалентности».
Эквивалентность обычно понимается в смысле какого-либо критерия ошибки или
функции потерь, являющейся функционалом от выхода объекта y и выхода модели yМ, т.е.
E  E( y, y M ) (1)
Говорят, что две модели М1 и М2 эквивалентны, если значения функций потерь для
этих моделей одинаковы, то есть
E ( y, y M 1 )  E ( y, y M 2 ) (2)
Существует большая свобода в постановке задачи идентификации. На выбор
класса моделей  , класса входных сигналов U и критерия сильно влияет априорная
информация об объекте и цель идентификации. Модель дает информацию трех видов:
1. о структуре в форме математических тождеств, блок-схем, сетей или
графов, матриц связи;
2. значения параметров, то есть величины не зависимые от входов
(независимые величины);
3. значения зависимых переменных (состояний) в фиксированный момент
времени или как функций потерь времени.
Часто подразумевается, что идентификация начинается из «ничего» без всякой
априорной информации об объекте. Но в большинстве технических задач такое
предположение не реалистично; из структуры объекта и по крайней мере частичного
понимания его функционирования можно извлечь определенную априорную информацию
и, в частности, вид структуры модели. В этом случае остается лишь получить
информацию о числовых значениях ряда параметров (коэффициентов дифференциальных
уравнений, описывающих динамику объекта, коэффициентов линейной или нелинейной
модели объекта и т.д.) и (или) состояний.
Под оцениванием параметров понимается экспериментальное определение
значений параметров, характеризующих динамику поведения объекта, в предположении,
что структура объекта известна.
Если исследователя интересует непрерывная информация о состоянии объекта,
говорят о задаче оценивания состояний. Грубо говоря, состояние объекта – это
переменная (например, вектор), которая вместе с входным сигналом объекта полностью
определяет его дальнейшее поведение.
Оценивание (параметров и (или) состояний) предполагает определенную структуру
модели.
Будем говорить, что рассматривается выходная ошибка, если
e  y  y M  y  M (u), (3)
где через M(u) обозначается выходной сигнал модели, на вход которой подается сигнал u
(рисунок 1).
Если
e  u  u M  u  M 1 ( y), (4)
где через uM обозначен вход модели, выходной сигнал которой равен y, то говорят, что e –
входная ошибка (рисунок 2). Обозначение М-1 предполагает, что модель обратима, то есть
грубо говоря, для заданного выходного сигнала всегда можно найти единственный
входной сигнал.
С точки зрения теории оценивания использование входной ошибки естественно
тогда, когда помеха представляет собой белый шум на входе системы.
Объект
n
Динамика
объекта
u
Модель
y
+
yM
-
e
Рисунок 2 - Ошибка выхода
Объект
n
u
y
Динамика
объекта
+
uМ
е
-
Обратная
модель
Рисунок 3 - Ошибка входа
Объект
n
u
y
Динамика
объекта
Обобщенная модель
М1
е
+
М2-1
Рисунок 4 – Обобщенная ошибка
В общем случае ошибку можно определить как
e  M 1 2 ( y)  M 1 (u ), (5)
где M-12 представляет собой обратную модель.
Этот тип модели и ошибки называют обобщенной моделью и обобщенной
ошибкой.
Другой тип задачи идентификации получается при вложении задачи
идентификации в семейство вероятностных задач. Если  - параметрический класс,
  S  , где  - параметр, то задача идентификации сводится к задаче оценивания
параметра. Такая постановка делает возможным использование теории оценивания и
теории принятия решений. В частности, можно использовать такие методы как метод
максимального правдоподобия, байесовские методы, минимаксные методы. Можно
задавать точность оценок параметров, проверять различные гипотезы. Многие
вероятностные задачи оценивания можно свести к задаче оптимизации. Но в этом случае
функция потерь определяется из вероятностных соображений.
Общие аспекты задачи оценивания параметров
Теория оценивания и идентификации основывается на математическом описании
связи между несколькими (множеством) входами и (множеством) выходами объекта,
заданными как функции времени.
Задаче оценивания можно дать следующее схематичное описание:
На объект и модель действует один и тот же входной сигнал. Сравниваются
искаженный помехой выходной сигнал объекта и выходной сигнал модели. Необходимо
определить оптимальный способ корректировки модели. Значения параметров
непосредственному наблюдению недоступны. Таким образом, критерием выбора
оптимума должен быть функционал от выходных сигналов или от математического
ожидания ошибок оценок параметров. Выходной сигнал функционально связан с
числовыми значениями параметров. Критерием часто является скалярная функция потерь.
Схема оценивания частично определяется видом имеющихся сигналов. При выборе
способа описания сигнала нужно учитывать:
1. представление об информационной емкости сигналов;
2. возможность использования сигналов для исследования динамических
характеристик объекта.
Сигналы могут быть непрерывными во времени (невыборочными) и выборочными
(импульсными). Эта классификация отражает свойства сигналов как функций времени. С
помощью соответствующих приемов непрерывный сигнал может быть преобразован в
импульсный и наоборот, если частота квантования fs удовлетворяет условию Уиттекера Шеннона: f s  2 f h , где fh – максимальная частота ограниченного спектра непрерывного
сигнала. При выполнении этого условия квантование не уменьшает содержащееся в
сигнале количество информации.
Априорная информация об объекте отражает сведения о структуре объекта и о
возможных значениях параметров физической или математической (априорной) модели.
Наличие априорной информации может на порядок изменить сложность реализации
модели и соответствующие затраты. То же самое относится к выбору между линейными и
нелинейными моделями. Какое-то представление о скорости изменения параметров
является совершенно необходимым, так как оно может определять реализацию метода.
Теоретически идея черного ящика представляется привлекательной, однако она
приводит к очень продолжительным процедурам, так как пренебрегает частью имеющейся
информации. На практике во многих ситуациях, кроме выходного сигнала объекта, можно
измерять и другие характеристики. Исходя из априорной информации об объекте и цели
оценивания, обычно ясно, что требовать от модели. Существует много различных типов
моделей. Для любой модели требования реализации процедуры оценивания состоят в том,
чтобы:
1. оценки были точными, на их качество мало влияли аддитивные помехи и
неучтенные нелинейности;
2. оценки получались быстро, что связано с требованием устойчивости
системы;
3. оценки должны быть экономически обоснованы, то есть необходимо
использовать доступное оборудование.
Отсюда следуют требования к системе оценивания, которая должна быть:
1. формализуемой;
2. легко реализуемой;
3. достаточно общего вида;
4. приводить к оптимальным оценкам;
5. обеспечивать приемлемую скорость сходимости.
Задача идентификации может быть поставлена как задача оптимизации. Часто
критерий записывается как функционал ошибки
T
E ( y, y M )   e 2 (t )dt , (6)
0
где y – выход объекта, yM - выход модели, а e – ошибка. y, yM и e рассматриваются
как функции, определенные на (0, Т). Этот критерий можно интерпретировать как
критерий наименьших квадратов для ошибки e.
Рассмотрим случай выборочных измерений функции непрерывного времени.
Символами u, ui, y, n и yM обозначены векторы соответствующих выборок (например, y’ =
[y(Ts), y(2Ts), ..., y(kTs)]).
Символами b и  обозначим соответственно векторы параметров объекта и модели:
b  [b0 , b1 ,, bm ]
(7)
   [  0 ,  1 ,,  m ].
Отсюда находим
y  y (u , b, n),
(8)
y M  U ,
где
u 0 (1) u m (1) 
U  [u 0 , u 1 ,, u m ]  
 
u 0 (k ) u m (k )
Решения задач теории оценивания можно дифференцировать по способу
реализации процедур. Можно выделить два основных способа реализации:
1. Моделирование математических соотношений, выражающееся в задании
набора числовых параметров. Этот тип реализации называется реализацией,
использующей явные математические выражения.
2. Моделирование структуры (физической или математической) модели,
параметры которой меняются так, чтобы характеристики модели были в
каком-либо смысле близки к характеристикам исследуемой системы. В этом
случае реализация называется реализацией по настраиваемой модели.
Формально различие между указанными способами реализации состоит в
следующем. Пусть выход объекта задается уравнением
y(t )  f (u, b, n), (9)
а выход модели yM описывается уравнением
y M (t )  f (u, β,0), (10)
где b – (m+1)-мерный вектор параметров объекта;
 – (m+1)-мерный вектор оценок;
u = u(t) – входной сигнал объекта и модели;
n = n(t) – помехи (возмущения);
f – функциональная связь между входной и выходной переменными.
Это означает, что объект и его модель предполагаются подобными по структуре и что
помехи не меняют вида модели.
Допустим, что мера близости объекта и модели определяется функционалом
ошибки
Ey, y M ; β 
t
 y(t )  y
(t; β) dt (11)
2
M
t T
Теперь можно поступить двояко.
1. Положить
E
 0 при i=0, 1, …, m. (12)
 i
Это необходимое условие достижение минимальной ошибки. Получаем систему из m+1
уравнений с m+1 неизвестными оценками (0, …, m), которую можно решить
относительно , использовав реализацию первого типа.
2. Положить
E
 0 при i=0, 1, …, m. (13)
 i
Указанные типы реализации процедур оценивания получили несколько разных
наименований:
Тип 1
Тип 2
1. с
использованием
явных
1. с настройкой модели;
математических выражений;
2. явные методы;
2. неявные методы;
3. методы по разомкнутому контуру;
3. методы по замкнутому контуру;
4. прямые методы;
4. итеративные методы.
5. с накоплением;
6. с
выдачей
окончательного
результата.
Решение
Решение
1. получается в результате выполнения
1. получается
после
выполнения
конечного
числа
элементарных
бесконечного числа элементарных
операций;
операций;
2. требует значительной памяти;
2. требует меньшей памяти;
3. не
может
быть
получено
3. может быть получено приближенно,
приближенно
как
результат
как
результат
промежуточных
промежуточных вычислений;
вычислений;
4. по отношению к оценке получается в
4. по отношению к оценке получается в
разомкнутом контуре.
замкнутом контуре
Задачу оценивания параметров объекта можно рассматривать как исследование
параметров распределения или параметров связи. Последнее естественно, когда u и y
представляют входной и выходной сигналы объекта. Интерпретация
оценивания
параметров объекта как оценивания параметров распределения связана с использованием
метода максимального правдоподобия. Ожидаемые результаты оценивания могут быть
самыми разными в зависимости от характера прикладной задачи и доступной априорной
информации. Рассмотрим описание объекта в пространстве состояний:
x  f (x , u , b),
(14)
y  g (x , u , b, n),
где
u = u(t) – входной сигнал,
y = y(t) – выходной сигнал,
n = n(t) – помеха,
x = x(t) – вектор состояния объекта,
b – вектор параметров объекта,
 b0 
 x1 (t ) 


x (t )    , b    . (15)
bm 
 xn (t )
Уравнения модели имеют тот же вид:
ξ  f (ξ, u, β),
(16)
y M (t )  g (ξ, u, β,0),
где  = (t) – вектор состояния модели,  - вектор параметров модели.
Задачу оценивания параметром можно сформулировать как задачу минимизации:
Минимизируемая величина
Параметр
Состояние
Функция (функционал) от измеримых E{ y(t; b)  y M (t; β)}
E{ y(x)  y M (ξ)}
величин, а именно от разности выходных
сигналов объекта и модели
Математическое ожидание [] функции
 [ E{x   }]
 [ E{b  β}]
(функционал) от неизмеримых величин, а
именно параметров и (или) состояния
объекта
Некоторая функция (функционал) e = y – yM, может быть минимизирована, так как
программированием модели на ЭВМ ошибка может быть сделана измеримой.
В зависимости от модели и входного сигнала эта ошибка определяет некоторую
меру соответствия между векторами параметров и (или) состояний объекта и модели. В
некоторых случаях соответствие между входом и выходом важнее соответствия
параметров, в частности, если модель проще (более низкого порядка), чем объект.
Очевидно, что величины b и x нельзя непосредственно измерить. Таким образом, можно
минимизировать только математические ожидания E{b - } или E{x - }. Однако это
возможно только тогда, когда имеется какая-то априорная информация о распределениях
вероятностей.
Основной задачей является отыскание оптимальной или наилучшей процедуры
оценивания. В литературе по математической статистике описан ряд различных процедур
оценивания. Эти методы отличаются, прежде всего, по используемому критерию
оптимальности и имеющейся априорной информации. Выбор критерия оптимальности
более или менее субъективен, а получающиеся алгоритмы существенно зависят от
сделанного выбора.
Можно поставить задачу как отыскание оценок  вектора параметров b по
наблюдениям y. Основываясь на априорной информации, можно выделить следующие
виды оценок.
Оценивание по методу наименьших квадратов
Достоинством метода является то, что не требуется никакой априорной
информации. Критерий ошибки определяется как
k
E  eIe   e 2 ( j ),
j 1
(17)
e  y  yM .
Здесь I – единичная матрица. Минимизируя критерий ошибки, получаем систему
нормальных уравнений для оценивания параметров:
βˆ  [U U] 1 U y (18)
U’ – транспонированная матрица U.
Марковские оценки или оценивание
по обобщенному методу наименьших квадратов
Предположим, что известна ковариационная матрица аддитивного шума
nn(1)n(1)n(k )] 
. (19)
N  nn  



n(k )n(1) n(k )n(k )
Можно доказать, что при N  I наилучшая линейная оценка получается
минимизацией выражения
E  eN 1 e , (20)
что приводит к следующему правилу оценивания:
βˆ  [U N -1 U] 1 U N -1 y (21)
(марковская оценка или оценивание по обобщенному методу наименьших квадратов).
Оценивание методом максимального правдоподобия
Задачу оценивания можно рассматривать как исследование параметров
распределения вероятностей. Априори известно, что выборочные значения вектора
выхода y являются случайными величинами с совместным распределением вероятностей
p{y(1), ..., y(k); b}, (22)
зависящим от вектора параметров b. Апостериори (после измерений) становятся
известными реализации этих случайных величин: y(1)=c1, ..., y(k)=ck. По ним определим
оценку . Функциональная связь между c  {c1 ,, ck } и  определяется формулой (22).
Чтобы подчеркнуть, что формула (22) связывает реализацию выборочных значений с
вектором параметров , перепишем ее в виде
L{c1 ,, ck ; β} . (23)
Эта функция называется функцией правдоподобия. Так как выборочные значения
определяются в результате измерений, L является функцией только . Удобнее
рассматривать ln(L) (вследствие монотонности логарифма максимумы L и ln(L)
достигаются при одном и том же значении ). Это значение  можно найти из уравнения

  ln L{c; β}   ˆ 
ln L{c; β}   ˆ  0. (24)

Решение этого уравнения β̂ называется оценкой максимального правдоподобия вектора b,
если β̂ действительно зависит от выборочных значений c1, ..., ck. В этом случае
необходимо знать не только ковариационную матрицу помехи, но и вид совместного
распределения вероятностей выборочных значений.
Оценивание по минимальному среднему риску
В этом случае необходима еще большая априорная информация. Должны быть
заданы плотности распределения вероятностей u, n и b.
Дополнительная априорная информация приводит к улучшению оценки, однако
затраты на реализацию могут быть чрезмерными.
Какие бы методы оценивания не использовались, они должны опираться на
случайные наблюдения, случайность которых связана с наличием случайных помех.
Следовательно, любая оценка, являющаяся функцией этих случайных наблюдений, тоже
является случайной величиной.
Методы оценивания по настраиваемой модели
Ошибку можно определить как e(t )  y(t )  y M (t ) , а критерий ошибки – как
минимизацию любого четного функционала этой ошибки, например
t2
E   e 2 (t , b,  )dt , (25)
t1
где b – параметр рассматриваемого объекта, а  - соответствующий параметр
модели.
Направление оптимальной настройки указывается знаком первой производной по
. Для непрерывных сигналов
t2
E
e
 E 
 2  e(t , b,  )
dt. (26)



t1
y
e
E
  M нельзя измерить непосредственно без дополнительных
, ни



приспособлений. Если удастся найти эти частные производные, то для определения
наилучшего значения  можно использовать градиентные методы.
Для выборочных сигналов в том случае, когда выбранное описание адекватно
представляет поведение исследуемого объекта
y  Ub  n (объект ),
(27)
y M  U ( модель)
следовательно, ошибка определяется как
e  y  y M  U (b   )  n. (28)
Квадратичная форма
E  ee (29)
достигает минимума при b=.
Хорошая стратегия получается, если положить
    E (30)
Такой выбор приводит к градиентному методу. Г – коэффициент усиления, от
которого зависит скорость сходимости. Коэффициент Г можно выбирать как постоянным,
так и зависящим от времени, он может быть скалярным или матрицей.
Если пользоваться дискретной схемой
 (i  1)   (i)  (i)  E (i), (31)
Ни
где (i) – вектор параметров модели после i-ой настройки; E(i) – значение
функционала на i-м наборе ошибок; Г(i) – коэффициент усиления, определяющий
скорость сходимости алгоритма.
Методы получения частных производных и градиентов
Имеются следующие подходы:
1. Использование коэффициентов влияния параметров или коэффициентов
чувствительности параметров
2. Использование двух моделей с параметрами  и (+)
3. Использование модели с возмущаемым параметром
4. Использование обобщенной модели.
Использование коэффициентов влияния параметров или коэффициентов
чувствительности параметров
Рассмотрим модель первого порядка с одним неизвестным параметром  и
выходным параметром yМ=w:
dw
 w  u. (32)
dt
Ошибка e=y-w. Отсюда e
  w . Так как нас интересует поведение модели


на всей временной оси    t   , начальные условия не имеют значения. Формально
w=w(t, ), тогда
w
1 2w
w(t ,  )  w(t ,  0 ) 



( ) 2   (33)
0
2 0

2! 
Оставив только члены первого порядка малости, величину w можно

определить, продифференцировав по  дифференциальное уравнение (32):
2w
w

 w  0 (34)
t

Меняя порядок дифференцирования и делая замену v  w , находим

v
  v   w (35)
t
Это уравнение называется уравнением чувствительности по . Для переменного 
величина v является оценкой градиента w , который в этом случае не зависит от

времени.
Использование двух моделей с параметрами  и (+)
Оценку первой производной по  можно найти, если использовать две модели с
параметрами  и (+) соответственно. Разность выходных сигналов этих моделей w1 и
w2 дает величину w
, которую можно использовать как оценку e
в
  e



уравнениях (26), (30) и (31).
Использование модели с возмущаемым параметром
Этот метод основывается на соотношении
dE E  E
, (36)


dt  t
t
из которого следует, что если величина параметра модели определяется
возмущением, заданным известной функцией времени – пробным сигналом, а
возникающее возмущение производной dE
информацию о величине E

dt
может быть измерено, то можно получить
.
Использование обобщенной модели
Все перечисленные выше методы вычислений E
и w или их оценок


предъявляют серьезные требования к технической реализации и машинным процедурам.
Эти трудности возрастают, если определению подлежит ряд параметров. Вообще говоря,
для каждого оцениваемого параметра необходима еще одна модель или еще один
возмущающий пробный сигнал. Поэтому часто рассматривают случай, когда ошибка
является линейной функцией настраиваемых параметров:
n
m
i 0
j 0
e   i yi    j u j . (37)
В этом случае
e
e
 yi ,
 uj,
 i
 j
то есть коэффициенты чувствительности входят в модель в явном виде.
Объект
n
u
y
P
F0
u0
0
0
i
Fj
Fm
uj
um
j
m
y0
yi
G0
Gi

n
yn
Gn
e
M
Рисунок 5 – Модель линейной функции настраиваемых параметров
Входной сигнал стационарен и в большинстве случаев считается случайным
процессом.
Блоки F0, …, Fm и G0, …, Gn представляют собой операторы (например,
передаточные функции для линейных систем, нелинейные операторы). Эти блоки вместе с
потенциометрами 0, …, n и 0, …, m и сумматором образуют обобщенную модель
объекта. Потенциометры позволяют осуществить настройку положительных и
отрицательных значений коэффициентов. Выходную ошибку e(t) называют обобщенной
ошибкой.
Оценивание параметров и состояний
В ряде приложений понятие состояния играет важную роль. Это особенно
справедливо для задач оптимального управления. Так как состояние объекта не поддается
непосредственному измерению, а измеримые величины искажены помехами, состояние
объекта может быть оценено. Полное решение задачи оценивания получено для линейных
объектов, динамические свойства которых полностью известны. Для нелинейных
объектов предложено много приближенных схем.
Задача становится более сложной, если параметры объекта заранее неизвестны и
должны оцениваться вместе с состояниями.
УПРАВЛЯЕМОСТЬ, НАБЛЮДАЕМОСТЬ, ИДЕНТИФИЦИРУЕМОСТЬ
Объект называется управляемым, если можно найти такой вектор управления,
который из произвольного начального состояния переводит систему в произвольное
конечное состояние за ограниченное время.
Объект называется наблюдаемым, если по измерениям выходного сигнала объекта
можно определить его состояние.
Объект называется идентифицируемым, если по измерениям координат состояния
объекта можно определить матрицу коэффициентов модели.
Модели объектов: линейные с постоянными и переменными
параметрами, нелинейные
Первый из признаков, по которому различают модели, - их линейность или
нелинейность, а также является модель параметрической или непараметрической. Для
теории идентификации важны такие понятия, как управляемость, наблюдаемость и
идентифицируемость.
Классы моделей
Описание поведения объектов с помощью дифференциальных уравнений
заимствовано из классической механики. Связь между входной величиной u  u (t ) и
выходом y  y (t ) рассматривается в виде уравнения
dny
dy
d nu
du
a0 n    a n 1
 a n y  b0 n    bn1
 bn u  c (38)
dt
dt
dt
dt
i
вместе с начальными условиями для d y(0) i , i  0,1,, n  1 . Если в объекте
dt
имеется чистое запаздывание, то u  u (t   ) . Один из коэффициентов можно выбрать
произвольно, например a0=1.
В линейном случае коэффициенты ai и bi не зависят от u и y и их производных.
Если, кроме того, они не зависят от времени, то получается уравнение с постоянными
коэффициентами. Это самый простой случай. Если эти коэффициенты зависят от времени,
то уравнение называется линейным уравнением с переменными коэффициентами или
нестационарнолинейным. Если какие-либо коэффициенты из коэффициентов ai или bi
зависят от u или y или их производных, то объект называют нелинейным.
Основное отличие между линейными и нелинейными объектами состоит в том, что
для нелинейных не выполняется принцип суперпозиции. Согласно этому принципу, если
y1 – выходной сигнал, обусловленный входом u1, а y2 – выходной сигнал, обусловленный
входом u2, то при подаче на объект сигнала u1+u2 на выходе наблюдается сигнал
y1+y2.
Для объектов важно знать следующие зависимости: соотношение между входным
и выходным сигналами и связь этих сигналов с переменными состояния объекта.
Выражение F (u, u, u,, u ( m) , y, y , y, y ( n ) )  0, где F – аналитическая функция,
характеризует связи первого типа. Так как дифференциальное уравнение выражает неявно
связь между входным и выходным сигналами, нужно найти явное выражение y(t) как
функции u(t).
u( )t (39)
y(t )  
Оператор О может быть функционалом, то есть правилом, которое каждой
функции в заданном интервале ставит в соответствие определенное число.
Частные случаи функционала О:
1. F  y  bu  0 - случай линейной связи между u(t) и y(t), объект не
содержит инерционных элементов. Такие системы называются линейными
системами без памяти. В этом случае функционал сводится к линейной
функции от u:
y (t )  bu (t ) (40)
2. F  y  a1 y  a2 y  u  b2u  0, a1 , a2 , b2  константы .
y(t) может быть записана в виде функционала
t
y (t ) 
 h(t   )u ( )d
(41)

Объект содержит инерционные элементы, играющие роль памяти, так что имеется
зависимость от предыдущих значений u(t). Такие системы называют линейными
системами с памятью.
3. F  y  ay 3  u  0, a  const
Между входом и выходом имеется нелинейная связь. Функционал сводится к
функции
y(t )  O[u ( )]t  g{u (t )} (42)
Эту функцию можно найти подстановкой, итеративным методом или разложением
в ряд Тейлора. Для рассматриваемого примера
y  u  au 3  3a 2 u 5  12a 3u 7  . (43)
4. F  y  a1 y  a2 y  f ( y)  u  0, a1 , a2  константы
Это уравнение описывает поведение нелинейного объекта с памятью (см. рис. 6).
u(t)
+
-
1
D  a1 D  a 2
f(y)
Нелинейный
элемент
y(t)
2
Рисунок 6 – Нелинейная динамическая система с памятью
Для получения явного описания можно использовать разложение в ряд Вольтера:
t
y (t ) 
t
 h (t   )u ( )d    h (t  
1
2

t
t
t
t
   h (t  
3
1
, t   2 )u ( 1 )u ( 2 )d 1 d 2 
  
1
(44)
, t   2 , t   3 )u ( 1 )u ( 2 )u ( 3 )d 1 d 2 d 3  
   
Возможно описание системы в функциональном пространстве и описание в
пространстве параметров. В первом случае используется идея преобразования,
определенного на функциональном пространстве, в котором можно описать входной
сигнал объекта. На фиксированном интервале времени сигнал представляется одной
точкой функционального пространства. Можно также получить представление сигнала,
используя скользящий интервал на временной оси. Этому случаю соответствует кривая в
функциональном пространстве. Примерами таких представлений могут служить
разложение в ряд Фурье, разложение по прямоугольным сигналам, разложение в ряд по
функциям Лагерра. Преобразование в функциональном пространстве определяется
динамикой объекта. Выходной сигнал объекта можно описать в таком пространстве или
представить точкой в одномерном пространстве уровней сигнала. В этих терминах задача
оценивания состоит в том, чтобы определить преобразование функционального
пространства входных сигналов в функциональное пространство выходных сигналов.
Этот подход относится к методам, использующим идею черного ящика, так как не
учитывает информацию о физической природе объекта, о его гипотетической модели.
Описание в пространстве параметров основано на предполагаемой математической
модели динамики объекта. Такое описание представляет собой параметрическую модель
конечной размерности. Координатами пространства параметров являются числовые
значения величин, определяющих выход модели. Если внешние силы отсутствуют, то зная
точку пространства параметров, можно предсказать поведение выхода системы. При
наличии внешних сил добавление неизвестных параметров этих сил увеличивает
размерность пространства параметров. Различают:
1. непараметрические модели (весовые функции, передаточные функции,
ковариационные функции, спектральные плотности, ряды Вольтерра)
2. параметрические модели (дифференциальное уравнение заданного порядка,
модели в пространстве состояний)
Параметрические модели могут приводить к большим ошибкам, если порядок
модели не соответствует порядку объекта. Преимущество непараметрических моделей
состоит в том, что они не требуют явного знания порядка объекта. Однако в этом случае
описание является по существу бесконечномерным, а это часто означает возможность
построения модели, выход которой точно повторяет выход объекта.
ЛИНЕЙНЫЕ МОДЕЛИ
Описание «вход-выход»
В соответствии с принципом суперпозиции динамика линейного объекта может
быть описана специальными функциями времени: импульсной переходной функцией или
весовой функцией и (или) реакцией на единичный скачок. Эти функции являются
решениями дифференциального уравнения (38) при нулевых начальных условиях и u(t),
равной


u (t )   (t )


 (t )  0 при t  0единичная импульсная функция



 (t )dt  1

u (t )  0 для t  0
функция единичного скачка
u (t )  1 для t  0 
Физически любая функция времени u(t) может быть представлена как комбинация
таких импульсов и скачков.

t
0

y(t )   h( )u (t   )d   h(t   )u ( )d (45)
h(t) называется весовой функцией.
Для определения h(t) можно воспользоваться следующей процедурой. Рассмотрим
выражение (45) как предполагаемую модель. Дифференцируя это выражение можно найти
все производные, которые входят в выражение (38). Подставляя эти производные в (38) и
приравнивая коэффициенты, получим выражение для h(t).
Для описания динамики объектов, которые характеризуются выборочными
значениями входных и выходных сигналов, вместо дифференциальных уравнений можно
воспользоваться разностными уравнениями.
Обозначим через u (k )  u (k ) и y (k )  y (k ) выборочные значения входного и
выходного сигналов соответственно. Тогда разностное уравнение может иметь вид:
a0 y(k )  a1 y(k  1)    an y(k  n)  b0 u(k )    bm u(k  m) (46)
Необходимо задать начальные условия. Коэффициент a0 может быть выбран
произвольно, например, a0=1. Для линейной системы с постоянными коэффициентами
справедлив принцип суперпозиции, поэтому динамика объекта может быть описана
весовой функцией h(k), реакцией на единичный импульс. Интеграл свертки заменяется
суммой:
y (k ) 
k
 h(k  i)u (i)
(47)
i  
Выражение для h(k) получается также как в непрерывном случае.
Для устойчивых объектов, если h(i )  0 при i  L , достаточно ограничится лишь
конечным числом значений весовой функции.
L
y (k )   h(i )u (k  i ), k  L (48)
i 0
В этом случае поведение системы характеризуется набором величин {h(0), …, h(L)}.
Введем оператор сдвига во времени z:
zy (k )  y (k  1)
и
(49)

Y ( z )   y (k ) z k
k 0
Тогда разностное уравнение (46) можно переписать в виде:
{a 0 z k  a1 z k 1    a n z k  n }Y ( z )  {b0 z k  b1 z k 1    bm z k  m }U ( z ) (50)
Обе части этого уравнения можно поделить на zk. Из уравнения (50) следует, что
Y ( z ) b0  b1 z    bm z m
H ( z) 

(50)
U ( z ) a0  a1 z    a n z n
Величину H(z) называют импульсной (выборочной) передаточной функцией.
Описание в пространстве состояний
x  Ax  Bu  уравнениесостояний
(51)
y  Cx  Du  уравнение выхода
Для случая выборочных сигналов
x(k  1)  Ax(k )  Bu (k )  уравнениесостояний
(52)
y (k )  Cx(k )  Du (k )  уравнение выхода
НЕСТАЦИОНАРНЫЕ ЛИНЕЙНЫЕ МОДЕЛИ
Описание «вход-выход»
t
y (t ) 
 h(t , )u ( )d
(53)

Описание в пространстве состояний
x (t )  A(t ) x(t )  B(t )u (t )  уравнениесостояний
(54)
y (t )  C (t ) x(t )  D(t )u (t )  уравнение выхода
Для выборочных сигналов представление в пространстве состояний имеет вид
x(k  1)  A(k ) x(k )  B(k )u (k )  уравнениесостояний
(55)
y (k )  C (k ) x(k )  D(k )u (k )  уравнение выхода
НЕЛИНЕЙНЫЕ МОДЕЛИ
В случае линейной модели знания одной функции времени, характеризующей
объект (весовой функции), достаточно для определения выходного сигнала объекта при
произвольных входных сигналах. Это обеспечивает преимущества, которые хотелось бы
сохранить при описании нелинейных объектов:
1. возможность явно записать связь между входом и выходом;
2. простота описания соединений систем;
3. возможность рассмотрения случайных сигналов.
Для некоторых классов нелинейных систем эти требования выполняются при
использовании рядов Вольтерра.
Используя ряды Вольтерра, ядра которых представляют собой весовые функции
высших порядков, можно получить описание нелинейного объекта, допускающее ясную
физическую интерпретацию. Достоинство этого метода состоит в том, что нелинейная
система рассматривается как непосредственное обобщение линейного случая, хотя сам
объект может существенно отличаться от линейного.
Анализ и синтез с помощью рядов Вольтерра является наиболее удобным из
существующих методов изучения нелинейных систем.
Кроме разложения в ряды Вольтерра, существует также несколько других способов
описания нелинейных объектов:
1. функциональное
разложение
с
функциональными
свойствами
n
y (t )   Gi [ g i , u (t )], где Gi [ g i , u (t )] является функционал ом от u(t), g i функi 1
ции n переменных, которые не совпадая с ядрами Вольтерра, могут быть
сопоставлены им.
2. способ описания Винера. Используются ортогональные функции Лагерра и
полиномы Эрмита.
ЛИНЕЙНЫЕ ОДЕЛИ «ВХОД-ВЫХОД»
В целях упрощения предположим, что
1
Система имеет единственный вход и единственный выход;
2
Система является линейной и стационарной;
3
Аддитивная помеха, действующая на выходной сигнал системы, не
зависит от входного сигнала и представляет собой стационарный
случайный процесс.
n(t)
Неизвестная
система
u(t)
+
g(t)
+
z(t)
Рисунок 6 – Модель для идентификации линейной системы с одним
входом и одним выходом
Тогда задача сводится к определению одной из следующих характеристик:
1 Импульсной переходной или весовой функции g(t);
2 Частотной характеристики G(j)
3 Передаточной функции G(s).
Частотный анализ
ЧАСТОТНАЯ ХАРАКТЕРИСТИКА
При отсутствии помех выходной сигнал системы y(t) выражается через входной
сигнал u(t) и импульсную переходную функцию g(t) с помощью интеграла свертки

y (t )   g ( )u (t   )d
(56)
0
Предположив, что входной сигнал синусоидален, u(t) можно представить в виде
u (t )  A exp((  j )t )  A exp( st )
где A – амплитуда,  - угловая частота. Подставляя выражение в интеграл свертки,
получим



0
0
0
y(t )  A g ( ) exp( st ) exp( s )d  A exp( st )  g ( ) exp( s )d  u (t )  g ( ) exp( s )d (57)
Отношение преобразований Лапласа выходного и входного сигналов, которое
называется передаточной функцией системы, может быть представлено в виде

( y(t )) Y ( s)

 g ( ) exp( s )d (58)
(u (t )) U ( s) 0
Этот интеграл не зависит от времени t и определяет передаточную функцию
системы G(s) через ее импульсную переходную функцию g(t). Если в формуле (58) в
качестве аргумента преобразований Лапласа подставить комплексную переменную j, то
получится установившееся значение частотной характеристики системы

Y ( j )
G( j ) 
 g ( ) exp(  j )d (59)
U ( j ) 0
Поскольку импульсная переходная функция системы g(t) должна быть равна нулю
при t<0, то нижний предел интегрирования можно продлить до -, так что
G( s) 
G ( j ) 

 g ( ) exp(  j )d
(60)

Рассматривая комплексную величину G ( j ) как вектор, можно получить
представление G ( j ) в полярных координатах
Y ( j )
G ( j ) 
ˆ M ( )  отношение амплитуд или амплитудная характеристика,
U ( j )
(61)
Y ( j )
G ( j )  
ˆ  ( )  фазовый сдвиг или фазовая характеристика.
U ( j )
Здесь передаточная функция определяется на основе частотного анализа.
ЧАСТОТНЫЙ АНАЛИЗ МЕТОДОМ ДИАГРАММ БОДЕ
Передаточная функция стационарной линейной системы обычно записывается в
виде отношения двух многочленов от s:
bm s m    b1 s  b0
G( s) 
(62)
a n s n    a1 s  a0
При отсутствии комплексных полюсов и нулей выражение (62) можно разложить
на элементарные дроби вида
k
k
k
(63)
G( s)  1  2    n ,
s  s1 s  s 2
s  sn
где s1, s2, …, sn – полюсы, а k1, k2, …, kn – вычеты G(s). Такое разложение называют
разложением Хевисайда, которое является чрезвычайно полезным при вычислении
обратного преобразования Лапласа.
Вторую форму записи можно получить посредством факторизации числителя и
знаменателя передаточной функции:
K (s  c1 )( s  c2 ) ( s  cm )
G( s) 
. (64)
(s  s1 )( s  s 2 ) (s  s n )
Здесь c1, c2, …, cm – нули G(s), а K – коэффициент усиления. Такое представление
называют разложением Боде или полюсно - нулевым представлением.
Частотную характеристику удобно представлять с помощью диаграммы Боде,
потому что
1. амплитудную характеристику G(j) можно аппроксимировать кусочнолинейной ломаной;
2. поскольку масштаб изменения частоты  логарифмический, то в диаграмму
укладывается широкий диапазон значений ;
3. умножение амплитуды частотной характеристики G(j) на диаграмме Боде
сводится к простому сложению.
АНАЛИЗ ПЕРЕХОДНЫХ ПРОЦЕССОВ
Аппроксимация частотной характеристики с помощью конечной суммы
Если известна импульсная переходная функция системы, заданная, например,
набором ординат, представляющих собой значения g(t) в точках t=i, i=0, 1, 2, …, , где период выборки, то выражение (60) может быть приближенно представлено суммой вида

G ( j )    g (i ) exp(  j (i ))
(65)
i 0
Используя формулу Эйлера, можно представить экспоненту в виде
exp(  j (i ))  cos(i )  j sin( i )
(66)
Подстановка выражения (66) в (65) дает


i 0
i 0
G ( j )    g (i ) cos(i )  j  g (i ) sin( i )
(67)
Если система асимптотически устойчива, так что g(t)0 при t, то импульсная
переходная функция может быть усечена при некотором t=n. Тогда выражение (67)
преобразуется к виду
n
n
i 0
i 0
G ( j )    g (i ) cos(i )  j  g (i ) sin( i )
(68)
Период выборки  нужно определить так, чтобы не пропустить резких изменений
g(t).Чтобы получилось хорошее согласие с истинной частотной характеристикой, период
выборки по теореме выборки должен удовлетворять следующему неравенству:
ПЕРИОД ВЫБОРКИПОЛОВИНА РАССМАТРИВАЕМОЙ ЧАСТОТНОЙ
ОБЛАСТИ
Отсюда следует, что если рассматриваемая область частот задается в виде
максимальной частоты  , то наибольший период выборки, при котором имеет место
хорошее согласие с истинной характеристикой, равен
(69)
  2 / 
Определение частотной характеристики прямым методом подгонки Леви
Передаточная функция линейной динамической системы может быть представлена
в виде отношения двух многочленов от частоты.
Пусть форма идентифицируемой передаточной функции
b  b ( j )  b2 ( j ) 2    bm ( j ) m
Gˆ ( j )  0 1

1  a1 ( j )  a 2 ( j ) 2    a n ( j ) n
(70)
(b0  b2 2  b4 4  )  j (b1  b3 2  b5 4  )   j N ( )
ˆ
ˆ
(1  a 2 2  a 4 4  )  j (a1  a3 2  a5 4  )   j D( )
Для интерполяции экспериментальных данных функциями такого вида предложено
несколько методов. Наиболее известный подход состоит в определении таких оценок
неизвестных коэффициентов ai и bi передаточной функции, чтобы сумма квадратов
отклонений оценок G(j) значений частотной характеристики от экспериментальных
данных была минимальной.
Чаще всего используется метод, предложенный Леви. Метод представляет собой
модификацию метода наименьших квадратов.
Для любой частоты ошибка подгонки равна
N (i )
(71)
D(i )
Соотношение (71) умножается на D(i):
(72)
D(i ) (i )  D(i )G( ji )  N (i )
Формулу можно разделить на действительную и мнимую части:
(73)
D(i ) (i )  A(i )  jB(i )
Квадрат модуля этого выражения равен
2
D( i ) ( i )  A 2 ( i )  B 2 ( i )
(74)
Функцию ошибок можно представить в виде
 (i )  G( ji )  Gˆ ( ji )  G( ji ) 
k
k
E   D( i ) ( i )   [ A 2 ( i )  B 2 ( i )]
i 0
2
(75)
i 0
Процедуру минимизации Е можно охарактеризовать как взвешенный метод
наименьших квадратов.
A(i )  Re[ D(i )G( ji )  N (i )]  Re[( i  ji i ){R(i )  jI (i )}  ( i  ji  i )] 
 i Ri  i i I i   i
B(i )  Im[ D(i )G ( ji )  N (i )]  Im[(  i  ji i ){R(i )  jI (i )}  ( i  ji  i )] 
i i Ri   i I i  i  i
МЕТОДЫ НЕЛИНЕЙНОЙ ИДЕНТИФИКАЦИИ
Идентификация многих нелинейных объектов начинается с построения
статической модели. При этом задача идентификации формулируется обычно следующим
образом. На входе объекта измеряются значения вектора входных переменных u=(u1, …,
uk), распределенные в соответствии с неизвестной плотностью распределения, а на выходе
соответствующие значения выходной переменной. Объект рассматривается как
функциональный преобразователь, где y=F(u) – статическая характеристика объекта,
заранее неизвестная. Основываясь на знании выборок входных векторов и
соответствующих значений выходной переменной, необходимо найти такую
~
y  F (u ) функции y  F (u ) , чтобы заданный критерий качества
аппроксимацию ~
аппроксимации принимал экстремальное значение.
Обычно этим критерием является остаточная дисперсия выходной переменной y
относительно аппроксимирующей функции.
Существует ряд методов решения этой задачи, такие, как методы наименьших
квадратов и максимального правдоподобия, обычные алгоритмы регрессионного и
корреляционного анализа, процедуры стохастической аппроксимации. При использовании
~
таких методов форма аппроксимирующей функции F (u ,  ) должна выбираться заранее с
точностью до вектора неизвестных параметров . Тогда задача сводится к определению
оценки ˆ , минимизирующей функционал от критерия по экспериментальным данным.
В качестве аппроксимирующей функции можно предложить модели теории
катастроф.
Источниками теории катастроф являются теория особенностей гладких
отображений Уитни и теория бифуркаций динамических систем Пуанкаре и Андронова.
Теория особенностей – это обобщение исследования функций на максимум и
минимум. В теории Уитни функции заменены отображениями (наборами нескольких
функций нескольких переменных). Отображение поверхности на плоскость – это
сопоставление каждой точке поверхности точки плоскости. Если точка поверхности
задана координатами (х1, х2) на поверхности, а точка плоскости координатами (у1, у2) на
плоскости, то отображение задается парой функций y1=f1(x1,x2), y2=f2(x1,x2).Отображение
называется гладким, если эти функции гладкие (дифференцируемые достаточное
количество раз). Для всех случаев, кроме некоторых исключительных встречаются
особенности двух видов: складка Уитни (особенность, возникающая при проектировании
сферы на плоскость в точках экватора), сборка Уитни (получается при проектировании на
горизонтальную плоскость (х2,у) поверхности у=х13+х1х2). Все другие разрушаются при
малом шевелении тел или направлений проектирования, в то время как особенности этих
двух видов устойчивы и сохраняются при малых деформациях отображения.
Теорема Уитни: Отображение двумерного многообразия в двумерное устойчиво в
точке тогда и только тогда, когда в подходящих локальных координатах (х 1,х2) в
прообразе и (y1,y2) в образе отображение записывается в одном из трех видов:
У1. y1= х1, y2= х2 (регулярная точка);
У2. у1=х12, у2=х2 (складка);
(76)
3
У3. у1=х1 +х1х2, y2= х2 (сборка).
Задача: Найти критические точки и критические значения отображения Уитни
3
у1=х1 +х1х2, y2= х2.
Решение: Получим матрицу Якоби отображения
3 x 2  x x x 
d
2 1 2
y    1


dx
0
1 

В критических точках ранг этой матрицы должен быть меньше двух, то есть
определитель равен нулю. Следовательно,
6
чтобы найти критические точки необходимо
решить
уравнение
3x12+x2=0.
Значит
4
множество критических точек – гладкая
2
кривая (парабола).
В
критических
точках
x2=-3x12.
0
Подставляем в у1=х13+х1х2, y2= =х13+х1х2, y2=
-80
-60
-40
-20
0
х2 вместо х2 его выражение через х1. Получим
-2
-4
60
-6
параметрическое уравнение множества
критических точек у1=-2х13, y2= -3x12 .
Множество критических значений –
полукубическая парабола на плоскости (у1,
y2). Кривая имеет особую точку в начале
координат.
Кривая делит плоскость на две
части.
40
20
0
-30
-25
-20
-15
-10
-5
0
-20
-40
-60
Задача: Найти множество критических точек и множество критических значений
отображения плоскости комплексного переменного z=x1+ix2 на плоскость комплексного
переменного w=y1+iy2, заданного формулой w=z2, как гладкое отображение двумерной
вещественной плоскости на двумерную вещественную плоскость y1=x12-x22, y2=2x1x2.
Решение: Ранг производной равен двум во всех точках, кроме точки z=0. В этой
точке производная равна нулю, а ядро производной двумерно. В классе ростков
голоморфных отображений особенность z=w2 устойчива. Для приведения в общее
положение в классе вещественных отображений нужно сделать добавку, нарушающую
голоморфность. Например, можно в качестве возмущенного взять отображение
w=z2+z
Это отображение близко к исходному, если || достаточно мал. Примем =2.
Производная отображения на векторе  имеет вид dw() =2z+2. Для того, чтобы
найти критические точки отображения, необходимо решить уравнение 2z+2=0. z=-/.
|z|=1. Таким образом, множество критических точек – окружность радиуса 1.
Пусть критическая точка z=ei. Соответствующее критическое значение
w=2e-i+ e2i.
120
90
3
60
2
150
30
1
w( )
180
0
0
210
330
240
300
270

Теория особенностей – это область математики, связывающая некоторые
абстрактные разделы математики (дифференциальную и алгебраическую геометрию и
топологию, теорию групп, коммутативную алгебру, теорию комплексных пространств и
др.) с прикладными (теория устойчивости движения динамических систем, теория
бифуркация положения равновесия, геометрическая и волновая оптика и др.).
Одним из наиболее важных выводов теории особенности является вывод об
универсальности нескольких простых образов – складки, сборки, точки возврата. Часто
встречаются еще несколько образов, получивших названия – «ласточкин хвост»,
«пирамида», «кошелек». Это особенности каустик. Каустика – это огибающая семейства
лучей, описывающих процесс возмущений.
Ласточкин хвост можно определить как множество всех точек (a, b, c) таких, что
многочлен x3+ax2+bx+c имеет кратный корень. Ласточкин хвост можно получить из
пространственной кривой A=t2, B=t3, C=t4: он образован всеми касательными. Ласточкин
хвост имеет два ребра возврата.
Пирамида имеет три ребра возврата, касающиеся в вершине. Кошелек – одно ребро
возврата и состоит из двух симметричных носов лодки, пересекающихся по двум линиям.
Эти особенности устойчивы. Все более сложные особенности каустик в трехмерном
пространстве при малом шевелении рассыпаются на эти стандартные элементы.
Уитни описал также особенности отображений общего положения двумерных
многообразий в трехмерные. Их также конечное число. Образ такого отображения
представляет собой поверхность в трехмерном пространстве. Кроме очевидных
особенностей
отображения
общего
положения
могут
иметь
особенность,
представляющую собой поверхность в трехмерном пространстве. Эта поверхность
называется зонтиком Уитни (зонтиком Кэли). Ее уравнение имеет вид y12=y3y22.
Отображение описывается следующими соотношениями: y1=x1x2, y2=x2, y3=x12.
«Бифуркация» означает раздвоение и употребляется для обозначения
качественных, топологических перестроек и метаморфоз различных объектов при
изменении параметров, от которых они зависят. Объекты могут быть самые
разнообразные: вещественные и комплексные кривые и поверхности, функции или
отображения, многообразия или расслоения, векторные поля или дифференциальные
уравнения.
Эволюционный процесс математически описывается векторным полем в фазовом
пространстве. Точка фазового пространства задает состояние системы. Приложенный в
этой точке вектор указывает скорость изменения состояния. В некоторых точках вектор
может обращаться в нуль. Такие точки называются положениями равновесия. Кривые в
фазовом пространстве, образованные последовательными состояниями процесса,
называются фазовыми кривыми. В окрестности положения равновесия поведение фазовых
кривых типично: узел (устойчивый и неустойчивый), фокус (устойчивый и
неустойчивый), седло.
Вблизи неособой точки все векторные поля устроены просто и одинаково. Для
исследования мелких деталей вблизи особых точек разработан специальный
математический аппарат – разрешение особенностей. Суть данного метода заключается в
таком выборе систем координат вблизи особой точки, в которых малым перемещениям
вблизи особенностей соответствуют большие изменения координат. Этим свойством
обладает полярная система координат. Однако переход к полярным координатам требует
тригонометрических функций, поэтому алгебраически часто удобнее другая процедура,
называемая -процесс (раздутие особенностей). Практически -процесс означает переход
от координат (x, y) к координатам (x, u=y/x) там, где x0, и к координатам (v=x/y, y) там,
где y0.
Задача. Построить фазовые кривые уравнения маятника с коэффициентом трения
k. Уравнение имеет вид
Системы, описывающие реальные системы, как правило, общего положения. Такие
системы всегда зависят от параметров, которые никогда не бывают известны точно.
Малое общее изменение параметров превращает систему необщего положения в систему
общего положения. К настоящему времени решенным можно считать лишь вопрос о
перестройках фазовых кривых при бифуркациях положений равновесия в
однопараметрических системах общего положения.
Потеря устойчивости состояния равновесия при изменении параметра не
обязательно связана с бифуркацией самого состояния равновесия: оно может терять
устойчивость не только сталкиваясь с другим, но и самостоятельно. Возможны два
варианта перестройки фазового портрета на плоскости:
 При изменении параметра из положения равновесия рождается предельный
цикл; устойчивость равновесия переходит к циклу, само же равновесие
становится неустойчивым.
 В положении равновесия умирает неустойчивый предельный цикл; область
притяжения положения равновесия уменьшается с ним до нуля, после чего
цикл исчезает, а его неустойчивость передается равновесному состоянию.
Если положение равновесия – установившийся режим в реальной системе, то при
изменении параметра в рассмотренных выше случаях наблюдаются следующие явления:
 После потери устойчивости равновесия установившимся режимом является
колебательный
периодический
режим,
амплитуда
колебаний
пропорциональна квадратному корню закритичности (отличия параметра от
критического значения, при котором равновесие теряет устойчивость). Этот
вид потери устойчивости называется мягкой потерей устойчивости, так как
устанавливающийся колебательный режим при малой закритичности мало
отличается от состояния равновесия.
 Перед тем, как установившийся режим теряет устойчивость, область
притяжения этого режима становится очень малой, и всегда
присутствующие малые возмущения выбрасывают систему из этого
состояния еще до того, как область притяжения полностью исчезает. Этот
вид потери устойчивости называют жесткой потерей устойчивости, так как
при этом система уходит со стационарного режима скачком и перескакивает
на иной режим движения. Этот режим может быть другим устойчивым
стационарным режимом, или устойчивыми колебаниями, или более
сложным движением.
Установившиеся режимы движения получили название аттракторов, так как они
«притягивают» соседние режимы (переходные процессы). Аттракторы отличные от
состояний равновесия и строго периодических колебаний получили название странных
аттракторов и связываются с проблемой турбулентности.
Переход системы на режим – странный аттрактор означает, что в ней наблюдаются
сложные непериодические колебания, детали которых очень чувствительны к малому
изменению начальных условий, в то время как усредненные характеристики режима
устойчивы и не зависят от начального условия.
Переход от устойчивого состояния равновесия процесса к странному аттрактору
может совершаться как скачком (при жесткой или катастрофической потере
устойчивости), так и после мягкой потери устойчивости. В последнем случае родившийся
цикл сам теряет устойчивость. В работах по теории катастроф мягкая потеря
устойчивости положения равновесия обычно называется бифуркацией Хопфа. Потеря
устойчивости цикла в общем однопараметрическом семействе систем возможна
несколькими способами: столкновение с неустойчивым циклом; удвоение; рождение и
смерть тора.
Катастрофами называются скачкообразные изменения, возникающие в виде
внезапного ответа системы на плавне изменение внешних условий.
Теорией катастроф называют совокупность теории особенностей и ее приложений.
Схема большинства применений теории катастроф в большинстве случаев такая:
 Предполагается, что изучаемый процесс описывается при помощи
некоторого числа управляющих и внутренних параметров;
 Состояния равновесия процесса образуют поверхность;
 Проекция поверхности равновесий на плоскость управляющих параметров
может иметь особенности (в предположении – особенности общего
положения).
 Теория особенностей предсказывает геометрию катастроф, то есть
перескоков из одного состояния равновесия в другое при изменении
управляющих параметров.
Модели теории катастроф могут использоваться при решении задачи идентификации в
рамках выбранной модели. В этом случае задается структура модели (складка, сборка) и
по результатам наблюдений над входными и выходными переменными системы должны
быть определены параметры модели, то есть должна быть построена оптимальная, в
некотором смысле модель.
В этом случае задача идентификации сводится к задаче оценивания параметров
модели (параметрического оценивания).
На практике форма функции F (u ) часто неизвестна. Поэтому для преодоления
~
F (u ,  ) последняя
трудностей
выбора
аппроксимирующей
функции
обычно
представляется конечным отрезком разложения по заданной системе функций g j (u ):
n
~
F (u, )   j g j (u )
j 1
(77)
Литература
1. Арнольд
В.И.
Дополнительные
главы
теории
обыкновенных
дифференциальных уравнений. – М.: Наука, 1978. 304 с.
2. Арнольд В.И., Варченко А.Н., Гусейн-Заде С.М. Особенности
дифференцируемых отображений. Классификация критических точек,
каустик и волновых фронтов. – М.: Наука, 1982. 304 с.
3. Арнольд В.И. Теория катастроф. Изд. 4-е, стереотипное. – М.: Едиториал
УРСС, 2004. 128 с.
4. Современные методы идентификации систем: Пер. с англ./ Под ред.
П.Эйкхоффа. – М.: Мир, 1983.
5. Льюнг Л. Идентификация систем. Теория для пользователя: Пер. с англ./Под
ред. Я.З.Цыпкина. – М.: Наука, 1991.
Download