На правах рукописи Шмалько Елизавета Юрьевна РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДА СЕТЕВОГО ОПЕРАТОРА

advertisement
На правах рукописи
Шмалько Елизавета Юрьевна
РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДА СЕТЕВОГО ОПЕРАТОРА
В ЗАДАЧЕ СИНТЕЗА СИСТЕМЫ УПРАВЛЕНИЯ
СПУСКОМ КОСМИЧЕСКОГО АППАРАТА
Специальность 05.13.01 - Системный анализ,
управление и обработка информации
Автореферат диссертации на соискание ученой степени
кандидата технических наук
Москва 2009
1
Работа выполнена в Российском университете дружбы народов
Научный руководитель:
Доктор технических наук Дивеев Асхат Ибрагимович
Официальные оппоненты:
Доктор технически наук, профессор Афанасьев Валерий Николаевич
Доктор физико-математических наук, профессор Дикусар Василий Васильевич
Ведущая организация:
Государственный космический научно-производственный центр им. М.В. Хруничева
(ГКНПЦ им. М.В. Хруничева)
Защита диссертации состоится «19» марта 2009 года в 16 часов 00 мин. на
заседании диссертационного совета Д 002.017.03 в учреждении Вычислительного
центра Российской академии наук Вычислительного центра им. А.А. Дородницына
РАН по адресу: 119333, г. Москва, ул. Вавилова, 40.
С диссертацией можно ознакомиться в библиотеке учреждения Российской
академии наук Вычислительного центра им. А.А. Дородницына РАН.
Автореферат разослан « 19 » февраля
2009 г.
Ученый секретарь Совета по защите
докторских и кандидатских диссертаций,
кандидат физико-математических наук
2
Мухин А.В.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность
темы
диссертационного
исследования
обусловлена
необходимостью разработки и внедрения в практику универсального метода синтеза
систем управления сложными объектами.
В настоящей работе ставится задача синтеза системы управления. Задача синтеза
состоит в том, чтобы для любого момента времени найти оптимальный закон
управления в виде функции от состояния объекта, действующий по принципу обратной
связи. Методов и подходов для решения задачи синтеза системы управления сегодня
известно не очень много. Большинство известных подходов используют специальные
свойства объектов и функционалов. Для произвольных функционалов и нелинейных
объектов эффективного метода решения задачи синтеза управления, в общем случае, не
известно. Это обстоятельство обуславливает актуальность настоящей работы.
Рассматриваемая в работе задача синтеза системы управления спуском
космического аппарата в качестве критерия оптимальности использует функционал
максимума перегрузки. Такой функционал имеет сложный нелинейный вид, а так как
объект управления также нелинеен, то для решения задачи синтеза управления в
данном случае не могут быть использованы известные методы. В работе при решении
поставленной задачи используется подход на основе новых результатов в области
алгоритмизации, метода генетического программирования и сетевого оператора.
Предметом исследования является задача синтеза системы управления спуском
космического аппарата.
Целью диссертационной
работы является разработка эффективного
вычислительного метода синтеза системы автоматического управления сложным
нелинейным объектом. Для достижения поставленной цели было осуществлено
решение следующих задач:
– обзор существующих методов и подходов решения поставленной задачи синтеза
оптимального управления;
– исследование математической модели спуска космического аппарата;
– разработка и исследование численного метода решения задачи оптимального
управления;
– разработка и исследование метода сетевого оператора для решения задачи
многокритериального структурно-параметрического синтеза системы управления
спуском космического аппарата;
– разработка программного обеспечения для реализации методов оптимального
управления и синтеза, проведение вычислительного эксперимента.
Методологической основой исследования послужили научные труды и
практические результаты, сформулированные в исследованиях российских и
зарубежных ученых в области теории управления, системного анализа, методах
оптимального управления, теории графов, теории алгоритмов.
Новизна научных результатов диссертационной работы состоит в разработке и
формализации метода синтеза системы управления нелинейным объектом, его
применение и исследование его возможностей для решения задачи управления
сложным техническим объектом. В свою очередь для решения задачи оптимального
управления разработан новый эффективный численный метод на основе
аппроксимации кривыми Безье. Основные положения и выводы, содержащиеся в
диссертации, могут быть использованы при дальнейшем развитии теории управления
нелинейными объектами.
Практическая значимость исследования состоит в том, что на основании
разработанных алгоритмов создан программный комплекс для синтеза систем
3
управления. Разработанный в диссертации метод синтеза управления может быть
использован при проектировании, анализе и эксплуатации различных систем сложных
технических объектов. Работоспособность и эффективность метода подтверждена
решением сложной технической задачи синтеза оптимального управления спуском
космического аппарата. Кроме того, результаты исследования могут быть включены в
учебные курсы по синтезу систем управления сложными динамическими объектами.
Апробация результатов исследования, подтверждается докладами на
следующих научных конференциях и международных симпозиумах: «Надежность и
качество 2007» (г. Пенза), «Космонавтика. Радиоэлектроника. Геоинформатика 2007»
(г. Рязань), «Научной сессии МИФИ-2008» (г. Москва), «Интеллектуальные системы»
(INTELS'2008) (г. Нижний Новгород). По теме диссертации опубликованы 7 печатных
работ.
Основные положения, выносимые на защиту:
1. Численный метод решения задачи построения программного оптимального
управления на основе аппроксимации кривыми Безье.
2. Метод синтеза системы управления на основе сетевого оператора. Метод поиска
решения основан на генетическом алгоритме с представлением функциональных
зависимостей в виде сетевого оператора.
3. Решение задачи синтеза системы управления спуском космического аппарата на
основе разработанного метода и программный комплекс для проведения
вычислительных экспериментов.
По теме диссертации опубликовано 7 научных трудов, общим объемом 35 п.л.,
в том числе 3 работы [3, 6, 7] в изданиях, рекомендованных ВАК РФ, объемом 23 п.л. В
совместных статьях автору принадлежит 50%.
Структура диссертации. Диссертация состоит из введения, пяти разделов,
заключения, списка литературы и приложения. Объем работы – 134 страницы, включая
50 иллюстраций и 6 таблиц. Список литературы содержит 122 наименования.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы, сформулированы предмет, цель и
задачи исследования, методы исследования, новизна научных результатов и их
практическая значимость, приведены данные о структуре и объеме диссертации.
В первом разделе приведена общая постановка задачи и обоснована
необходимость разработки метода решения задачи синтеза управления для нелинейных
объектов и произвольных функционалов.
Математическая
модель
объекта
управления
описывается
системой
обыкновенных дифференциальных уравнений
(1.1)
x  f x ,u ,
где x  x1  xn T - вектор состояния системы, u  u1 u m T - вектор управления,
x  ℝn, u U  ℝm, m  n , U - ограниченное множество.
Задано начальное состояние объекта управления


x0  x10  xn0 .
Заданы функционалы, определяющие критерии качества управления
  
T
(1.2)
tf
J i  Gi x t f   Fi xt ,ut dt , i  1, M ,
0
4
(1.3)
где t f - длительность процесса управления.
Необходимо синтезировать систему управления в виде
u  gx , q ,
(1.4)
где g - искомая структура управления, q  q1 q R T - вектор параметров системы
управления, q  Q  ℝR, Q - ограниченное множество.
Решением рассматриваемой задачи (1.1) – (1.4) является множество Парето в
пространстве функционалов (1.3). Каждая точка множества Парето представляет собой
математическое выражение (1.4) со значением вектора параметров q . Конкретная
система управления определяется как одно из решений на множестве Парето,
выбираемое по дополнительным критериям.
Задача синтеза оптимального управления на протяжении многих лет является
одной из ключевых проблем теории управления. Выделившись в отдельную область
науки еще в середине 50-х годов 20-ого столетия, математическая теория оптимального
управления аккумулировала в себе основные достижения классического вариационного
исчисления, принципа максимума Л.С. Понтрягина, численных методов оптимизации.
Большинство известных подходов к решению проблем управления космическими
аппаратами связаны с построением программных управлений, оптимальных по
различным критериям, но не решающих проблему синтеза в общей постановке. Анализ
этих подходов применительно к проблеме управления спуском космического аппарата
обусловил необходимость построения общего метода синтеза оптимальных систем
управления, которые используют информацию о поведении объекта. Кроме того, в
последнее время все большую важность приобретает вопрос о создании так называемой
«физической теории управления», определяемую А.А. Красовским как «теорию
управления, которая базируется на фундаменте физических законов, учете ресурсов и
приоритетах реального мира». Такой принципиально новый подход к проблеме поиска
общих объективных законов управления обусловил необходимость построения общего
метода синтеза оптимальных систем управления, которые используют информацию о
поведении объекта.
Первым шагом в решении поставленной задачи синтеза управления, как функции
координат пространства состояния объекта u  ux , стало создание Р. Беллманом
метода динамического программирования. Согласно данному методу структура
оптимального управления определяется путем решения уравнения Беллмана для
непрерывных детерминированных систем, которое является достаточным условием
минимума функционала (1.3). Уравнение Беллмана представляет собой
дифференциальное уравнение в частных производных, решение которого в общем
случае ведет к значительным и часто непреодолимым трудностям вычислительного
характера.
Наиболее известным и исследованным случаем решения задачи синтеза
оптимального управления является задача, решенная для линейных систем с
квадратичным функционалом. Метод называется аналитическим конструированием
оптимальных регуляторов (АКОР), основанный А.М. Летовым и Р. Калманом, а затем
получивший свое развитие в работах А.А. Красовского, М.М. Атанса и П. Фалба, В.Н.
Афанасьева и других ученых. Методы теории АКОР хорошо формализованы. Своей
практической завершенности данный подход достиг только для линейных
стационарных объектов и квадратичных оптимизирующих функционалов, путем
сведения задачи к решению нелинейных алгебраических уравнений Рикатти.
Существенное продвижение в решении нелинейной теории АКОР было
достигнуто в работах А.А. Красовского и его учеников по неклассическим
функционалам обобщенной работы. Суть данного подхода состоит в приведении
уравнения Беллмана к линейному виду в частных производных, что позволяет
5
разработать ряд приближенных методов его решения. В литературе имеются другие
частные результаты по нелинейной теории АКОР, однако, в целом, проблема синтеза
оптимальных регуляторов в своем практическом применении еще далека от
разрешения.
Сегодня достаточно большое внимание уделяется развитию методов синтеза
адаптивных систем управления ( Дж. Траксел, В.А. Якубович и др.). Общепринятый
подход к синтезу адаптивных систем состоит в том, что в процессе синтеза сначала
находят уравнения регулятора объекта с использованием какого-либо метода теории
управления, а затем алгоритм настройки его параметров. Применяемые сегодня методы
адаптивного управления можно разделить на два основных направления – замена
исходной нелинейной модели на приближенную линейную и использование
нелинейных канонических форм.
Первый подход, замена исходной нелинейной модели упрощенной линейной или
выделение в модели объекта линейной и нелинейной частей, широко применяется на
практике. Подход позволяет использовать традиционные формализованные методы
управления линейными объектами, основанные на использование эталонной модели
(Ортега Р., Дата А.), или применение методов теории абсолютной устойчивости
(Кристич М., Каннелакопулос И., Котокович П.). Ограничение по применению данного
подхода состоит в необходимости оценивать степень ухудшения качества системы
управления при замене упрощенной линейной модели объекта исходной нелинейной, а
эта задача редко обосновывается аналитически, так как в общем случае сопоставима по
сложности с построением самого регулятора.
Суть второго подхода состоит в том, что путем нелинейного преобразования в
пространстве состояний некоторые нелинейные объекты можно привести к
канонической форме со скалярным выходом (output-feedback canonical form), в которой
все функции зависят только от измеряемых величин. Методы на основе канонических
форм применимы для ограниченного класса нелинейных объектов. Для канонических
форм были разработаны итеративные процедуры синтеза стабилизирующего
управления с применением метода функций Ляпунова, получившие название «обход
интегратора» (И. Канеллакопулос, П. Кокотович, А. Исидори, Р.Марино, П. Томеи).
Помимо сложности решения задачи синтеза на основе канонических форм, остается
нерешенной проблема чувствительности синтезируемых алгоритмов к неизбежному
отличию исходных нелинейных моделей объектов от используемых для построения
регуляторов данного типа упрощенных моделей. Сами условия существования
нелинейного преобразования реальных моделей в канонические формы являются
непростыми и их проверку осуществить так же непросто.
В данной диссертационной работе рассматривается задача спуска космического
аппарата в атмосфере Земли. Исследованию проблемы управления движением
космического аппарата при входе в атмосферу и спуске его на поверхность Земли
посвящено множество работ российских и зарубежных авторов (Охоцимский Д.Е.,
Бухаркина А.И., Власов А.Г., Вингрув Р., Дау П. и др.). В виду отсутствия общих
методов синтеза управления нелинейными динамическими объектами на практике
сегодня применяют подход, который состоит из двух этапов. На первом этапе любым
из известных методов оптимального управление находится оптимальное управление в
виде функции времени u* (t ) . По найденному оптимальному управлению строится
оптимальная траектория x* (t ) . На втором этапе строится система управления, которая
обеспечивает стабилизацию поведения системы вблизи оптимальной траектории. При
построении системы стабилизации, как правило, математическая модель объекта
линеаризуется в окрестности оптимальной траектории, поэтому используют
стандартные методы синтеза регуляторов для линейных систем. Однако такие системы
формально не являются оптимальными.
6
Во втором разделе рассматриваются современные методы решения задачи
синтеза управления.
Сейчас большое внимание ученых и разработчиков занимает новый метод аналитическое
конструирование
агрегированных
регуляторов
(АКАР),
сформулированному А.А. Колесниковым в контексте синергетической теории
управления. Метод базируется на принципе инвариантных многообразий,
описывающих состояние исходной динамической системы, которое удовлетворяет
технической цели управления. Задача синтеза регулятора в методе АКАР решается в
два этапа. Сначала в зависимости от физической сути задачи строят инвариантное
многообразие  x  0 , размерность которого меньше размерности исходной системы.
Затем из системы дифференциальных уравнений T    0 для агрегированных
переменных находят управление u x , которое переводит систему из начального
состояния x(0) в окрестность заданного инвариантного многообразия  x  0 .
Несмотря на обоснованность данного подхода, открытой остается проблема выбора
инвариантных многообразий, поэтому метод АКАР успешно применяется в основном
для задач стабилизации, где форма инвариантного многообразия очевидна. К тому же,
при решении нелинейного уравнения, описывающего связь управления с
агрегированными переменными, необходимо учитывать ограничения на управление.
Современные системы управления космическими аппаратами используют
бортовые вычислительные машины для реализации различных алгоритмов расчета
управляющего воздействия. Это обстоятельство позволяет применять в управлении
любой вид регулирования, не ограничиваясь только классом линейных или адаптивных
регуляторов. В данном случае синтез структуры управления представляет собой
создание алгоритма для вычислительной машины с учетом динамических свойств
исполнительных устройств.
В настоящей работе для разработки эффективного вычислительного метода
синтеза системы управления используются последние достижения в области
алгоритмизации. Наиболее важным результатом последних лет в этом направлении
является создание метода генетического программирования (Koza J.R.), которое
позволяет получить с помощью вычислительной машины аналитические решения
различных математических задач. В генетическом программировании для
универсального описания математического выражения и его кодировки используется
польская запись программного кода, которая представляет собой строку символов,
описывающих операторы и операнды. Польская запись является промежуточным
кодом, к которому преобразуют трансляторы исходные тексты программ при их
переводе в машинные команды. Для строк польской записи Дж. Коза разработал
генетические операции скрещивания и мутации. Новый разработанный метод явился
развитием генетического алгоритма (Davis Lawrence, Goldberg D.E., Holland J.H.),
позволив реализовывать на вычислительной машине любые функциональные
зависимости.
Методы генетического программирования, основанные на использовании
структуры данных в виде строк польской записи, обладают существенными
недостатками, связанными с работой с динамической памятью и лексическим
анализом строк, что приводит к значительным вычислительным затратам. Для
повышения эффективности вычислительных алгоритмов в работе используется метод
сетевого оператора, разработанный А.И. Дивеевым, позволяющий в наиболее удобной
для поиска на компьютере форме представлять функциональные зависимости.
Основная идея метода сетевого оператора [5] состоит в том, что он позволяет
описывать произвольные математические выражения и представлять их в ЭВМ с
помощью целочисленной матрицы.
7
В третьем разделе приводится математическая постановка практической задачи
синтеза системы управления спуском космического аппарата, проводится анализ
параметров модели объекта управления (влияние параметров атмосферы, зависимость
от начального угла входа), позволивший получить основные зависимости и выявить
основные проблемы, связанные с решением задачи.
Математическая
модель
объекта
представляет
собой
систему
дифференциальных уравнений четвертого порядка.
dx1
 x2 ,
dt
(3.1)
 x2  x2 R 
z
1
3

1  u S0 x x 2  x 2 e 
g0 Rz2 x1
dx2


2
2
4
32
dt
m
x12  x32
dx3
 x4 ,
dt


 x2  x2 R 
z
1
3

1  u S0 x x 2  x 2 e 
g0 Rz2 x3
dx4


4
2
4
32
dt
m
x12  x32


,
(3.2)
(3.3)
,
(3.4)
где x1 , x3 – координаты центра масс космического аппарата в геоцентрической
ортогональной системе координат, x2 , x4 – компоненты скорости космического
аппарата, x  x1  x4 T ℝn, u – управление, u U  ℝ1, m – масса космического
аппарата, g 0 – ускорение свободного падения на поверхности Земли, Rz – радиус
Земли, S – площадь поверхности сопротивления,  0 – плотность атмосферы на
поверхности Земли,  – коэффициент разреженности.
Создание управляющих сил осуществляется за счет изменения направления
подъемной силы аппарата при развороте аппарата по крену вокруг вектора скорости.
При этом космический аппарат балансирует на некотором номинальном угле атаки.
Для системы (3.1) – (3.4) заданы начальные условия:
(3.5)
x10  0, x2 0  V0cos0 , x3 0  Rz  h0 , x4 0  V0sin 0 ,
где V0 – модуль начальной скорости, h0 – начальная высота,  0 – начальный угол
наклона траектории.
Угол наклона траектории является важным параметром, влияющим на точность
приземления и критерии качества управления. Реально начальный угол  0 не может
быть известен абсолютно точно. Поэтому считаем, что начальный угол принадлежит
ограниченному диапазону.
 0   0   0 ,
(3.6)
где  0 ,  0 – нижнее и верхнее ограничение, которое определяет коридор входа в
атмосферу.
Цель управления описывается следующими функционалами:

x12 t   x32 t  x22 t   x42 t 
J1  max
 min
t
Rz2 g 0
x t 
J 2  Rz arctg 4  L f  min
x2 t 
8
(3.7)
(3.8)
Функционал (3.7) описывает максимальное значение перегрузки в процессе
посадки, функционал (3.8) описывает выполнение терминального условия,
обеспечивающего попадание космического аппарата в точку посадки.
Необходимо с помощью ограниченного управления
u  u  u
(3.9)
обеспечить при достижении заданной высоты H f попадание в точку, проекция
которой на поверхность Земли находится на заданном расстоянии L f от проекции
точки входа (3.8), при этом минимизировать максимальную перегрузку (3.7),
возникающую в процессе посадки.
Управление ищется как функция координат пространства состояния
(3.10)
u   x, q
где  x, q  – искомое математическое выражение, которое представляет собой
однозначное непрерывное отображение, x,q :
ℝn×ℝp→ ℝ1, q – вектор искомых
параметров, q  ℝp.
В четвертом разделе приведено описание разработанного численного метода
решения задачи оптимального управления на основе аппроксимации кривыми Безье.
Для решения задачи (3.1) – (3.10) цель управления (3.7), (3.8) запишем в виде
функционала


x 2 t   x32 t  x 22 t   x 42 t 
J1  max 1
  R z arctg
2
t
Rz g 0
 
 
x4 t f
 L f  min ,
x2 t f
(4.1)
где  - весовой коэффициент, t f - время управления, определяемое из соотношения
t , если x 2 t   x 2 t   H  R
1
3
f
z .
(4.2)
tf 


t , если t  t
Разработанный метод позволяет быстро и гарантированно находить оптимальный
закон управления u * (t ) , доставляющий минимум критерию качества, при этом, не
привлекая больших вычислительных мощностей. Уменьшение нагрузки на
вычислительные мощности достигается путем использования для вычислений на
каждой итерации не большого количества дискретных точек u(t j ) , j  0, M , а
значительно меньшего количества управляющих точек, определяемых параметрами qi ,
i  0, N , где N  M .
Управляющие точки (qi , ti ) равномерно распределены на интервале [t0 , t f ] , где
t0 и t f – начальная и конечная границы интервала соответственно. Для того, чтобы
равномерно распределить управляющие точки по интересующему нас интервалу,
положим
ti  t0  i(t f  t0 ) / N .
Для каждого набора управляющих точек строим кривую Безье. Кривая Безье – это
параметрическая кривая, задаваемая выражением
N
 t 
(4.3)
y t    qi BiN   ,
tf 
i 0
 
9
где qi – оптимизируемые параметры, определяющие положения управляющих точек,
 t
BiN 
tf


 – базисные функции кривой Безье, или функции Бернштейна, i  0, N ,


  i  t  t  N i 


N


 t

t
f

BiN         
,
 t f   i   t f   t f 

 

  

N
N!
  
, i  0, N ,
 i  i!N  i !
где N – степень полинома, i – порядковый номер управляющей точки.
Для вычисления функций Бернштейна (4.4) используем
соотношения
 t 
B00    0 ,
 t 
(4.4)
рекуррентные
 t  t t
,
B1N   
t
 t 
 t  t N  t 
BiN   
Bi 1  , i  1, N ,
 t  t
 t 
 

t N t 
N t t  N  t 
Bj 
B  
B   , j  i  1,1 ,
 t   j 1 t   t  j  t  


(4.5)
t   t
, если i  1

N  t   t
B0     
.
 t    t  t N  t 
B0  , иначе
 t 
 t 
По кривой Безье y (t ) определяем закон управления
u  , если y t   u 

u (t )  u  , если y t   u  ,
 y t , иначе

(4.6)
где u  и u  – верхняя и нижняя граница управления соответственно.
Оптимальное управление ищем путем нахождения оптимальных значений
параметров q  q1  q N T , определяющих
соответствии с соотношениями (4.3) – (4.5).
вид
функции
управления
y (t )
в
Для поиска оптимальных значений параметров q  q1  q N T используем метод
нелинейного программирования нулевого порядка Хука-Дживса с ускоряющим
одномерным поиском методом золотого сечения.

0
Задаем случайно начальное значение вектора параметров q 0  q10  q N



T
qi0   u   u   u  ,
где  – случайная равномерно распределенная в диапазоне 0,1 величина.
Вычисляем значение функционала, определяющего качество управления, для
вектора параметров q 0 .
10
 
J 0  J q0 .


T
Находим в окрестности q 0 другое значение вектора параметров q1  q11  q1N ,
которое дает меньшее значение функционала
 0
 1
1
0
0
0 T
0
qi   i , если J  q1  qi 1qi   i qi 1  q N   J



T



0
q1i  qi0   i , если J  q11  q1i 1qi0   i qi01  q N
  J0 ,



qi0 , иначе


где  i – величина приращения.




Если q1  q 0 , то уменьшаем величины  i ,  i   i / 2 . При выполнении условия
 i   , где  – малая заданная величина, процесс вычисления останавливаем.
Решаем задачу одномерной оптимизации

min J 1   q 0  q1


 
методом золотого сечения. Находим оптимальное значение параметра ~  0,   , где
   1 . Находим новое значение вектора параметров
q 0  1  ~ q 0  ~q1
и повторяем вычисления.
Вычислительный эксперимент проводился при следующих параметрах модели:
m  5000 кг,
g0  9,81
м / с2 ,
Rz  6371 103 м, S = 3,5 м 2 ,
0  1,22 кг / м 3 ,
  1,35  104 ,   10 5 , H f  10000 м, L f  1450000 м, t   300 с, N  32 .
Максимальное значение перегрузки при оптимальном управлении составило
величину
Fmax  8,053 ед.
терминальной
g,
точки составил
максимальный
промах
относительно
заданной
26313 м. На рис. 4.1 и 4.2 приведены значения
перегрузки, соответственно при неоптимальном и оптимальном управлениях. На рис.
4.3 и 4.4 приведены значения неоптимального и оптимального управления
соответственно, а также неоптимальные и оптимальные значения вектора параметров.
11
Рис. 4.1. Значение перегрузки при неоптимальном управлении
Рис. 4.2. Значение перегрузки при оптимальном управлении
Рис. 4.3. Неоптимальные управление ut  и вектор параметров q
12
~.
Рис. 4.4. Оптимальные управление u~t  и вектор параметров q
В пятом разделе описан новый метод синтеза системы управления на базе
сетевого оператора. Изложены теоретические основы метода, представлен
разработанный алгоритм, изложены принципы построения базисного решения,
приведены методики вычислительного эксперимента и его результаты.
Для разработки метода синтеза оптимального управления космическим аппаратом
на этапе посадки в атмосфере необходимо:
 выбрать эффективную с вычислительной точки зрения структуру для представления
функциональных зависимостей;
 обеспечить возможность выбора оптимальных значений параметров в каждой
функциональной зависимости;
 обеспечить возможность построения множества Парето оптимальных решений с
помощью генетического алгоритма.
Для реализации вычислительных алгоритмов в работе используем метод сетевого
оператора [5], позволяющий в наиболее удобной для поиска на компьютере форме
представлять функциональные зависимости.
Сетевой оператор представляет собой ориентированный граф, который описывает
некоторое математическое выражение.
Для описания математических выражений в удобном для использования в
вычислительной машине виде введем в рассмотрение несколько конечных
упорядоченных множеств, из элементов которых состоит формула.
Множество переменных – это упорядоченное множество символов, вместо
которых в процессе вычисления могут подставляться числа из множества
вещественных чисел ℝ1,
(5.1)
V  v1,, vP  , vi  R1 , i  1, P .
Множество параметров – это упорядоченное множество чисел, не меняющихся в
процессе вычислений,
(5.2)
С  с1, , сR  , сi  const , i  1, R .
Множество унарных операций – это упорядоченное множество функций или
однозначных отображений, заданных на числовом множестве,
O1  1 z ,  2 z ,, W z  ,
(5.3)
где i z  : ℝ1→ℝ1, z  ℝ1, y  ℝ1  y  i z  , i  1,W .
Множество бинарных операций – это упорядоченное множество функций двух
аргументов или однозначных отображений декартового произведения пары
одинаковых числовых множеств в одно такое же числовое множество,
13
O2  1z, z,  2 z, z, , V z, z ,
(5.4)
где  i z , z  : ℝ1×ℝ1=ℝ2→ℝ1, z , z   ℝ1, y  ℝ1  y   i z , z  , i  1, V .
Бинарные операции должны обладать свойствами коммутативности,
ассоциативности и иметь единичный элемент.
Сетевой оператор представляет собой ориентированный граф без циклов с
определенными свойствами. Значения переменных и параметров связаны с узламиисточниками графа. Результаты вычислений математических выражений помещаются в
узлах-стоках. На дугах графа заданы номера унарных операций. В узлах графа заданы
номера бинарных операций.
При построении сетевого оператора необходимо математическое выражение
записать с помощью унарных и бинарных операций. Внешней операцией должна быть
бинарная. Аргументом унарной операции должна являться либо бинарная операция,
либо элемент из множества переменных или констант. Аргументами бинарной
операции должны быть только унарные операции, причем эти унарные операции, не
могут иметь в качестве аргументов одну и ту же переменную или один и тот же
параметр.
Сетевой оператор в машинной реализации представляется в виде целочисленной
матрицы сетевого оператора. На диагонали матрицы сетевого оператора расположены
номера бинарных операций, а остальные элементы либо нули, либо номера унарных
операций, причем при замене диагональных элементов на нули, а ненулевых
недиагональных элементов на единицы получаем матрицу смежности графа сетевого
оператора.
Для выполнения формальных вычислений введем в рассмотрение целочисленные
векторы:
–
вектор номеров узлов входных переменных b  b1 bP T , где bi – номер узлаисточника в сетевом операторе, с которым связана переменная vi , i  1, P ;
–
вектор номеров узлов параметров s  s1  s R T , где si – номер узла-источника в
сетевом операторе, с которым связан параметр ci , i  1, R ;
–
вектор номеров узлов выходных переменных d  d1  d M T , где di – номер узла
сетевого оператора, который соответствует выходной переменной yi , i  1, M .
 
Верхний треугольный вид матрицы сетевого оператора    ij , i, j  1, L ,
уменьшает число циклов при вычислении результата математического выражения по
сетевому оператору.
Для вычислений по матрице сетевого оператора и хранения промежуточных


результатов введем вектор узлов z  z1  zQ T , размерность Q которого равна
количеству узлов сетевого оператора. Зададим начальные значения вектору узлов. Если


узел является источником, то в качестве начального z 0   z10   z 20 
значения
возьмем соответствующий элемент из множеств переменных или параметров.
Остальные значения вектора узлов должны быть равны единичному элементу бинарной
операции, с которой связан соответствующий узел.
Для вычисления формулы по матрице  сетевого оператора используем
следующий алгоритм:
Шаг 0. Задана матрица сетевого оператора в верхнем треугольном виде    ij ,
T
 
 ij  0 , если i  j , i, j  1, Q , Определены векторы номеров узлов входных переменных
14
b  b1 bP T , параметров s  s1  s R T и вектор номеров узлов выходных переменных
y   y1  y L T .
Шаг 1. Задаем начальные значения вектора узлов
vk , если i  bk , k  1, P

0 
, i  1, Q ,
zi  c j , если i  s j , j  1, R
e , если i  I , 
0
 ii e ii , z  z
  ii


(5.5)
где ek - единичный элемент для бинарной операции  k , I 0 - множество номеров
узлов-источников или номеров нулевых столбцов матрицы  сетевого оператора.
Шаг 2. i  1 .
Шаг 3. j  i  1 .


Шаг 4. Если  ij  0 , то z ji     jj  z ji 1 ,   z ii 1  .
ij


Шаг 5. j  j  1 . Если j  Q , то переходим на шаг 4.
Шаг 6. i  i  1. Если i  Q , то переходим на шаг 3, иначе завершаем вычисления.
При построении генетического алгоритма для решения задачи синтеза управления
используем принцип базисного решения. Данный принцип заключается в том, что
задается одно базисное решение в виде сетевого оператора, описывающего
математическое выражение (3.10). Множество возможных решений определяется
множеством вариаций базисного решения.
В работе представлены и исследованы различные подходы для определения
базисного решения.
На основе анализа физических свойств задачи базисное решение можно
построить с помощью траектории в геофизическом пространстве. Вообще говоря, при
решении задач управления подобного типа, где управление осуществляется движением
механического объекта в пространстве, для выбора базисного решения можно
использовать предложенную далее методику [6].
Для построения базисного решения соединим на плоскости L, H  начальную
L0 , H 0  и терминальную L f , H f точки прямой линией


H  H0
L  L0
,

H f  H 0 L f  L0
(5.6)
H  x12  x32  R z ,
(5.7)
где
x
L  R z arctg 1 .
(5.8)
x3
На вход системы управления подаем отклонения от траектории (5.6) по
положению y1 и по углу y2 .

x 2  x32  R z   H f / H 0  1 
x
y1  1

R z arctg 1  1 .
(5.9)



H0
L
x
f
3





 2

2
 x x  x x  x 2  x 2 
x1  x3  R z  H f 
 1 2
3 4
1
3 

y 2  arctg 
 arctg
.
(5.10)

x1 
R z  x2 x3  x1 x4  

 L f  R z arctg



x3 

Таким образом, базисное управление можно записать в виде:
15
u  , если z  u 

u  u  , если z  u  ,
 z , иначе

(5.11)
где
(5.12)
z  q1 y1  q2 y2 ,
где q1 , q2 - компоненты вектора искомых параметров.
Выражение (5.12) определяет вид базисного сетевого оператора. Кроме того, на
основании (5.12) можно задать и любую другую комбинацию переменных y1 , y2 и
параметров qi , где i  1.. p .
Основная цель работы генетического алгоритма состоит во внесении таких
изменений (вариаций) в матрицу сетевого оператора базисного решения, чтобы на
выходе получился сетевой оператор, представляющий формулу искомого
оптимального управления (3.10).
Внесение изменений в матрицу сетевого оператора базисного решения
осуществляем путем последовательного внесения в нее малых вариаций одного из
перечисленных типов: замена унарной операции на дуге графа; замена бинарной
операции в узле графа; добавление дуги; удаление дуги, т.е. используем вариации,
которые не влияют на размерность сетевого оператора.
Каждая вариация изменяет граф сетевого оператора, сохраняя его свойства.
Все вариации формально могут быть описаны целочисленным вектором вариаций
из четырех компонент w  w1 w2 w3 w4 T , где w1 - номер вариации, w2 - номер
строки матрицы сетевого оператора, w3 - номер столбца матрицы сетевого оператора,
w4 - номер бинарной или унарной операции, в зависимости от номера вариации.
При реализации генетического алгоритма на основе принципа базисного решения
в качестве хромосомы используем упорядоченный набор векторов вариаций.
Для того, чтобы обеспечить достаточную вариабельность решений при малой
длине хромосомы необходимо периодически изменять базисное решение. Базисное
решение изменяем после нескольких поколений, или эпох, которые являются
основными циклами генетического алгоритма. При смене эпохи базисное решение
заменяется наилучшим найденным решением, при этом в популяции необходимо
создать тождественную хромосому, состоящую из векторов вариаций, не меняющих
решение.
Для решения задачи (3.1) – (3.10) на основе сетевого оператора необходимо
определить конструктивные множества (5.1) – (5.4). Затем установить размерность
сетевого оператора, определить множество вариаций и выбрать базисные решения.
После этого можно построить генетический алгоритм для поиска решений.
На первом этапе алгоритма генерируем множество возможных решений –
популяцию хромосом. Каждая хромосома состоит из двух частей.
Первая часть влияет на структуру системы управления и представляет собой




T
упорядоченное множество векторов вариаций W  w1, , w r , где w i  w1i w2i w3i w4i
– вектор вариаций, i  1, r . Вторая часть хромосомы влияет на значения параметров
системы управления и представляет собой битовую строку, закодированную кодом
Грея, s  s1,,s N  , где s j  0,1, j  1, N .
Первоначально создаем популяцию из H хромосом, состоящих из двух частей,
структурной и параметрической. Для каждой хромосомы вычисляем значения функций
приспособленности, которые соответствуют функционалам (3.7), (3.8).
16
Для определения приспособленности хромосомы введем условное множество

h
Парето. Пусть J h  J1h  J M
 - вектор значений функционалов для хромосомы
T
h
h.
h
Отношение Парето J h1  J h2 справедливо, если выполняются условия J i 1  J i 2 ,
i  1, M ,  k  k1,, M , J i 1  J i 2 .
Условное множество Парето Pc представляет собой совокупность возможных
h
h


решений или хромосом W k , s k , 1  k  H , для которых не существует хромосом,
более лучших в смысле отношения Парето.
Чтобы построить условное множество Парето на популяции хромосом, введем
характеристику – расстояние от текущей хромосомы до условного множества Парето
H
k 
 hk ,
(5.13)
h 1

где  hk  1, если J  J .
0 , иначе
В качестве функции приспособленности для оценки решения используем
расстояние до условного множества Парето.
h
k



Pc  W k , s k ,1  k  H : k  0 .
(5.14)
Хромосомы, имеющие нулевое расстояние, принадлежат условному множеству
Парето.
W

Для репродукции хромосом в популяции случайно отбираем пару W h1 , s h1
h2
,s
h2
. Определяем вероятность скрещивания по условию
h
h

1   1 1   2
ps  max 
,
h
h

 1  1 1  2


,


и
(5.15)
где   0,1 – параметр скрещивания.
Обмениваем части хромосом и получаем четыре новых хромосомы–потомка:
W H 1, s H 1 , W H 2 , s H 2 ,
где

сохраняем
 
структурные

части
родителей,
W H 1  W h1 , W H  2  W h2 , и W H  3 , s H  3 , W H  4 , s H  4 , где изменяются и
структурная и параметрическая части.
Для новых хромосом с заданной вероятностью pm выполняем операцию
мутации. Для мутации хромосомы случайно выбираем элементы в структурной и
параметрической частях и заменяем их на новые, случайно сгенерированные.
Вычисляем значения функционалов для новых хромосом. Осуществляем
проверку включения новой хромосомы в популяцию. Вычисляем расстояние до
условного множества Парето для новой хромосомы H  i . В популяции находим


хромосому с наибольшим расстоянием h  max h , h  1, H , где h - номер
наихудшей хромосомы в популяции. Если расстояние до условного множества Парето
у наихудшей хромосомы больше, чем у новой хромосомы h  H  i , то заменяем
наихудшую хромосому на новую W h  W H  i , s h  s H  i , 1  i  4 .
Пересчитываем заново расстояния до условного множества Парето по формуле
(5.13) для всех хромосом в популяции и повторяем операции отбора родителей,
скрещивания и мутации.
Алгоритм завершает свою работу после прохождения заданного числа поколений.
Результатом работы алгоритма является условное множество Парето, построенное на
17
конечной популяции хромосом. Алгоритм также может завершить свою работу, если
условное множество Парето не изменяется на протяжении заданного количества
поколений. Выбор конкретного решения осуществляется на основании
дополнительных критериев или на основании экспертного анализа полученных
решений.
Вычислительный эксперимент проводился при тех же параметрах модели, что и
для решения задачи оптимального управления. Начальный угол входа точно не был
известен и поэтому, он выбирался из диапазона (3.6), где
 0  0,085 рад,
 0  0,09 рад.
Для реализации вычислений были определены следующие множества:
- множество унарных операций
O1  1 z , 3 z ,  4 z , 5 z , 8 z , 9 z , 10 z , 14 z , 15 z ,
где
1z   z ,
3 z    z ,
4 z   10 z   z ,
 1
 z , если z  
5 z   
, где   10 7 ,
10 z 

, если z  
 
8  z  
1  e z
1  e z
,
1, если z  0,
0, если z  0,
 1, если z  0,
,
10 z   sign ( z ), где sign ( z )  
 1, если z  0,
9 z   ( z ), где ( z )  функция Хевисайда, ( z )  
14 z   z 3 ,
15 z   3 z ,
- множество бинарных операций
O2   0 z  , z   z   z  , 1 z  , z   z   z  .
Множество переменных имело следующий вид: V   y1 , y2  , где y1 , y2
вычислялись из соотношений (5.9), (5.10). Множество параметров содержало четыре
параметра C  q1 , q2 , q3 , q4  . Для увеличения числа параметров базисное решение
было модифицировано и имело следующий вид z  q3 q1 y1  q2 y 2   q4 q1 y1  q2 y 2  .
Векторы номеров узлов входных переменных, параметров и выходных
переменных имели следующие значения: b  1,2T , s  3,4,5,6T , d  16T .
При синтезе использовались следующие параметры генетического алгоритма:
размер начальной популяции 512; число пар, отбираемых для скрещивания в одном
поколении 256; число поколений 127; число поколений между эпохами 16; длина
хромосомы 12; размерность матрицы сетевого оператора 16; параметр для скрещивания
0,4; вероятность мутации 0,8.
В результате синтеза была получена Парето-область (рис.5.1), являющаяся
решением поставленной задачи. В таблице 5.1 представлены значения функционалов
(3.7) и (3.8), определяющие полученное множество Парето.
18
Таблица 5.1.
J1, ед.g
7,999274964
7,997622506
7,996670258
7,994186528
7,992438382
7,991468201
7,985293168
7,977366284
7,968619679
7,966361225
7,954134774
7,952536446
J2, м
25,94089319
165,8786695
384,5775085
451,047627
595,4433004
816,1181808
887,4421348
891,8490394
1220,027666
2537,325314
3063,004451
4067,107054
Рис. 5.1. Парето-область решения задачи
Экспертно выбрали одно решение, для которого J1  7 ,95 ед.g., J 2  3063 м .
Выбранное на множестве Парето управление имеет следующий вид:
u  , если z  u 

u  u  , если z  u  ,
 z , иначе

где
3


q1  q4  q12 q4  q42 q1
1 







y

1

q
y


z    y1  y 2  q1 
1
2 2
 q3 q 2 y 2 
q
q
q
1 4
4



q1  q4  q12 q4 
q1  q4  q12 q4

 sgn y1  1  q2 y 2 
y  1  q2 y 2 


 1
q1q4
q1q4



1 
q2 q3 y 2  q3 ,
  y1  y 2  q1 
q4 

где q1  3,96875 , q1  2,765625 , q3  0,421875 , q4  2 .
Выражение для переменной z описывается следующей матрицей сетевого
оператора:
19
0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 
0 0 0 0 0 0 3 1 0 0 0 0 0 0 0 0 
0 0 0 0 0 0 3 0 0 0 5 0 0 0 0 0 
0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 
0 0 0 0 0 0 0 0 0 1 0 0 4 0 0 0 
0 0 0 0 0 0 5 0 0 0 0 1 0 0 0 0 
0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 
~ 0 0 0 0 0 0 0 1 1 0 3 0 0 0 0 0 
.

0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 14
0 0 0 0 0 0 0 0 0 0 0 1 0 0 4 0 
0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 
0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 
0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 


Управление было получено при начальном угле  0  0,09 . На рис. 5.2 и 5.3
приведены графики перегрузки и управления. Из представленных графиков видно, что
структура управления сохранилась и имеет такой же вид, как и при полученном
оптимальном программном управлении.
J1 , ед. g
t, c
Рис. 5.2. Значение перегрузки при синтезированном управлении
u
t, c
Рис. 5.3. Значение управления при синтезированном управлении
20
Для сравнительного анализа чувствительности к изменению начальных условий
синтезированной системы управления и программного управления проводилось
моделирование при вариации начального угла наклона траектория  0 . Результаты
моделирования приведены на рис. 5.4 и 5.5. Сплошной линией на рисунках указаны
изменения функционалов для синтезированного управления, а пунктирной линией –
для программного. Как видно из рисунков синтезированное управление при вариации
начальных условий сохраняет лучшие значения обоих функционалов, чем
программное.
J1 , ед. g
 0 , рад.
Рис. 5.4. Влияние значения начального угла входа космического
аппарата на перегрузку J1
J 2 , км
 0 , рад.
Рис. 5.5. Влияние значения начального угла входа космического
аппарата на точность попадания J 2
ЗАКЛЮЧЕНИЕ
1. Разработан численный метод решения задачи оптимального управления, на основе
аппроксимации управления с помощью кривых Безье. Метод позволяет уменьшить
количество оптимизируемых параметров за счет использования опорных точек
вместо точек дискретизации. На основе разработанного метода получено
приближенное оптимальное программное управление спуском космического
аппарата.
2. На основе метода сетевого оператора и генетического программирования
разработан алгоритм для решения задачи многокритериального структурнопараметрического синтеза системы управления спуском космического аппарата.
21
Алгоритм позволяет одновременно искать решения для структурного и
параметрического синтеза системы управления.
3. На основе разработанного метода синтеза построена система управления спуском
космического аппарата, работающая по координатам пространства состояний. С
помощью моделирования показано, что синтезированная система управления в виде
нелинейных обратных связей по координатам пространства состояния обеспечивает
управление близкое к результату, полученному с помощью оптимального
управления как функции времени, вычисленного для той же задачи с помощью
метода аппроксимации кривыми Безье. Синтезированное управление при вариации
начальных значений сохраняет лучшие значения функционалов, чем оптимальное
программное управление.
4. Разработан в среде Delphi 7 комплекс программ, реализующих алгоритмы для
решения задачи оптимального управления методом кривых Безье и синтеза системы
управления на основе генетического программирования с сетевым оператором.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Дивеев А.И., Комарь1 Е.Ю., Северцев Н.А., Софронова Е.А. Генетический алгоритм
синтеза оптимального управления посадкой космического аппарата // Труды
международного симпозиума Надежность и качество в 2-х томах/ под ред. Ю.К.
Юркова. Пенза 21-31 мая 2007, изд-во ПГУ, Т. 1, С. 192-193.
2. Дивеев А.И., Комарь Е.Ю. Генетический алгоритм синтеза оптимального
управления посадкой космического аппарата // Тезисы докладов
5-й
Международной научно-технической конференции «К.Э. Циолковкий – 150 лет со
дня рождения. Космонавтика. Радиоэлектроника. Геоинформатика. ISBN 978-57722-0279-1. Рязань. 5-7 сентября 2007. РГРТУ, 2007. С.86-89.
3. Дивеев А.И., Шмалько Е.Ю. Метод аппроксимации кривыми Безье для решения
задачи оптимального управления посадкой космического аппарата // Труды
института Системного анализа РАН. Динамика неоднородных систем/ Под
редакцией члена корреспондента РАН Ю.С. Попкова. М.: ИСА РАН, КомКнига,
2007. Том 31(1). С. 8-13.
4. Дивеев А.И., Шмалько Е.Ю. Метод генетического программирования для синтеза
оптимального управления спуском космического аппарата // Интеллектуальные
системы: Труды Восьмого международного симпозиума (INTELS'2008) / под ред.
К.А. Пупкова –М.: РУСАКИ, 2008. ISBN 978-5-933470332-9. C. 325-327.
5. Дивеев А.И., Шмалько Е.Ю. Метод генетического программирования для решения
задачи оптимального управления. // Научная сессия МИФИ-2008. Том 10.
Интеллектуальные системы и технологии. ISBN 978-5-7262-0883-1. С. 119-121.
6. Дивеев А.И., Шмалько Е.Ю. Многокритериальный структурно-параметрический
синтез системы управления спуском космического аппарата на основе метода
сетевого оператора // Вестник Российского университета дружбы народов. Серия
инженерные исследования. 2008. №4. C. 86-93.
7. Дивеев А.И., Шмалько Е.Ю. Метод автоматического подбора формул для синтеза
системы управления спуском космического аппарата // Труды института
Системного анализа РАН. Динамика неоднородных систем / Под редакцией члена
корреспондента РАН Ю.С. Попкова. М.: ИСА РАН, КомКнига, 2008. T 32(1) C. 715.
1
Комарь – девичья фамилия автора диссертации Шмалько Е.Ю.
22
Download