Применение мультиагентных технологий для прогнозирования и

advertisement
ПРИМЕНЕНИЕ МУЛЬТИАГЕНТНЫХ ТЕХНОЛОГИЙ ДЛЯ ПРОГНОЗИРОВАНИЯ
И ПАРИРОВАНИЯ НЕШТАТНЫХ И АВАРИЙНЫХ СИТУАЦИЙ НА МКС
М,М.Матюшин1, Н.Н.Черленяк1, О.В. Волков1. П.О. Скобелев2, И.А. Сюсин2, В.П. Карбовничий2,
А.В. Соллогуб3, А.В.Царев2, Е.В. Симонова2
1
ОАО «РКК «Энергия»
Московская обл., г. Королев, ул. Ленина, д.4А, Россия
тел:+7 9859600520
2
ООО «НПК «Разумные решения»
443080, Самара, ул. Санфировой, 95, литера 4, офис 416, Россия
info@smartsolutions-123.ru
тел: +7 (846) 222-01-72, 222-91-73
3
Государственный научно-производственный ракетно-космический Центр «ЦСКБ - Прогресс»»
443009, Самара, ул. Земеца, 18, Россия
csdb@samtel.ru
тел: +7 (946) 992-66-36
Ключевые слова: космический аппарат, ресурсы, надежность, живучесть, нештатная и
аварийная ситуация, прогнозирование, мультиагентные технологии, ПВ-сеть, реальное время
Abstract
This paper describes the problems and methods of providing emergency diagnostics on International Space Station’s (ISS) which require fast reaction on events on early stages of problems
recognition. Intelligent system for decision making support is proposed which designed with the
use of on-board systems ontology management tools and multi-agent technology.
Введение
С первого полета аппарата, созданного человеком, в открытый космос, появилась мечта
запустить корабль с экипажем на борту. Однако выяснилось, что это не такая простая задача –
космическое пространство оказалось весьма враждебной средой по отношению как к живым
организмам, так и к технике. Одним из основных факторов негативного воздействия является
космический вакуум – совокупность физических явлений (таких как сильная разреженность,
низкая температура окружающей среды и др.), влияющих как на живые существа, так и на
аппаратную часть [1]. Кроме того, существует множество других разрушающих воздействий,
специфичных для космической среды [2]. Методом проб и ошибок, ценой неудач и аварий
(порой с человеческими жертвами и потерями дорогостоящих космических аппаратов) были
определены основные принципы проектирования, разработки и проверки техники, готовящейся к отправке в космос, а также к обеспечению жизнедеятельности экипажа:
 Для пилотируемых аппаратов основной и безусловной задачей в любых ситуациях является спасение жизни экипажа.


Приборы, аппаратура и другие технические устройства, отправляемые в космос,
должны быть максимально надежными даже во вредной и разрушительной среде.
Важные технические элементы должны иметь двукратное и трёхкратное дублирование.

Для человека необходимо обеспечить условия жизнедеятельности, по возможности,
приближенные к земным.
Эти принципы были заложены в концепцию построения Международной космической
станции (МКС), которая более десяти лет беспрерывно функционирует в штатном режиме и
по степени надежности, применению передовых технологий, сложности ни в чем не уступает
(а во многом и превосходит) такие сложнейшие конструкции, как атомные подводные лодки и
новейшие самолеты. Однако чем сложнее и современнее техника, тем больше времени, ресурсов и усилий требуется для поддержания ее в рабочем состоянии. За спиной любого космонавта, стартовавшего с Земли на МКС, стоят тысячи специалистов в самых разнообразных областях, которые готовятся к полету в течение нескольких лет не менее интенсивно, чем сам экипаж, во время полета в режиме реального времени следят за всеми параметрами техники, состоянием экипажа и в любой момент готовы использовать все имеющиеся средства для оказания поддержки и помощи при наступлении нештатной (НШ) или аварийной ситуации (АС).
Особенно это характерно для специалистов Центра управления полетами (ЦУП), которые
круглосуточно управляют полетом МКС и кораблей, направляющихся к ней, ведут переговоры
с экипажем.
Специалисты ЦУП подготовлены к работе в процессе парирования рассмотренных нештатных и аварийных ситуаций и готовы действовать решительно при появлении малейших
признаков угрозы здоровью или жизни космонавтов.
Постановка задачи
Самым опасным типом нештатной ситуации на МКС является аварийная ситуация, поскольку она угрожает жизни членов экипажа. В настоящее время накоплен ряд разработанных
и прошедших апробацию методических указаний, пособий и инструкций, регламентирующих
действия экипажа и специалистов ЦУП в условиях возникновения АС, таких как разгерметизация МКС, пожар, выброс токсичных веществ в атмосферу станции.
Однако в руководствах и инструкциях физически невозможно отобразить всю многогранность складывающейся полетной ситуации, поэтому экипаж и ЦУП нуждаются в средствах, учитывающих текущее изменение ситуации и работающих в дополнение к эксплуатационно-технической документации.
На практике, как правило, возникновению НШ и АС всегда предшествует множество
первых признаков или симптомов грядущей проблемы (НШ и АС). Своевременное выявление
этих признаков может существенно повысить эффективность работы экипажа и ЦУП по парированию такой ситуации.
Кроме того, изготовитель каждой подсистемы, блока, прибора или узла на станции обязан
проработать различные нештатные ситуации, которые могут возникнуть на станции в связи с
применением его устройства. Однако сохранить в памяти или в инструкциях такое множество
знаний далеко не всегда представляется возможным, особенно при различных комбинациях
использования этих устройств. В результате, при почти 100% надежности каждого узла в отдельности, вся система станции, как собранного вместе искусственного объекта в целом, может быть очень ненадежной в связи с непредвиденными проблемами взаимных влияний, согласования сигналов, разнообразных режимов работы и т.п. [2]
Наконец, даже при высокой надежности всех компонент станции она может в некоторых
ситуациях иметь невысокую живучесть, не позволяя быстро выполнить замену, и в итоге зависеть от одного узла, при выходе из строя которого экипаж и станция могут пострадать, если
не предусмотрены возможности удобного, быстрого и гибкого перераспределения нагрузки и
замены ресурсов узлов и агрегатов в критических ситуациях. И, наоборот, даже при низкой
надежности всех элементов и звеньев, если обеспечивается высокая живучесть станции в це-
лом, то в любой конфигурации и при любом стечении обстоятельств возможно успешно выходить из возникающих проблемных ситуаций.
Таким образом, эффективный подход к разрешению НШ и АС должен состоять в том,
чтобы не доводить дело до факта наступления указанных ситуаций, а как можно раньше прогнозировать и выявлять самые первые их признаки и своевременно реагировать, в корне предупреждая саму возможность появления и развития ситуации адекватными мерами воздействия, с использованием доступных ресурсов и других средств.
Такой подход требует сбора, формализации, интеграции и использования разнородных
полипредметных знаний специалистов о подсистемах станции для построения моделей ее
устройства и функционирования, а также специальных подходов и методов раннего прогнозирования и выявления НШ и АС и динамического планирования мероприятий по их профилактике, предупреждению и устранению.
Предлагаемый подход к решению проблемы
Решение поставленной задачи предлагается осуществлять на основе мультиагентной технологии и технологии представления и обработки знаний [3-4].
Для начала представим себе, что каждой подсистеме или узлу станции в соответствие поставлен программный агент, который действует от его имени и по его поручению. Такой агент
представляет собой автономную программу, которая может реагировать на события, принимать решения и взаимодействовать с другими агентами или пользователями, не требуя внешних инструкций, а реализуя внутренний встроенный цикл управления.
Следуя работе [5] введем два основных класса агентов: агентов потребностей (заказов) и
агентов возможностей (ресурсов), которые находятся в постоянном поиске друг друга. Цель
агента потребности - найти для себя наилучшую по заданным параметрам возможность для
реализации, а цель агента возможности – максимальная эффективность использования своего
ресурса. Агенты возможностей и агенты потребностей представляют собой находящиеся в
постоянном взаимодействии сущности, как «инь» и «янь» мира станции, которые в зависимости от ситуации могут переходить от конкуренции, когда на одну потребность претендуют две
возможности (и наоборот, две потребности борются за одну возможность), к кооперации, когда для удовлетворения одной большой потребности может быть необходимо несколько возможностей (и наоборот). В случае, если некоторой потребности наилучшим образом в текущий момент времени подходит определенная возможность, а этой возможности – данная потребность, эти агенты заключают договор и устанавливают связь «нуждается-в» между собой.
Образующуюся сеть потребностей и возможностей, отражающую установившиеся в ходе переговоров связи между указанными агентами, для краткости будем называть сетью потребностей и возможностей (ПВ-сетью), хотя в ней могут быть агенты, еще не нашедшие себе второй
«половинки», как свободные радикалы в химии, еще не имеющие связей, что соответствует
для них состоянию начального хаоса.
Например, устройству для биологического эксперимента может быть сопоставлен агент
потребности (заказа) на электроэнергию, которая может предоставляться определенным ресурсом – например, основным источником электроэнергии на станции. Если биологическому
эксперименту лучше всего подходит именно основной источник питания (например, по удобству подключения или другим параметрам), а этому источнику, встречно, наилучшим образом
подходят сроки эксперимента (с учетом скорости его разрядки и деградации), эти два агента
могут «договориться» о сотрудничестве и заключить «договор» о взаимодействии, запланировав использование источника на определенный период времени, при этом в мире станции возникнет связь между ними, которая может быть доступной для обозрения, анализа и принятия
решений для всех других агентов мира станции.
Пусть исходный теоретический график деградации мощности Р рассматриваемого основного источника в зависимости от срока его эксплуатации Т представлен на рисунке 1.
Т0
Т1
Рисунок 1 - Теоретический график деградации
(разрядки) рассматриваемого источника
(момент времени Т0)
Рисунок 2 - Сложившееся распределение
мощности источника между потребителями - в
зависимости от плана нагрузки график может изменяться (момент времени Т1)
Предположим, что в ходе переговоров, на начальном этапе или в ходе некоторой предыстории, ресурс источника оказался распределен плановым образом по времени между N элементами системы станции в соответствии с их текущими потребностями (рисунок 2).
Однако в зависимости от различных внешних и внутренних факторов эксплуатации источника график фактического потребления ресурса отклоняется от планового (рисунок 3).
Т2
Рисунок 3 - Расхождение между «планом» и «фактом»: возникает угроза потери источника для
части потребителей, начиная с 3 и 4 элементов (в момент Т2)
В результате отклонения от плана, некоторые элементы (например, 3 и 4) не смогут получить необходимое количество ресурса, что может привести к сбою в работе этих элементов и
катастрофическому каскаду нарастающих отказов для всей системы.
Основные задачи агентов в данном случае:
 как можно ранее сигнализировать об отклонении потребления ресурса от планируемых значений;
 спрогнозировать дальнейший уровень деградации ресурса, отличающийся от планируемого уровня;
 выяснить, насколько критичным является отклонение для потребителя;
 если событие критичное, то перераспределить потребление ресурса между элементами
системы в соответствии с их приоритетами для обеспечения работоспособности системы в целом;
 по возможности обнаружить и устранить причину отклонения, действуя при этом по
такому же принципу, что и при перераспределении ресурса.
Ниже представлен пример концептуальной модели станции в виде ПВ-сети, определяющей возможные взаимодействия агентов системы.
Эксперимент нуждается в космонавте
Эксперимент с
металлами
Результат нуждается в доставке
Космонавт
Источник нуждается в
профилактике
Эксперимент нуждается в источнике
Доставка на
Землю
БиоЭксперимент
Источник
Эксперимент нуждается в источнике
Рисунок 4 - Фрагмент концептуальной модели станции в форме ПВ-сети
Из анализа этой ПВ-сети агенту заказа энергии для био-эксперимента становится ясно,
что другого источника нет и он может лишь сократить сроки эксперимента. Аналогичным образом могут поступить и другие потребители: эксперимент с металлами и т.д.
Если всем агентам удается сократить свои сроки с соответствующим сокращением потребления энергии, то график перераспределения нагрузки на данный ресурс может иметь
следующий вид (рисунок 5).
Заметим, что если по каким-то причинам с источником питания вновь случается важное
событие, например, вновь изменился прогноз деградации, то согласованные сроки могут быть
заново пересмотрены (кривая 3 на рисунке 6).
Т3
Рисунок 5 - График перераспределения нагрузки
между потребителями энергии
Рисунок 6 - Новое событие – изменение прогноза
деградации источника энергии
.
Агент возможности при этом должен решать, готов ли он распределить свой ресурс равномерно между всеми потребителями на основе приоритетов либо других стратегий или параметров. Очевидно, что его решение вызовет «волну» пересмотров решений у других агентов, причем длина этой волны будет заранее неизвестна, но позволит смоделировать и увидеть
всю цепочку последствий принятого решения, что особенно важно для лиц, принимающих
решения.
Отметим, что на рисунке 4 показана ограниченная концептуальная модель станции, использующая лишь один тип отношений «нуждается в», характерных для ПВ-сетей, хотя подклассов таких отношений может быть выделено много (нуждается постоянно или периодически, как часто, с каким расходом и т.д.). В дальнейшем спектр концептов и отношений такой
семантической сети может быть существенно расширен структурными и функциональными,
логическими и временными отношениями, которые могут строиться на основе онтологий
предметных областей, причем могут предусматриваться вызовы модулей моделирования работы отдельных узлов, численных расчетов и т.п.
Агент возможности (ресурса) по своему характеру (роли) должен постоянно заботиться о
своем ресурсе, который может быть разовым или возобновляемым. Так, если это агент основного источника, то он должен знать график своей теоретической деградации и реальный факт
своей разрядки, для чего может периодически обращаться к данным телеметрии, если имеется
соответствующий датчик, или даже выходить на связь и просить космонавта проводить регулярный профилактический осмотр и измерения параметров разрядки источника с вводом этой
информации в систему, фактически, в базу знаний данного агента. В случае, если данный
агент обнаружит существенное расхождение между планом и фактом в своей работе, данный
агент должен идентифицировать тревожную ситуацию, сообщить об этом космонавтам и в
ЦУП и попытаться выяснить, как данный факт повлияет на работу станции как можно раньше.
В рассматриваемом примере данный агент должен будет немедленно связаться с агентом
биологического эксперимента, с которым у него установлена связь и которому по «договору»
была обещана электроэнергия на ближайшее время, и выяснить, насколько критична для него
новая ситуация. По соответствующему сообщению агент биологического эксперимента будет
«разбужен» и проинформирован о случившемся. Теперь он должен проанализировать свою
ситуацию, возможно, эксперимент уже успешно заканчивается раньше срока и тогда нет никакой проблемной ситуации, или наоборот затянулся, и ситуация становится для него критической. Во втором случае эксперименту, возможно, придется разорвать связь с первым элементом, начиная с определенного момента времени, и начать искать и бронировать себе другой
источник энергии, а если такой возможности нет – предложить отложить или полностью отменить эксперимент, и соответственно, отложить завоз биологических объектов на ближайшем корабле.
Из этого примера видно, что если агент возможности по своему характеру более «материальный», заботящийся о текущем состоянии и продлении срока работы своего ресурса, то
агент потребности более «идеалистический», который знает точно, что ему требуется и в какие сроки, т.е. живет больше будущим и постоянно планирует и перепланирует свою работу
для реализации заданной цели, например, проведения рассматриваемого эксперимента.
Логика взаимодействия потребностей и возможностей во многом зависит от того, является ли заказ разовым или периодическим, разделяемым или неделимым, а также является ли
ресурс разовым, пополняемым или воспроизводимым, разделяемым между несколькими потребностями или неделимым и т.д.
Таким образом, предлагаемая система представляет собой сообщество программных
агентов, каждый из которых реализует полный цикл управления своим объектом (подсистемой, узлом, прибором и т.д.):
1) настраивается на заданную цель (задачу);
2) выбирает сценарии для достижения цели или выполнения задачи;
3) реагирует на события (изменения) в ситуации (сцене);
4) планирует и перепланирует свою деятельность, устанавливая и изменяя связи с другими агентами в случае возникновения непредвиденных событий;
5) взаимодействует с другими агентами или пользователями - информирует о своем состоянии, предлагает решения, согласовывает свои действия, устанавливает или разрывает связи, дает встречные предложения, спрашивает и отвечает на запросы других
агентов и пользователей;
6) прогнозирует свое поведение на горизонт планирования;
7) ведет мониторинг и контроль исполнения намеченного плана;
8) выявляет расхождение между планом и фактом и инициирует перепланирование для
его устранения;
9) обучается (в будущем) из опыта.
Данный полный цикл управления оказывается присущим любому автономному организму, начиная от простейшей клетки, что и позволяет рассматривать данную систему как интеллектуальную. В результате, и вся система в целом реализует указанный цикл управления по
всей станции как композицию множества идущих квазипараллельно и асинхронно циклов работы отдельных агентов.
Чем более удовлетворены агенты своими связями – тем сильнее связи – тем в большем
равновесии находится все система. Но при возникновении непредвиденных событий часть
связей обрывается, и элементы начинают немедленно искать возможности – существующие
связи начинают пересматриваться. Система постепенно проходит состояние хаоса и переходит
в новое равновесие, соответствующее новому распределению потребностей и возможностей,
или новым планам использования ресурсов станции.
Таким образом, первой задачей системы является выявление возможной грядущей проблемы из потока разнородных данных: телеметрической, параметров, замечаний космонавтов,
наблюдений операторов ЦУП, отвечающих за работу подсистем станции, и других участников
процесса эксплуатации станции.
В рассматриваемой системе эту задачу предлагается решать на основе создания специализированных компьютерных средств представления и интеграции знаний: предметных онтологий и концептуальной модели станции на основе ПВ-сетей, которая описывает основные
ресурсы и помогает прослеживать связи основных подсистем станции на уровне потребностей
и возможностей отдельных узлов, показывающих взаимные зависимости между ними.
Второй задачей системы является динамическое планирование своевременных профилактических мероприятий для выявления состояния ресурсов станции и перепланирование имеющихся ресурсов в случае появления первых признаков и возникновения угрозы появления
НШ и АС.
Эту задачу предлагается решать на основе создания мультиагентной системы, где каждый
агент отвечает за определенную подсистему, блок или узел станции.
Ожидаемые результаты
 Решение сложной задачи прогнозирования и предупреждения НШ и АС на ранних
стадиях в условиях неопределенности;
 Обеспечение оперативной и гибкой реакции на непредвиденные события и изменения
в ситуации на станции;
 Повышение надежности и живучести в обеспечении жизнедеятельности МКС;
 Заблаговременное прогнозирование, обнаружение и выработка возможных решений
по предотвращению возникновения НШ и АС;
 Снижение сложности и трудоемкости работы персонала ЦУП и космонавтов;
 Повышение эффективности использования бортовых средств в процессе парирования
НШ и АС;
 Возможность моделирования и предсказания различных вариантов возникновения,
протекания и развития НШ и АС;
 Возможность обучать специалистов ЦУП действиям по прогнозированию, предупреждению и парированию НШ и АС.
Заключение
Создание непилотируемого, а тем более, пилотируемого аппарата, способного выполнять
поставленные задачи и обеспечивать нормальную жизнедеятельность экипажа (например, на
МКС) – сложная и комплексная задача. Для ее решения необходимо предъявлять высокие требования не только к надежности отдельных узлов, агрегатов и модулей, но и к живучести всей
системы в целом. Для обеспечения одного из аспектов живучести предлагается разработать
автоматизированную систему на основе мультиагентных технологий. Цель создания рассматриваемой системы – как можно более раннее выявление и предупреждение угроз возникновения и развития нештатных и аварийных ситуаций (НШ и АС) на борту МКС и использование
(перераспределение) имеющихся ресурсов станции для парирования указанных ситуаций,
обеспечения выживания экипажа и сохранения работоспособности самой станции, а также
скорейшего возврата МКС и экипажа к нормальной штатной работе.
Список литературы
[1] Нусинов М. Д. Космический вакуум / и надежность космической техники. – М.: Знание, 1986. – 64 с,
ил. – (Новое в жизни, науке, технике. Сер. «Космонавтика, астрономия»; № 6).
[2] Ахметов Р.Н., Макаров В.П., Соллогуб А.В. Проблемы обеспечения сбое - и отказоустойчивости
бортовой аппаратуры КА дистанционного зондирования Земли от воздействия излучений космического пространства. – «Мехатроника, автоматизация, управление». №11, 2009.
[3] Bonabeau E., Theraulaz G. Swarm Smarts. What computers are learning from them? // Scientific American.
– 2000. – Vol. 282, N 3. – P. 54–61.
[4] Wooldridge M. An Introduction to Multi-Agent Systems. – JohnWiley&Sons, 2002. – 340 p.
[5] П.О. Скобелев. Мультиагентные технологии в промышленных применениях: к 20-летию основания
Самарской школы мультиагентных систем. – «Мехатроника, Автоматизация, Управление», №12,
2010. – с. 33-46.
Download