А.В. ВАНИН, В.В. КЛИМОВ СИСТЕМА АВТОМАТИЧЕСКОГО ФОРМИРОВАНИЯ ФОРМАЛИЗОВАННЫХ ТЕКСТОВЫХ ДОКУМЕНТОВ НА

advertisement
А.В. ВАНИН, В.В. КЛИМОВ
Научный руководитель – Б.А. ЩУКИН, д.т.н., профессор
Национальный исследовательский ядерный университет «МИФИ»
СИСТЕМА АВТОМАТИЧЕСКОГО ФОРМИРОВАНИЯ
ФОРМАЛИЗОВАННЫХ ТЕКСТОВЫХ ДОКУМЕНТОВ НА
ОСНОВЕ СЕМАНТИЧЕСКОЙ СЕТИ
В докладе проводится обзор технологий работы с семантически размеченной
информацией и описывается система автоматического формирования формализованных текстовых документов (на примере боевых приказов) на основе семантической сети. Приводятся аргументы о целесообразности внедрения разрабатываемой системы.
Исследования предметной области показали, что в настоящее время
для построения плана боевых действий офицеры РФ используют стандартную геоинформационную систему, с помощью которой на интерактивную карту наносятся боевые единицы и выполняемые ими действия.
Однако, составление по данной карте такого формализованного документа, как боевой приказ, не автоматизировано и требует значительных трудовых и временных затрат.
В данной статье мы будем рассматривать построение такого формализованного документа как "боевой приказ". Офицер при составлении данного документа должен единовременно анализировать достаточно много
информации:
1.Анализ карты боевых действий. Боевые приказы строятся на основе
размеченной интерактивной карты боевых действий, на которой боевые
единицы и их действия помечены соответствующими знаками.
2. Анализ информации, связанной с знаками на карте. Каждый знак на
интерактивной карте ассоциируется с определенной боевой единицей,
причем, к нему приписывается дополнительная информация (такая как:
время выполнения назначенного боевой единице действия, название боевой единицы и т.д.)
3. Анализ смысловых (семантических) связей между знаками.
Встает задача автоматизации процесса составления такого формализованного документа. При этом, учитывая семантическую природу рассматриваемых данных, для работы с ними предлагается использовать такую
структуру данных как онтология (семантическая сеть).
Разработанный прототип системы представляет собой встраиваемый
программный модуль (построенный на платформе Eclipse RCP), который
будет работать в рамках уже используемой геоинформационной системы,
позволяющей с помощью интерактивной карты составлять план боевых
действий.
Внутренним представлением данных, необходимых для описания боевой обстановки и формирования приказов, является семантическая сеть,
включающая схему отношений между отдельными элементами боевой
обстановки. Схема данных семантической сети описывается в виде онтологии. Онтология используется на всех этапах функционирования системы. Семантическая сеть представляется в формате RDF, онтология — в
формате OWL.
RDF — Resource Description Framework, нотация описания "ресурсов".
OWL — Web Ontology Language, язык описания онтологий для семантической сети.
Для обработки семантической сети оперативной обстановки использована библиотека Jena. Данный выбор обусловлен тем, что Jena представляет собой наиболее развитое средство работы с семантическими сетями,
ориентированное на использование стандартизованных форматов RDF и
OWL.
Схема работы программного модуля генерации приказа состоит из
двух последовательных этапов:
1. Построение семантической сети, отражающей смысловые связи
между объектами обстановки. Семантическая сеть собирает все данные,
необходимые для генерации документов. Сеть строится по мере заполнения пользователем карты, отражающей план боевых действий.
2. Генерация документов на основе полученной семантической сети и
системы шаблонов. На этом этапе полученная семантическая сеть преобразуется с использованием набора шаблонов. Результатом преобразования
является набор целевых документов — текстов приказа.
Таким образом, пользователь получает возможность работать под контролем "умной" системы, не позволяющей вводить противоречивые данные и контролирующей формальные правила построения. Результатом
работы программного модуля является набор формализованных целевых
документов, информационная целостность которых гарантирована (формат выходных документов можно задавать в зависимости от потребности
пользователя: .doc, .odt, .html).
Внедрение разрабатываемой системы позволит значительно сократить объем рутинной ручной работы, выполняемой офицерами при составлении приказов, в значительной степени автоматизируя данную процедуру, ликвидируя риск внесения ошибок, неточностей. При этом также
сокращается и время, необходимое для формирования каждого выходного
документа, а так же гарантируется отсутствие смысловых противоречий
(семантическая сеть, лежащая в основе системы, обеспечивает поддержку
информационной целостности).
Прототип системы автоматического формирования формализованных
документов по семантической сети был успешно интегрирован в информационную систему построения плана боевых действий, используемую
офицерами в данный момент. Также прототип в интегрированном виде
был продемонстрирован высшему офицерскому составу и получил положительные отзывы с их стороны. Кроме того, в процессе демонстрации
были услышаны новые конструктивные предложения от потенциальных
пользователей, которые будут учтены в следующих версиях данной системы, что позволит повысить коэффициент эффективности использования данной системы.
Таким образом, на данный момент получено подтверждение о практической полезности и целесообразности внедрения системы автоматического формирования формализованных документов по семантической
сети. Так же данная задача, несомненно, представляет академический интерес. Рассматриваемая в данном докладе задача позволяет взглянуть на
такую интересную и актуальную технологию, как семантический веб, под
новым углом, что позволит определить новые области применения технологий, связанных с семантическим вебом.
Список литературы
1. Guarino N. Formal. Ontology and Information Systems. Amsterdam IOS Press, 1998.
2. Lee W. Lacy. Owl: Representing Information Using the Web Ontology Language. —
Traf-ford, 2005. — 259 с.
3. Sir Timothy John Berners-Lee. Spinning The Semantic Web. — MIT Press, 2003. — 366.
4. Климов В.В., Ванин А.В. Автоматическая генерация java веб-сервисов и их семантических описаний на основе онтологии предметной области. В кн.: Научная сессия
МИФИ-2012, “Молодежь и Наука”. Сборник научных трудов М.: МИФИ, 2012. Т.3. С.
107-108;
Download