Молодежный инновационный форум Приволжского федерального округа Конкурс научно-технического творчества молодежи (НТТМ)

advertisement
Молодежный инновационный форум Приволжского федерального округа
Конкурс научно-технического творчества молодежи (НТТМ)
Интернет-сайт: http://ify.ulstu.ru. Ульяновск, 2015 год
УДК 004.89
Средства формирования связей понятий для
онтологических рассуждений
ФГБОУ ВПО «Ульяновский государственный технический университет»
Васильева Татьяна, студент
Соснин Петр Иванович, д.т.н., профессор
В настоящей работе была произведена попытка разработать
средства установления связей между понятиями онтологии на материале
проектной документации на русском языке. Главной особенностью
является применение лингвистических инструментов, ориентация на
применение в вопросно-ответной инструментальной среде OwnWIQA, а
также использование лингвистических знаний о синтаксисе и морфологии.
За всю свою историю человечество накопило огромное количество
информации по самым разнообразным тематикам. Эта информация
характеризуется различными формами и средствами представления,
поэтому для того, чтобы накопленные данные были максимально
возможно реализованы в практической деятельности, необходимо свести
разнообразно представленную информацию к общепринятому виду.
Решение этой проблемы связано с задачей извлечения и представления
знаний, которая в настоящее время находится в фокусе внимания многих
современных исследователей. На данный момент в области
искусственного интеллекта разработан целый ряд способов представления
знаний, из которых одним из наиболее эффективных является онтология.
Согласно определению Грубера [1], онтология - это спецификация
концептуализации предметной области, т.е. онтология представляет собой
детализированное специфицированное описание некой области знания.
Основным назначением онтологии считают интеграцию информации. Как
отмечает Нахайнова [5], онтологии связывают два важных аспекта: вопервых, «определяют формальную семантику информации, позволяя
обработку этой информации компьютером», а во-вторых, «определяют
семантику реального мира, позволяя на основе общей терминологии
связывать информацию, представленную в виде, требуемом для
компьютерной обработки, с информацией, представленной в удобной
форме для восприятия человеком».
Главным элементом онтологии является понятие с набором всех
возможных отношений и связей. Понятие может быть представлено
словом или словосочетанием, которое является терминами данной
предметной области. Связь выражает вид отношения между парой
понятий.
Молодежный инновационный форум Приволжского федерального округа
Конкурс научно-технического творчества молодежи (НТТМ)
Интернет-сайт: http://ify.ulstu.ru. Ульяновск, 2015 год
Рис. 1. Система понятий в онтологии
В настоящей работе была произведена попытка разработать
средства установления связей между понятиями онтологии на материале
проектной документации на русском языке. Главной особенностью
является применение лингвистических инструментов и ориентация на
применение в среде OwnWIQA.
Поскольку нашей целью является выделение связей между
понятиями, мы не рассматриваем методику автоматизированного
выделения понятий и будем считать их уже выявленными на корпусе
текстов и внесенными в онтологию.
Инструментальная среда OwnWIQA содержит следующие типы
отношений:
базовые
наследование
часть-целое
реализация
атрибуты
причинно-следственные
прагматические
участвует
выполняет
инструмент для
ассоциациативные
по сходству
по смежности
по контрасту
временные
пространственные
синонимия
Таблица 1
Именно на эти типы отношений мы ориентировались в процессе
разработки методологии. В качестве способа был выбран синтаксический
способ установления связей, который предполагает выявление
терминологических отношений на основе определенных типов связей в
предложении.
Ермаков [3] в процессе лингвистического анализа корпусов текстов
выделяет четыре общих класса синтаксических связей в предложении:
Молодежный инновационный форум Приволжского федерального округа
Конкурс научно-технического творчества молодежи (НТТМ)
Интернет-сайт: http://ify.ulstu.ru. Ульяновск, 2015 год

связи между ситуациями и их участниками: предикатноаргументные связи (подписать → указ);
 связи внутри именных групп - связи, называющие участников
ситуации: атрибутивные связи (указ→ президента, человек → с
ружьем);
 связи между ситуациями: предикатно-предикатные (учиться
читать; видеть (как) обнаружили);
 связи ситуаций с обстоятельствами или дополнительными
атрибутами (сирконстантные связи).
Это позволило заключить, что потенциальные отношения между
понятиями могут быть выявлены на основе ближнего контекста с
привлечением морфологических шаблонов. Сложность используемых
лексико-синтаксических шаблонов определяется наличием априорных
знаний о типовых способах описания отношений в предметной области. В
наиболее простом и типичном случае возможен анализ на основании
самых общих синтаксических шаблонов:
 согласованное
определение
(прилагательное,
причастие)
выражает атрибут, признак;
 признаковое существительное при котором объект упоминается в
позиции несогласованного определения, выражает атрибут,
качество объекта;
 событийное (обычно отглагольное существительное), при котором
объект употребляется в позиции несогласованного определения,
выражает ситуацию, в которой участвует объект;
 существительное или прилагательное, связанное с объектом
глаголов связкой или стоящее в позиции субстантивного
сказуемого, выражает атрибут, качество объекта;
 полнозначный глагол или событийное существительное, при
котором объект выступает в роли актанта, представляет
ситуацию, в которой участвует объект;
 наречие при глаголе, при котором объект упоминается как
субъект, косвенно выражает характеристику объекта через его
действие.
Тип морфологического шаблона позволяет установить, описывает ли
слово отдельный концепт или вид отношения между парой концептов.
Обозначим первый случай как признак, второй как отношение. В таком
случае на основании словосочетаний можно выделить два типа связей:
 «Объект-атрибут»
Описывает расширение значения понятия. Представлено связью
в
словосочетании
типа
«согласование»
(например,
информационная система, образовательное сообщество);
 «Объект-ситуация»
Указывает на наличие вероятной связи с другим понятием.
Представлено связями в словосочетании типа «управление» и
«примыкание» (например, взаимодействие в области науки,
привлечь внимание).
Молодежный инновационный форум Приволжского федерального округа
Конкурс научно-технического творчества молодежи (НТТМ)
Интернет-сайт: http://ify.ulstu.ru. Ульяновск, 2015 год
Классификация связей по типам отношений на данном этапе пока не
была рассмотрена.
Таким
образом,
был
сформирован
алгоритм
выявления
потенциальных отношений на основе ближнего контекста:
1. Построение
словаря
терминов-обозначений
сущностей
предметной области (этап автоматизированного выявления
терминов документа);
2. Иерархическая группировка понятий на основе лексической
вложенности слов и словосочетаний;
3. Установление для каждого словосочетания связей типа «объектатрибут» и объект-ситуация».
Рис. 2. Этапы выявления потенциальных отношений
на основе ближнего контекста
1.
2.
3.
4.
5.
6.
Список литературы
Gruber T.R. A translational approach to portable ontologies //
Knowledge Acquisition, 1993, V. 5 (2), Pp. 199-200.
Гаврилова, Т.А. Извлечение знаний: лингвистический аспект //
Корпоративные системы (Enterprise Partner), 2001. - №10 (25). - с.
24-285.
Ермаков, А.Е. Эксплицирование элементов смысла текста
средствами синтаксического анализа-синтеза // Компьютерная
лингвистика
и
интеллектуальные
технологии:
труды
Международной конференции Диалог’2003. - М.: Наука, 2003. - С.
136-140.
Овдей, О. М. Обзор инструментов инженерии онтологий / О.М.
Овдей, Г.Ю. Проскудина // Электронные библиотеки. М.:
Институт развития информационного общества, т. 7, вып. 4, 2004.
Нахайнова, Л.В. Основные аспекты построения онтологий
верхнего уровня и предметной области / Л.В. Нахайнова //
Интернет-порталы : содержание и технологии : сборник научных
статей. Вып. 3 / ФГУ ГНИИ ИТТ «Информатика». - М.:
Просвещение, 2005. - С. 452- 479.
Соснин, П.И. Вопросно-ответное программирование человекокомпьютерной деятельности / П.И. Соснин. - Ульяновск: УлгТУ,
2010. - 240 с.
Download