2. Гуманитарные технологии формирования пространств знаний

advertisement
Онтологические модели и гуманитарные технологии:
что будет, если…
В.Ф. Хорошевский
Вычислительный центр им. А.А. Дородницына РАН
khor@ccas.ru
Аннотация
В докладе обсуждаются проблемы моделирования процессов, протекающих в
социуме. Представлен анализ существующей в данной области ситуации с
позиций двух направлений – разработки семантических моделей для
гуманитарной сферы и гуманитарных технологий формирования пространств
знаний.
Введение
В настоящее время одной из самых сложных и значимых проблем в области
искусственного интеллекта (ИИ) и информационных технологий (ИТ) является разработка
и реализация формальных моделей процессов, протекающих в социуме, где речь идет о
взаимодействии индивидов, обладающих своими целями и задачами (собственными и/или
«навязанными»), которые вербализуются
в специальных текстах на различных
естественных языках. В такой постановке речь идет о специализированных экспертных
системах (ЭС), а важнейшим их отличием является то, что и модели предметной области,
и механизмы вывода на знаниях формируются и/или корректируются экспертамижурналистами.
Как представляется, в настоящее время ни в области ИИ или ИТ, ни в области
социальных сетей нет адекватных полномасштабных решений этой проблемы. С другой
стороны, в области гуманитарных технологий уже накоплен достаточно обширный
фактический материал, в котором представлены (хотя и неформально) методы и средства
экспертной журналистики, обеспечивающие решение достаточно широкого спектра
практически значимых задач.
С учетом вышесказанного целью настоящей работы является анализ сложившейся
ситуации с точки зрения двух направлений – семиотических моделей для гуманитарной
сферы и гуманитарных технологий формирования пространств знаний и попытка ответить
на три вопроса: «Что может дать онтологический инжиниринг гуманитарным
технологиям?»,
«Что
могут
дать
гуманитарные
технологии
онтологическому
инжинирингу?» и «Что будет, если эти направления начнут работать вместе?».
1. Семантические модели для гуманитарной сферы
1.1. Общие замечания
 Анализ исследований и разработок по семантическим моделям пространств знаний,
методам приобретения экспертных знаний и онтологическому инжинирингу в
гуманитарных областях показывает, что с позиций сегодняшнего дня здесь можно
выделить следующие основные направления: от фундаментальных исследований по
ИИ к моделям гуманитарных процессов и из области ИТ и Semantic Technologies (ST)
к пространствам гуманитарных знаний.
1.2. Модели, методы и средства
Исследования и разработки в области ИИ внесли серьезный вклад не только в
формирование проблематики представления и обработки знаний, но и в саму идею
пространств знаний, а в последнее 10-летие и в Semantic Web. При этом такие
исследования, по существу, сформировали эту проблематику и те подходы, модели и
методы, которые развивались в дальнейшем с учетом новых Интернет-технологий.
В группе теперь уже классических работ, безусловно, выделяются инициатива
(KA)2 – Knowledge Acquisition Initiative of the Knowledge Acquisition Community
[Benjamins, et al., 1999] и проект SHOE – Simple HTML Ontology Extensions [Heflin, et al.,
2000], а также более близкие к тематике гуманитарных моделей работы [Газе-Рапопорт и
др.,1980; Поспелов и др., 1980; Таран, 2011; Михеенкова и др., 2006] и др.
Оценивая проект инициативы (KA)2 и проект SHOE в целом, можно
констатировать, что очень многие идеи, разработанные и реализованные в этих проектах,
сейчас «переоткрываются» и используются снова, а эти 2 проекта, по сути дела, заложили
научно-технические основы формирования пространств знаний.
Одной из первых, не только в нашей стране, но и в мире, работ по онтологическому
моделированию гуманитарных процессов была работа по генерации на ЭВМ волшебных
сказок [Гаазе-Рапопорт и др.,1980]. Основная цель этой работы состояла в том, чтобы на
базе идей В. Проппа и методов ИИ предложить формальную модель сказочных текстов,
где в рамках единого фреймового формализма представления знаний были бы
смоделированы как общий сюжет, так и персонажи волшебной сказки с их целями и
поступками. Для примера ниже рассматривается общая структура формальной модели
сказочного текста и ее конкретизация для модели детективной истории, предложенной
В.Б. Карповым.
В соответствии с общей идеей В. Проппа структура волшебной сказки может быть
представлена следующим образом:
Пролог (экспозиция) +Тело (развертывание сюжета) + Эпилог (постпозиция)
Экспозиция волшебной сказки по В. Проппу [Propp, 1968] описывается графом,
показанным на Рис. 1, развертывание сюжета осуществляется на основе представления
последовательности эпизодов, а постпозиция имеет простую линейную структуру вида
Награда-Героя + Заключение-Сказочника + Традиционная-Формула-Завершения.
Герой
Традиционная
формула начала
Место/Время
Моление о
ребенке или
пророчество
Родители
героя
Другие
персонажи
Завязка
Рождение
героя
Рис. 1. Экспозиция волшебной сказки
Для разных жанров развитие сюжета осуществляется в соответствии с разными
моделями. Так, для жанра волшебной сказки характерна линейная схема из множества
эпизодов. В случае сериалов модификация линейной схемы волшебной сказки состоит в
том, что в каждом эпизоде могут участвовать произвольно выбранные персонажи.
Детективная схема направлена на достижение цели и в рамках сюжета определяется
последовательность обменов вещей между персонажами таким образом, чтобы главный
герой, смог добиться своей цели (раскрытия преступления).
Таким образом, уже в 80-х годах ХХ века в рамках исследований и разработок в
области ИИ были заложены основы формального описания моделей текста различных
жанров. Дальнейшее развитие теории пошло по пути создания моделей поведения
персонажей и создания моделей конфликтных ситуаций.
Среди работ первого направления, на наш взгляд, представляет интерес
исследование Д.А. Поспелова и В.А. Шустер [Поспелов и др., 1980] по нормативному
поведению в интеллектуальных системах и моделям поступков. В дальнейшем
специалистами по ИИ, когнитивными психологами и структурными лингвистами самое
серьезное внимание уделялось различным аспектам создания формальных моделей в
гуманитарной сфере.
Не имея возможности в данной работе рассмотреть даже наиболее известные из
таких моделей, хотелось бы тезисно остановиться на тех отечественных работах, которые
сформировали саму методологию построения моделей гуманитарного знания, предложили
методы спецификации и анализа таких моделей, а также заложили основы создания
инструментальных
средств
формирования
пространств
гуманитарных
знаний.
Важнейшим аспектам когнитивного моделирования в гуманитарной сфере посвящены
работы недавно ушедшей из жизни Т.А. Таран [Таран, 2011] и работы В.К. Финна с
сотрудниками [Михеенкова и др., 2006], где представлены исследования в области
формальных моделей социологических явлений и процессов. Так, Т.А. Таран предложен
специальный математический аппарат для когнитивного картирования «образа ситуации»,
а для создания когнитивных карт здесь использовались репертуарные решетки,
обеспечивающие
выявление
представлений
личности
о
себе,
о
мире
и
о
взаимоотношениях с миром, и специальные средства представления данных решетки в
виде графов. Логический подход к построению моделей социологических явлений и
процессов развивается в научной школе В.К. Финна [Финн, 2004]. В частности, в работе
[Михеенкова
и
др.,
2006]
предлагается
формализация
качественного
анализа
социологических данных на базе ДСМ-метода автоматического порождения гипотез.
Таким образом, можно констатировать, что в настоящее время в результате
фундаментальных и прикладных исследований в области ИИ уже сформирован
достаточно представительный спектр формальных методов представления знаний в
гуманитарной сфере. Вместе с тем, использование этих методов на практике тормозится
отсутствием удобных для гуманитарного сообщества технологий и инструментария, где
математически сложный аппарат был бы «экранирован» от экспертов-предметников
адекватными интеллектуальными средствами формирования пространств гуманитарных
знаний.
На
наш
взгляд,
решение
этой
важнейшей
задачи
лежит
в
области
информационных технологий и онтологического инжиниринга, кратко представленных в
оставшейся части настоящего раздела.
Одним из прикладных направлений в области ИИ во второй половине ХХ века
было направление «Экспертные системы», где важнейшей задачей была разработка
методологий,
методов
и
средств
приобретения
знаний.
Оценивая
результаты
исследований и разработок в области формирования баз знаний для прикладных
интеллектуальных систем в целом, можно констатировать, что именно здесь были
заложены теоретические основы онтологического моделирования – направления, которое
в настоящее время активно развивается в рамках построения пространств знаний в
различных (в том числе, гуманитарных) областях.
1.3. Онтологический инжиниринг
В области онтологического инжиниринга ведутся интенсивные работы в рамках
десятков и даже сотен проектов [Ефименко и др., 2011а, 2011б; Гурьянова и др., 2011].
Одним из фундаментальных результатов исследований русской школы психологов,
который представляет большой интерес для построения онтологических моделей
гуманитарного знания, является теория активностей (теория деятельности) [Vygotsky,
1978; Leont'ev, 1978], в рамках которой предполагается, что в процессе деятельности
предмет изменяет объект для генерации результата с помощью средств в контексте
определенного сообщества с его правилами и разделением труда. Активные работы по
развитию и использованию теории деятельности ведутся в Скандинавии [Engestrom,
1987], где разрабатываются методологии проектирования многоуровневых онтологий на
базе контекстов. В подходе скандинавской (финской) школы выделяются 7 контекстных
областей, из которых «получают» концепты для уточнения и интерпретации контекстных
явлений – цель, лицо, действие, объект, возможность, место и время, а структурирование
понятий внутри и между областями осуществляется по схеме 7S: for Some purpose,
Somebody does Something for Someone, with Some means, Sometimes and Somewhere (с какой
целью кто-то делает что-то для кого-то с помощью некоторых средств время от времени и
в некотором месте). Значительный интерес для построения пространств гуманитарных
знаний представляет и методология когнитивного моделирования, предназначенная для
анализа и принятия решений в плохо определенных ситуациях, предложенная
Р. Аксельродом [Axelrod, 1976]
и основанная на моделировании субъективных
представлений экспертов о ситуации и методах анализа ситуаций, а также ее развитие –
технология конфайнмент-моделирования [Уиддет, Холлифорд, 2003], где общая модель
компетенций выступает в качестве онтологии предметной области, а специальные модели
рассматриваются как прикладные онтологии.
В контексте настоящей статьи представляют интерес и результаты работ в кластере
онтологического инжиниринга под руководством Т.А. Гавриловой в Санкт-Петербурге
[Гаврилова, 2009], где в качестве базисной парадигмы методологии структурного анализа
знаний и формирования поля знаний был предложен обобщенный объектно-структурный
подход и алгоритм объектно-структурного анализа (ОСА) предметной области,
позволяющего оптимизировать и упорядочить нестрогие процедуры структурирования
знаний с дезагрегацией ПО на отдельные страты.
В последнее время наблюдается значительное увеличение исследований в области
решения проблем формирования пространств знаний, а основные исследования
сосредоточены на разработке методологий и методов построения онтологий «с нуля»
(from scratch, on fly); методах реинжиниринга онтологий (ontology reengineering); методах
коллективной разработки онтологий (collaborative ontology development) и методах и
методологиях объединения и выравнивания онтологий (ontology merging & alignment).
2. Гуманитарные технологии формирования пространств знаний
В данном разделе доклада представлено обсуждение гуманитарных технологий как
совокупности методов и средств, направленных на достижение целей и решение задач,
специфицированных
в
работах
Е.Н. Пенской,
А.Г. Шмелева,
Г.П. Щедровицкого
[Пенская, 2006; Шмелев, 1982; Щедровицкий, 1995] и других исследователей, по сути
дела, создавших само направление гуманитарных технологий и экспертной журналистики,
а также активных практиков в данной области, интуитивно сформировавших работающие
здесь техники, но так и не построивших адекватные модели, которые бы могли
использоваться без их непосредственного участия.
Заключение
В чем же, по мнению автора, возможна синергия представленных в докладе
результатов, полученных в компьютерных и гуманитарных науках?
Ответ на вопрос «Что может дать онтологический инжиниринг гуманитарным
технологиям?», как представляется, состоит в следующем:
 разработанные формальные модели и методы обеспечивают теоретический базис
исследований и разработок в области создания пространств гуманитарных знаний;
 созданные в ИТ-сообществе инструментальные средства могут способствовать
переходу от неформальных моделей гуманитарного знания к практической реализации
пространств гуманитарных знаний.
Представляется,
что
гуманитарные
технологии
являются
ключевыми
для
онтологического инжиниринга в данной области, поскольку именно гуманитарные
технологии
 могут обеспечить построение адекватного поля знаний в данной области;
 могут способствовать развитию новых моделей для пространств гуманитарных знаний,
а также созданию новых методов и средств их использования в прикладных задачах.
С учетом вышесказанного ответ на вопрос «Что будет, если эти направления
начнут работать вместе?» представляется очевидным – это будет способствовать
становлению и развитию нового перспективного и в фундаментальном, и в прикладном
аспекте направления «Интеллектуальные системы в гуманитарной сфере».
Литература
[Гаврилова, 2009] Гаврилова Т.А. Инженерия знаний // В кн.: Инновационное развитие:
экономика, интеллектуальные ресурсы, управление знаниями / Под ред. Б.З. Мильнера, М.:
ИНФРА-М, 2009
[Гаазе-Рапопорт и др., 1980] Гаазе-Рапопорт М.Г., Поспелов Д.А., Семенова Е.Т. Порождение
структуры волшебных сказок. /Научный совет по комплексной проблеме «Кибернетика». М., 1980, -20с.
[Ефименко и др., 2011а] Ефименко И.В., Хорошевский В.Ф. Онтологическое моделирование
экономики предприятий и отраслей современной России: Часть 1. Онтологическое
моделирование: подходы, модели, методы, средства, решения (ч. 1). – М.: Изд. дом ВШЭ,
2011. – 76 с.
[Гурьянова и др., 2011] Гурьянова М.А., Ефименко И.В., Хорошевский В.Ф. Онтологическое
моделирование экономики предприятий и отраслей современной России: Часть 2. Мировые
исследования и разработки: аналитический обзор (ч. 2). – М.: Изд. дом ВШЭ, 2011. – 88 с.
[Ефименко и др., 2011б] Ефименко И.В., Хорошевский В.Ф. Онтологическое моделирование
экономики предприятий и отраслей современной России: Часть 3. Российские исследования
и разработки в области онтологического инжиниринга и бизнес-онтологий (ч. 3). – М.: Изд.
дом ВШЭ, 2011. – 58 с.
[Михеенкова и др., 2006] Михеенкова М.А., Финн В.К. Об одном варианте формализованного
качественного анализа социологических данных. //Труды национальной конференции по
искусственному интеллекту КИИ-2006, Тверь, 2006.
[Пенская, 2006] Структуризация российской гуманитарной среды. Подходы к изучению. //
Вопросы образования 2006, №4.
[Поспелов и др., 1980] Поспелов Д.А., Шустер В.А. Нормативное поведение интеллектуальных
систем. //Ученые записки Тартуского университета, -Тарту, 1980, Вып. 551. Логикосемантические вопросы искусственного интеллекта. -с. 92-103.
[Таран, 2011] Таран Т.А. Искусственный интеллект и гуманитарные проблемы: конфликты,
рефлексивные процессы, обучающие системы. Избранные труды. –К.: Просвiта, 2011. -224с.
[Уиддет, Холлифорд, 2003] Уиддет С., Холлифорд С. Руководство по компетенциям // М.: Hippo,
2003.
[Финн, 2004] Финн В.К. Об интеллектуальном анализе данных // Новости искусственного
интеллекта, 2004, № 3.
[Шмелев, 1982] Шмелев А. Г. Введение в экспериментальную психосемантику: теоретикометодологические основания и психодиагностические возможности. — М., 1982. — 180 с.
[Щедровицкий, 1995] Щедровицкий Г. П. Избранные труды. — М.: Шк.Культ.Полит., 1995. -800 с.
[Axelrod, 1976] Axelrod R. The Structure of Decision: Cognitive Maps of Political Elites. Princeton
University Press, 1976.
[Benjamins, et al., 1999] Benjamins R., Decker S., Fensel D., Gomez-Perez A. “(KA)2: Building
Ontologies for the Internet”: A Mid Term Report. International Journal of Human Computer
Studies (IJHCS). 51(3). September 1999.
[Engestrom, 1987] Engestrom Y. Learning by expanding: an activity theoretical approach to
developmental research. Orienta-Konsultit, Helsinki, Finland(1987).
[Heflin, et al., 1998] Heflin J, Hendler J, Luke S.: Reading Between the Lines: Using SHOE to Discover
Implicit Knowledge from the Web. In: AAAI-98 Workshop on AI and Information Integration,
1998.
[Leont'ev, 1978] Leont’ev, A. N. Activity, Consciousness, Personality. Englewood Cliffs, NJ, Prentice
Hall. (1978).
[Propp, 1968] Propp V., Morphology of the Folktale. //Austin: University of Texas Press. 1968.
[Vygotsky, 1978] Vygotsky, L. S. Mind in society: The development of higher psychological processes.
Cambridge, MA: Harvard University Press. xi, 159 p. 1978.
Download