развитие элементов самоорганизации и эволюции в

advertisement
РАЗВИТИЕ ЭЛЕМЕНТОВ САМООРГАНИЗАЦИИ И ЭВОЛЮЦИИ
В МУЛЬТИАГЕНТНОМ ПОРТАЛЕ СОЦИОКУЛЬТУРНЫХ РЕСУРСОВ
САМАРСКОЙ ОБЛАСТИ
В.В. Андреев1, О.И. Лахин3, И.А. Минаков2, А.Н. Сальков3, П.О. Скобелев2
1
Институт проблем управления сложными системами РАН
443020, Самара, ул. Садовая, 61
cscmp@iccs.ru
тел: +7 (8462) 32-39-27, факс: +7 (8462) 33-27-70
2
ООО НПК «Маджента Девелопмент»
443110, Самара, ул. Осипенко, 1а
contact@magenta-technology.ru
тел: +7 8462 706684, +7 8462 706685 факс: +7 8462 706685
3
ООО НПК «Генезис Знаний»
443011, Самара, ул. Ново-Садовая, д. 221, офис 206
salkov@kg.ru
тел/факс: +7 (8462) 34-87-57, 17-30-69
Ключевые слова: открытые мультиагентные системы, самоорганизация и эволюция, извлечение знаний, понимание текста, социокультурные ресурсы
Abstract
The paper discusses new approach for self-organization and evolution applied to Internet-portal of
social and cultural resources of the Samara region. This approach develops and advances the ideas
of the Semantic Web, basing on the multi-agent technologies, knowledge management and text
understanding algorithms.
Введение
Быстрое развитие сети Интернет сделало для пользователя доступным огромное количество информационных ресурсов, а также Интернет – порталов, предоставляющих целый комплекс информационных услуг. Но гигантские объемы имеющейся информации становятся
причиной ряда проблем, в первую очередь связанных с необходимостью быстро и корректно
обрабатывать и получать релевантные данные и знания.
К числу основных проблем относится задача индивидуализации поиска, когда каждый
пользователь имеет возможность указать, какие именно предметные области\темы для него
являются наиболее важными, и получить только актуальную информацию. Для решения этой
задачи необходимо наличие интеллектуальных средств, способных понять потребности и желания каждого отдельного пользователя, а также механизмы работы с информационными ресурсами, позволяющие оперативно отреагировать на его запросы.
Второй серьезной проблемой является «пассивность» информационных ресурсов – когда
имеющиеся данные никак не связаны между собой, и появляющиеся различные статьи и сайты
на одну и ту же тему, зачастую взаимно дополняющие друг друга, существуют независимо,
без коммуникации друг с другом (иногда даже не зная о существовании друг друга), не имея
возможности организоваться в некое «сообщество по интересам», а также сами про-активно
искать пользователей, проявляющих интерес к данной предметной области.
277
Поэтому для решения указанных проблем W3 Consortuim1 разрабатывает концепцию Семантической Сети. Семантическая Сеть (Semantic Web) – расширение современной сети, в которой каждому информационному ресурсу присваивается формализованный смысловой описатель, представляющий семантическое значение этого ресурса. Суть этой идеи состоит в том,
чтобы научить, наконец-то, компьютеры “понимать” семантическое содержание Интернетсайтов, то есть распознавать и интерпретировать смысл (значение) той информации, которая
находится на странице [1].
Для решения данной проблемы нами предлагается подход работы со знаниями, основанный на принципах самоорганизации и эволюции, и реализуемый с помощью мультиагентной
технологии. В настоящей статье мы рассмотрим особенности его применения на примере создание мультиагентного портала социокультурных ресурсов.
1 Мультиагентный портал социокультурных ресурсов Самарской области
Для интеграции деятельности общественных организаций и объединений, а также стимулирования процессов самоорганизации людей в таких сообществах был создан Интернет – портал социокультурных ресурсов Самарской области [2].
Портал представляет собой открытую и развивающуюся систему, позволяющую пользователям всех категорий не только получить интересную для них информацию, но и принять
активное участие в повседневной жизни и развитии портала. Для обеспечения указанной функциональности каждому пользователю и ресурсу ставятся в соответствие агенты - программные
объекты, постоянно следящие за изменениями системы портала и стремящиеся найти наиболее
интересные ресурсы на основе динамически изменяющейся карты интересов и знаниях о пользователе. При этом знания представлены онтологией портала, в которой хранятся социокультурные ресурсы – кванты и связи культурной сферы деятельности между ними. Каждый пользователь может не только добавить новый квант, но и развивать существующую онтологию,
путем построения семантических дескрипторов (описаний) квантов.
Агенты в дальнейшем используют онтологий социокультурных ресурсов для поиска наиболее интересных для пользователя квантов, при этом, накапливая информацию о действиях
пользователя и заботясь о том, чтобы картина его исходных предпочтений постоянно уточнялась и корректировалась с каждым его шагом в системе.
Таким образом обеспечивается интеллектуальное взаимодействие с пользователем, динамическое формирование страниц портала с учетом интересов пользователя, индивидуализация
работы портала под каждого пользователя и открытость системы.
На сегодняшний день в портале социокультурных ресурсов Самарской области насчитывается более 450 квантов, и примерно в полтора раза больше – связей между ними [3]. Наличие
такого объема связанной информации, а также ее постоянный рост порождает следующие проблемы:
• усложняется процесс реорганизации онтологии портала, то есть динамического изменения
связей между квантами;
• затрудняется возможность адекватной реакции на изменение поведения пользователей:
• усложняется доступ к актуальной для пользователя информации.
Для решения указанных проблем необходимо применение механизмов самоорганизации и
эволюции в системе портала.
1
Международный индустриальный консорциум, целью которого является разработка общих стандартов сети Интернет.
278
2 Механизм самоорганизации в портале социокультурных ресурсов
Самарской области
Для того чтобы система портала адекватно и своевременно реагировала на изменение интересов пользователей, необходимо наличие механизма самоорганизации, то есть наличие механизма автономной реорганизации связей в системе. Самоорганизация в портале возможно
благодаря тому, что агенты пользователей и ресурсов способны самостоятельно воспринимать
ситуацию и принимать решения об изменении связей между квантами.
В качестве механизма, обеспечивающего процессы самоорганизации, используется метод
компенсаций, когда каждый информационный ресурс имеет некий уровень энергии (виртуальные деньги), отражающие его информационную ценность\популярность. В процессе переговоров информационные ресурсы соревнуются за возможность быть показанным тому или иному
пользователю, оплачивая установление связи, а пользователь, в свою очередь, реагируя на интересность представленной ему информации, дает деньги наиболее заинтересовавшим его
квантам, посредством выбора той или иной статьи.
Таким образом, задача агента кванта – распределить свои деньги так, чтобы получить
максимальный доход. В случае траты всех денег агент погибает, а соответствующий квант удаляется из системы. Так, например, рискованный агент может инвестировать все свои деньги в
связь с самым посещаемым квантом, но за счет высокой оплаты связи разориться и отказать от
связи или погибнуть в системе. Однако он может вовремя понять ситуацию и поменять свою
стратегию на менее рискованную.
Более того, агенты могут организовывать связи на основе подобия содержимого, то есть в
результате матчинга (сравнительной схожести) их семантических дескрипторов, таким образом, образуя группы по определенным темам.
3 Механизм эволюции в портале социокультурных ресурсов
Для того чтобы обеспечить пользователей новыми и интересными ресурсами и чтобы
портал мог адекватно и своевременно реагировать на изменение поведения пользователей, например при снижении уровня посещаемости портала, необходимо наличие механизма эволюции и развития.
При этом эволюция представляется, как неограниченная последовательность процессов
самоорганизации в условиях постоянно меняющихся внешних условий, в результате которой
из простой "плоской" сети квантов портала образуется более сложная комбинация групп (кластеров) квантов, а также появляются совершенно новые кванты (агент рекомендует автору изменить содержимое заметки и появляется статья с новым содержанием, агент находит информацию в сети, которую просит подключить к своему тексту и т.д.).
Агент ресурса, у которого понижается уровень посещаемости, может:
• инициировать своего хозяина, который его создал, чтобы он поменял семантический дескриптор, при этом агент может предоставить список рекомендуемых изменений на основе
анализа интересов и смысла своего ресурса
• самостоятельно по своему семантическому дескриптору установить связь с другими схожими ресурсами, которые находятся за пределами системы портала;
• пригласить людей посетить портал.
В случае изменения поведения пользователей, например, при появлении нового кванта,
уровень посещаемости которого резко возрастает, агент может автоматически изменить стратегию, пересмотреть свои связи и по возможности установить связь с этим квантом.
Таким образом, данные механизмы позволяют оперативно реагировать на любые изменения в структуре портала, будь то появление новой информации или смена интересов групп
пользователей, давая в любом случае наиболее адекватную информацию, динамически подстраиваясь под текущие интересы посетителей портала.
279
4 Применение систем извлечения знаний и понимания текста
в задачах самоорганизации и эволюции
Для поддержки механизмов самоорганизации и эволюции используются системы извлечения знаний [3] и понимания текста [4].
Система понимания текста применяется для формирования семантических дескрипторов
каждого информационного ресурса, давая возможность представить семантический смысл каждого кванта портала. Также на ее основе реализуются механизмы поиска похожих квантов,
позволяя образовывать группы схожих материалов, обеспечивая самоорганизацию информации в портале.
Механизмы эволюции проявляются в возможности системы понимания текста пополнять
онтологию новыми понятиями, знаниями, которые встречаются в поступающих информационных материалах, тем самым увеличивая знания агентов о том мире, в котором они существуют,
и давая возможность использовать вновь обретенные знания в логике рассуждений. (Например,
если на сайт добавляется новый квант, рассказывающий о предстоящей выставке, а само понятие «выставка» не представлено в онтологии, то на основе понимаемого контекста будет сделан вывод, что выставка – вид социокультурного события, и в дальнейшем этот факт, добавленный в онтологию, будет использоваться при анализе и выработке предложений пользователям).
Для поддержки механизма самоорганизации применяется система извлечения знаний, позволяющая адекватно реагировать на поведение пользователей, динамически уточняя карту их
интересов на основе наблюдения за действиями пользователя.
Так, агенты квантов и пользователей портала могут образовывать связанные группы - кластеры, при этом пользователи могут объединяться на основе общих интересов и увлечений, а
кванты на основе подобии содержимого их семантических дескрипторов. Кроме того, кванты
могут образовывать группы наиболее посещаемых ресурсов по определенной тематике. (Например, группа информационных материалов, посвященных событиям конца 19-го века, могла
быть задана вручную в процессе построения онтологии, а могла и образоваться самостоятельно
на основе механизма кластеризации, когда стало понятно, что многие материалы имеют эту
общую особенность, а данная тема востребована посетителями портала).
Также механизм извлечения знаний применяется для обеспечения эволюционного развития агентов, когда посредством анализа удачных и неудачных стратегий продвижения информационных квантов пользователям, агенты динамически меняют стратегии своего поведения,
чтобы лучше быть приспособленным к имеющейся ситуации и быть точнее ориентированными
на те или иные группы пользователей.
Системы извлечения знаний и понимания текста обеспечивают основные механизмы работы со знанием – представление, извлечение, поиск, анализ, пополнение. На основе этих механизмов и осуществляются процессы самоорганизации и эволюции, рассмотренные нами на
примере социокультурного портала.
5 Идеологические аспекты механизмов самоорганизации и эволюции
Рассматриваемые механизмы самоорганизации и эволюции на теоретическом уровне подробно разобраны в работах Г. Хакена [5] и И. Пригожина [6].
В указанных работах изучаются процессы самоорганизации и эволюции в сложных открытых системах, к которым относится также и портал социокультурных ресурсов, так как
структура портала может динамически изменяться, а число элементов достаточно высоко.
Под самоорганизацией понимается спонтанное образование устойчивых организаций,
структур при определенных условиях, например, образование групп агентов по определенной
тематике при наличии достаточного количества квантов со сходными семантическими дескрипторами. При этом эволюция представляется, как неограниченная последовательность про-
280
цессов самоорганизации в условиях постоянно меняющихся внешних условий. Для портала
социокультурных ресурсов такими условиями, например, являются динамика появления в
портале новых ресурсов, уровень посещаемости портала, типы и интересы пользователей.
Кроме того, в сложных открытых системах наблюдаются различные феномены, которые
мы надеемся наблюдать в портале:
• осцилляция связей между квантами,
• катастрофы - лавинообразный пересмотр связей, например, при появлении нового интересного кванта в портале,
• аттракторы – устойчивые структурообразования, например группы квантов по определенной тематике.
Заключение
В настоящей статье рассмотрены основные аспекты построения кардинально нового инструмента с использованием развитых элементов самоорганизации и эволюции, позволяющие
решить такие проблемы, как поиск актуальной для пользователя информации и обеспечение
«про-активности» информационных ресурсов.
Использование Интернет-порталов «по интересам» дает возможности индивидуализации
поиска и работы со знаниями для каждого пользователя на основе его интересов и предпочтений, определяемых автоматически и динамически подстраивающихся. Алгоритмы извлечения
знаний и понимания текста позволят интегрировать различные информационные ресурсы, создавая сообщества «по интересам» и связывая информацию из различных информационных
источников, тем самым продвигая идеи Semantic Web в новом направлении, где знание автоматически определяется на основе текста сайта, автоматически коммуницирует и преобразует
себя на основе взаимодействия с пользователем, и в итоге создает среду, в которой каждый
пользователь оперативно может получить всю необходимую информацию в удобной форме с
множеством гиперсвязей на интересующие его материалы.
Список литературы
[1] Батищев С.В., Искварина Т.В., Скобелев П.О. Методы и средства построения онтологий для интеллектуализации сети Интернет // Известия Самар. науч. центра РАН. – 2002. – Янв. – июнь. – С. 126137.
[2] Батищев С.В., Генералова Г.Д., Горбунова Т.Ф., Куруленко Э.Я., Лахин О.И., Скобелев П.О. Мультиагентный Интернет-портал по социокультурным ресурсам Самарской области // Труды 4-й Междунар. конф. по пробл. упр. и моделир. сложных систем, Самара, 17-24 июня 2002. – Самара: СНЦ
РАН, 2002. С. 449-458.
[3] Андреев В.В., Волхонцев Д.В., Ивкушкин К.В., Карягин Д.В., Минаков И.А., Ржевский Г.А., Скобелев П.О. Мультиагентная система извлечения знаний. // Труды 3-й Международной конференции по
проблемам управления и моделирования сложных систем.
[4] Андреев В.В., Ивкушкин К.В., Карягин Д.В., Минаков И.А., Ржевский Г.А., Скобелев П.О., Томин
М.С. Разработка мультиагентной системы понимания текста. // Труды 3-й Международной конференции по проблемам управления и моделирования сложных систем (в печати).
[5] Хакен Г. Синергетика: Иерархия неустойчивостей в самоорганизующихся системах и устройствах:
Пер. с англ. – М.: Мир, 1985. - 423 с., ил. – С. 86
[6] Николис Г., Пригожин И. Самоорганизация в неравновесных системах. М., 1979. – 289 с.
281
Download