Полный отчет - Научно-образовательный центр

advertisement
Государственное образовательное учреждение высшего профессионального
образования
ВОЛОГОДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
УДК 378
№ госрегистрации 01201056386
Инв.№
УТВЕРЖДАЮ
Ректор ВоГТУ
д-р техн. наук,
______________ Л.И. Соколов
«___»_________ _2010_ г.
ОТЧЕТ
О НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ РАБОТЕ
В рамках федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» на 2009-2013 годы
по теме:
МЕТОДОЛОГИЯ ПОСТРОЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТНООРИЕНТИРОВАННЫХ УЧЕБНЫХ КОМПЛЕКСОВ ДЛЯ
МНОГОУРОВНЕВОЙ ПОДГОТОВКИ СПЕЦИАЛИСТОВ
ТЕХНИЧЕСКОГО ПРОФИЛЯ
(промежуточный, этап № 2)
Наименование этапа: «Определение методов и формулировка ожидаемых результатов»
Руководитель НИР, д-р техн. наук, проф.
_________________
подпись, дата
Москва 2010
А.Н.Швецов
СПИСОК ИСПОЛНИТЕЛЕЙ
Руководитель темы, д-р
техн. наук
А.Н. Швецов (введение, раздел 1.2, 1.3,
_________________ 2.1, 4, заключение)
подпись, дата
Исполнители темы
доцент, канд. техн. наук
С.Ю. Ржеуцкая (раздел 1.1, 2.4,
_________________ заключение)
подпись, дата
Зав. кафедрой
д-р физ.-мат. наук
Доцент
канд. техн. наук
В.А. Горбунов (раздел 1.1)
_________________
подпись, дата
Е.Н. Давыдова (раздел 2.1)
_________________
подпись, дата
Аспирант
А.Л. Копытов (раздел 2.1)
_________________
подпись, дата
Аспирант
К.А. Суконщиков (раздел 2.1)
_________________
подпись, дата
Аспирант
А.О. Гуцалюк (раздел 2.2)
_________________
подпись, дата
Аспирант
В.И. Летовальцев (раздел 2.2)
_________________
подпись, дата
Доцент
канд. техн. наук
А.Н. Сорокин (раздел 2.2, 3)
_________________
подпись, дата
Студент
О.А. Сергушичева (раздел 2.2)
_________________
подпись, дата
Профессор
д-р физ.-мат. наук
Профессор
д-р физ.-мат. наук
А.Н. Наимов (раздел 2.3)
_________________
подпись, дата
Э.М. Мухамадиев (раздел 2.3)
_________________
подпись, дата
Аспирант
С.И. Сорокин (раздел 2.3)
_________________
подпись, дата
Аспирант
Ю.О. Мамадкулов (раздел 2.3)
_________________
подпись, дата
Доцент
канд. техн. наук
А.П. Сергушичева (раздел 2.3, 2.5)
_________________
подпись, дата
Аспирант
М.В. Ржеуцкая (раздел 2.4)
_________________
подпись, дата
Аспирант
А.В. Ржеуцкий (раздел 2.4)
_________________
подпись, дата
Студент
Е.А. Бахтенко (раздел 2.4)
_________________
подпись, дата
Доцент
канд. техн. наук
Т.З. Нижерадзе (раздел 2.5)
_________________
подпись, дата
Студент
И.А. Фомина (раздел 2.5)
_________________
подпись, дата
Доцент
канд. техн. наук
Доцент
канд. техн. наук
Доцент
канд. техн. наук
А.А. Суконщиков (раздел 3,4)
_________________
подпись, дата
И.А. Андрианов (раздел 3)
_________________
подпись, дата
П.В. Скородумов (раздел 3)
_________________
подпись, дата
Студент
В.Н. Зайцев (раздел 3)
_________________
подпись, дата
Аспирант
М.А. Сергушичева (раздел 3)
_________________
подпись, дата
Нормоконтролер
А.П. Сергушичева
_________________
подпись, дата
УДК 001.891[047]:006.354
МКС 01.140.20
Т62
ОКСТУ 0007
Ключевые слова: научно-технический документ, отчет, научно-исследовательская работа,
промежуточный отчет
Реферат
Отчет
191
с.,
4
ч.,
27
рис.,
7
табл.,
231
источн.,
0
прил.
МНОГОУРОВНЕВАЯ ПОДГОТОВКА СПЕЦИАЛИСТОВ, КОМПЬЮТЕРНЫЕ
ОБУЧАЮЩИЕ
СИСТЕМЫ,
ИНТЕЛЛЕКТУАЛЬНЫЕ
АГЕНТЫ,
ЭЛЕКТРОННЫЕ
УЧЕБНЫЕ КОМПЛЕКСЫ, АГЕНТНО-ОРИЕНТИРОВАННЫЕ СИСТЕМЫ, МОДЕЛИ
ОБУЧЕНИЯ
В отчете представлены результаты исследований, выполненных по 1 этапу
Государственного контракта № 02.740.11.0625 в рамках федеральной целевой программы
«Научные и научно-педагогические кадры инновационной России» на 2009-2013 годы по
лоту «Проведение научных исследований коллективами научно-образовательных центров
в области информатики» шифр «2010-1.1-113-025» по теме: «Методология построения
интеллектуальных агентно-ориентированных учебных комплексов для многоуровневой
подготовки специалистов технического профиля» (шифр заявки «2010-1.1-113-025-043»).
Целью работы является создание методологии построения интеллектуальных
агентно-ориентированных электронных учебных комплексов для подготовки специалистов
технического профиля.
Объектом исследований является интеллектуальный агентно-ориентированный
учебный комплекс (ИАОУК).
Проанализированы основные направления развития архитектур электронных
учебных комплексов, определены существующие подходы к разработке интеллектуальных
обучающих систем, выявлены достоинства и недостатки известных методологий
построения агентно-ориентированных систем.
Выполнен анализ методов и средств формирования компьютерных тестов,
проведено сопоставление известных методов с разработками авторского коллектива.
Выполнен анализ известных моделей обучения и сделан вывод о том, что в ИАОУК выбор
модели обучения целесообразно осуществлять с помощью адаптивной модели управления
учебным процессом.
Приведены
результаты
патентных
исследований
по
тематике
научно-
исследовательской работы.
Обоснован
оптимальный
вариант
направления
исследований,
установлены
известные методы, применимые к области исследований и сформулированы задачи
разработки
новых
методов.
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ ...................................................................................................... 6
1 Сравнение и оценка возможных направлений исследований с учетом имеющихся
прогнозов. ...........................................................................................................................................9
1.1 Сравнение и оценка базовых типов моделей и архитектур агентно-ориентированных
систем по применимости в интеллектуальных агентно-ориентированных учебных
комплексах (ИАОУК) .........................................................................................................................9
1.2 Сравнение и оценка балансов программно-технических и психолого-педагогических
компонентов в создании ИАОУК ....................................................................................................24
1.3 Оценка возможностей сервис-ориентированных моделей и средств для реализации
компонентов ИАОУК .......................................................................................................................33
2 Определение и уточнение методов выполнения исследований, с постановкой задач
разработки новых методов, моделей и алгоритмов..................................................................36
2.1 Постановка задачи разработки модели ИАОУК ......................................................................36
2.2 Постановка задачи разработки модели преподавателя в ИАОУК .........................................52
2.3 Постановка задачи разработки модели управления знаниями в ИАОУК .............................71
2.4 Постановка задачи разработки модели процесса обучения в ИАОУК ......................................
2.5 Постановка задачи разработки моделей, методов и алгоритмов компьютерного
тестирования в ИАОУК.................................................................................................................. 117
2.6 Постановка задачи разработки моделей обучаемого в ИАОУК ..........................................140
2.7 Постановка задачи разработки моделей интеллектуальных агентов в ИАОУК ................222
3 Формулировка ожидаемых новых научных результатов ..................................................162
ЗАКЛЮЧЕНИЕ ..................................................................................................... 172
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ ........................................ 174
ВВЕДЕНИЕ
1. Сравнение и оценка возможных направлений исследований с
учетом имеющихся прогнозов
1.1 Сравнение и оценка базовых типов моделей и архитектур агентноориентированных систем по применимости в интеллектуальных агентноориентированных учебных комплексах (ИАОУК)
Исследования последних десятилетий и определенный опыт практических
разработок агентно-ориентированных систем убедительно показывают, что создание
интеллектуальных агентов является весьма сложной задачей, требующей теоретического
фундамента для концептуального представления агентов. Таким фундаментом служат
модели ИА, по-разному описывающие знания, способы рассуждений, планирование
поведения и непосредственные действия агентов.
Данные модели следует рассматривать в двух аспектах: во-первых, с позиций
анализа свойств и поведения агентов в процессе функционирования АОС в целом; вовторых, с позиций изучения и конструирования свойств агента, определяющих его
внутренние процессы (получение информации (знаний), выработка целей, принятие
решений и т.д.).
Можно считать устоявшейся традицию выделения трёх базовых классов архитектур
агентных систем [Тарасов, 2002], [Майкевич, 1997] и соответствующих им моделей интеллектуальных агентов:
– делиберативные архитектуры и модели (deliberative architectures);
– реактивные архитектуры и модели (reactive architectures);
– гибридные архитектуры и модели (hybrid architecture).
Термин «делиберативный агент» (deliberate agent) (ДА) был введён в работе
[Genesereth, 1987]. Делиберативную архитектуру принято определять как архитектуру
агентов, содержащих точную символическую модель мира и принимающих решения на
основе логического вывода [Гаврилова, Хорошевский, 2000]. Теоретическим основанием
для построения моделей делиберативных агентов послужила гипотеза физических
символьных систем, сформулированная Ньювеллом и Саймоном [Emerson, 1988].
Физическая символьная система по определению должна быть физически реализуемым
множеством
физических
сущностей
или
символов,
которые
комбинируются
в
определенные структуры и способны запускать процессы, оперирующие на этих символах
в соответствии с символически закодированными множествами инструкций. Данная
гипотеза постулирует утверждение о том, что такая система способна на интеллектуальное
поведение в достаточно общем понимании этого термина. Согласно трактовке M.R. Genesereth делиберативный агент должен обладать следующими свойствами:
- содержать эксплицитно представленную базу знаний, заполненную формулами в
некотором логическом языке, представляющую его убеждения;
- функционировать в следующем цикле: восприятие обстановки (обсервация) –
логический вывод – действие …;
- принимать решения о действиях на основе некоторых форм логического вывода.
Вулдридж и Дженнингс [Wooldridge, 1995] определяли ДА как «то, что содержит
явно представленную символическую модель мира, и в котором решение (например, о том
какие действия выполнять) принимается через логический (или по крайней мере псевдологический) вывод, основанный на сопоставлении с образом или символической
манипуляции».
В
соответствии
с
наиболее
общим
делиберативным
подходом,
когнитивный компонент содержит по существу две части: планировщик и модель мира
(Рис. 2.1.).
Сенсоры
Модель
мира
Высокоуро
вневое
описание Планиров
щик
планы Исполните
ль планов
Эффекторы
Рис. 1.1. Базовая архитектура ДА.
Модель мира является внутренним описанием внешней для агента среды и иногда
также включает описание самого агента.
Планировщик использует это описание для создания плана достижения цели
агентом следующим способом: задавая атомарные действия (операторы), которые агент
способен выполнить, их предусловия и их результаты в мире (постусловие), и начальную
и целевую ситуации, он ищет в пространстве последовательность операторов, пока не
находит такую, которая преобразует начальное состояние в целевое состояние.
Готовый план – есть список действий, который передается исполнителю планов,
который будет выполнять эти действия, вызывая различные процедуры низкого уровня
эффекторов.
Основы строгой формализации знаний и действий делиберативного агента
заложены Куртом Конолиге (Kurt Konolige) в работе [Konolige, 1988].
Он предложил иерархический метаязык для описания и логического вывода на
знаниях и действиях вычислительных агентов. Предполагается, что объектный язык есть
стандартный язык первого порядка, а для каждого примитивного выражения объектного
языка e предполагается существование соответствующего терма e' в метаязыке. Термы
метаязыка, обозначающие составные формулы объектного языка, конструируются с
использованием метаязыковых функций and , or , not и так далее.
Для обозначения того, что формула объектного языка отражает истинное состояние
мира, Конолиге использует истинностный предикат метауровневого языка TRUE ,
приписывая ему следующие аксиомы:
f  TRUE  f   TRUE not  f 
f  g  TRUE  f   TRUE g   TRUE or  f , g 
etc.
Конолиге использует синтаксический подход для описания убеждений агентов:
каждому агенту назначается множество формул объектного языка (теория данного агента)
и убеждения  , если  являются доказуемыми в этой теории. Функция метауровневого
языка th задается на множестве термов, определяющих агентов, и возвращает множество
формул объектного языка, представляющих теорию агента. Предикат метаязыка
FACT t , f  говорит о том, что f принадлежит теории t . Общий факт есть формула
истинная для всех агентных теорий
f  CFACT f   a  FACT tha, f & TRUE f .
Далее вводится бинарный предикат доказуемости PR , использующий в качестве
аргументов теорию и формулу. Система аксиом для этого предиката использует
аксиоматику объектного языка и поэтому включает такие правила как модус поненс,
рефлексивность и т.д.
t  f  g  PRt , imp f , g  & PRt , f   PRt , g 
t  f  PRt , f   PRt , f 
etc.
Убеждения определяются через предикат метаязыка, связывающий агента и
формулу объектного языка
a  f  BELa, f   PRtha, f .
Знание определяется как истинное убеждение.
Далее Конолиге расширяет свою модель в трех направлениях:
- вводит функцию стандартных имен  и денотационную функцию  для
упрощения некоторых синтаксических проблем, связанных с метаязыком;
- вводит вложенные убеждения (т. е. убеждения об убеждениях), расширяя
двухязыковую иерархию в трехязыковую иерархию;
- вводит ситуации (в смысле ситуационного исчисления) в область метаязыка для
выводов об изменяющемся мире.
Основные проблемы, выявленные в данной модели состоят в том, что
трехуровневая
иерархия
устанавливается
“ad
hoc”,
т.е.
произволом
автора;
с
вычислительной точки зрения модель Конолиге представляется неуправляемой из-за
наличия метауровней; некоторые аксиомы, предложенные для общих фактов оказались
неверными.
Тем не менее, работы Конолиге послужили стимулом для последующего развития
моделей делиберативных агентов в трудах M.J. Wooldridge, N.R. Jennings, M. d’Inverno, D.
Kinny, M. Luck, B. Van Linder, W. Van der Hoek, J.-J. Ch. Meyer [Wooldridge, 1992],
[D’Inverno, 1998], [Wooldridge, 2002], [Van Linder, 1996], [Van Linder, 1996a].
Согласно [Wooldridge, 1992] интеллектуальный агент определяется как структура
0 ,  ,  , , MR, AR,
где 0  Belset - начальное множество убеждений,   Drule - множество правил вывода
для L ,   Brf - функция ревизии убеждений,   Mes sin t - функция интерпретации
сообщений, MR  Mrule - множество правил сообщений, AR  Arule - множество правил
действий, L - внутренний логический язык.
Поведение агента определяется базовым циклом, включающим следующие шаги:
1)
интерпретация любых принятых сообщений;
2)
изменение убеждений через обработку эпистемических входов с учетом
предыдущих действий и интерпретации сообщений через функцию ревизии убеждений;
3)
построение дедуктивного замыкания множества убеждений;
4)
извлечение множества возможных сообщений, выбор одного из возможных
и отправка его получателю;
5)
извлечение множества возможных действий, выбор одного из них и вы-
полнение этого действия;
6)
возврат к шагу 1.
В формализованном виде функционирование агента представляется следующими
выражениями:
Belset  powerset FormL 
Close _ Belset  powerset Drule  Belset
Epin  powerset FormL 
Brf  Belset  powerset Epin  Belset
Action  Belset  Epin
Cond  FormL   { true }
Arule  Cond  Action
Mrule  Cond  Mess
Достоинства и недостатки обсуждаемых моделей авторы помещены в таблицу 2.2.
Известна формализация делиберативного агента средствами языка AgentSpeak(L),
разработанного Рао [Rao, 1996] . Этот язык является языком программирования,
основанным на абстракции PRS-архитектуры. Далее d’Inverno и Luck построили
формальную спецификацию AgentSpeak(L) [D’Inverno, 2000], которая переопределяет
оригинальное описание Рао в терминах состояний и операций над состояниями, позволяя
перейти к реализации такой модели.
В последующих работах
[D’Inverno, 1998], [Wooldridge, 2002] предложена
развернутая формальная модель делиберативной архитектуры dMARS, использующая
язык Z [Spivey, 1992]. Z является модельно-ориентированным языком формальных
спецификаций, основанным на теории множеств и логике первого порядка. Ключевыми
компонентами Z-спецификации являются пространство состояний системы и множество
возможных операций, переводящих одно состояние в другое [Spivey, 1996].
Модели агентов в PRS и dMARS являются примерами наиболее популярной в
настоящее время парадигмы, известной как BDI-подход. BDI-архитектура как правило
содержит 4 ключевые структуры данных: убеждения, цели, намерения и библиотеку
планов.
Агентные убеждения соответствуют информации агента о мире и могут быть
неполными и некорректными. Обычно агенты в BDI-модели хранят убеждения в
символьной форме, подобно фактам в языке Prolog [Georgeff, 1987]. Желания агентов (или
цели)
интуитивно
соответствуют
задачам,
назначенным
данным
агентам.
Для
действующих BDI-агентов требуется, чтобы желания были логические непротиворечивы,
хотя человеческие желания часто этому требованию не соответствуют. Агенты не могут, в
общем случае, достичь всех своих желаний, даже если эти желания непротиворечивы.
Агенты должны зафиксировать некоторое множество достижимых желаний и передать
ресурсы для их достижения. Эти выбранные желания являются намерениями и агент
будет стремиться достигнуть намерения до тех пор пока его убеждения соответствуют
желанию либо желание при данных убеждениях не является более достижимым.
Каждый агент в dMARS имеет библиотеку планов, определяющих варианты
возможных действий, которые могут быть предприняты агентом для достижения его
намерений. Планы, таким образом, реализуют процедурные знания агента. Каждый план
содержит несколько компонентов. Триггер или условие вызова определяет обстоятельства
(обычно в терминах событий) при которых план должен рассматриваться как возможный
для применения. План имеет контекст или предусловия, определяющие обстоятельства
при которых выполнение плана может начаться. План может иметь также главное условие,
которое должно быть истинным во время выполнения плана. План также имеет тело,
которое может содержать цели (подцели) и примитивные действия (могут быть
процедурными вызовами).
События, воспринимаемые агентом помещаются в очередь событий. Внутренний
интерпретатор агента отвечает за его поведение и непрерывно выполняет следующий
цикл:
1)
обозревает мультиагентный мир и внутреннее состояние агента и изменяет
очередь событий;
2)
генерирует новые возможные желания (задачи), находя те планы, чьи
триггеры событий включены;
3)
выбирает из этого множества включенных планов один для выполнения;
4)
помещает желаемое значение в существующий или новый стек, в соот-
ветствии с тем, имеется или нет подцель;
5)
выбирает стек намерений, читает план, находящийся в вершине стека и
выполняет следующий шаг из этого плана; если шаг есть действие – выполняет его, если
это подцель – посылает эту подцель в очередь событий;
6)
возврат к шагу 1.
Шаг 5) этого цикла реализует способ выполнения плана, когда подцель помещается
в очередь событий, что вызывает активизацию очередного плана и т.д.
Содержательно модель агента в dMARS представляет собой ситуационную
формальную систему.
Развитие моделей делиберативных агентов идет по пути попыток формализации
новых и новых мотивационных свойств и отношений в комбинации с поведением и
действиями агентов [Lesperance, 1996], [Rao, 1991], [Shoham, 1993], [Singh, 1996],
[Wooldridge, 1996]. Такой подход приводит к созданию абстрактных логических моделей,
претендующих на строгое формальное описание всех релевантных свойств рациональных
агентов в целях анализа, спецификации и верификации МАС.
Построение делиберативных архитектур требует решения таких проблем, как
построение адекватного символического описания реального мира (модель мира),
учитывающего сложность происходящих во времени процессов и действующих объектов;
организация логического вывода из имеющихся знаний, который должен приводить к
определённым действиям агентов.
Достоинством делиберативных моделей и архитектур является возможность применения строгих формальных методов и хорошо отработанных технологий традиционного
искусственного интеллекта, позволяющих относительно легко представлять знания в
символьной форме и переносить их в агентную систему. В то же время создание полной и
точной модели некоторой предметной области реального мира, формализация ментальных
свойств агентов и процессов рассуждения в этих когнитивных структурах представляют
существенные трудности для технической реализации.
Поиски путей разрешения проблем, возникающих при использовании в агентных
системах классических методов ИИ, привели к появлению нового класса – реактивных
архитектур. Основоположником этого направления принято считать Р. Брукса (R. Brooks),
который так сформулировал ключевые идеи бихевиористического взгляда на интеллект:
– интеллектуальное поведение может создаваться без явного символьного
представления знаний;
– интеллектуальное поведение может создаваться без явного абстрактного
логического вывода;
– интеллект является внезапно возникающим свойством некоторых сложных систем
[Brooks, 1991a], [Brooks, 1991b].
В реальном мире интеллект не является экспертной системой или машиной
логического
вывода,
а
интеллектуальное
поведение
возникает
как
результат
взаимодействия агента со средой.
Вместо моделирования мира и планирования РА должны иметь коллекцию простых
поведенческих схем, которые реагируют на изменения в среде в форме «стимул –
реакция». Простая архитектура РА подхода на рис. 2.5.
Сенсоры
Поведение
«стимул –
реакция»
Эффекторы
Рис. 1.2. Базовая архитектура РА.
Брукс принимает чистый инженерный подход, когда он конструирует
своих
реактивных агентов и производит конструкцию в стиле приращений. Он начинает с
простейшего поведения и доводит ее до стадии более совершенного поведения.
Наиболее спорным из принципов Брукса является принцип, касающийся
репрезентации. Он утверждает, что явные представления мира не являются необходимыми
для реализации действующих агентов. Вместо этого РА должен использовать «…мир как
его собственную модель – непрерывное обращение к собственным сенсорам лучше, чем к
внутренней модели мира» [Brooks, 1991b]. Это возможно, если мы имеем ситуационных
агентов, которые действуют в прямом контакте с реальным миром, не используя только
одни абстрактные его описания.
Другой принцип говорит, что агенты должны быть воплощенными. Это означает, что они
не могут «жульничать», они встречают лицом все реальные проблемы, которые обычно
остаются без внимания.
Следующий принцип касается перцепции. В ИИ предполагается, что целью зрения
является создание трехмерной модели реального мира. Брукс утверждает, что эта задача
слишком сложна для выполнения в реальном мире. Вместо этого его агенты используют
«целенаправленное зрение». Возникает вопрос как его направлять, нужно ли агенту
обладать какими-то знаниями или достаточно широкой картиной мира, чтобы осуществить
соответствующей цели перцепции.
Реактивные агенты, по крайней мере в нескольких экспериментах, доказали
способность решать ограниченное число простых задач в областях реального мира.
Однако, они сталкиваются с проблемами при выполнении задач, требующих знаний о
мире, которые получаются логическим выводом или из памяти.
Такими
объективных
заданиями
перспектив,
являются
проблемы
предсказание
понимания
поведения
других
ситуации
агентов,
на
основе
креативность
(стимулируемая свободная активность). Более того, РА часто построены «жестко» и не
имеют достаточных способностей к обучению. Тот факт, что каждый вариант поведения
должен быть запрограммирован отдельно ведет к сложным проблемам, как во время
разработки, так и во время выполнения.
Критика реактивного подхода изложена у Д. Кирша [Kirsh 1991a, Kirsh 1991b].
Известными примерами таких архитектур являются Pengi [Arge, 1987], архитектура
ситуационных автоматов [Kaelbling, 1990], ABLE (Agent Behaviour Language) [Wavish,
1992].
Как показал Вулдридж [4] известные спецификации моделей ИА определяют те
свойства, которые должны у агентов быть, но не направлены на конструктивное
определение поведения агентов. Главным следствием из этой ситуации является
невозможность связать высокоуровневые спецификации с программной реализацией таких
моделей. Поэтому для моделей РА характерно использование концепции состояний и
переходов и механизмов поведения типа «стимул-реакция». Ярким примером такой
реактивной модели является модель Фербера [17]. В этой модели вводится динамическое
состояние как пара , где из есть состояние среды и описывает взаимодействие (влияние).
Вместе с тем, состояние среды из не получает у Фербера точного определения.
Попыткой синтеза делиберативных и реактивных моделей является модель,
предложенная в работах С. Амброшкевича, С. Билки, Я. Комара [18]. В данной модели
выделяется пять базовых модулей: перцепция, тип агента, знания и убеждения,
коммуникационный модуль, модуль вывода. В модели Амброшкевича поведение агента
определяется исключительно задачей, причем задача трактуется как множество действий ,
не рассматривается последовательность во времени, не анализируются логические
взаимосвязи, не выполняется оценка состояний МА-мира. Процедурный аспект данной
модели соответствует модели конечного автомата. По признанию самих авторов данная
модель не полна, так как поведение агента должно основываться на убеждениях
подвергнутых ревизии на основе информации перцепции и коммуникации, а эти переходы
не определены.
Модель реактивного агента, функционирующего в реальном масштабе времени
исследована в работах В.В. Денисова, Д.В. Пузанкова, М.Г. Пантелеева, Г.Г. Колосова [19].
ИА определяется через совокупность пространств ментальных состояний и отображений
между ними. Пространства ментальных состояний включают в себя: SEI – текущие
данные о состоянии внешней среды; IET – текущую оценку внешней обстановки на требуемом уровне абстракции; PES – прогнозируемое состояние внешнего мира; ISS – оценку
текущего состояния собственных подсистем агента; PIS – прогнозируемое внутреннее
состояние агента; STP – тактический план агента; LTP – стратегический план агента.
Реактивный подход позволяет эффективно использовать множество простых
сценариев поведения в рамках установленных реакций на определённые события, но его
ограниченность проявляется в практической невозможности полного ситуативного
анализа всех возможных активностей агентов. Поэтому в большинстве действующих
систем используются гибридные архитектуры.
Достаточно давно были выделены [20] две категории гибридных агентных
архитектур. Однородная архитектура использует одну общую репрезентацию и схему
управления для реакций и рассуждений, в то время как многослойные архитектуры
используют различные представления и алгоритмы (реализованные в отдельных слоях).
Фергюссоном
была
предложена
архитектура
циклической
машины
[21],
включающая три уровня: реактивный, который представляет собой множество правил
“ситуация–
действие”,
планирующий,
чьим
главным
компонентом
является
иерархический, неполный планировщик, и моделирующий уровень. Задача реактивного
уровня – обеспечить реакцию на события в реальном масштабе времени, планирующего
уровня – сгенерировать и выполнить планы для достижения долговременных целей
агента, моделирующего уровня – обнаружить и предсказать ситуации потенциального
конфликта целей между агентами и предложить действия для выхода из этих конфликтов.
Архитектура Glair (Grounded Layered Architecture with Integrated Reasoning)
(многоуровневая архитектура с обобщенным выводом) [22] определяет 3 уровня: уровень
знаний, который содержит традиционную планирующую систему; перцепторно-моторный
уровень; и сенсорно-активаторный уровень, который имеет только процедурные
представления.
Архитектура DYNA, предложенная в [23] может рассматриваться как гибридная,
интегрирующая реактивность и планирование. Она ориентирована на обучение с
подкреплением и включает три главных компонента: модуль политики, который является
реактивной системой, модель мира и оценочную функцию, которая отображает состояния
в величины поощрений.
Cущественным недостатком гибридных архитектур является то, что они делаются
ad hoc, т.е. их структура достаточно хорошо обоснована с конструкторской точки зрения,
но не ясно, как ее обосновать со стороны глубокой теории.
Результаты проведенного анализа моделей интеллектуальных агентов сведены в
таблицу 1.1.
Свойства моделей ИА в МАС
Таблица 1.1
Авторы модели
Достоинства
Недостатки
Делиберативные модели
Логическая полнота модели
Отсутствует явное понятие
Возможность применения
«цели»
различных внутренних
Поведение определяется
логических языков
алгоритмом «цикла действий»
M.J. Wooldridge, M.
Логическая полнота модели
Цель определяется только
d’ Inverno, D. Kinny,
Наличие точной формальной
логическими средствами
M. Luck
семантики
Не рассматривается понятие
Наличие библиотеки планов,
мультиагентного мира, не
обеспечивающих
определяется с кем и как
вариативность поведения ИА
взаимодействует агент
M.J. Wooldridge
Отсутствует иерархия ИА
B. Van Linder, W.
Формальная строгость модели
Высокая сложность формальной
van der Hoek, J.-J.
Формализация достаточно
модели
Ch. Meyer)
трудноопределимых понятий,
Специализированная
таких как предпочтения и
теоретическая направленность
обязательства
Отсутствует конструктивное
определение цели
Отсутствует модель поиска
Авторы модели
Достоинства
Недостатки
решения
Реактивные модели
K. Cetnarowicz, E.
Предусматривается
Отсутствует иерархия ИА
Nawarecki, M.
мобильность агентов
Связь агента и пространства Е
Zabinska
Предполагается множество
точно не определена
стратегий
Не определяются логические
Предусматривается
взаимоотношения агентов и
возможность адаптации к
отсутствует логический вывод
условиям среды через опера-
Поведение агента точно не
цию обучения
определено
Не учитывается предыстория
системы
Не предлагается конструктивного механизма
реализации стратегий
J. Ferber, O. Labbani, Относительная простота
J.-P. Muller, A.
модели
Отсутствует понятие цели,
модель носит исключительно
реактивный характер «стимул –
Bourjault
реакция»
Поведение агента точно не
определено
В.В. Денисов, Д.В.
Оригинальная и глубоко
Отсутствует иерархия ИА
Пузанков, М.Г.
проработанная модель ре-
Отсутствует иерархия целей
Пантелеев, Г.Г.
активного ИА
Колосов, М.А.
Наличие системы скелетных
Натей-Голенко
планов, обеспечивающих
приемлемое поведение в
реальном масштабе времени
Гибридные модели
S. Ambroszkiewicz,
относительная простота
цели являются статическими и
S. Bylka, J. Komar
формирования целей
предустановленными
нет иерархии целей
отсутствует конструктивное
Авторы модели
Достоинства
Недостатки
определение окрестности цели,
неясно от каких агентов цель
будет зависеть, от каких нет
K. Fisher, J.P. Muller, наличие иерархии агентов
отсутствие строгой формальной
M. Pischel
модели
В ходе выполнения первого этапа исследований по государственному контракту ГК
№ 02.740.11.0625 были проанализированы основные тенденции развития компьютерных
обучающих систем, установлено содержание объекта исследований (интеллектуального
агентно-ориентированного учебного комплекса) и сформулированы отличительные
характеристики, которыми должны обладать исследуемые комплексы [Отчет 1 этапа].
Разрабатываемые
агентно-ориентированные
учебные
комплексы
должны
обеспечивать:
1. порождение, модификацию и эволюцию индивидуальных моделей каждого
обучаемого во всей полноте его психологических, ментальных и профессиональных
качеств и параметров;
2. взаимодействие обучаемого с виртуальным миром (ВМ) – моделью изучаемой
предметной области с учетом требуемых компетенций и межпредметного взаимодействия;
3. порождение, модификацию и эволюцию индивидуальных моделей каждого
преподавателя-эксперта
с
возможностью
создания
виртуального
мира
каждого
преподавателя как носителя его индивидуальности и пространства знаний;
4. гибкое адаптивное управление процессами обучения каждого обучаемого с
динамическим формированием учебного материала и тестовых баз в соответствии с
изменениями виртуальных миров;
5. автоматический поиск, извлечение и накопление новых знаний в совокупности
предметных областей ИАОУК;
6. эволюционное развитие ИАОУК в соответствии с динамикой изучаемых
предметных областей, изменением компетенций и требований на соответствующих
образовательных уровнях;
7. порождение, модификацию и эволюцию комплексных виртуальных моделей
специалиста соответствующего уровня (модель «идеального специалиста»).
Проведенный
анализ
современных
тенденций
создания
интеллектуальных
обучающих систем и комплексов, использующих парадигму интеллектуальных агентов,
позволил выбрать направление исследования структуры ИАОУК как АОС, включающей
динамически изменяющиеся сообщества различных ИА.
В свете выбранной ориентации, исходя из множества установленных базовых
характеристик (1-7), можно определить обобщенную структуру ИАОУК как совокупность
нескольких сообществ ИА (СИА), административных и функциональных компонентов
(подсистем), опирающихся на программно-технологическую платформу базовых сервисов
(рис. 1.1.).
Сопоставление
обобщенной
структуры
ИАОУК
и
множества
базовых
характеристик позволяют выделить следующие типы ИА, связанных с соответствующими
СИА.
В рамках СФАП целесообразно выделить агента человеко-машинного интерфейса
(Human-Machine Interface Agent – HMIA), поскольку с ИАОУК будет взаимодействовать
большое количество людей (пользователей), выступающих в различных ролях (обучаемые,
эксперты
предметной
области,
преподаватели-эксперты,
администраторы
и
т.д.).
Глобальная цель HMIA – обеспечить эффективный диалог человека, находящегося вне
ИАОУК с соответствующим ИА, находящимся в структуре ИАОУК (рис. 1.4).
На данном этапе исследований предполагается, что роли людей-агентов будут
достаточно точно определены, типы ИА в структуре ИАОУК также являются
предустановленными, множество типов ИА будет достаточно ограниченным, поэтому
задачи HMIA сводятся к приему и передаче сообщений по каналам ИА – пользователь.
Таким образом, обработка информации ведется HMIA на синтаксическом уровне,
семантику сообщений он не анализирует, оставляя эту функцию соответствующему IAi .
Таким образом, HMIA не требуются процедуры логического вывода, и он может быть
построен в рамках реактивной архитектуры базового реактивного агента типа «стимулреакция».
Поскольку
структура
ИАОУК
предусматривается
достаточно
свободной,
подразумевает подключение к комплексу различных новых ИА, имеющих разную
функциональную
ориентацию,
то
целесообразно
введение
специальных
агентов
межагентного интерфейса (Agent-to-Agent Interface Agent – AtAIA), выполняющих роль
посредников – организаторов диалога между самыми различными ИА (рис. 1.5).
Глобальной целью
AtAIA является организация диалога различных агентов,
желающих вступить в диалог, как внутри ИАОУК, так и в перспективе во внешней
информационно-коммуникационной
исследований
среде
рассматривается
(Интернет).
как
AtAIA
на
реактивный
данном
этапе
агент.
В структуре СФАП целесообразно выделение агентов онтологий (Ontology Agent –
OA),
специализированных
ИА,
хранящих
логические
модели
соответствующих
предметных областей. Онтологии могут описывать не только содержательные знания об
изучаемых конкретных областях действительности (предметные знания), но и служебные
знания, возможно такие как онтологии процесса обучения, онтологии человеко-машинного
интерфейса, онтологии управления знаниями, онтологии межагентного взаимодействия и
т.п.
В сообщество интеллектуальных агентов обучаемых (СИАО) должны входить ИА,
представляющие данного индивидуума в структуре ИАОУК. Такого агента (Student
Individual Agent – SIA) естественно рассматривать как мультиагентную систему, поскольку
он будет обладать весьма сложным поведением и выполнять достаточно интеллектуальные
функции. В структуру SIA будут входить HMIA и AtAIA для обеспечения взаимодействия
с обучаемым и другими ИА. Для построения психологического портрета следует ввести
психологического агента (Psychological Agent – PsA), а для построения профессионального
портрета – профессионального агента (Professional Agent – PrA). Работа этих агентов
должна основываться на соответствующих онтологиях и потребует выполнения
логических выводов для оценки психологических качеств обучаемого и определения его
профессиональных
характеристик.
Следовательно,
возникает
потребность
и
в
персональном административном агенте, управляющем взаимодействием HMIA, AtAIA,
PsA и PrA. С PsA и PrA могут быть связаны агенты соответствующих психологических и
профессиональных онтологий.
Таким образом, SIA представляется достаточно сложным агентом многоуровневой
организации, обладающим как делиберативными, так и реактивными свойствами, что
требует применения гибридной архитектуры.
Агентно-ориентированный подход, реализуемый в мультиагентных технологиях,
позволяет создавать сложные динамические модели предметных областей, наиболее
сильно приближенные к реальности моделируемых сред и ситуаций. Такие модели в
рамках ИАОУК мы будем называть виртуальными мирами предметных областей (ВМПО).
Для реализации общего процесса многоуровневой подготовки специалиста
(бакалавра, магистра) таких ВМПО потребуется достаточно много (возможно несколько
десятков), представляющих как определенные дисциплины учебного плана, так и
направленных на выработку навыков, умений, формирование компетенций, проверку
соответствующих профессиональных качеств.
Сообщество ВМПО потребует определенного управления и контроля, поэтому
целесообразно выделение агента управления (Virtual Worlds Community Administrative
Agent – VWCAA), содержащего базу знаний о существующих и возможных ВМПО,
поддерживающего создание и уничтожение ВМПО, редактирование свойств виртуальных
миров, создание различных учебных и проблемных ситуаций.
Виртуальный мир представляется нам динамической моделирующей средой,
возможно реализуемой как МАС или АОС, в которую обучаемый включается как
некоторый агент, обязанный достичь установленных целей обучения посредством
разрешения тех или иных проблемных ситуаций.
Для адекватного целям обучения поведения виртуального мира целесообразно
создание отдельного агента динамики ВМ (Virtual World Dynamic Agent – VWDA),
который устанавливает параметры поведения, инициирует процесс моделирования
(обучения), останавливает процесс моделирования, отслеживает параметры и результаты
моделирования и передает их агентам обучаемых или административному ядру.
Для представления различных сущностей моделируемого мира потребуются ИА
различных типов, имеющие разную архитектуру, что будет определяться особенностями
моделируемой предметной области.
Для
реализации
компетентностного
подхода
в
сообществе
ВМПО
предусматриваются агенты проблемных ситуаций (Problem Situation Agent – PSA). PSA
порождает модель проблемной ситуации на основе онтологий виртуального мира и
собственных
знаний
и
передает
ее VWDA,
который
организует
и
реализует
соответствующее поведение ВМ.
Таким
образом,
в
сообществе
ВМПО
требуется
наличие
агентов
как
делиберативного, так и гибридного типов.
Для реализации индивидуальных моделей преподавателей в структуре СИАПЭ
должны создаваться агенты преподавателей-экспертов (Professor Agent – PfrA). Такой
агент представляет личностные свойства преподавателя и его ролевые функции. В
процессе многоуровневого обучения данный преподаватель-индивидуум может выступать
в различных ролях по различным учебным дисциплинам и компетенциям.
На данном этапе исследований представляется целесообразным выделить
следующие классы преподавателей-экспертов в структуре ИОАУК:
– главный преподаватель-эксперт (ГПЭ);
– преподаватель-администратор (ПА);
– преподаватель-тьютор (ПТ).
Наибольшими правами обладает ГПЭ (их может быть несколько для организации
процесса обучения по направлению/специальности), который назначает ПА и тьюторов,
регистрирует их в комплексе, управляет правами доступа и устанавливает пароли. ГПЭ
формирует базы данных и базы знаний по классам преподавателей. Отличительной
особенностью ГПЭ является право создания, редактирования и уничтожения виртуальных
миров
и
полные
права
для
управления
сценариями
обучения
(по
направлению/специальности, по отдельным дисциплинам и компетенциям, по категориям
студентов и персоналиям обучаемых).
Администратор-преподаватель (или просто администратор) позиционируется в
нашем комплексе как ведущий преподаватель по данной дисциплине, как правило, в роли
администратора должен выступать профессор или опытный доцент, имеющий большой
опыт преподавания специализированных дисциплин, полностью владеющий содержанием
соответствующих курсов, четко представляющий место дисциплины к общей структуре
образовательных стандартов, обладающий авторским видением излагаемой дисциплины и
знающий
методические
тонкости
и
дидактические
проблемы
в
изложении
соответствующих учебных материалов.
На третьем уровне административной иерархии в данном комплексе располагаются
преподаватели-тьюторы (или просто тьюторы), обладающими меньшими правами в
отношении управления учебным процессом по сравнению с администраторами. Введение
подкласса тьюторов обусловлено тем, что в современных условиях, сложившихся в
системе высшего профессионального образования (в частности это характерно и для
ВоГТУ), дисциплины специализации нередко ведутся несколькими преподавателями,
причем варианты распределения учебной нагрузки могут быть различными. Одна и та же
дисциплина может проводиться для разных специальностей, соответственно несколько
меняются объемы излагаемого материала и возможно формы проведения занятий. В то же
время некоторые дисциплины разделяются между несколькими преподавателями в рамках
одной специальности, например, лекционный курс делится на несколько частей, в
соответствии с предпочтениями преподавателей. Содержание курсов может отличаться и в
зависимости от формы обучения студентов (дневная, заочная, ускоренная и т.д.). Особенно
важные изменения в структуре дисциплины должны произойти при организации
полностью дистанционного обучения, в отсутствие аудиторных занятий преподавателя со
студентами.
ПА наделяется полными правами управления процессом обучения по данной
дисциплине (дисциплинам) и/или компетенции (компетенциям), управляет типовыми
сценариями обучения по данной дисциплине и сценариями обучения по категориям и
персоналиям обучаемых. ПА устанавливает ограничения на управление процессом
обучения по дисциплинам и компетенциям для ПТ.
В
соответствии
с
выделенными
ролями
в
структуре
PfrA
необходимо
предусмотреть административное ядро – административного агента-преподавателя
(Professor Administrative Agent – PfrAA) и множество ролевых агентов, связанных с
дисциплинами и компетенциями.
Свойства эволюционного развития ИАОУК предполагается реализовать с помощью
сообщества функциональных агентов и подсистем (СФАП). Расширение пространства
знаний
всех
пользователей
комплекса
должны
обеспечить
поисковые
агенты,
ориентированные на семантический поиск в сети Интернет. К таким агентам с
поисковыми запросами могут обращаться по необходимости все ИА комплекса (SIA,
VWCAA, PfrA, и другие). Обозначим такого поискового агента как KDA (Knowledge
Discovery Agent).
Найденные информационные материалы (это данные в различных форматах –
текстовые, видео, аудио и другие файлы) передаются агентам извлечения знаний KAA
(Knowledge Acquisition Agent). Данный агент должен сформировать из полученных
материалов новые знания в формах моделей представления знаний. Предполагается, что
KAA будет создавать:
–
утверждения
в
соответствующей
передаваемые агенту онтологии;
логике
для
модификации
онтологий,
– новые правила, представленные в тех или иных продукционных формах,
передаваемые агенту управления ВМ (VWCAA) и агенту динамики ВМ (VWDA), для
модификации поведения виртуального мира;
–
новые правила,
передаваемые
агенту проблемных
ситуаций
PSA для
модификации порождаемых проблемных ситуаций;
– новые структуры данных для виртуальных миров (модификация баз данных,
содержащих фактографическую информацию).
Подобным образом смогут эволюционировать и агенты PfrA, модифицируя свои
онтологии и индивидуальное пространство знаний преподавателя.
В
структуре
СФАП
предусматривается
создание
«идеальных»
агентов,
представляющих целевого специалиста соответствующего уровня (бакалавр, специалист,
магистр). Обозначим такого агента ISA (Ideal Specialist Agent). ISA должен быть способен
демонстрировать навыки, умения, знания и компетенции соответствующего целевого
специалиста во взаимодействии с определенными ВМПО, показывая обучаемому как он
должен разрешать те или иные проблемные ситуации.
Агенты KAA, KDA, ISA должны обладать существенными возможностями
логического вывода, что требует использования для их построения делиберативных
моделей и архитектур.
Таким образом, анализ требуемых характеристик ИАОУК и сопоставление их с
известными моделями и архитектурами ИА показывает, что для достижения необходимых
структурных и функциональных свойств комплекса требуется использование множества
ИА, имеющих различные архитектуры, модели и интеллектуальные свойства.
Ввиду значительного разнообразия ИА в структуре ИАОУК не удастся
ограничиться
одним
предопределенным типом
модели
ИА
и
соответствующей
архитектурой. Поэтому представляется целесообразным создать достаточно общий
формализм ИА, в рамках которого уточнить и детализировать конкретные модели и
архитектуры ИА разрабатываемого комплекса.
Такой формализм и связанные с ним задачи разработки моделей ИА исследуются в
разделе 2.7.
1.2 Сравнение и оценка балансов программно-технических и психологопедагогических компонентов в создании ИАОУК
Download