Программные_средства_СИИ

advertisement
Направления : “Программные средства для систем искусственного интеллекта”
выпускных квалификационных работ по специальности 230105
Глоссарий.
Под Искусственным Интеллектом (ИИ) понимается область исследований, в которой
ставится задача изучения и моделирования принципов и механизмов интеллектуальной
деятельности человека. Конечной практической целью работ в области ИИ является
создание работающих моделей разумного поведения в виде программных или иных
технических средств, а также технологий программирования самого такого поведения.
Технология знаний (инженерия знаний, knowledge engineering) - инженерные методы и
навыки в области искусственного интеллекта.
Под Естественным Языком (ЕЯ) в лингвистике понимается любой язык общения между
людьми. Под естественностью некоторого языка понимается наличие синонимии и
омонимии слов и словосочетаний, а также свободный порядок слов в предложении.
Обработка Естественного Языка. Целью исследований в области обработки
естественного языка является построение программных средств, обеспечивающих
восприятие и генерацию ЕЯ-текстов. При этом текст рассматривается как дискретное
представление ЕЯ-высказывания, подлежащее восприятию (представление в том виде, в
котором текстовый материал вводится с клавиатуры или сканирующего устройства).
Отдельную область исследований составляет звуковое распознавание и синтез звучащей
речи как перевод речевого сигнала в текстовое представление и наоборот.
Проблемная область интеллектуальной системы определяется предметной областью и
решаемыми в ней задачами.
Предметную область можно характеризовать описанием области в терминах
пользователя, а задачи - их типом. С точки зрения разработчика выделяются статические и
динамические предметные области. Предметная область называется статической, если
описывающие ее исходные данные не изменяются во времени. При этом производные
данные (выводимые из исходных) могут появляться заново и изменяться (не изменяя при
этом исходных данных). Если исходные данные, описывающие предметную область,
изменяются за время решения задачи, то предметную область называют динамической.
Вопросно-ответная система (QA-система) - это особый тип информационных систем,
являющиеся гибридом поисковых, справочных и интеллектуальных систем (часто они
рассматриваются как интеллектуальные поисковые системы). Основное требование : QAсистема должна быть способна принимать вопросы на естественном языке, то есть это
система с естественно-языковым интерфейсом.
Экспертная Система (ЭС) - программа (комплекс программ), моделирующая в некоторой
степени работу человека-эксперта в конкретной предметной области. Причем эта область
строго ограничена. По степени сложности ЭС подразделяются на поверхностные и
глубинные, по типу используемых методов и знаний – на традиционные и гибридные.
Поверхностные ЭС представляют знания об области экспертизы в виде правил (условие действие). Условие каждого правила определяет образец некоторой ситуации, при
соблюдении которой правило может быть выполнено. Условие каждого правила
1
определяет образец некоторой ситуации, при соблюдении которой правило может быть
выполнено.
Глубинные ЭС, кроме возможностей поверхностных систем, при возникновении
неизвестной ситуации, которая не сопоставляется ни с одним правилом, с помощью
описанных некоторым формальным образом общих принципов области экспертизы
определять, какие действия следует выполнять.
Стадия существования характеризует степень проработанности и отлаженности ЭС.
Выделяют следующие стадии : демонстрационный, исследовательский, действующий
прототипы, промышленную и коммерческую системы.
Под выводом в ЭС понимается доказательство того, что из множества предположений
следует некоторое заключение. Принятая логика получения заключения специфицируется
правилами вывода. Вывод осуществляется посредством поиска и сопоставления по
образцу.
Знания с точки зрения ИИ и инженерии знаний следовало бы определить как
представляемую в определенной форме информацию, ссылаясь на которую делают
различные заключения на основании имеющихся данных с помощью логических выводов.
С точки зрения решения задач в некоторой предметной области знания следует разделять
на факты и эвристику. Посредством фактов описываются хорошо известные в данной
предметной области обстоятельства, эвристика основана на собственном опыте человекаэксперта. Существует также классификация с разделением знаний на факты, правила
(знания "ЕСЛИ-ТО") и метазнания - знания о способах использования знаний и свойствах
самих знаний. Знания как информация объединяют в себе многие черты процедурной и
декларативной информации. К особенностям знаний относят внутреннюю
интерпретируемость, структурированность и связность.
Процедурную информацию составляют программы для решения тех или иных задач.
Декларативную информацию составляют данные, с которыми работают программы для
решения задач.
Внутренняя интерпретируемость подразумевает ввод в обращение особой информации,
которая описывает некоторую используемую в программе протоструктуру
информационных единиц. Каждой информационной единице задается уникальное имя,
которое позволяет вести поиск.
Структурированность означает возможность произвольного установления между
отдельными информационными единицами отношений типа "часть-целое", "род-вид" или
"элемент-класс". Иными словами, должна быть обеспечена рекурсивная вложимость
одних информационных единиц в другие.
Связность предполагает возможность установления связей различного типа между
информационными единицами. Прежде всего эти связи могут характеризовать отношения
между информационными единицами. Семантика отношений может носить
декларативный (задание иерархии информационных единиц, причинно-следственных
связей) или процедурный (отношение "аргумент-функция") характер. Отношения
структуризации определяют иерархические связи.
2
Представление знаний - множество соглашений по синтаксису и семантике, согласно
которым описываются объекты. В зависимости от способов классификации и размещения
информации Базы Знаний различают : логическую, продукционную, сетевую и
фреймовую модели представления знаний.
В основе логической модели лежит формальная система, задаваемая четверкой вида :
M=<T, P, A, B>. Здесь T есть множество базовых элементов (пример - множество
элементов терминального словаря). Причем существует некоторая процедура П(T),
которая за конечное число шагов дает ответ на вопрос о принадлежности произвольного
элемента x множеству T. P - множество синтаксических правил. С их помощью из
элементов множества T образуются синтаксически правильные совокупности.
Декларируется существование процедуры П(P), с помощью которой за конечное число
шагов можно ответить на вопрос, является ли совокупность X={x}: xX синтаксически
правильной. A - множество аксиом, является подмножеством множества синтаксически
правильных совокупностей вида {x}. Применительно к Базе Знаний множество A
составляют введенные извне информационные единицы. B - множество правил вывода.
Применяя их к элементам из A, можно получать новые синтаксически правильные
совокупности, к которым снова можно применять правила из B.
Сетевая модель основана на представление знаний в виде сети, вершины которой
соответствуют понятиям, а дуги - отношениям между ними. В зависимости от типов
связей между информационными единицами различают классифицирующие сети,
функциональные сети и сценарии.
В классифицирующих сетях используются отношения структуризации, которые
позволяют описывать различные виды иерархий между информационными единицами.
Функциональные сети (вычислительные модели) характеризуются наличием
функциональных отношений, которые позволяют описывать процедуры "вычислений"
одних информационных единиц через другие.
Сценарии характеризуются использованием в качестве типов связей каузальных
отношений, а также отношений типов "средство-результат", "орудие-действие" и т.п.
Семантическая сеть - модель представления знаний в виде иерархической сети, в
вершинах которой находятся информационные единицы, причем связи между
информационными единицами могут быть произвольного типа.
В основе фреймовой модели представления знаний лежит логическая группировка
атрибутов объекта, при этом для хранения и обработки логические группы описываются
во фреймах.
Продукционная модель объединяет в себе черты логической и сетевой. Из логических
моделей заимствована идея правил вывода - продукций. Из сетевых моделей представление знаний в виде семантической сети. Продукционная модель есть модель
представления знаний правилами вида "ЕСЛИ-ТО" (явление-реакция).
Нечеткое множество – расширение классического канторовского понятия множества,
допускающее, что характеристическая функция (функция принадлежности элемента
множеству) может принимать любые значения в интервале [0,1], а не только значения 0
или 1. Нечеткое множество есть основное понятие нечеткой логики в широком смысле.
3
Онтология - это структурная спецификация некоторой предметной области, ее
формализованное представление, которое включает словарь (или имена) указателей на
термины предметной области и логические выражения, которые описывают соотношения
терминов друг с другом.
Логико-лингвистическое управление подразумевает использование логических средств
обработки информации для преобразования данных и знаний, представленных в
лингвистической форме.
Логико-лингвистическая модель (по определению В.П. Гладуна) есть такая модель,
основными элементами которой являются имена и логические связи. Логиколингвистические модели адекватно описываются конструкциями Естественного Языка.
Онтологический инженеринг подразумевает использование структурно-логических
средств представления данных и знаний предметной области.
Суть простейшего алгоритма онтологического инженеринга :
1) выделение концептов - базовых понятий данной предметной области;
2) определение "высоты дерева онтологий" - числа уровней абстракции;
3) распределение концептов по уровням;
4) построение связей между концептами - определение отношений и взаимодействий
базовых понятий;
5) консультации с различными специалистами для исключения противоречий и
неточностей.
Онтологический инженеринг как целостный подход к автоматизации управления
предприятием включает :
 системность - онтология представляет целостный взгляд на предметную область;
 единообразие - материал, представленный в единой форме гораздо лучше
воспринимается и воспроизводится;
 научность - построение онтологии позволяет восстановить недостающие логические
связи во всей их полноте.
4
Download