Представление знаний в информационных системах

advertisement
Представление знаний в
информационных системах
Спицын В.Г
Томский политехнический университет
E-mail: spvg@tpu.ru
http://portal.main.tpu.ru/SHARED/s/SPV/teach work
Лекция 1
СИСТЕМЫ, ОСНОВАННЫЕ НА ЗНАНИЯХ
•
•
•
•
•
•
•
Введение
История создания искусственного
интеллекта
Процесс мышления
Основные понятия и классификация
систем, основанных на знаниях
Экспертные системы как элемент
искусственного интеллекта
Методы извлечения знаний
Литература
2
Введение
В первой лекции рассматриваются:
•
история возникновения систем
искусственного интеллекта,
•
процесс мышления человека,
•
системы, основанные на знаниях,
•
методы извлечения знаний.
3
1. История создания
искусственного интеллекта
Появление искусственного интеллекта (ИИ) как
научного направления произошло после
создания ЭВМ в 40-х годах XX в. [1-3].
В это время Норберт Винер создал свои
основополагающие работы по кибернетике.
Вскоре произошло разделение его на два
направления:
“нейрокибернетика”
и
кибернетика “черного ящика”.
4
Этапы развития ИИ
• Нейрокибернетика ориентирована на
программно-аппаратное моделирование
структур, подобных структуре мозга.
• Основной принцип кибернетики “черного ящика”
заключается в том, что не имеет значения как
построено “мыслящее” устройство. Требуется,
чтобы на заданные входные воздействия оно
реагировало так же, как и человеческий мозг.
• В США в середине 1970-х годов на смену поискам
универсального алгоритма мышления пришла
идея моделировать конкретные знания
специалистов-экспертов. Появились первые
коммерческие системы, основанные на знаниях,
или экспертные системы.
5
2. Процесс мышления
• Процесс мышления, протекающий в
человеческом сознании, чрезвычайно сложен [4].
• Одна ячейка человеческого глаза способна
выполнять за 10 мс обработку, эквивалентную
решению системы из 500 нелинейных
дифференциальных уравнений.
• Глаз человека насчитывает не менее 10
миллионов ячеек, компьютеру Cray-1 необходимо
затратить по меньшей мере 100 лет, чтобы
воспроизвести процессы, происходящие
ежесекундно в человеческом глазу.
6
Обработка и анализ информации
• Данные из внешнего мира воспринимаются человеком с
помощью одного из органов чувств и затем помещаются в
буфер кратковременной памяти для анализа [4].
• В долговременной памяти хранятся символьные образы и
смысловые связи между ними, которые используются для
объяснения новой информации, поступающей из
кратковременной памяти.
• Большие объемы данных постоянно записываются в
кратковременную память, и мы непрерывно анализируем и
фильтруем получаемую информацию для того, чтобы
определить степень ее важности и то, как она соотносится
с образами, хранящимися в долговременной памяти
7
Система обработки информации
у человека [4]
8
Доступ к информации
• Доступ к информации в долговременной памяти
осуществляется достаточно эффективно. Любой
элемент данных может быть извлечен в течение
цикла обработки продолжительностью не более
70 мс и затем преобразован [4].
• Перемещение данных из кратковременной
памяти в долговременную память занимает
приблизительно 15–20 минут.
• Если человек в получил мозговую травму, то
долговременная память может восстановиться.
Однако вся информация, поступившая в течение
15–20 минут до катастрофы, будет потеряна и
никогда не восстановится.
9
Соответствие между памятью
человека и ЭВМ
• Можно провести аналогию между
кратковременной памятью человека и
оперативной памятью ЭВМ, для которой
отключение электропитания означает полное
уничтожение всех данных [4].
• Долговременная память человека похожа на
дисковую память ЭВМ. В долговременной
памяти образы существуют в виде
циркулирующих электрохимических
импульсов и физических нейронных
взаимодействий.
10
Способ хранения символьных
образов
• Способ хранения символьных образов в
долговременной памяти во многом схож со
способом хранения числовой информации в
базах данных сетевого типа.
• Человеческая память хранит не числовые
данные,, а образы или символы.
• В памяти существует система указателей,
позволяющая нам быстро извлечь любой
нужный символ и все данные, которые с ним
связаны [4].
11
Символьные образы
• Символьные образы в мозге человека
объединены в чанки – наборы фактов и
связей между ними, запомненные и
извлекаемые как единое целое.
• Чанки хранятся совместно с
взаимосвязями между ними. В каждый
момент времени человек может
обрабатывать и интерпретировать не
более четырех-семи чанков.
12
Способность формировать чанки
• Эксперт развивает свою способность
объединять в чанки большие объемы данных и
устанавливать иерархические связи между ними
для того, чтобы быстро извлекать эти данные из
памяти и с их помощью распознавать новые
ситуации по мере поступления информации о них
в мозг.
• Средний специалист в конкретной предметной
области помнит от 50 000 до 100 000 чанков,
которые могут быть использованы для решения
той или иной проблемы.
• Их накопление в памяти человека и построение
указателей для такого объема данных требуют от
10 до 20 лет.
13
3. Основные понятия и классификация
систем, основанных на знаниях
• Искусственный интеллект ориентирован на
создание методов дублирования функций живых
интеллектуальных систем искусственными
системами.
• Технология разработки интеллектуальных
программных средств основана на том, что
знания о решении задач отделяются от программ
и реализуются в виде базы знаний, а в
программах реализуется алгоритм
манипулирования этими знаниями.
• Этот алгоритм называют механизмом
логического вывода.
14
Виды знаний
• К знаниям относят информацию о логике
решения задач, а к данным – информацию,
которая должна быть проанализирована в
соответствии с этой логикой.
• Знания, которыми обладает специалист в какойлибо предметной области, можно разделить на
формализованные и неформализованные
знания.
• Формализованные знания формулируются в
виде общих и строгих суждений (законов,
формул, моделей и алгоритмов), отражающих
универсальные знания.
• Неформализованные знания отличаются
конкретностью, субъективностью и
15
приблизительностью.
Особенности экспертных систем
• Экспертные системы отличаются от
традиционных программ тем, что ориентированы
на решение неформализованных задач.
• Основными особенностями ЭС являются:
• алгоритм решения неизвестен заранее, а
строится самой системой с помощью
символических рассуждений, базирующихся на
эвристических приемах;
• способность анализа и объяснений своих
действий и знаний;
• способность приобретения новых знаний от
пользователя – эксперта, не знающего
программирования, и изменения в соответствии
с ними своего поведения.
16
• Экспертные системы представляют собой
класс компьютерных программ, которые
выдают советы, проводят анализ,
выполняют классификацию и ставят
диагноз.
• Они ориентированы на решение задач,
обычно требующих проведения
экспертизы человеком-специалистом.
• В отличие от машинных программ,
использующих процедурный анализ, ЭС
решают задачи в узкой предметной
области на основе дедуктивных суждений.
17
Классификация ЭС по
решаемой задаче
•
•
•
•
•
•
•
•
•
Интерпретация.
Диагностика.
Мониторинг (наблюдение).
Прогнозирование.
Планирование.
Проектирование.
Обучение.
Контроль и управление.
Поддержка принятия решений.
18
4. Экспертные системы
как элемент искусственного интеллекта
• Задачей ИИ является воссоздание с помощью
искусственных устройств разумных рассуждений и
действий.
• При этом возникают трудности двух типов:
• В большинстве случаев, выполняя какие-то действия,
мы сами не осознаем, как мы это делаем. Нам
неизвестен точный способ (или алгоритм), как именно
происходит понимание текста, узнавание лица,
решение задач.
• ЭВМ априори далеки от человеческого уровня
компетентности: до начала любой их работы
необходимо составить соответствующие программы.
Однако в действительности языки программирования
дают возможность выражать только элементарные
понятия.
19
Применение ЭС позволяет
• при проектировании интегральных микросхем
повысить производительность труда в 5 раз, при
этом выполнение некоторых операций
ускоряется в 10 раз;
• ускорить поиск неисправностей в 7 раз;
• повысить производительность труда
программистов в 5 раз;
• при профессиональной подготовке сократить в
10 раз время на индивидуальную работу с
обучаемым персоналом.
20
Система PROSPECTOR
• Предназначена для выдачи геологам следующей
информации:
• о наличии в анализируемой местности залежей
полезных ископаемых;
• об оценке геологических ресурсов района, о
выборе мест, благоприятных для бурения.
• Система создана фирмой SRI International.
Трудозатраты на создание системы оцениваются
в 30 человеко-лет, система достигла
промышленной стадии.
• База знаний (БЗ) системы содержат свыше 1000
правил и включают классификацию более 1000
геологических понятий.
21
Онтологии
• Развитие систем искусственного интеллекта и
экспертных систем привело к появлению
специальности инженера по онтологии.
• Под онтологией в данном случае понимается
явная формальная спецификация терминов
проблемной области и отношений между ними.
• Другими словами, онтологию можно представить
как стандартный, согласованный набор
терминов, применяемых для описания
определенной прикладной области.
22
5. Извлечение знаний
• Можно выделить три основных аспекта
извлечения знаний:
• психологический,
• лингвистический и
• гносеологический.
• Из них психологический аспект является
ведущим, так как он определяет
эффективность взаимодействия инженера
по знаниям и эксперта.
23
Потери информации
• При разговорном общении велики
потери информации.
• В связи с этим представляет интерес
увеличение информативности
общения аналитика и эксперта за
счет применения психологических
знаний.
24
Потери информации при разговорном
общении
25
Число Ингве–Миллера
• На успех беседы влияет длина фраз.
Установлено, что человек лучше всего
воспринимает предложения с длиной 7+/-2
слова (число Ингве–Миллера).
• Опытные лекторы, используя короткие
фразы в лекции, сводят потерю
информации до 3 %.
• Несоблюдение этого принципа может
приводить к потере до 20–30 %
информации.
26
Лингвистический аспект извлечения знаний
• Лингвистический аспект извлечения знаний
относится к исследованиям возникающих при
этом языковых проблем.
• Различие языков, на которых говорят эксперт
и аналитик, обусловливает возникновение
языкового барьера между ними.
• Эти два языка являются отражением
“внутренней речи” эксперта и аналитика.
• Психологи и эксперты полагают, что язык
является основным средством мышления.
27
Гносеологический аспект
• Гносеологический аспект извлечения
знаний связан с теорией отражения
действительности в сознании
человека.
• При этом вначале действительность
отображается в сознании эксперта.
Затем опыт эксперта интерпретируется
сознанием инженера по знаниям.
• Далее происходит построение третьей
интерпретации в виде поля знаний
экспертной системы
28
Классификация методов извлечения
знаний
29
СПИСОК ЛИТЕРАТУРЫ
1. Гаврилова Т.А. , Хорошевский В.Ф. Базы знаний
интеллектуальных систем. – Санкт-Петербург: Питер, 2000. – 382 с.
2. Корнеев В.В., Гареев А.Ф., Васютин С.В., Райх В.В. Базы данных.
Интеллектуальная обработка информации. – М.: Нолидж, 2000. –
352 с.
3. Змитрович А.И. Интеллектуальные информационные системы. –
Минск: Тетра Системс, 1997. – 367 с.
4. Таунсенд К., Фохт Д. Проектирование и программная реализация
экспертных систем на персональных ЭВМ / пер. с англ. – М.:
Финансы и статистика, 1990. – 320 с.
5. Спицын В.Г., Цой Ю.Р. Представление знаний в информационных
системах: Учебное пособие. – Томск: Изд-во ТПУ, 2008. – 152 c.
6. Джарратано Д., Райли Г. Экспертные системы: принципы
разработки и программирования / пер. с англ. – М.: Издательский
дом “Вильямс”, 2007. – 1152 c.
7. Дюк В., Самойленко А. Data Mining. – Санкт-Петербург: Питер,
2001. – 368 с.
30
Download