Исследовательский центр искусственного интеллекта

advertisement
Институт программных систем РАН
Исследовательский центр
искусственного интеллекта
Переславль-Залесский, Россия
ПС «Miracle»
Программная система
инструментальных средств
проектирования интеллектуальных
систем
Общая архитектура системы
Интерфейс разработчика
Задача преследования целей
Самоходная установка, имеющая пространственные
координаты. Установка обладает скоростью, направлением
движения, которые зависят от скорости левой и правой
гусеницы. Скорость левой и правой гусеницы являются
управляющими переменными.
Передвигающиеся цели имеют пространственные координаты,
скорость, и направление движения.
Передвижение осуществляется по полю размером 100 х100
метров.
Необходимо выполнить такое управление самоходной
установкой, при котором обеспечивается последовательное
совпадение ее координат с координатами каждой из целей
(подавление целей).
Задача преследования целей
SIRIUS
Интеллектуальная
Метапоисковая
Система
Интеллектуальная
метапоисковая система
Sirius - метапоисковая система с
мультиагентной средой
распределенных вычислений и
мощным лингвистическим модулем
анализа текстов
Отличительные
особенности системы






расширение механизмов стандартного поиска
по ключевым словам
ввод запроса на естественном языке
использование методов семантической
обработки текстов
автоматическое подключение новых
информационных источников
увеличение точности поиска
использование параллельных вычислений
Компонентная модель
Общая схема обработки
поисковых запросов
Анализ текста
Анализ текста проводится в три
этапа:
морфологический анализ
 синтаксический анализ
 семантический анализ

Пример поискового
запроса
Запрос = "Президент приехал в Брюссель"
Семантическое отношение DIR(X, Y) определяет
факт того, что Y есть направление движения X
(роль синтаксемы X – «субъект», роль
синтаксемы Y – «директив»):
DIR(Президент, Брюссель)
Семантическая модель
Семантические образы поискового запроса и найденных документов
состоят из множества троек и двоек:
<relation, arg1, arg2>, где
<relation> - некоторый тип семантического отношения,
<arg1>, <arg2> - соответствующие синтаксемы.
<role, arg>, где
<role> - семантическая роль
<arg> - соответствующая синтаксема
При подсчете релевантности производится сопоставление по тройкам и
двойкам такого вида.
Подсчет релевантности
Релевантность вычисляется по:
Семантическим ролям
 Семантическим связям
 Ключевым словам

Пример поискового запроса
Пример результатов поиска
ПС INEX
ПРОГРАММНАЯ СИСТЕМА
ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ
ТЕКСТОВ
Цели и задачи
Основная цель:

разработка технологических программных средств
извлечения информации из текста на примере
задачи обнаружения сообщений о новых товарах
Задачи:




разработать язык описания правил извлечения
информации
разработать методы предварительной обработки
текстов
разработать алгоритм применения правил
извлечения информации
использовать преимущества параллельной
архитектуры
Извлечение информации
Цель:
 извлечь требуемую информацию
из неструктурированных текстов
Результат:
 структурированные данные
Примеры
Спортивные события:
<победитель>, <проигравший>,
<счет>, <место_встречи>,
<дата>…
 База данных о рынке жилья:
<район>,<цена>,
<количество_комнат>,
<контактный_телефон>…

Приложения технологии
извлечения информации
семантическая кластеризация и
классификация
автоматическое аннотирование
визуализация данных
семантическое сравнение и поиск
создание баз данных
…
Архитектура системы
извлечения информации
Лингвистический
процессор
Разбиение на слова и предложения
Выделение составных слов
Морфологический анализ
Лингвистическая
информация
Семантический
анализатор
Массив
текстов
Текст
для анализа
Вспомогательные
словари
Выделение составных типов
Применение правил извлечения информации
Объединение частичных результатов
Устранение омонимии
Результаты
Синтаксический анализ
Правила
извлечения
информации
Выделение составных
типов
идентификация имён собственных
и названий
 назначение семантических классов
фрагментам текста

Правила извлечения
информации
определение целевого фрейма
 набор правил, описывающих
способ извлечения информации и
заполнения слотов целевого
фрейма
 набор ограничений,
накладываемых на текстовые
единицы при применении правил

Пример извлечения
информации (текст)
Корпорация Hewlett-Packard начала
поставки нового лазерного
принтера LaserJet 1005W на
европейский рынок;
рекомендованная производителем
цена LaserJet 1005W - 349 евро.
Результаты извлечения
информации
ПС АКТИС
ПРОГРАММНАЯ СИСТЕМА
АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ
ТЕКСТОВЫХ ИНФОРМАЦИОННЫХ
СООБЩЕНИЙ
Цели и задачи
Основная цель:

разработка технологических программных средств
классификации текстов
Задачи:




возможность настройки на предметную область путем
обучения на основе обучающей выборки текстов;
возможность классификации текстов (отнесения
текста к одной или нескольким рубрикам);
возможность отображения результатов
классификации с использованием графического
интерфейса пользователя;
использование преимуществ параллельной
архитектуры
ПС АКТИС
Режимы работы:
 обучение;
 классификация.
Достоинства системы:
 Использование в качестве терминов как
отдельных слов, так и словосочетаний;
 Высокие полнота и точность;
 Реализация на кластерной платформе;
 Высокая производительность;
 Высокая утилизация.
20 000 текстов
120
100
%
80
60
40
20
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
кол-во процессоров
Время (%)
Теоретическое время (%)
Утилизация (%)
22
23
Таблица результатов для 20 000 текстов
Кол-во
Время
Теоретическое
процессоров счёта (сек) время (сек)
1
526,99
526,99
2
264,32
263,49
3
177,43
175,66
4
132,77
131,75
5
105,78
105,4
6
88,63
87,83
7
76,15
75,28
8
66,74
65,87
9
59,59
58,55
10
53,79
52,7
11
49,64
47,91
12
48,7
43,92
13
45,56
40,54
14
42,59
37,64
15
40,68
35,13
16
37,69
32,94
17
35,93
31
18
34,09
29,28
19
32,71
27,74
20
31,43
26,35
21
29,97
25,09
22
29,2
23,95
23
28,07
22,91
Время Теоретическое
(%)
время (%)
100
100
50,16
50
33,67
33,33
25,19
25
20,07
20
16,82
16,67
14,45
14,29
12,66
12,5
11,31
11,11
10,21
10
9,42
9,09
9,24
8,33
8,65
7,69
8,08
7,14
7,72
6,67
7,15
6,25
6,82
5,88
6,47
5,56
6,21
5,26
5,96
5
5,69
4,76
5,54
4,55
5,33
4,35
Сумма
Сумма Утилизация
MHz
MHz (%)
(%)
800
100
100
1600
200
99,69
2400
300
99,01
3200
400
99,23
4000
500
99,64
4800
600
99,1
5600
700
98,87
6400
800
98,71
7200
900
98,26
8000
1000
97,96
8800
1100
96,51
9600
1200
90,17
10400
1300
88,98
11200
1400
88,39
12000
1500
86,35
12800
1600
87,38
13600
1700
86,29
14400
1800
85,88
15200
1900
84,8
16000
2000
83,83
16800
2100
83,74
17600
2200
82,04
18400
2300
81,63
Задачи космической тематики
•
•
Автоматическое определение
геометрических параметров объектов по
растровым телевизионным изображениям
Управление процессом стыковки
активного корабля и орбитальной станции
Определение геометрических параметров
объекта по телевизионному изображению
Кадр телевизионного изображения
Определение геометрических параметров
объекта по телевизионному изображению
Обработанное изображение
Определение геометрических параметров
объекта по телевизионному изображению
Обработанное изображение с выделенными на нём
прямыми линиями и дугами окружностей
Измерение параметров объекта с
использованием геометрических моделей
Этапы решения задачи:


создание геометрических моделей
исследуемого объекта;
определение характеристик объекта путем
поиска максимума корреляционной функции
образа реального объекта и образа
модельного объекта.
Измерение параметров объекта с
использованием геометрических моделей
Исследовательский прототип
(определение параметров мишени стыковочного узла
станции МИР)
Управление процессом стыковки
активного корабля и орбитальной станции
Возможные варианты исходов
процесса управления сближением
Управление процессом стыковки
активного корабля и орбитальной станции
Модель системы управления:








Параметры (ограничения) процесса
стыковки;
аналитическое описание зон управления;
база данных состояний корабля;
модель корабля;
модель станции;
множество целей;
система правил;
плановая траектория.
Управление процессом стыковки
активного корабля и орбитальной станции
Отображение относительного движения на
плоскости промаха в координатах положения
(дальность и угол)
Управление процессом стыковки
активного корабля и орбитальной станции
Основные области управления и границы между
ними
Управление процессом стыковки
активного корабля и орбитальной станции
Глобальные цели:



Причаливание
Расхождение
Нерасчетное касание станции с
наименьшими повреждениями
Подцели:




Нахождение станции;
Сближение;
Зависание;
Облёт.
Управление процессом стыковки
активного корабля и орбитальной станции
Группы правил:




Замыкания
Выбора цели
Управления
Перехода
Управление процессом стыковки
активного корабля и орбитальной станции
Интерфейс
Модуль визуализации
Исследовательский прототип
Диагностика и образный анализ
процессов пуска сложного
изделия
Система представления информации
о контролируемом объекте
УРОВНИ
ОБРАЗЫ
СИСТЕМА
ЦВЕТОЯРКОСТНЫЙ
ПОДСИСТЕМА
ПОЛЯРНЫЙ и СЕКТОРНЫЙ
ПАРАМЕТРЫ
ИНТЕГРАЛЬНЫЙ и
ЦВЕТОЯРКОСТНЫЙ
Уровень системы
Уровень подсистемы
Диагностика процесса поддержания избыточного давления
в баках
Классы отказов
программа
входная
ситуация
отказ клапана
отказ РД 0.3
метод
логического
распознавания
отказ РД 0.6
утечка
Уровень подсистемы
Разработка образа для диагностики процесса поддержания
избыточного давления в баках
отказ электроклапана
полярная развертка вектора
сегментное представление вектора
Уровень параметров
Интегральное представление
полярная развертка вектора
p  
N
x
k 1
k
sin 
Уровень параметров
Цветояркостное представление
Выводы


Предложен метод диагностики некоторых
подсистем процесса подготовки пуска
сложного изделия, основанный на методах
логико-вероятностного анализа данных.
Показано, что образное, графическое
представление информации может быть
использовано для визуального контроля
динамических процессов.
Диагностика
топливной аппаратуры
дизельных двигателей
Институт программных систем РАН
Исследовательский центр искусственного
интеллекта
Общая структура системы
Накла
дные
датчи
ки
давле
ния
Предварительная обработка сигнала
Настройка модели
Сигнал
Пользовательс
кий интерфейс
Нахождение информативных точек и
числовых характеристик
Вычисление
лингвистических
признаков
Определение
поломок
Диагноз
База данных
экспертной
системы
Теория точек

Зависимость высокого
давления в трубопроводе от
фазы поворота
коленчатого вала
Эксперты различают от
пяти до десяти
характеристических
точек, содержащих
важнейшую
информацию об
эксплуатационной
исправности
двигателя.
Модельная функция

Важную роль в локализации
характеристических точек играет модельная
функция
Лингвистические признаки

Найденные характеристические
точки и параметры модельной
функции позволяют перейти от
числовых характеристик к
лингвистическим признакам,
описывающим диаграмму
давления.
Один из лингвистических
признаков
Давление открытия распылителя
Низкое давление открытия распылителя
вызывает низкое максимальное давление. Это
приведет к уменьшению остаточного давления
и, следовательно, к задержке повышения
давления. Кроме того, момент начала впрыска
происходит позже. Высокое давление
открытия распылителя приводит к обратному
эффекту. Признак формируется по
остаточному давлению и моменту начала
повышения давления – точке №1.
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
Запаздывание нарастания давления
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
Нет впрыска на холостом ходу
*
Опережение нарастания давления
*
*
*
Узкая зона волновых колебаний
Высокие пики давления
*
*
Широкая зона волновых колебаний
*
*
Низкие пики давления
Очень крутое нарастание давления
Пологое нарастание давления
Крутое нарастание давления
*
*
Затянутое падение давления
Зависание открытой иглы
распылителя
Сломанная пружина форсунки
Негерметичность форсунки (распылителя)
Закоксованный распылитель
Низкое давление открытия форсунки
Высокое давление открытия форсунки
Трещина в форсунке
Изношенный разгружающий поясок
нагнетательного клапана
Нагнетательный клапан завис в открытом положении
Негерметичность по запорному
конусу нагнетательного клапана
Большой объем разгрузки
Заклинивший плунжер
Негерметичный плунжер (малая
плотность)
Большой объем подачи
Малый объем подачи
Изношенный кулачек
Изношенный/сломанный подшипник
насоса;
Изношенная/сломанная ось или ролик
толкателя
Высокое остаточное давление
Построение
диагноза
может
осуществлятьс
я как с
помощью
экспертной
системы, так и
автономно с
помощью
методов
нечеткой
логики.
Возможные неисправности
Низкое остаточное давление
неисправностей
Отсутствие диаграммы
Таблица
*
*
Нет впрыска
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
Выдача диагноза
(на примере дизеля локомотива)


Производится
диагностика
всех
цилиндров.
Углубленный диагноз

Применение
экспертной
системы
Simer + Mir
позволяет
выдавать
более
полный
диагноз.
Download