Янковская А., Аметов Р.

advertisement
21
ОСНОВАННАЯ НА ТЕСТОВЫХ МЕТОДАХ РАСПОЗНАВАНИЯ
ОБРАЗОВ ПОДСИСТЕМА ВЫЯВЛЕНИЯ СИГНАЛЬНЫХ ПРИЗНАКОВ1
А. Янковская2, Р. Аметов3
2Томский
государственный архитектурно-строительный университет, 634003, Томск,
пл. Соляная, 2, 8(3822)65-33-51, ayynkov@gmail.com. yank@tsuab.ru
3Томский государственный архитектурно-строительный университет, 634003, Томск,
пл. Соляная, 2, 8(3822)65-33-51, rin@tsuab.ru
Предлагается подсистема выявления новых видов закономерностей в знаниях, а
именно, сигнальных признаков 1-го и 2-го рода, изменение которых указывает на
возможность перехода объектов из одного образа в другой и исследуемого
объекта, принадлежащего к одному образу, ко второму образу соответственно.
Разработанная подсистема основана на тестовых методах распознавания образов
и включена в интеллектуальное инструментальное средство ИМСЛОГ.
Приводятся примеры из области психологии и геоэкологии.
Введение
Выявление закономерностей в данных и
знаниях является одной из наиболее
важных
задач
при
создании
интеллектуальных систем, основанных на
тестовых методах распознавания образов
[1-7]. При создании интеллектуальных
систем используются различные понятия
закономерностей в данных и знаниях. В
данном исследовании будем опираться на
понятие закономерностей, введенное в [2] и
расширенное
новыми
видами
закономерностей сигнальными признаками,
введенными в публикации [6].
Под
закономерностями
понимаются
подмножества признаков с определенными
легко интерпретируемыми свойствами,
влияющими на различимость объектов из
разных образов, устойчиво наблюдаемыми
для объектов из обучающей выборки и
проявляющимися на других объектах той
же
природы,
а
также
весовые
коэффициенты
признаков
[2-5],
характеризующие их индивидуальный
вклад в различимость объектов.
Под сигнальными признаками 1-го рода
будем
понимать
минимальные
подмножества
характеристических
признаков,
различающие
объекты,
принадлежащие к 2-м разным образам.
Под сигнальными признаками 2-го рода
будем
понимать
минимальные
подмножества
характеристических
признаков,
различающие
описание
исследуемого объекта, принадлежащего
одному образу от описания объектов,
принадлежащих
другому
образу.
Приводится постановка задачи, излагаются
методы выявления сигнальных признаков,
описывается иллюстрирующий их пример и
реализующая их подсистема. Приводятся
примеры из различных проблемных
областей, для которых актуальна задача
выявления сигнальных признаков.
Постановка задачи
Далее при изложении воспользуемся рядом
понятий,
матричной
моделью
представления данных и знаний [2,3,5],
включающей матрицу описаний (Q)
объектов
в
пространстве
характеристических признаков и матрицу
различений (R) объектов в пространстве
классификационных признаков. Элемент qij
матрицы Q задает значение j-го признака
для i-го объекта. Элемент rij матрицы R
задает принадлежность i-го объекта одному
Работа выполнена при поддержке грантов РФФИ, проект № 07-01-00452, и РГНФ, проект №
06-06-12603в.
1
22
из выделенных классов по j-му механизму
классификации.
Множество
неповторяющихся
строк
матрицы R сопоставлено множеству
выделенных образов. Элементами образа
(класса) являются объекты, представленные
строками матрицы Q, сопоставленными
одинаковым строкам матрицы R. Если
имеется
единственный
механизм
классификации, то матрица различений
вырождается в столбец, что соответствует
традиционному представлению знаний в
задачах распознавания образов [1].
Данная модель позволяет представлять не
только данные, но и знания экспертов,
поскольку одной строкой матрицы Q
можно задавать в интервальной форме
подмножество объектов, для которых
характерны одни и те же решения,
задаваемые строкой матрицы R [2,5].
Диагностический
тест
называется
минимальным,
если
он
содержит
минимальное количество признаков [1].
Подматрица Q’ матрицы Q и подматрица R’
матрицы R представляют собой сжатое
описание образов [2,5,7]. Столбцы матрицы
Q’
сопоставлены
характеристическим
признакам, вошедшим во все минимальные
тесты, причем в сжатом описании образов
удалены равные строки и соответствующие
им строки из матрицы R и скорректированы
веса оставшихся строк в матрице Q’.
Сконструированная на основе матриц Q и R
безызбыточная матрица импликаций U'
задает различимость объектов из разных
образов [2,5]. В матрице U’ отсутствуют
поглощающие строки.
Задача ставится следующим образом.
Необходимо создать основанную на
тестовых методах распознавания образов
[2-6] подсистему выявления сигнальных
признаков
и
включить
ее
в
инструментальное
интеллектуальное
средство (ИИС) ИМСЛОГ [8].
В этих целях необходимо:
1. Для каждой пары сжатых описаний
образов
выявить
все
подмножества
сигнальных признаков 1-го рода, что
сводится к задаче нахождения всех
минимальных
тестов,
различающих
объекты из каждой пары образов.
2.
Для
исследуемого
объекта,
принадлежащего одному из образов и
заданному сжатому описанию образов,
выявить все подмножества сигнальных
признаков 2-го рода, что сводится к задаче
нахождения всех минимальных тестов,
различающих исследуемый объект от
объектов заданного образа.
Основные идеи и методы решения
В основу создания подсистемы выявления
сигнальных признаков положены идеи и
методы выявления закономерностей [2-7],
реализованные в виде программных
модулей (плагинов) и включенных в ИИС
ИМСЛОГ [8].
Для выявления сигнальных признаков 1-го
рода для анализируемой пары образов из
матрицы Q' сжатых описаний образов
выделяется соответствующая по этим 2-м
образам подматрица, по которой строится
безызбыточная матрица импликаций U’,
задающая различимость объектов из
данной пары образов, и находятся все
кратчайшие столбцовые покрытия [2,3,7]
этой матрицы. Признаки, вошедшие в
каждое
из
кратчайших
покрытий,
составляют
соответствующий
минимальный тест [2,7], а, следовательно,
подмножество сигнальных признаков 1-го
рода.
Для выявления сигнальных признаков 2-го
рода для анализируемого образа из
матрицы Q' сжатых описаний образов
выделяется соответствующая подматрица,
по которой и по описанию исследуемого
объекта строится безызбыточная матрица
импликаций,
задающая
различимость
исследуемого
объекта
от
объектов
анализируемого образа и находятся все
кратчайшие покрытия этой матрицы.
Признаки, вошедшие в каждое из
кратчайших
покрытий,
составляют
соответствующий минимальный тест, а,
следовательно, подмножество сигнальных
признаков 2-го рода.
Рассмотрим иллюстрирующий пример
выявления
подмножеств
сигнальных
признаков 1-го и 2-го родов.
Пусть заданы сжатые описания 2-х образов
(рис. 1), а также исследуемый объект,
описание (101001) которого принадлежит
1-му образу (выявлено в результате
распознавания), и сжатое описание 2-го
образа.
23
1
2
3
4
5
1
1
1
1
0
0
2
1
0
0
0
0
3
1
1
0
1
0
4
0
0
0
0
1
5
1
1 1-й образ
1
1 2-й образ
1
каждой
группе
определяет
переход
объектов из одного образа в другой,
приведен на рис. 4.
Рис. 1. Сжатое описание двух образов
4
5
1
1
0
0
2
0
0
0
3
1
1
0
4
0
0
1
5
0 Описание объекта
1 2-й образ
1
Рис.2. Исследуемый объект и сжатое описание 2-го
образа
Подмножество сигнальных признаков 1-го
рода {1} включает 1-й признак (столбец 1),
а подмножества сигнальных признаков 2-го
рода включают следующие подмножества
признаков {1}, {5}.
Следует
отметить,
что
при
нерепрезентативности обучающей выборки
признаки 3,4 могут указывать на
возможность
перехода
исследуемого
объекта в анализируемый образ.
Рис. 3. Типовая схема шаблона для выявления
сигнальных признаков в ИИС ИМСЛОГ
Подсистема выявления сигнальных
признаков в ИИС ИМСЛОГ
Отличительной особенностью подсистемы
выявления сигнальных признаков является
использование уже реализованных в ИИС
ИМСЛОГ [8] ключевых алгоритмов
выявления
закономерностей
путем
построения по матрицам описаний и
различений
безызбыточной
матрицы
импликаций, поиска всех ее кратчайших
столбцовых
покрытий
[7],
всех
минимальных безусловных тестов [2,7] и
построения сжатой матрицы описаний.
Типовая схема шаблона для выявления
сигнальных признаков в ИИС ИМСЛОГ
приведена на рис. 3. На рис. 3 пунктирной
линией обведены модули, составляющие
подсеть
для
выявления
сигнальных
признаков. При этом три из четырех
модулей
являются
типовыми,
реализующими ключевые алгоритмы [2-7].
Программный интерфейс пользователя
основного модуля подсистемы выявления
сигнальных признаков – модуля выбора
анализируемых образов для выявления
сигнальных
групп
(подмножеств)
признаков 1-го рода, изменение которых в
Рис.4. Интерфейс плагина, реализующего выбор
образов для выявления сигнальных признаков
Подключаемый модуль проверяет в начале
работы наличие и размерность матрицы
описаний на входе и формирует списки
образов для выбора анализируемых
образов. Для выявления сигнальных
признаков 2-го рода необходимо наличие
описания исследуемого объекта, а также, в
случае
необходимости
вычисления
вероятностей перехода при изменении
значений
сигнальных
признаков,
необходимы данные о коэффициентах
условной близости исследуемого объекта с
образами [4]. В связи с этим функция
выявления сигнальных признаков 2-го рода
становится доступной только при наличии
требуемых данных на входе модуля.
В нижней части оконной формы имеется
окно консольного вывода, в которое при
смене фокуса ввода выводится информация
о выбранных образах и о значениях
входных
параметров.
Интерпретация
24
выявленных сигнальных признаков зависит
от конкретной предметной области и может
быть осуществлена совместно с экспертами
либо профильными специалистами в
данной области.
Вместе с модулем выбора анализируемой
пары образов поставляется файл справки,
содержащий краткие теоретические основы
выявления сигнальных признаков и
инструкцию пользователя, описывающую
принципы
работы
с
подсистемой
выявления сигнальных признаков. Доступ к
справке осуществляется из основной
экранной
формы
интерфейса
динамического подключаемого модуля.
Во избежание необходимости заново
конструировать
сеть,
описывающую
подсистему
выявления
сигнальных
признаков и задающую взаимосвязи между
входами/выходами
входящих
в
нее
модулей, вся сеть добавлена в библиотеку
типовых решений ИИС ИМСЛОГ и может
быть целиком добавлена, в случае
необходимости, в шаблон текущей базы
данных и знаний.
Заключение
Разработана и включена в ИИС ИМСЛОГ
подсистема
выявления
нового
вида
закономерностей в знаниях, а, именно,
сигнальных признаков 1-го и 2-го рода.
Особенностью
подсистемы
является
использование типовых модулей ИИС
ИМСЛОГ,
реализующих
ключевые
алгоритмы выявления закономерностей.
На сконструированной на основе ИИС
ИМСЛОГ прикладной интеллектуальной
системе выявления закономерностей и
принятия
диагностических
и
психокоррекционных решений с целью
улучшения психологического здоровья
детей (154 испытуемых) были выявлены
подмножества сигнальных признаков 1-го
рода, указывающих на возможность
перехода из здорового состояния в
предневроз, из предневроза – в невроз и
обратно, а также сигнальные признаки 2-го
рода для ряда индивидуумов.
В области геоэкологии на созданной на
основе
ИИС
ИМСЛОГ
прикладной
интеллектуальной системе диагностики
оползнеопасности склонов и принятия
решений
по
инженерной
защите
территории
выявлены
подмножества
сигнальных
признаков
1-го
рода,
указывающих на переход из одного класса
(степени) устойчивости склонов в другой.
Разработанная подсистема может быть
использована для поиска «сложных»
закономерностей в знаниях, позволяющих
судить о динамике исследуемых процессов
и судить о факторах, способных влиять на
состояние объектов исследования. Данная
возможность
особенно
актуальна
в
областях, где требуется длительное
наблюдение за объектом и где важны
вероятности перехода объекта в те или
иные состояния, таких как медицина,
психология, педагогика и ряд других.
Список литературы
1. Журавлев Ю.И., Гуревич И.Б. Распознавание
образов и анализ изображений // Искусственный
интеллект в 3-х кн. Кн 2. Модели и методы:
Справочник / Под ред. Д.А.Поспелова. - М:
Радио и связь, 1990. С. 149-190.
2. Янковская А.Е. Логические тесты и средства
когнитивной графики в интеллектуальной
системе// Новые информационные технологии в
исследовании дискретных структур. Доклады 3ей
Всероссийской
конференции
с
международным участием. – Томск: изд-во СО
РАН, 2000. – С. 163-168.
3. Янковская А.Е., Гедике А.И. Теоретикометодологические
основы
создания
интеллектуальных
тестовых
распознающих
систем// Таврический вестник информатики и
математики. – 2004. – № 1. – С. 83-94.
4. Yankovskaya A.E. Minimization of Orthogonal
Disjunctive Normal Forms of Boolean Function to
be Used as a Basis for Similarity and Difference
Coefficients in Pattern Recognition Problems//
Pattern Recognition and Image Analysis. – 1996. –
Vol. 6, No 1. – pp. 60-61.
5. Yankovskaya
A.E.
Logic-Combinational
Probabilistic Recognition Algorithms// Pattern
Recognition and Image Analysis. – 2001. – Vol. 11,
No. 1. – pp. 123-126.
6. A.E. Yankovskaya. New kinds of regularities in
knowledge and algorithms of their revealing //
Proceedings of the 7th Open German-Russian
Workshop 2007 (Ettlingen, August, 20-25, 2007). In
print.
7. Yankovskaya A.E. and Gedike A.I. Construction
and Evaluation of Compressed Descriptions of
Patterns in an Intelligent Recognizing System//
Pattern Recognition and Image Analysis. – 1999. –
Vol. 9, No. 1. – pp. 124-127.
8. A.E. Yankovskaya, A.I. Gedike, R.V. Ametov, A.M.
Bleikher. IMSLOG-2002 Software Tool for
Supporting Information Technologies of Test Pattern
Recognition// Pattern Recognition and Image
Analysis, 2003, vol. 13, no. 4, pp. 650-657.
Download