Об одном методе поиска алгебраических корректоров при

advertisement
Об одном методе поиска алгебраических корректоров при
решении задачи распознавания образов по прецедентам
А.С. Бирюков1
In the given work the task of construction of the algebraic corrector of the second degree
is considered. Two methods of the decision of this task based on the various approaches
are offered. (Decision of a task of optimization and search of the maximal joint
subsystem). The carried out experiments on the casual tables have shown improvement
of results of recognition up to 5 % at use of the algebraic corrector.
В данной работе рассматривается задача практического построения
алгебраического корректора степени не выше второй над заданным конечным
множеством эвристических алгоритмов распознавания.
Рассмотрим следующую задачу для системы объектов, состоящей из l
классов. Пусть известно N стандартных алгоритмов распознавания
A 1 , A 2 , ... , A N , с известными матрицами оценок ij
для заданных обучающей
q l
выборки I 0 и контрольной – I ' , состоящей из q объектов, и известным
решающим правилом r [1]. Оператор r для всех алгоритмов одинаков. Будем
искать новый алгоритм в виде:
N
 N

A  r   R i R j x ij   R i x i 
 i , j ,i  j

i 1
,
(1)
где xij , xi некоторые неизвестные константы.
Основная задача: Найти полином минимальной сложности и наиболее точно
распознающий проверочную выборку I ' .
Под сложностью мы подразумеваем число членов суммы в (1), а под
точностью распознающего алгоритма – число правильно распознанных
объектов контрольной выборки.
Будем пользоваться следующим решающим правилом: объект S  –
относиться к j – классу, если выполнены следующие неравенства:
j   , для   1,..., l ,   j
Опишем общий алгоритм построения корректора. Для заданных алгоритмов
вычисляем все возможные члены суммы алгебраического корректора и
представляем их в виде матриц ij
, т.е. мы получаем массив матриц ijk
,
q l
 N  3N 

k  1, ... , 
2


2
q l
, где N матриц соответствуют исходным распознающим
операторам, а остальные матрицы соответствуют всевозможным по парным
произведениям операторов.
1-й шаг. Рассматриваем все возможные пары членов алгебраического
корректора и для каждой пары находим неизвестные константы. Говоря
другими словами, мы строим все возможные корректоры из двух членов.
Выбираем лучшую пару.
i-й шаг. Мы уже имеем корректор, построенный из i членов. Перебираем все
незадействованные в корректоре члены суммы и выбираем тот, который при
умножении на некоторую константу дает максимальное улучшение.
1
Вычислительный центр РАН, 117967, Москва, улица Вавилова, дом 40, телефон 135-62-31.
Алгоритм заканчивает работу либо когда все члены суммы исчерпаны, либо
когда на некотором шаге мы не получаем улучшения.
Далее предлагается два различных метода реализации описанного алгоритма.
Эти методы различаются принципами нахождения неизвестных констант на
каждом шаге.
Первый метод. Будем строить корректор, стремясь в итоге получить
алгоритм, в результате действия которого получается матрица, которая
описывает все элементы точно. Элементы этой матрицы мы получим как
усреднение элементов соответствующих тому же классу в исходных матрицах.
Обозначим эту матрицу  0 .
Первый шаг. Для каждой пары членов корректора нам надо решить задачу:
q
l

f ( x , x  )    x ij  x  ij  ij0
i 1 j 1


2
 min
В результате строим корректор с матрицей:
   x    x   
На последующих шагах мы будем решать аналогичные задачи для уже
построенного корректора и еще не задействованных членов суммы, вычисляя в
конце каждого шага новую матрицу   .
Второй метод. Чтобы не загромождать изложение опишем алгоритм на
примере системы объектов состоящей из двух классов. Пусть у нас q 
элементов первого класса и q  элементов второго, а всего у нас q  q   q 
элемента.
Первый шаг. Сопоставим каждой паре членов корректора с матрицами  i ,  j
корректор с матрицей  i  x j . Эта матрица должна удовлетворять следующей
системе:
ki 1  xkj1  ki 2  xkj2 , k  1,..., q 
ki 1  xkj1  ki 2  xkj2 ,
k  q  1,..., q .
Найдем максимальную совместную подсистему для x . В результате получаем
алгоритм с матрицей     i  x j .
На последующих шагах мы будем решать аналогичные задачи для уже
построенного корректора и еще не задействованных членов суммы. Вычисляя в
конце каждого шага новую матрицу   .
Проведенные эксперименты на случайных таблицах с использованием
системы ЛОРЕГ [2] показали улучшение результатов распознавания до 5% при
использовании алгебраического корректора.
Настоящая работа выполнена при поддержке Российского Фонда
фундаментальных исследований, проекты №99-07-90120, 00-01-00650, 99-0790390.
Список литературы
1. Журавлёв Ю.И. Об алгебраическом подходе для решения задач распознавания или
классификации, Проблемы кибернетики, Наука, Москва, 1978, выпуск 33, стр. 5-68.
2. Богомолов В.П., Виноградов А.П., Ворончихин В.А., Журавлёв Ю.И., Катериночкина Н.Н.,
Ларин С.Б., Рязанов В.В., Сенько О.В. Программная система ЛОРЕГ – алгоритмы
распознавания, основанные на голосовании по множествам логических закономерностей.
Москва, ВЦ РАН, 1998, 63 с.
Download