Федотов Н.Г., Шульга Л.А., Моисеев А.В., Кольчугин А.

advertisement
Федотов Н.Г., Шульга Л.А., Моисеев А.В., Кольчугин А.
СВОЙСТВА ПРИЗНАКОВ РАСПОЗНАВАНИЯ, ОСНОВАННЫХ НА СТОХАСТИЧЕСКОЙ ГЕОМЕТРИИ, ПРИ СКАНИРОВАНИИ ИЗОБРАЖЕНИЙ
СЛУЧАЙНЫМИ РЕШЕТКАМИ
Работа выполняется при поддержке гранта РФФИ (№ 05-01-00991)
ВВЕДЕНИЕ
Вопрос, рассматриваемый в статье, примыкает к проблеме распознавания. В распознавании образов
традиционно выделяют два этапа — формирование признаков и решающую процедуру. Исторически сложилось так, что наибольшее количество публикаций посвящено решающим правилам и мало исследований по
формированию признаков. В частности, долгое время не существовало практически значимой теории
признаков распознавания изображений.
Подход с позиций стохастической геометрии [1] позволили не только теоретически исследовать
этот важный этап распознавания, но и получить большое количество новых конструктивных признаков
распознавания (триплетных признаков). Опора на большое количество признаков генерируемых в процессе распознавания, ведет к повышению интеллектуальности и надежности интеллектуальных распознающих систем. Характерной особенностью новых триплетных признаков является их структура в виде
композиции трех функционалов ( F )    ( F  l ( p, )) , где p ,  - нормальные координаты сканирующей
прямой l ( p, ) , с которыми связаны функционалы P и  ; функционал  связан с естественной координатой t сканирующей прямой l ( p, ) и F – обозначение изображения распознаваемого объекта. Варьируя свойства функционалов, включаемых в композицию, можно изменять свойства признаков и в частности, формировать признаки с заданными свойствами. Например, весьма важными свойствами являются
инвариантность и сенситивность признаков по отношению к движению и линейным деформациям объекта.
Инвариантность важна для независимости результата распознавания от движений и линейных деформаций, то несть в конечном итоге для достижения высокой надежности распознавания. В месте с тем для
целого ряда практически важных задач в аэрокосмических исследованиях, в робототехнике (позиционирование инструмента) важно не только правильно распознать движущийся объект, но и определить параметры движений и масштабных преобразований. Эту функцию по определению параметров движения и
деформаций выполняют сенситивные признаки распознавания [2].
На практике существует обширный класс задач распознавании образов, где задача распознавания
совмещена с задачей поиска объекта. Кроме того, часто встречаются задачи распознавания случайных
текстур, например, из области нанотехнологий. В этих задачах целесообразно интерпретировать распознаваемый объект как случайный. В работах [1], [3] показано, что в данной ситуации применение
сканирования случайной решеткой дает лучшее соотношение надежность-быстродействие распознавания.
В связи с этим возникает важный вопрос о сохранении свойств инвариантности и сензитивности
признаков распознавания при сканировании изображений случайной решеткой. Сохранение инвариантности при таком сканировании практически очевидно. Это следует из того, что вероятностная мера при
генерации множества сканирующих линий (мера Лебега) строится на основе кинематической меры множества прямых [1]. Вопрос о сохранении сенситивности признаков распознавания при сканировании случайной решеткой далеко не тривиален. Исследованию свойства сензитивности признаков при применении
сканирования случайной решеткой посвящена настоящая статья.
ФОРМИРОВАНИЕ ТРИПЛЕТНОГО ПРИЗНАКА
Прямая l на плоскости однозначно определяется расстоянием p от начала координат до нее и углом  (с точностью до 2  ) ее направляющего вектора. При пересечении изображения F
рассмотрим бинарную функцию
с прямой l
1; t  F  l ,
f (, p, t )  
0; t  F  l
где t - естественный параметр прямой l .
Действуя функционалом  на функцию f ( , p, t ) , получим функцию
g (, p)  f (, p, t ) . Функционал 
назван Trace-функционалом (―Trace‖-след), соответственно, функция
преобразования (Trace-трансформантой). Сам процесс получения функции
g
g
- результат Traceпод действием Trace-
функционала  назван Trace-преобразованием.
Далее усложним эксперимент. Рассмотрим множество сканирующих прямых, определенных для всевозможных допустимых значений параметров ( R  p  R; 0    2) . Обозначим  - множество всех таких
прямых, тогда   { p; ; R  p  R;0    2 } . Для случая детерминированного сканирования задание параметров p и 
для генерации прямой реализовано следующим образом:
i 2
j 2R
;(i  0,1,..., N ) ,
 R;( j  0,1,.., M ) и  
N
M
где M - число разбиений параметра p длиной 2R ; а N - число разбиений параметра 
p
длиной
2 ; тогда общее число сканирующих прямых равно D  (M  1)( N  1) .
Таким образом, множество  задает детерминированную решетку, которой сканируется изображение F
В результате сканирования изображения объекта F множеством прямых  получаем матрицу, которая названа Trace-матрицей или Trace-образом данного изображения.
Горизонтальная ось O Trace-матрицы содержит значения углов
мых, вертикальная ось Op - значение параметра
(0  i  2 ) для сканирующих пря-
p ( R  p j  R) , тогда в точке (i , p j ) будет распо-
ложен элемент матрицы с номером (i, j ) , т.е. результат действия Trace-функционала для сканирующей
прямой
lk (i , p j ) . Здесь  i
и
pj
– некоторые значения равномерных дискретных сеток на указанных
осях.
Последующее вычисление признака заключается в последовательной обработке столбцов матрицы с
помощью функционала  , который назван диаметральным функционалом. Результат действия диаметрального функционала h( )  g ( , p) к Trace-матрице - 2  - периодическая кривая.
Заключительный этап формирования нового признака распознавания изображений состоит в действии
функционала  на функцию h( ) , т.е. признак распознавания есть ( F )  h( ) . Сам функционал 
назван круговым, так как область определения кривой 2  .
Структура признака распознавания представляет собой последовательную композицию трех функционалов , ,  , действующих, соответственно, по переменным , p и t :
(F )  (h( ))   ( g ( , p))    ( f ( , p, t )) .
Проведены исследования свойств инвариантности и сензитивности генерируемых признаков по отношению к заданным группам преобразований изображений. Далее приводятся определения функционалов,
инвариантных и сенситивных к переносам, поворотам и масштабным преобразованиям изображений и
предлагается теоретический подход к конструированию признаков распознавания с заранее заданными
свойствами инвариантности или сензитивности.
Мы называем функционал  инвариантным, если (u ( x  b))  u для всех b  R .
Теоретические исследования определения свойств инвариантности выявленных признаков основаны на
теореме, доказанной ранее Н.Г. Федотовым, А.А. Кадыровым.
Теорема: если функционалы , ,  инвариантны к сдвигу, т.е. если
(u(t  b))  (u(t )) для всех чисел b ;
(u( p  b))  (u( p)) для всех чисел b ;
(u(  b))  (u( )) для всех чисел b ;
то признак ( F )    ( f ( , p, t )) независим от группы движений образа.
В месте с тем, для многих задач аэрокосмических исследований; в робототехнике для точного позиционировании инструмента необходимо определять параметры перемещения объектов. Для этих целей
разработаны сенситивные признаки, позволяющие определять параметры движения и линейных деформаций
изображений объектов.
Мы называем функционал  чувствительным или сенситивным, если (u ( x  b))  u  b для всех
bR .
Приведем некоторые примеры функционалов двух видов:
Инвариантные функционалы:
Максимальное значение функции.
Количество экстремумов функции.
Общая вариация функции.
Стандартная евклидова норма функции.
Любой функционал, определяемый распределением значений функции.
Сенситивные функционалы:
Стандартный центр тяжести масс, вычисленный следующим образом: g   pg ( p)dp (пример диаметрально-

g ( p)dp
го функционала).
Фаза второй гармоники Фурье функции.
Абсолютное значение коэффициента Фурье третьей гармоники.
Теоретико-вероятностная медиана.
Показано, что для каждого из трех функционалов можно подобрать десятки разных конкретизаций,
удовлетворяющих требуемым условиям. Следовательно, без больших вычислительных затрат можно генерировать тысячи новых признаков, инвариантных или чувствительных к движениям образа. Это доказывает ценность рассмотренных подходов для задач распознавания образов с множественной структурой
классов (распознавание иероглифов или текстур).
ИССЛЕДОВАНИЕ СОХРАНЕНИЯ СВОЙСТВА СЕНЗИТИВНОСТИ ПРИЗНАКОВ РАСПОЗНАВАНИЯ ПРИ СКАНИРОВАНИИ
СЛУЧАЙНОЙ РЕШЕТКОЙ
Рассмотрим получение триплетных признаков на основе кинематической меры
 ( F )   dpd dt .
F
Для расширения получаемых признаков рассмотрим интегрирование некоторой функции
f ( p, , t ) изоб-
ражения распознаваемого объекта F
( F )   f ( p, , t )dpd dt .
F
Представим кратный интеграл как последовательный
( F ) 
2

0
0
 d  dp  f ( p, , t )dt .
Такое представление позволяет рассматривать ( F ) как триплетный признак (последовательное
действие трех функционалов).
Введем в рассмотрение на множествах изменения  и p вероятностные распределения путем определения функций распределения G( ) и S ( p) . В этом случае
( F ) 
2

0

dG( )  dS ( p)  f ( p, , t )dt
0
так же может рассматриваться как признак, полученный с использованием сканирования со случайными параметрами.
Если вероятности распределения G( ) и S ( p) таковы, что существуют функции плотности распределения, то

2

0
0
 g ( )d  s( p)dp  f ( p, , t )dt 
( F ) 
2

0
0
 d  dp  g ( )s( p) f ( p, , t )dt.
По своей структуре признак ( F ) аналогичен признаку ( F ) . Отличие состоит в том, что функция
изображения f умножается на функции плотности распределения g ( ) и s( p) .
Если рассматривать техническое устройство, то изменение параметра p конечно; на множествах
изменения 
и p можно задать равномерные распределения. В этом случае
1

 , если   [0,2 ],
g ( )   2

0, если   [0,2 ].
1

 , если p  [0, ],
s( p)   

0, если p  [0, ].
 — ширина изменения параметра p . В этом случае будем иметь
( F ) 
1
2
2

0
0
1
 d  dp  f ( p, , t )dt  2 ( F ) .
Данный факт позволяет сказать, что если признак ( F ) обладал некоторыми свойствами, например,
был сенситивным, то и признак ( F ) так же будет обладать этими же свойствами.
Следует сказать, что в общем случае вероятностные распределения могут быть достаточно произвольными. Подбор функций g ( ) и s( p) может быть осуществлен таким образом, что функция изображения f   g  s  f сохранит свойства признака ( F ) при организации сканирования со случайными параметрами.
ЗАКЛЮЧЕНИЕ
В статье доказано, что свойства сензитивности признаков распознавания по отношению к движению
и линейным деформациям объекта сохраняется при сканировании со случайными параметрами. Следовательно, сенситивные признаки можно использовать для определения параметров движения (перемещения, поворотов) и линейных деформаций объектов (в частности, масштабных изменений).
Погрешности вычислений интеграла
 f ( p, , t )dt
казано в [1], определяется величиной  
2
 [ f ]
2
N
при сканировании изображения объекта F , как по, где  2 [ f ] — дисперсия случайной величины
f ,
которая определяется исключительно размерами элементарной области  , N — число сканирующих прямых. При организации сканирования со случайными параметрами за начальное множество, на котором
задаются вероятностные распределения, берется элементарная область  с меньшими размерами.
Значит, величина  2 при том же значении N будет меньше для сканирования со случайными параметрами, чем для детерминированного сканирования.
На основе вышеизложенного следует, что при формировании признаков распознавания с использованием сканирования со случайными параметрами дисперсия оценки признака уменьшается при использовании того же числа сканирующих прямых, что и при детерминированной развертке. Это ведет к повышению точности вычисления признаков,
и в конечном итоге, повышению надежности распознавания при
фиксированном количестве шагов работы сканирующей системы. При фиксированной точности определения
признаков распознающая система со сканированием со случайными параметрами дают больший выигрыш в
быстродействии, чем распознающая система с детерминированным сканированием.
ЛИТЕРАТУРА
1. Федотов Н. Г. Методы стохастической геометрии в распознавании образов. — М: Радио и связь.
— 1990.
2. Nikolay G. Fedotov, Lyudmila A. Shul’ga, Feature Generation and Stochastic Geometry, //
Proceedings of the 4th International Workshop on Pattern Recognition in Information Systems, PRIS
2004, Porto, Portugal, April 2004, p. 169-175.
3. Nikolay G. Fedotov, Lyudmila A. Shul’ga, New Ways to Form Features for Pattern Recognition
on the Basis of Stochastic Geometry // Proceedings of the 12th Scandinavian conference of Image
Analysis? SCIA — 2001. Bergen, Norway. — Grafik produksion: Geo Grafik as Bergen, 2001. — vol. 1.
— p.686-690.
Download