Медников Д., Миловидов А., Сергунин С., Кумсков М.

advertisement
310
ИДЕНТИФИКАЦИЯ УСТОЙЧИВЫХ ЭЛЕМЕНТОВ ОПИСАНИЯ С
ИСПОЛЬЗОВАНИЕМ МОДЕЛИ АКТИВНОГО СЕНСОРА
Д.И. Медников1, А.Н.Миловидов1, С.Ю.Сергунин1, М.И.Кумсков1
1Кафедра
вычислительной математики, Механико-математический факультет,
Московский Госуниверситет им. М.В. Ломоносова, Москва, 119991 Россия.
E-mail: image_msu@mail.ru, kumskov@mail.ru
Предложен алгоритм первичного поиска объекта на изображении с
использованием особых точек в схеме распознавания с активным сенсором.
Показано значительное улучшение работы предложенного алгоритма при
использовании пирамиды изображений.
Введение
Важной
компонентой
модели
распознавания изображений с активным
сенсором является модуль первичного
поиска объекта (эталонного изображения)
на тестовом изображении [3]. Предлагается
алгоритм поиска частей эталонного
изображения («помещающихся» в окне
сенсора), который используется как при
выявлении похожести объектов на грубом
изображении, так и при подтверждении
найденных похожестей на детальном.
Алгоритм решает проблему устойчивости
элементов описания при смене фона вокруг
объекта.
Постановка задачи
Тестовое изображение – это изображение,
на котором требуется произвести поиск
объектов.
Эталонное
изображение
(эталон)
–
изображение объекта на черном фоне,
который требуется найти на тесте или
сообщить об его отсутствии.
Будем называть особой точкой (ОТ) [1]
некоторый
характерный
участок
изображения. ОТ описывается парой
координат (точкой) и числовым маркером,
описывающим тип этой точки. Могут быть
пересечениями и/или изломами контуров
изображения, центрами геометрических
фигур, которые можно выделить на
контурах,
или
центрами
сегментов
изображения
(как
в
предложенном
алгоритме).
Определение: облако особых точек –
некоторое подмножество множества всех
особых точек данного изображения.
Определение: пирамида изображения –
набор изображений (уровней), полученных
из данного уменьшением детализации.
Определение:
окно
сенсора
–
прямоугольник фиксированного размера
(его размер является одним из параметров
системы, определяемым при обучении [3]),
в котором происходит описание ОТ их
окрестностями и сравнение облаков ОТ; ОТ
вне его при этом не учитываются.
В
каждый момент времени система работает
только
с
частью
изображения,
расположенной внутри окна сенсора. При
этом окно сенсора может перемещаться по
изображению в процессе распознавания и
динамически изменять уровень «зума», т.е.
отображать разные по площади участки
изображения в зависимости от уровня
пирамиды изображения, на котором
происходит работа.
Будем называть описанием изображения
множество особых точек такое, что по нему
можно определить похожесть одного
изображения на другое, используя только
функции сравнения облаков ОТ, но не
участков изображений.
Определение: конфигурация особых точек
– вектор определенной размерности,
описывающий взаимное расположение
особых
точек,
находящихся
на
изображении достаточно близко.
Определение:
рейтинг
одной
ОТ
относительно
другой
–
число,
описывающее похожесть окрестностей этих
311
ОТ друг на друга. Чем он больше, тем
более похожи окрестности.
Решаемая задача является объединением
следующих подзадач.
Задача
построения
описания
изображения. [2]
Задача
состоит
в
выделении
на
изображении
особых
точек,
удовлетворяющих следующим условиям:
1) ОТ должны быть характерными, т.е.
похожее расположение ОТ (близкие по
евклидовой метрике конфигурации ОТ)
должно отвечать похожим объектам, а
непохожие – непохожим (похожесть
определяется оператором при обучении
[3]).
2) ОТ должны быть устойчивыми
относительно изменения фона, т.е. ОТ на
объекте не должны «сильно меняться» при
изменении фона, окружающего объект.
Задача построения дескрипторов особых
точек по их окрестностям.
Задача состоит в описании расположения
особых точек в некоторой окрестности
выделенной ОТ вектором фиксированной
длины. Требуется, чтобы векторы не
сильно менялись (по метрике Rn ) при
незначительных подвижках особых точек.
Задача сравнения облаков особых точек.
Задача состоит в сравнении двух облаков
(наборов) особых точек, описанных своими
окрестностями, и вычислении их рейтинга
друг относительно друга. При этом:
1) Рейтинг похожих облаков должен
сильно отличаться от рейтинга непохожих.
Это
необходимо
для
построения
процедуры, решающей, представлен объект
на тесте или нет.
2) Нужно уметь распознавать ситуации,
когда одно облако является подмножеством
другого. Типичным примером такой
ситуации как раз является добавление ОТ
фона к объекту.
Задача поиска похожих областей на тесте и
эталоне.
Задача состоит в поиске на тестовом
изображении областей, похожих на области
эталонного изображения (в нашем случае
будут рассматриваться только области,
целиком попадающие в одно окно). На
тестовом и на эталонном изображениях
фиксируется положение окна. Части этих
изображений,
попавшие
в
соответствующие им окна, описываются
особыми точками, получившиеся облака
сравниваются, и получается рейтинг одного
окна относительно другого. При этом
алгоритм должен достаточно быстро
работать, чтобы обеспечить поиск объектов
на тесте по большой базе эталонов.
Алгоритм поиска наилучшего окна
На вход получаем изображение эталона и
теста. На выходе для каждого положения
окна на образце получаем наиболее
похожее на него положение окна на тесте и
их рейтинг относительно друг друга.
1) На обоих изображениях выделяются
особые точки.
2) Строится некоторое покрытие окнами
образца и теста.
3) Для каждого положения окна на образце
ищется наиболее похожее (близкое)
положение окна на тесте – для каждого
положения окна на тесте считается его
рейтинг (пункт (4)) относительно окна на
образце. Среди полученных рейтингов
ищется максимум, окно с этим рейтингом
считается наиболее похожим на окно на
образце.
4) Есть два окна. Для каждой особой точки,
попавшей в окна, по ее круговой
окрестности строится описывающий ее
вектор (алгоритм (1)). Два получившихся
облака описанных точек сравниваются при
помощи алгоритма (2).
(1) Алгоритм построения вектора,
описывающего круговую окрестность
ОТ
На вход получаем особые точки,
координаты
описываемой
точки
и
параметры описания (радиус области,
число колец разбиения, число секторов
разбиения). На выходе получаем вектор,
описывающий нужную точку.
Круг описания с центром в описываемой
точке разбивается на кольца и сектора,
соответствующие параметрам разбиения.
Получается «мишень»:
312
Свойство «зума» активного сенсора
Здесь 4 кольца (разбиение по расстоянию
от центра) и 8 секторов (разбиение по
углу). Всего 32 области.
Для каждой точки, попавшей в область
описания,
считается
степень
ее
принадлежности к этой области как сумма
принадлежности к отрезку по углу
(например [  /2,  ]) и принадлежности к
отрезку по расстоянию (например [100,
200]). Возможно использование разных
функций принадлежности к отрезку. В
данной
реализации
использовалась
трапецеидальная.
Для пары [область, дескриптор] считается
сумма принадлежностей к этой области
точек с таким дескриптором. Таким
образом, получается матрица [область,
дескриптор], она и распрямляется в
выходной вектор.
При обработке большого количества
эталонных объектов скорость работы
является более важной, чем точность
распознавания (на стадии первичного
определения главное — отсечь заведомо не
находящиеся на изображении объекты).
Для скорости приведенного алгоритма
критичным является количество особых
точек на изображении, так как сложность
алгоритма O(n 2 ) . При этом особые точки
все-таки
должны
однозначно
характеризовывать объект, поэтому их не
может быть совсем мало. Хорошие
результаты в этом направлении дает
использование свойства «зума» активного
сенсора, т.е. пирамиды изображений.
Наилучшие результаты достигаются на
уровне
уменьшения
детализации
изображения в 4 раза.
Рис1. Слева изображение уменьшено в два раза
(2) Алгоритм сравнения двух облаков ОТ
На вход получаем два облака особых точек
(считается, что первое относится к
образцу). На выходе - рейтинг одного
относительно другого.
Если во втором точек меньше, чем 1/3 от
количества в первом, то возвращается
рейтинг 0.
Если в первом меньше точек, чем во
втором, то рейтинг считается по формуле




1
 max  1  dist t1, t 2  ,
t1 из первого


 t 2 из второго 
где dist t1, t 2 — евклидово расстояние
между векторами, описывающими эти
точки, полученными из алгоритма (1).
Иначе – по формуле




1
 max  1  dist t1, t 2  .
t 2 из второго


 t1 из первого 
Рис 2. Сверху изображение уменьшено в два раза
313
На приведенных примерах видно, что
таким образом удается избежать влияния
шума и выделить только самые важные
области. За счет этого удается уменьшить
количество ОТ, убрав все незначительные,
что позволяет увеличить не только
скорость, но и точность работы (примеры
приведены ниже). Также использование
свойства
«зума» активного
сенсора
позволяет проводить быстрый первичный
поиск объектов на изображениях малого
качества. Далее найденные локальные
похожести можно подтвердить (или
опровергнуть) тем же самым алгоритмом.
Таким образом, можно организовать
несколько уровней подтверждения, при
этом
с
большим
объемом
ОТ,
возникающим на изображениях высокого
разрешения, придется работать только на
небольшом количестве отобранных на
предыдущих шагах фрагментов. Такой
подход увеличивает не только скорость
распознавания (большая часть объектов
будет
отсечена
при
работе
с
изображениями низких разрешений), но и
его точность (работа с изображениями
высокого
разрешения
происходит
локально, значит, не мешает окружающий
шум).
Результаты работы
Рис 4. Результат работы программы, реализующей
данный алгоритм в системе Matlab. Линиями
соединены соответствующие особые точки
Численные эксперименты показывают, что
за
счет
использования
пирамиды
изображений удается достичь ускорения
работы в 3-3.5 раза и увеличения точности
распознавания на 10-15%.
Заключение
Построен алгоритм первичного поиска
объекта на изображении на основе модели с
активным сенсором, которой обладает
повышенной устойчивостью. Проведены
вычислительные
эксперименты,
показывающие эффективность метода.
Экспериментально отмечено значительное
улучшение эффективности алгоритма при
использовании пирамиды изображений.
Литература
Рис 3. Результат работы программы, реализующей
данный алгоритм в системе Matlab. Линиями
соединены соответствующие особые точки
1. C.Ю. Сергунин, А.Н. Миловидов, В.М.
Лозинский, Д.Н.Кравченко Примеры построения
алфавитов описания окна активного сенсора в
РОАС системе.//Доклады 12-й Всероссийской
конференции
«Математические
методы
распознавания
образов»
(ММРО-12-2005)
Москва, 2005, г. с. 447 – 450.
2. C.Ю. Сергунин, М.И. Кумсков Свойства модели
объекта в системе распознавания с активным
сенсором. // Доклады 12-й Всероссийской
конференции
«Математические
методы
распознавания
образов»
(ММРО-12-2005),
Москва 2005, с.441 – 444.
3. Sergunin S., Kumskov M. Computational Model for
Recognition of Scene Objects with an Active
Sensor. // Pattern Recognition and Image Analysis,
2007, Vol. 17, No. 2, p. 210–216
Download