Обнаружение человеческих лиц в

advertisement
УДК 004(06) Информатика и процессы управления
Ю.П. КУЛЯБИЧЕВ, С.В. ПИВТОРАЦКАЯ
Московский инженерно-физический институт (государственный университет)
ОБНАРУЖЕНИЕ ЧЕЛОВЕЧЕСКИХ ЛИЦ
В ВИДЕОПОТОКЕ НА ОСНОВЕ МЕТОДА
ВИОЛЫ-ДЖОНСА
Рассматривается задача обнаружения лиц в видеопотоке при условии использования нейросетевого подхода. Приводятся особенности реализации метода Виолы-Джонса для решения задачи обнаружения человеческих лиц на статических
изображениях. Предлагается введение предварительной фильтрации изображений
при работе с видеопотоком.
Обнаружение человеческих лиц на изображениях является одной из
актуальных задач в области автоматической обработки визуальной информации. В настоящей работе для обнаружения лиц на основе метода
Виолы-Джонса [1] был сформирован каскад нейронных сетей, каждая из
которых построена по алгоритму AdaBoost [2]. В качестве входных данных для нейросетей используются функции, подобные функциям Хаара
[3].
Процесс анализа изображения происходит следующим образом:
«скользящее» окно, представляющее собой квадрат все увеличивающегося размера, последовательно перемещается по изображению и подается на
первый слой каскада – нейронную сеть, состоящую из двух нейронов.
Если в исследуемом квадрате не было найдено человеческого лица, то
процесс обнаружения лиц заканчивается и происходит передвижение
квадрата по изображению и/или его увеличение. Если же человеческое
лицо было найдено в окне, то последнее подается на второй слой каскада
– нейросеть, состоящую из пяти нейронов. Точное количество нейронов
на каждом слое созданного каскада определялось по методу ВиолыДжонса. Процесс обнаружения продолжается до тех пор, пока не будут
пройдены все уровни каскада нейросетей.
По результатам обработки «скользящего» окна принимается решение о
наличии в квадрате человеческого лица, либо происходит прерывание
анализа по факту его необнаружения и выход из каскада.
Время, затрачиваемое на анализ изображения, при применении предложенного каскада нейросетей значительно сокращается по сравнению с
использованием единственной нейронной сети, состоящей из большого
количества нейронов, при неизменном качестве обнаружения лиц, поскольку при проверке изображения количество «скользящих» окон, в коISBN 5-7262-0710-6. НАУЧНАЯ СЕССИЯ МИФИ-2007. Том 12
12
УДК 004(06) Информатика и процессы управления
торых отсутствует человеческое лицо, во много раз превышает количество окон, его содержащих.
Описанный каскад нейронных сетей состоит из пятнадцати уровней и
реализован в виде программного модуля, представляющего собой динамическую библиотеку. При тестировании разработанного модуля было
использовано 245 статических изображений размером 384*288 пикселей с
глубиной цвета 8 бит/пиксель, на которых было найдено 93,5 % от общего
числа присутствующих на изображениях лиц при среднем времени обработки одного изображения – 27 мс.
Созданный модуль предполагается использовать при обнаружении лиц
в видеопотоке. Для того чтобы улучшить качество изображений, поступающих с датчиков внешнего видеонаблюдения на модуль, целесообразно
применять фильтры высоких частот и усредняющие фильтры локальных
окрестностей.
Список литературы
1. P. Viola and M. Jones. Robust real-time object detection. Technical Report CRL 2001/01,
The Cambridge Research Laboratory, February, 2001.
2. Y. Freund and R. E. Schapire. A decision-theoretic generalization of on-line learning and
an application to boosting. European Conference on Computational Learning Theory, 1995.
3. C. Papageorgiou, M. Oren, and T. Poggio. A general framework for object detection. In International Conference on Computer Vision, 1998.
ISBN 5-7262-0710-6. НАУЧНАЯ СЕССИЯ МИФИ-2007. Том 12
13
Download