256_Крлн_Нврв

advertisement
Международная научно-техническая конференция «Информационные системы и технологии»
ИСТ-2014
СЕКЦИЯ 5.1 ТЕХНИЧЕСКАЯ КИБЕРНЕТИКА (СИСТЕМЫ ОБРАБОТКИ ИНФОРМАЦИИ)
О. Н. КОРЕЛИН (доцент, к.т.н), М. А. НЕВРОВ (магистрант)
(Нижегородский Государственный Технический Университет им. Р. Е. Алексеева)
ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ АЛГОРИТМА JB2 В ФОРМАТЕ DJVU
В настоящее время все больше и больше увеличивается количество информации
представленной в цифровом виде. Информация чаще всего представлена в виде изображения, для
удобства обработки и ее восприятия. Для экономии пространства на носителе информации, к
изображениям применяются различные алгоритмы сжатия. Данные алгоритмы можно разделить
на две категории:
 Алгоритмы сжатия с потерями
 Алгоритмы сжатия без потерь
Мы будем рассматривать алгоритмы сжатия изображений с потерями. Наиболее
распространённый алгоритм - это JPEG и некоторые из его модификации. JPEG не дает
достаточного уровня сжатия без серьезной потери в качестве изображения. Поэтому нами был
выбрана технология сжатия изображения с потерями DjVu. Это относительно новый формат
кодирования изображения. Наибольшая степень сжатия достигается при применения на
комбинированных изображениях содержащих текстовую и графическую информации. Основная
идея алгоритма – это разделении изображения на слои и дальнейшее сжатие каждого слоя с
помощью наиболее подходящего алгоритма, в зависимости от типа информации хранящейся в
данном слое. Выделяют три слоя на изображении:
 Передний план
 Задний план
 Маска
Для сжатия переднего и заднего планов используется вейвлет метод непрерывного сжатия
IW44. Маска сжимается методом сжатия черно-белых изображений JB2.
Ключевым новшеством в JB2, относительно метода оптического распознавания текста
(OCR - Optical Character Recognition), является решение проблемы ошибок замещения, в которых
неточно отсканированный знак (из-за шума, неровностей сканирования и т.д.) неверно
распознается и рассматривается как совершенно другой знак.
Ключевые идеи JB2:
 Начальное изображение сегментируется на отдельные знаки (связные компоненты черных
пикселей)
 Знаки иерархически группируются на основе сходства с определенной точностью
 Некоторые знаки сжимаются и кодируются непосредственно с использованием статистической
модели и арифметического кодирования
 Остальные знаки сжимаются и кодируются косвенно на основе ранее закодированных знаков,
также с использованием статистической модели и арифметическое кодирование
 Изображение кодируется с указанием индекса и положения каждого знака относительно
предыдущего
Рассмотрим процесс сегментации изображения на отдельные знаки. Первоначально
изображение сканируется слева - направо, сверху – вниз до обнаружения первого не белого
пикселя, который будет использоваться, как начальный (seed pixel) для извлекаемого знака. После
того как найден начальный пиксель используется алгоритм граничной трассировки, для поиска
границ знака. Цель поиска границы, определить размер растрового изображения для хранения
знака. Следующим шагом будет извлечение знака из изображения.
Алгоритм граничной трассировки базируется на связности пикселей. Группа пикселей,
состоящая из основного и восьми пикселей окружающих его, называется связанной. В алгоритме
трассировке рассматривается основной пиксель и восемь связанных с ним. Связанные пиксели
рассматривается по часовой стрелке и если встречается не белый пиксель, тогда этот пиксель
становится основным и процедура продолжается дальше пока начальный пиксель не станет
основным. После этого знак удаляется из изображения.
256
Download