Контекстный предиктор для сжатия изображений без потерь

advertisement
УДК 004(06) Информационные технологии
П.М. КАРПОВ
Московский инженерно-физический институт (государственный университет)
КОНТЕКСТНЫЙ ПРЕДИКТОР ДЛЯ СЖАТИЯ
ИЗОБРАЖЕНИЙ БЕЗ ПОТЕРЬ
Предлагается оригинальный контекстный предиктор для беспотерьного и
около-беспотерьного сжатия изображений, показывающий существенно лучшие
результаты (меньшее среднеквадратичное отклонение остаточного изображения),
чем MED-предиктор, использованный в стандарте Lossless JPEG.
Для сжатия изображений без потерь часто используется следующая
схема. При сжатии изображение просматривается слева направо, сверху
вниз. Следующие значения предсказываются на основе уже известных.
Кодируется же лишь разница между предсказанными и действительными
значениями. Декомпрессия происходит симметрично: на основе
известных значений предсказывается следующее значение и к нему
прибавляется сохранённая разность. Таким образом, коэффициент сжатия
сильно зависит от предиктора (т.е. алгоритма, который предсказывает
следующее значение на основе предыдущих): чем точнее предсказание,
тем меньшее среднеквадратичное отклонение разности действительных и
предсказанных значений и тем сильнее может быть сжато изображение.
Подобная схема применена в формате Lossless JPEG, который использует
MED-предиктор, описанный в [1].
Предлагается предиктор, существенно превосходящий MEDпредиктор в смысле среднеквадратичного отклонения. Принцип действия
предлагаемого метода сходен с контекстным моделированием: для
предсказываемого пиксела назовём контекстом все уже известные
пикселы в окне размером R1xR1 пикселов с центром в данном пикселе. В
окне
размером
R2xR2
пикселов
находится
расстояние
(среднеквадратичное отклонение) между контекстом текущего пиксела и
контекстом искомого пиксела. Далее, искомое значение вычисляется как
взвешенное среднее пикселов во втором окне с весами, равными
соответствующим ошибкам в степени P.
Параметр P может быть задан жёстко или же вычисляться в процессе
сжатия следующим образом: задаётся интервал изменения параметра и
шаг разбиения, так что получается конечное количество (N) возможных
значений параметра. После того, как значение пиксела предсказано (и его
действительное значение уже известно), производится предсказание со
всеми возможными значениями параметра P, и соответствующие ошибки
ISBN 5-7262-0555-3. НАУЧНАЯ СЕССИЯ МИФИ-2005. Том 2 149
УДК 004(06) Информационные технологии
сохраняются. В качестве параметра P на следующем шаге выбирается
значение, для которого среднее по массиву ошибок в окне R3xR3
пикселов минимально.
Благодаря своей общности, алгоритм может применяться к широкому
классу изображений, в том числе и к остаточному изображению, что при
однократном применении ещё больше снижает ошибку.
Высокая точность предсказания обеспечивается главным образом за
счёт того, что данный алгоритм может предсказывать значения на краях с
произвольной ориентацией (в отличие от MED, который справляется
только с вертикальными и горизонтальными краями). К достоинствам
алгоритма так же следует отнести возможность регулирования
соотношения скорость/качество за счёт изменения параметров R1 и R2.
Ниже приводятся результаты тестов на стандартном изображении Lena
512x512. Максимальное значение яркости принято за 1. Параметры
следующие: R1=4; R2=3; R4=7; N=8;
Среднеквадратичное отклонение
Размер при сжатии арифметическим кодером, байт
MED
0.02837457
150558
Context
0.02298973
142038
К остаточному изображению был снова применён предиктор.
MED
Context
На рисунках показаны модули разности действительных
предсказанных значений (нулю соответствует белый цвет)
Список литературы
ISBN 5-7262-0555-3. НАУЧНАЯ СЕССИЯ МИФИ-2005. Том 2 150
и
УДК 004(06) Информационные технологии
1.
Nasir Memon, Xiaolin Wu. Recent Developments in Context-Based
Predictive Techniques for Lossless Image Compression // The Computer Journal. 1997.
Vol. 40, No. 2/3.
ISBN 5-7262-0555-3. НАУЧНАЯ СЕССИЯ МИФИ-2005. Том 2 151
Download