сжатие изображений

Алгоритмы сжатия изображений Сжатие – представление информации в более эффективном виде, влекущее за собой уменьшение объема данных (как правило). В основном алгоритмы сжатия используют свойства графических данных:  избыточность – группы одинаковых символов;  предсказуемость – часто повторяющиеся одинаковые комбинации символов;  необязательность – данные, мало влияющие на человеческое восприятие (цвет). Классификация методов сжатия  Сжатие без потерь  кодирование информации меньшим числом битов без ее искажения  Сжатие с потерями  кодирование информации с потерей той ее части, которая несущественна для представления данных  применимо не для любых данных Оценки методов сжатия         Степень сжатия Качество сжатия Скорость сжатия, в том числе отдельно компрессия и декомпрессия изображения Симметричность (по времени) Возможность масштабирования Устойчивость к ошибкам Учет специфики изображения Стоимость аппаратной реализации или/и эффективность программной реализации Критерии сравнения различных методов сжатия Худший, средний, лучший коэффициенты сжатия  Класс изображений  Симметричность  Потери качества  Особенности алгоритма  Классы изображений  Класс 1. Изображения с небольшим количеством цветов (4-16) и большими областями, заполненными одним цветом. Плавные переходы цвета отсутствуют. (деловая графика – гистограммы, диаграммы, графики)  Класс 2. Изображения с плавными переходами цветов, построенные на компьютере (графика презентаций, САПР, векторные изображения 3d объектов)  Класс 3. Фотореалистичные изображения.(Цифровые или отсканированные фотографии)  Класс 4. Фотореалистичные изображения с наложением деловой графики (реклама) Сжатие без потерь RLE (Run Length Encoding)  LZW (Lempel, Ziv, Welch)  Метод Хаффмана (Huffman)  Алгоритм группового кодирования RLE     Изображение вытягивается в цепочку байт по строкам растра. Серия повторяющихся величин (значений пиксела) заменяется одной величиной и количеством ее повторений. Abbbbbbbccdddeeee – 1a7b2c3d4e Этот подход хорошо работает с длинными сериями повторяющихся величин, т.е. с изображениями с большими областями постоянной яркости (или цвета). Используется во многих форматах bitmap файлов – TIFF, GEM, PCX и других. Возможные проблемы могут быть связаны с порядком записи величины и количества повторений: 1a7b2c3d4e или a1b7c2d3e4. Характеристики RLE  Худший, средний, лучший коэффициенты сжатия: 32 – 2 – 0.5  Класс изображений: небольшое количество цветов (деловая и научная графика)  Симметричность: 1  Особенности алгоритма: не требует дополнительной памяти при архивации и разархивации, быстро работает. Алгоритм LZW (словарный алгоритм)    Метод назван по первым буквам фамилий его разработчиков: Lempel, Ziv, Welch. Сжатие осуществлянтся за счет одинаковых цепочек байт (шаблонов). Алгоритм создает таблицу кодов, представляющих повторяющиеся пиксельные «узоры», начиная с простой таблицы и формирует более эффективную таблицу по мере своего продвижения – этот алгоритм является адаптивным. Включен в несколько форматов файлов: GIF, TIFF (с правом выбора). Пример работы алгоритма LZW кукушкакукушонкукупилакапюшон Характеристики LZW  Худший, средний, лучший коэффициенты сжатия:0.7 – 4 –1000  Класс изображений: 8-битные изображения, построенные на компьютере.  Симметричность: 1, при оптимальном построении. Алгоритм Хаффмана  Использует частоту появления исходных байт в изображении. При этом более короткие коды используются для часто повторяющихся величин, и наоборот. Присвоения хранятся в таблице перекодировки.  Требует двух проходов по изображению. В первый проход создается статистическая модель, т.е. каждой величине ставится в соответствие число ее повторений; во второй проход – кодируются данные. Для кодировки используются алгоритмы построения бинарных деревьев. Характеристики алгоритма Хаффмана  Худший, средний, лучший коэффициенты сжатия: 8 – 1.5 – 1 (единственный алгоритм, который не увеличивает размер исходных данных в худшем случае, не считая хранения таблицы перекодировки)  Класс изображений: практически не применяется непосредственно к изображениям, обычно используется как один из этапов компрессии по более сложной схеме, например, в JPEG  Симметричность: 2 (за счет необходимости двух проходов) Сжатие с потерями JPEG  JPEG 2000 (Wavelet)  Фрактальное сжатие  Оценка потерь качества  Базовая метрика оценки качества сжатия – PSNR (peak-to-peak signal-to-noise ratio)  Хорошо работает только на высоком качестве. Алгоритм JPEG Разработан в 1991 г. группой экспертов в области фотографии (Joint Photographic Expert Group – подразделение в рамках ISO) специально для сжатия 24-битных изображений.  Основу алгоритма составляет дискретное косинусное преобразование Фурье (DCT)  Оперирует блоками 8х8, внутри которых яркость и цвет меняются сравнительно плавно.  1. RGB  YUV Пересчет изображения в пространство Яркость-Цвет 2. Прореживание    Изображение разбивается на прямоугольники 8х8 пикселов. Данные о цвете подвергаются прореживанию (как правило). Например, для каждых 4 значений Y берут по 1 значению U и V, что уже сокращает объем данных на 50% практически без потерь качества восприятия. Параметры прореживания зависят от требуемой степени сжатия и качества восстановленного изображения. 3. DCT (discrete cosine transform)    DCT превращает исходные данные в частоты, содержащие информацию о том, насколько быстро меняются яркость и цвет пикселов. DCT раздельно применяется к цвету и яркости для прямоугольников 8х8 с нумерацией от (0,0) в левом верхнем углу (низкие частоты) до (7,7) в правом нижнем (высокие частоты). Плавные изменения цвета соответствуют низкочастотной составляющей, резкие скачки – высокочастотной. Формула DCT : 4. Квантование   Квантование устанавливает точность, с которой будет храниться каждая из величин. Каждое из значений DCT делится на фактор квантования и округляется до целого, при этом используется таблица факторов квантования 8х8.    В общем случае таблицы для Y и для U и V различны. Данные низкой частоты F(0,0) (без изменений) оказываются более важными, чем данные высокой частоты F(7,7). В соответствии с этим типичные таблицы имеют низкий фактор для F(0,0) – от 1 до 16 и высокий для F(7,7) – около 100. При декодировании исходные величины умножают на факторы квантования. Например, значения DCT от 120 до 135 и фактор 16 дают на выходе 8, а после восстановления преобразуются в 8 * 16 = 128 – аппроксимация входного значения. 5. Вытягивание в цепочку   Высокочастотные компоненты после квантования, как правило, обращаются в ноль. Полученные значения вытягиваются в цепочку в зигзагообразном порядке, в начале компоненты самой низкой частоты: F(0,0) – F(0,1) – F(1,0) - … - F(6,7) – F(7,6) – F(7,7) 6. Свертывание и кодирование  Свертывание полученного на предыдущем этапе вектора с помощью группового кодирования. В результате образуются пары типа (пропустить, число), где пропустить – счетчик пропускаемых нулей, число – значение, которое необходимо поставить в следующую ячейку. Например: вектор (42 3 0 0 0 -2 0 0 0 0 1) … будет свернут в пары (0,42) (0,3) (3,-2) (4,1) …  Кодирование данных методом Хаффмана Достоинства и недостатки JPEG       Наилучшее сжатие для фотоизображений ввиду отсутствия там резких линий (букв) и больших областей однотонной окраски. Стандарт де-факто для хранения, обработки и передачи фотоизображений. Регулируемая степень сжатия. Резкие линии после обработки по алгоритму JPEG выглядят слегка размытыми, а в однотонной окраске появляются переливы (муар). При больших степенях сжатия возникает эффект блочности. Довольно медленная программная обработка. Существование несовместимых реализаций из-за необязательных дополнений в стандарте. Характеристики алгоритма JPEG  Степень сжатия: 2-200 (задается пользователем)  Класс изображений: полноцветные 24-битные изображения или изображения в градациях серого без резких переходов цветов (фотографии)  Симметричность: 1  Характерные особенности: эффект блочности при высоких степенях сжатия и «ореолы» вокруг резких вертикальных и горизонтальных границ. ПримерJPEG  Фотография заката в формате JPEG с уменьшением степени сжатия слева направо Сравнение JPEG и JPEG2000        Большая степень сжатия при том же качестве для высоких степеней сжатия Поддержка кодирования отдельных областей с лучшим качеством DCT заменено на DWT (wavelet-преобразование), что позволило избежать блочности и достичь плавного проявления изображения Вместо кодирования по методу Хаффмана используется более эффективное арифметическое кодирование Поддержка сжатия без потерь Поддержка сжатия 1-битных изображений Поддержка прозрачности при помощи отдельного канала JPEG и JPEG2000 при сжатии в 30 раз Характеристики алгоритма JPEG2000  Степень сжатия: 2-200 (задается пользователем). Возможно сжатие без потерь  Класс изображений: полноцветные 24-битные изображения или изображения в градациях серого без резких переходов цветов (фотографии). 1-битные изображения  Симметричность: 1-1.5  Характерные особенности: эффект блочности при очень высоких степенях сжатия. Позволяет повышать качество в отдельных областях. Фрактальное сжатие изображений Фрактальное сжатие – алгоритм с потерей информации, появившийся в 1992 году.  Одним из важных свойств фракталов является самоподобие – отдельные части фракталов по форме похожи на весь фрактал в целом. На этом самоподобии основан алгоритм фрактального сжатия изображений.  Задание фракталов при помощи IFS  Один из способов построения фракталов – с помощью системы итеративных функций (Iterated Functions System – IFS). Он заключается в последовательном итеративном расчете координат новых точек в пространстве: xk+1 = a*xk + b*yk + e = Fх(xk , yk) yk+1 = c*xk + d*yk + f = Fу(xk , yk)  Функции F – аффинное преобразование, определяющее форму фрактала. Требуется только определить коэффициенты a,b,c,d,e,f. Алгоритм со студентом      даем студенту изображение; даем студенту компьютер; запираем студента в комнате; ждем, пока студент найдет систему преобразований; выпускаем студента из комнаты. Базовые понятия фрактального сжатия    Пусть  - множество всех возможных изображений. Пусть также существует преобразование W:   . W является объединением преобразований wi : W(D) =  wi (si), где D – изображение, а si – какие-либо (возможно перекрывающиеся) области изображения D. Каждое преобразование wi переводит si в di. Таким образом, W(D) =  di . Изображение можно представить в виде функции от двух переменных f(x,y). На множестве всех таких функций введем метрику (расстояние между изображениями) следующим образом: (f,g) = max (| f(x,y) – g(x,y)|) x,y    Доказано, что существует определенный класс преобразований, для которых существует константа с<1, такая, что для любых изображений f и g выполняется неравенство: (W(f),W(g))  c * (f,g) Такие преобразования называются сжимающими, и для них справедливо следующее утверждение: если к какому-либо изображению F0 многократно применить преобразование W F1 = W(F0) ; F2 = W(F1) ; … ; Fi = W(Fi – 1) то в пределе, при i стремящемся в бесконечность, мы получим одно и то же изображение вне зависимости от того, какое изображение мы взяли в качестве F0 : lim Fi = F i Это конечное изображение F называют аттрактором или неподвижной точкой преобразования W. При этом если преобразования wi являются сжимающими, то их объединение W тоже является сжимающим. Схема компрессии   изображение D разбивают на участки di , называемые доменами (непересекающиеся области, покрывающие все изображение). для каждого домена находят ранговую область si и преобразование wi такие, что выполняются условия:  si по размерам больше di.  wi (si) имеет ту же форму, размеры и положение, и di.  значение (wi(si) , di) должно быть как можно меньше.  запоминают коэффициенты аффинных преобразований wi , положение ранговых областей si и разбиение изображения на домены. что Схема декомпрессии создать какое-либо (любое!!!) начальное изображение D0 ;  многократно применить к нему преобразование W (объединение wi);  так как преобразование W сжимающее, то после достаточного количества итераций, изображение придет к аттрактору и перестанет меняться. Аттрактор и есть исходное изображение после декомпрессии.  Декомпрессия Характеристики фрактального алгоритма  Степень сжатия: 2-100  Класс изображений: полноцветные 24-битные изображения или 8-битные изображения в градациях серого.  Симметричность: Существенно несимметричен, с коэфиициентом, достигающим 10 000  Характерные особенности: эффект блочности при очень высоких степенях сжатия. Позволяет повышать качество в отдельных областях Форматы графических файлов BMP (DIB, Device Independent Bitmap)  JPEG  GIF (Graphics Interchange Format)  TIFF (Tag Image File Format)  EPS (Encapsulated PostScript)  CGM (Computer Graphics Metafile)  DXF (Drawing Interchange Format)  PNG (Portable Network Graphics)  Продолжение Цветовые модели компьютерной графики Свет – это электромагнитное излучение Цвет – это действие излучения на глаз человека излучаемый свет поглощение света ЦВЕТ получается в процессе излучения отражения описывается с помощью цветовых моделей RGB, CMY(K), HSL и др. Аддитивная модель англ. “add” – «присоединять» Основными цветами являются: RED – красный GREEN – зеленый BLUE – синий Цвет получается в результате суммирования трех цветов. В палитре RGB каждый из цветов может менять свою интенсивность от 0 до 255. 0 – интенсивность цвета минимальна 255 – интенсивность цвета максимальна Аддитивный – при увеличении яркости отдельных цветов результирующий цвет становится ярче. Цветовой куб RGB-кодирования Таблица цветов RGB Красный Зеленый Синий Цвет 0 0 0 Черный 255 0 0 Красный 0 255 0 Зеленый 0 0 255 Синий 0 255 255 Бирюзовый 255 255 0 255 0 255 Пурпурный 255 255 255 Белый Желтый Субтрактивная модель англ. “subtract” – «вычитать» Основными цветами являются: Cyan – голубой Magenta – пурпурный Yellow – желтый Каждый из них поглощает (вычитает) определенные цвета из белого света, падающего на печатаемую палитру. В палитре CMY каждый из цветов может менять свою интенсивность от 0 до 255. 0 – интенсивность цвета минимальна 255 – интенсивность цвета максимальна Субтрактивный - при увеличении яркости отдельных цветов результирующий цвет становится темнее. Из-за особенностей типографских красок смесь трех цветов дает не черный, а грязно – коричневый цвет. Поэтому к основным цветам добавляют еще и черный. Cyan – голубой; Magenta – пурпурный; Yellow – желтый; Black – черный. СMYK Цветовой куб СMYK-кодирования Таблица цветов СMYK Голубой Пурпурный (нет красного) (нет зеленого) Желтый (нет синего) Цвет 0 0 0 Белый 0 0 255 0 255 0 Пурпурный 255 0 0 Голубой 0 255 255 Красный 255 0 255 Зеленый 255 255 0 255 255 255 Желтый Синий Черный Отличие в воспроизведении цветов в моделях RGB и СMYK Цветовая модель HSB При работе в графических программах с помощью этой модели очень удобно подбирать цвет, так как представление в ней цвета согласуется с его восприятием человеком. Hue — цветовой тон Saturation — насыщенность Brightness — яркость Тон имеет 360 уровней, а цвет и яркость по 100 уровней. Цвет представляется как комбинация параметров цвета: тона, насыщенности и яркости. Круговое расположение цветов модели HSB Цвет на web – страницах кодируется в RGB и записывается в шестнадцатеричной системе: #RRGGBB, - где RR, GG и BB – яркости красного, зеленого и синего, записанные в виде двух шестнадцатеричных цифр; это позволяет закодировать 256 значений от 0 (0016) до 255 (FF16) для каждой составляющей. Код Цвет #FFFFFF Белый #000000 Черный #FF0000 Красный #00FF00 Зеленый #0000FF Синий #FFFF00 Желтый #FF00FF Фиолетовый #00FFFF Голубой CIE Lab & Adobe RGB vs sRGB

сжатие изображений

Related documents

Products

Support

сжатие изображений

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib