Использование регион-ориентированной схемы сжатия изображений без потерь и

advertisement
Использование регион-ориентированной
схемы сжатия изображений без потерь и
с ограниченными потерями в системах
технического зрения
И.М.Книжный, 2011 г.
Институт космических исследований РАН
e-mail: kim@mx.iki.rssi.ru
Wavelet (JPEG 2000)
80
70
Частота, %
60
50
4,00 bpp
3,20 bpp
2,67 bpp
40
30
20
10
0
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
Ошибка восстановления
JPEG
60
Частота, %
50
40
30
4,00 bpp
20
3,20 bpp
10
2,67 bpp
0
-8
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
Ошибка восстановления
4
5
6
7
8
Общая схема предиктивного кодера
2,50
2,25
2,00
N (i ), %
1,75
1,50
1,25
1,00
0,75
0,50
0,25
0,00
0
20
40
60
80 100 120 140 160 180 200 220 240 260
Яркость i
Исходное
изображение
Предсказатель
Контекстная
модель
+
Модель ошибки
предсказания
Энтропийное
кодирование
Gradient Adjusted Predictor (GAP)
dh = |W - WW| + |N - NW| + |NE - N|
dv = |W - NW| + |N - NN| + |NE - NNE|
IF ((dv – dh) > 80)
// резкая горизонтальная граница
Cp = W;
ELSE IF ((dv – dh) < - 80)
// резкая вертикальная граница
Cp = N;
ELSE {
Cp = (W + N)/2 + (NE – NW)/4;
IF ((dv – dh) > 32)
// горизонтальная граница
Cp = (Cp + W)/2;
ELSE IF ((dv – dh) > 8)
// мягкая горизонтальная граница
Cp = (3* Cp + W)/4;
ELSE IF ((dv – dh) < - 32)
// вертикальная граница
Cp = (Cp + N)/2;
ELSE IF ((dv – dh) < -8)
// мягкая вертикальная граница
Cp = (3* Cp + W)/4;
}
Адаптивный код Голомба (1)
q l + q l+1 ≤ 1 < q l + q l-1
Пусть
r  n%l.
r  2 log2 l   l
t  n / l ,
Если
r кодируется
иначе число
кодируется
а
log 2 l   1битами
r2
log2 l 
log 2 l 
l
t  n / l 
битами.
l ≈ –1/log2 q
ln x ≈ x – 1

1   ln 2   ln 2 
l  

  


log
q
ln
q
1

q
 

2  

l
q
l
q
1
0.5000 ÷ 0.6180
9
0.9217 ÷ 0.9296
2
0.6180 ÷ 0.7549 10 0.9297 ÷ 0.9361
3
0.7550 ÷ 0.8192 11 0.9362 ÷ 0.9415
4
0.8193 ÷ 0.8567 12 0.9416 ÷ 0.9460
5
0.8568 ÷ 0.8813 13
6
0.8814 ÷ 0.8987 14 0.9500 ÷ 0.9533
7
0.8988 ÷ 0.9116 15 0.9534 ÷ 0.9563
8
0.9117 ÷ 0.9216 16 0.9564 ÷ 0.9589
0.9461 ÷0.9499
] z [ - ближайшее целое к z
округления z
z  -с результат
избытком
z  - результат округления z
с недостатком
Адаптивный код Голомба (2)
ai-k
ai-k+1
...
ai-3
ai-2
ai-1
ai
k
ˆl   ln 2 , где
1  qˆ 


qˆ  (n  k ) / n.
если выбрать k таким образом, чтобы
k / ln 2  2 j ,
k
то с учётом того, что
n  k   ai ,
i 1
k
lˆ  ( ai  c( j ))  j ,
i 1
где
с(j) = ] 2 j (ln 2 + 0.5) [.
k
j
c(j)
3
2
4
6
3
7
11
4
14
22
5
28
44
6
56
89
7
112
177
8
449
Адаптивный код Голомба (3)
Избыточность адаптивного кода Голомба
для различных значений k (в предположении, что
q – неизвестно, но остаётся постоянным):
0,12
R(q), бит
0,10
0,08
k=11
k=22
0,06
k=44
k=89
0,04
G-V
0,02
0,00
0,5
0,6
0,7
0,8
0,9
q
белая линия на графике – граница Галлагера-Ван Вурхиса (случай,
соответствующий известному значению вероятности q).
Использование АКГ в предиктивных
схемах сжатия изображений
Оценка параметра l по двумерному окружению из уже закодированных
ошибок предсказания. На графиках - среднее число бит на пиксел
сжатого изображения в зависимости от способа оценки l.
k = 22
k=6
k = 11
х
х
k=3
х
Вычисление по среднему
3,97
Вычисление по взвешенному среднему
3,97
3,96
S(k), bpp
х
3,96
3,95
3,95
3,94
3,94
3,93
3,93
3,92
3,92
3,91
3,91
3,90
3,90
0
2
4
6
8
10
12
14
16
Число точек окружения k
18
20
0
2
4
6
8
10
12
14
Число точек окружения
16
18
20
Выбор ROI различной степени важности
Результаты сжатия тестовых изображений
Сравнение эффективности схем сжатия на примере изображений
из набора “Old JPEG test set”, не подвергавшихся искажающему сжатию:
Размеры JPEG-LS
CALIC
arithm.
WinRAR
3.80
BMF 2.0
(FAST)
DaRT
DaRT-R
20/30/50 %
Размерность
пиксел
bpp
bpp
bpp
Bpp
bpp
bpp
AIRFIELD
512x512
5,5660
5,4748
6,1154
5,5724
4,9652
3,8266
BRIDGE
512x512
5,5004
5,3750
4,4789
3,9822
3,4734
3,4652
COUPLE
512x512
4,6766
4,5957
5,4002
4,6111
4,2082
2,9804
HARBOUR
512x512
4,4940
4,4583
5,1976
4,4948
4,4259
3,0702
LENA
512x512
4,2368
4,1207
5,2088
4,1013
4,0739
2,6017
MAN
512x512
4,5049
4,3851
5,3396
4,3899
4,3386
2,8857
MANDRILL
512x512
6,0382
5,8987
6,5533
5,9166
5,8906
4,3002
PEPPERS
512x512
4,2891
4,2091
5,2391
4,2002
4,1638
2,6683
SAILBOAT
512x512
4,7688
4,6945
5,5167
4,7080
4,6599
3,1565
WOMAN1
512x512
4,6722
4,5546
5,4659
4,5718
3,9605
2,9084
WOMAN2
512x512
3,3000
3,2021
4,0453
3,1567
3,1389
1,9511
Среднее:
–
4,7315
4,6335
5,3237
4,5186
4,2999
3,0763
[MБ/с]:
–
5,41
1,51
3,20
3,47
3,59
4,02
Заключение и выводы
Описанный в докладе регион-ориентированный подход к сжатию
изображений обеспечивает компромисс между требованием
отсутствия искажений при восстановлении передаваемых по
каналу связи или архивируемых изображений в представляющих
особый интерес областях, обеспечивает в среднем в 1.5 раз
больший коэффициент сжатия, чем в схемах сжатия без потерь,
отличается малой вычислительной сложностью и низкими
требованиями к ресурсам памяти кодера. В сочетании с высокой
скоростью работы всё перечисленное позволяет сделать вывод о
практической целесообразности применения описанного подхода
для сжатия изображений в том числе – в системах технического
зрения.
Использование регион-ориентированной
схемы сжатия изображений без потерь и
с ограниченными потерями в системах
технического зрения
И.М.Книжный, 2011 г.
Институт космических исследований РАН
e-mail: kim@mx.iki.rssi.ru
Download