Фурман Я., Кревецкий А., Роженцов А.

advertisement
172
СРАВНИТЕЛЬНАЯ ЭФФЕКТИВНОСТЬ МЕР СХОЖЕСТИ
ПОЛИВЕКТОРНЫХ СИГНАЛОВ1
2
Я.А. Фурман2, А.В. Кревецкий2, А.А. Роженцов
Марийский государственный технический университет, 424000, Йошкар-Ола,
пл. Ленина 3. Тел. (8362) 455412. E-mail: rts@marstu.mari.ru
Исследована информативность меры схожести поливекторных сигналов,
получаемой при вычислении скалярного произведения в пространствах Е, С и Н.
Проведен сравнительный анализ информативности получаемых скалярных
произведений и даны рекомендации по выбору пространства для представления
сигналов при решении задачи распознавания пространственных изображений.
1. Постановка задачи
В зависимости от вида линейного
пространства, с которым сопоставлено
афинное
пространство,
заданное
множеством точек и совокупностью
соответствующих им радиус-векторов,
меняется информативность меры схожести
поливекторных сигналов, формируемая в
виде их скалярного произведения (СП).
Пусть Q  qn 0, s 1 и P  pn 0, s 1 – два
одинаковой мощности подмножества точек
в афинном пространстве, задающие
одноименные векторные сигналы Q и P
(рис.1). Радиус-векторы qn и pn ,
n  0,1,..., s  1 , являются элементарными
векторами (ЭВ) этих сигналов.
Z
p (0)
P

q(1)
p (1)
q( 0)
Q
равные
длинам
проекций
точек
подмножеств на оси системы отсчета:
2D сигналы: qn  q1 n, q2 n ;
pn   p1 n, p2 n , n  0,1,..., s  1 ;
3D сигналы: qn  q1 n, q2 n, q3 n ;
pn   p1 n, p2 n, p3 n , n  0,1,..., s  1 .
ЭВ КЗС задаются комплексными числами:
qn  q1 n  iq 2 n ;
pn  p1 n  ip 2 n;
n  0,1,..., s  1 , а кватернионных сигналов –
векторными
кватернионами:
qn   q1 n i  q2 n  j  q3 nk ;
pn  p1 ni  p2 n j  p3 nk ;
n  0,1,..., s  1 .
Решение
задачи
распознавания
поливекторных
сигналов
связано
с
формированием меры схожести
m
наблюдаемого сигнала Q  qn 0, s 1 с
каждым
из
эталонных
сигналов
m 
m 
m  0,1,..., M  1 , и
P  p n 0,s 1 ,
принятием решения в пользу класса,
эталонный сигнал которого наиболее
близок к распознаваемому сигналу Q
(рис.2).
q(2)
p(2)
X

Y
Рис.1.
3D
векторные
сигналы,
подмножествами точек Q и P
заданные
В зависимости от вида линейного
пространства
представления
ЭВ
–
действительного Е, комплексного С или
кватернионного Н, поливекторные сигналы
Q или P будем называть вещественными
(ВВС), комплекснозначными (КЗС) или
кватернионными (КТС). ЭВ ВВС в качестве
компонент содержат вещественные числа,
Рис. 2. Структура устройства распознавания
сигналов (ФМС – формирователь меры схожести,
ЭУ – экстремальное устройство
________________________________________
Работа выполнена при финансовой поддержке РФФИ (проект № 07-01-00058а)
1
173
Различие (близость, схожесть) между двумя
ЭВ q и p определяется величиной
расстояния
между
ними:
2
2
2
R  q  p  2q, p  , где
q, p –
скалярное произведение векторов q и p.
Если
q  p  1 , то R 2  21  q, p  .
Отсюда
следует,
что
единственной
существенной операцией для получения
меры различия (схожести) нормированных
векторов по величине расстояния между
ними является операция вычисления их СП.
Выполнение операции нормировки вектора
будем обозначать горизонтальной чертой
над его символом, например pn .
Цель данной работы заключается в
исследовании информативности меры
схожести
векторов,
получаемой
в
результате вычисления СП их ЭВ, при
задании
сигналов
в
линейных
пространствах Е, С и Н. Для этого далее
рассмотрим структуру СП поливекторных
сигналов в этих пространствах, а затем
проведем
сравнительный
анализ
информативности
СП
и
дадим
рекомендации по выбору пространства для
представления сигналов при решении
задачи их распознавания.
2. Вещественные векторные сигналы
Квадрат
расстояния
между
нормированными ВВС Q и P имеет вид:
Чтобы
получить
RQ2 , P  21  Q, P  .
Q, P  через
выражение
для
СП
координаты ЭВ qn и pn , учтем, что
всякая билинейная векторная функция
векторных аргументов Q и P
s 1
 s 1

f q, p   f   qn en ,  pn en  
n 0
 n 0

s 1
  f nm qn pm 
n 0
может рассматриваться в качестве их СП
[1]. В данном выражении en 0, s 1 – базис
в Е, а f nm  f en , em – билинейная
функция от пары базисных векторов. Если
положить, что f en, em равна единице
при n  m , а в остальных случаях есть
ноль, то СП нормированных ВВС можно
представить в виде
s 1
Q, P 
E
  q1 n  p1 n   q 2 n  p 2 n  .
(1)
n 0
В частности, СП одномерных ВВС равно
q, p   q1 , q2 ,  p1 , p2   q1  p1  q2  p2 .
Геометрический
смысл
этого
СП
заключается в том, что его величина равна
косинусу угла  между векторами q и p,
т.е.
q, p   cos  . С учетом этого
выражение для СП нормированных ВВС
принимает вид:
Q, P 
E
s 1
  q n  p n  cos n  
n 0
1

Q P
s 1
 qn pncos n.
(2)
n 0
3. Комплекснозначные сигналы
В унитарном пространстве С скалярное
произведение
одномерных
КЗС
Q  q  q1  iq 2 и P  p  p1  ip 2 равно
C   E2  iq1 p 2  q 2 p1  [1]. Видно, что
реальная часть C равна СП векторов q и p
в евклидовом пространстве Е и при
q  p  1 содержит всю имеющуюся
информацию о расстоянии между этими
векторами в виде значения косинуса угла 
между ними. Дополнительная мнимая часть
Imq, p C  iq1 p2  q2 p1  численно равна
ориентированной
площади
параллелограмма,
построенного
на
векторах q и p. Условимся плоскость  ,
образованную этими векторами, называть
их
собственной
плоскостью.
СП
Q  qn 0, s 1
многомерных
КЗС
и
P  pn 0, s 1 в унитарном пространстве
записывается следующим образом [1]:
s 1
 С  Q, P C   qn  p * n  
n 0
s 1
  E2 s  i  q1 n  p 2 n   q 2 n  p1 n .
(3)
n 0
Реальная часть этого выражения равна СП
сигналов Q и P в евклидовом пространстве
E 2 S . Она содержит всю информацию о
схожести сигналов Q и P , определяемую
величиной
расстояния
между
174
многомерными векторами Q и P . Мнимая
часть
СП
равная
Q, P C ,
s 1
 i  q1 n  p2 n   q2 n  p1 n  
n0
s 1
  qn  pn  sin n ,
n 0
дает
определенную
дополнительную
информацию об этих сигналах. Выражение
равно сумме ориентированных площадей
параллелограммов, построенных на ЭВ
qn и pn , n  0,1,..., s  1 . Отметим, что
условие ортогональности векторов в
пространстве С более сложное, чем в Е. Два
вектора в евклидовом пространстве
ортогональны, если равно нулю первое
слагаемое
в
выражении
(3).
Для
ортогональности
этих
векторов
в
пространстве С дополнительно должно
равняться нулю и второе слагаемое в (3).
Таким образом, векторы, ортогональные с
С, будут ортогональными и в Е. Обратное
верно не всегда. Поэтому для векторов с
нулевой мерой схожести в пространстве Е,
существует много ненулевых градаций
меры
их
схожести
в
унитарном
пространстве С. В этом и заключается
более высокая информативность СП
векторов в унитарном пространстве.
4. Кватернионные сигналы
Элементами пространства H s служат
полные
кватернионы
Для
qn  q0 n  q1 ni  q2 n j  q3 nk .
него
имеют
место
следующие
соотношения: 1) f q  p  f q  f p и
2) f q  f q , где q и p – любые
векторы из Е в кватернионном виде,  –
произвольный
кватернион.
Операция
перемножения кватернионов определяется
правилами умножения мнимых единиц i,j,k:
ii  jj  kk  1 ; ij  k ; jk  i ; ki  j ;
ji  k ; kj  i ; ik   j . Для билинейной
эрмитовой формы f q, p в Н справедливо:
1) f q, p   f * q, p  ;
2) f q  r, p  f q, p  f r, p ;
f q, p  r   f q, p  f q, r  ;
3) f q, p  f q, p ; f q, p  f q, p* .
Поскольку билинейная форма может
рассматриваться в качестве СП, для
одномерного случая запишем [3]:
*
(4)
H  q, pH  qp *  p, q .
В
качестве
единственного
вектора,
составляющего ортонормированный базис
в H 1 , можно взять любой полный
кватернион
с
единичным
модулем,
например,
e1  cos   r sin  ,
r  r1i  r2 j  r3 k , r  1 .
Некоммутативность операции умножения
кватернионов
обуславливает
специфические свойства их СП. Например,
кватернионы  и  , участвующие в
образовании СП q, p и q, p , нельзя
без
нарушения
правил
умножения
выносить за знак СП.
Норма вектора в пространстве Н равна
q  q, q  , а два вектора будут
ортогональными при q, pH  0 . СП
векторных кватернионов представляется в
 H  q, p E  hyp q, p H .
виде
Гиперкомплексная часть этого СП равна, с
обратным
знаком,
векторному
произведению векторов q и p, т.е.
hyp q, pH  q, p   q p r sin  , (5)
где r  r1i  r2 j  r3 k , r  1 – нормаль к
собственной плоскости  , в котором
образован
параллелограмм
с
ориентированной площадью S  q p sin  .
Кватернионный сигнал (КТС) Q  qn 0, s 1
представляет
собой
упорядоченную
совокупность множества точек в афинном
пространстве, радиус-векторы которых
являются
элементами
линейного
кватернионного пространства H s и заданы
векторными
кватернионами.
Пусть
P  pn 0, s 1 – другой КТС, заданный в
этом же пространстве. На основании (4) СП
КТС имеет вид
s 1
Q, P H   qn p * n  
n 0
 Q, PE  hyp Q, PH  P, QH , (6)
*
причем Q, PH  Q P и Q, Q H  Q .
Последние
два
соотношения
дают
возможность использования СП в качестве
2
175
меры схожести КТС: чем меньше различие
между ними, тем меньше разница между
нормой СП и произведением норм КТС.
5. Сравнительная информативность
мер схожести
5.1. Структуры меры схожести
Структура
меры
схожести

поливекторных сигналов в виде их СП
усложняется при усложнении базиса для их
представления в линейных пространствах.
В евклидовом пространстве Е величина E
является
одномерной,
представляется
вещественным числом и зависит как от
длин ЭВ этих сигналов, так и от величины
углов между соответствующими ЭВ. По
существу величина E вместе с энергиями
сравниваемых сигналов есть квадрат
расстояния
между
поливекторными
сигналами. При нормировании этих
сигналов величина этого расстояния
зависит только от величины E .
В унитарном пространстве С величина С
есть комплексное число, вещественная
часть которого равна Re C   E . Мнимая
часть Im C является алгебраической
суммой
ориентированных
площадей
параллелограммов,
построенных
в
собственных плоскостях соответствующих
ЭВ поливекторных сигналов.
В кватернионном пространстве Н величина
 H является полным кватернионом. Его
реальная часть по-прежнему служит мерой
схожести поливекторных сигналов по
расстоянию между точками, задающими
эти сигналы, т.е. Re H  E . Мнимая часть
hyp H является векторным кватернионом,
модуль которого равен сумме площадей
параллелограммов,
построенных
на
соответствующих
ЭВ
сигналов,
а
нормированное значение hyp H есть
векторная сумма нормалей к этим
плоскостям.
Таким образом, мера схожести  H является
трехмерной величиной и характеризует
пару
поливекторных
сигналов
по
следующим параметрам: 1) по расстоянию
между подмножествами точек, задающих
эти сигналы, 2) по суммарной площади
параллелограммов,
образованных
соответствующими ЭВ сигналов и 3) по
согласованности
ориентации
в
3D
пространстве собственных плоскостей этих
ЭВ.
5.2.Измерение меры схожести
5.2.1. Многомерность меры схожести
усложняет ее применение при решении
задач обработки поливекторных сигналов,
связанных с принятием решения – задач
обнаружения,
распознавания,
оценки
параметров и разрешения. Решение удобно
принимать, когда эта мера выражается
одним числом, например, величиной E .
Если поливекторные сигналы представлены
в кватернионном пространстве, то значение
меры схожести в виде одного числа можно
получить в виде линейной комбинации
значений схожести по расстояниям между
точками, задающими сигналы, по величине
их «суммарной площади» и по степени
согласованности собственных плоскостей
их ЭВ. Весовые коэффициенты в такой
комбинации назначаются по степени
важности каждого из параметров меры
схожести.
5.2.2. Следует отметить ситуацию, когда
меру схожести можно задать точно одним
числом. Она имеет место при   0 , т.е.
когда
поливекторные
сигналы
ортогональны. С этих позиций мера
схожести
определяется
степенью
ортогональности сигналов: чем она выше,
тем больше различие между сигналами. В
этом плане интерес представляют условия
ортогональности поливекторных сигналов.
Наиболее просты они для сигналов,
преставленных в евклидовом пространстве
Е: сигналы Q и P ортогональны при
равенстве нулю взвешенной суммы
косинусов
углов
между
n
соответствующими ЭВ qn и pn ,
n  0,1,..., s  1 .
Для
ортогональности
заданных в унитарном пространстве С
сигналов Q и P дополнительно нулевой
должна быть сумма ориентированных
площадей
S n  qn pn sin n
параллелограммов, построенных на ЭВ
qn и pn , n  0,1,..., s  1 . Кватернионные
176
сигналы Q и P будут ортогональными при
Re Q, P H  hyp Q, P H  0 . Учитывая, что
s 1
hyp Q, P H   qn  pn  r sin n  , условия
n 0
ортогональности сигналов в пространстве
Н требуют кроме обеспечения их
ортогональности в пространстве С еще, в
частности, параллельности собственных
плоскостей  n .
Как следствие, отметим, что переход от
пространства Е к пространству С и далее к
пространству Н создает возможность более
точной оценки степени ортогональности
поливекторных
сигналов:
сигналы,
ортогональные
в
Е,
могут
иметь
значительную степень схожести с С, а
сигналы, ортогональные в С, быть
достаточно близкими в Н.
5.3. К вопросу о выборе системы отсчета
для представления сигналов
Выше
была
проиллюстрирована
сравнительная
информативность
СП
поливекторных сигналов при их заданиях в
линейных пространствах Е, С и Н. В этом
плане наибольшей информативностью о
схожести (различиях) сигналов обладает
СП сигналов, являющихся элементами
кватернионного пространства Н. Поэтому
данное
пространство
целесообразно
выбирать в задачах, связанных с принятием
решений. Не подвергая сомнению такой
выбор, отметим следующее замечание
К.Ланцоша по поводу выбора системы
отсчета для представления сигналов [4].
Суть его сводится к сравнению системы
отсчета с лесами вокруг здания, роль
которого играет сигнал. Леса служат для
обеспечения удобства доступа к зданию и
не являются неотъемлемой частью сигнала.
После окончания строительства они
вообще могут быть убраны без ущерба для
здания. Таким образом, количество
информации, содержащееся в сигнале,
представленном
в
евклидовом
пространстве, не зависит от вида
пространства, в котором он задан.
Правильно выбранный вид пространства
дает возможность более просто (удобно)
получить содержащуюся в сигнале нужную
информацию. Количество информации в
сигнале, представленном в евклидовом
пространстве, не меняется при переходе,
например, в унитарное пространство.
Представление
сигнала
в
С
дает
возможность ее получить в результате
вычисления СП. Но ее можно получить и
другим путем, в ряде случаях, достаточно
затратно. Например, фильтрация сигнала в
евклидовом пространстве неинвариантна к
вращению сигнала. В то же время такая
инвариантность возникает при переходе в
унитарное пространство [5].
6. Заключение
Одними
из
основных
причин,
сдерживающих развитие методов анализа и
распознавания 3D изображений является
значительная, по сравнению с обработкой
плоских изображений, трудоемкость и
отсутствие
эффективных
алгоритмов,
основанных не на эвристике, а на теории
сигналов. Получение таких алгоритмов,
общая структура которых приведена на
рис. 2, являлось целью данного доклада.
Традиционно оценка степени схожести
двух сигналов, распознаваемого Q и
эталонного
P,
вырабатывается
при
фильтрации
сигнала
Q
фильтром,
согласованным с сигналом P. Получаемый
выходной сигнал  out отражает величину
расстояния
между
точками
концов
векторов Q и P, т.е. out ~  E . Как было
показано выше, для оценки степени
ортогональности поливекторных сигналов
(степени их различия) этого недостаточно.
Для более точной оценки различия
сигналов в 3D пространстве необходимо
оценить
значение
суммарной
ориентированной
площади
параллелограммов,
построенных
на
соответствующих друг другу ЭВ qn и
этих
сигналов,
и
степени
pn
коллинеарности
нормалей
к
rn 
n
собственным
плоскостям
этих
элементарных векторов. Наиболее удобно,
как показано в работе, это делать при
задании
сигналов
в
линейном
кватернионном пространстве H s .
177
Список литературы
1. Ефимов Н.В., Розендорн Э.Р. Линейная
алгебра и многомерная геометрия. – М.:
Наука, 1974.
2. Кантор И.Л., Солодовников А.С.
Гиперкомплексные числа. – М.: Наука,
1973.
3. Furman Y.A., Krevetsky A.V. Complex
and hipercomplex systems in tasks of
images and signal processing// Pattern
Recognition and Image Analysis, Vol 16,
No 4, 2006. – 665-676 p.
4. Ланцош К. Практические методы
прикладного анализа. – М.: Физматгиз,
1961.
5. Введение
в
контурный
анализ;
приложения к обработке изображений и
сигналов/
Я.А.
Фурман,
А.В.
Кревецкий, А.К. Передреев, и др.; Под
ред. Я.А.Фурмана. – 2-е изд. – М.:
ФИЗМАТЛИТ, 2003. – 592 с.
Download