алгебра фурье-дуальных операторов

advertisement
ОБ АЛГЕБРАИЧЕСКИХ ОСНОВАНИЯХ ГОЛОГРАФИЧЕСКОЙ ПАРАДИГМЫ В
ИСКУССТВЕННОМ ИНТЕЛЛЕКТЕ: АЛГЕБРА ФУРЬЕ-ДУАЛЬНЫХ
ОПЕРАТОРОВ
Павлов А.В., к.т.н., с.н.с.
СПб ГУ ИТМО
тел./факс: (812)232-14-67
e-mail: pavlov@phoi.ifmo.ru
1. ВВЕДЕНИЕ
В искусственном интеллекте хорошо известна голографическая парадигма (ГП), основанная на ряде
аналогий между механизмами работы и свойствами мозга с одной стороны и оптической голографии с
другой [1]. Предтечей ГП можно считать А. Гольдшайдера, предложившего еще в 1906 г. рассматривать
механизмы памяти и внимания как взаимодействие (т.е. интерференцию) волновых фронтов,
формирующихся при поступлении стимулов в кортикальные области мозга. Известно, что голографическая
парадигма пересекается с нейросетевой парадигмой [2], а также имеет ряд глубоких аналогий с теорией
нечетких множеств. Для выявления этих аналогий полезно рассмотреть алгебраические основания ГП. В
данной статье, исходя из принципа физической обоснованности математической модели, рассмотрены
алгебраические основания голографии Фурье.
2. АЛГЕБРА ФУРЬЕ-ДУАЛЬНЫХ ОПЕРАТОРОВ
Определение 1. Пусть U – универсальное множество, его элементы обозначим x. Обозначим через Im
элементы модели, построенной на универсальном множестве U, и определим множество элементов модели
(множество всех подмножеств) следующим образом:
F  Im   Im Im :U   0,1
(1)
Нетрудно видеть, что (1) формально совпадает с определением нечеткого множества [3].
Аналогия в оптике. Рассмотрим плоский волновой фронт, ограниченный апертурой кадрового окна. В
силу универсального свойства ограниченности, в том числе, Фурье-спектра, этот волновой фронт в
соответствии с теоремой Котельникова (или теорией дифракции в оптике) может быть представлен в виде
набора пикселей – дифракционно-ограниченных элементов разрешения, имеющих конечный размер. В
предположении безаберрационности оптической системы и отсутствия геометрических искажений
положение пикселей строго фиксировано и не изменяется. Любое изображение Im, т.е. электромагнитное
поле в данной плоскости или транспарант, также состоит из пикселей. Приняв для изображений обычную
процедуру нормировки, ограничившись только амплитудными изображениями, и обозначив плоский
волновой фронт U, а пиксели x, правомочно представить любое изображение в виде Im( x ) :U  0,1 ,
формально совпадающем с определением нечеткого подмножества (1).
Таким образом, мы можем принять плоский волновой фронт, ограниченный апертурой кадрового
окна в качестве оптической реализации абстрактного понятия универсального множества U, пиксели – в
качестве его элементов. Обратим внимание, что допущение на безаберрационность системы позволяет
однозначно приписать каждому пикселю x его координату, которую также обозначим x (для простоты
рассмотрим одномерный случай).
Определение 2. Определим алгебру как модель F  Im  ,D,, ,o,u , где  и  – определяющие модель
операции, D – оператор, задающий дуальность определяющих операций  и  в форме
 Ima  x  ,Imb  x   F  Im  ;D  Ima  x   Imb  x   
D  Ima  x    D  Imb  x  
,
(2)
o и u – наименьший и наибольший элементы.
Определение 3. Определим коммутативную, ассоциативную и неубывающую бинарную операцию
2
V :  o, u    o, u  с нейтральным элементом e(x), т.е
(3)
 Im  x  o,u  ;V  Im  x  ,e  x    V  e  x  ,Im  x    Im  x 
Тогда, если e(x)=u(x), то определим V как абстрактное умножение (V = ); а если e(x) = o(x), то V
определим как абстрактное сложение (V = )). Нетрудно видеть, что определенные таким образом операции
суть t-норма и t-конорма соответственно [3, 4].
Определение 4. Определим D как унарный оператор o, u   o, u  , удовлетворяющий следующему
набору аксиом, включая (2):
D  o   u, D  u   o ,
(4)
 Ima  x  ,Imb  x   F  Im  ; Ima  x   Imb  x  
(5)
D  Ima  x    D  Imb  x  
Здесь мы предполагаем, что на
F  Im задано отношение порядка, но не конкретизируем его.


 Ima  x   F  Im  ;D D  Ima  x    Ima  x  .
(6)
Определение 5. Используем классическое определение оператора Фурье-преобразования F,
связывающего функцию Im(x), удовлетворяющую условиям Дирихле и абсолютно интегрируемую (x в
данном контексте координата), с ее Фурье-образом F():
F  Im  x    F   

 Im  x  exp   j 2 x  dx ,
(7)

где j – мнимая единица,  – координата в Фурье-пространстве (частота).
Операция Фурье-преобразования (ФП) реализуется в оптике положительной линзой. В задней
фокальной плоскости линзы формируется Фурье-образ распределения амплитуд волнового поля в передней
фокальной плоскости.
Нетрудно видеть, что в силу хорошо известных свойств Фурье-преобразования оператор F
удовлетворяет аксиомам (4) в форме:
F   x    Const   ; F Const  x      
где  (x)- -функция Дирака, определяемая следующим образом:
 при x  0
  x  
 0 при x  0 ,
+
   x  dx  1
-
и аксиоме (5) в случае нормальных унимодальных функций (обозначим их a(x) и b(x))
a ( x ), b( x ) : U  0,1 ;   0,1 ; a  x   b  x  
,
Re F  a  x    Re F  b  x   ,




где а – -срез а. Если функции не унимодальные, то последнее условие имеет силу для глобальных
максимумов автокорреляционных функций
  0,1 ;  Ima  x   Ima  x     Imb  x   Imb  x   
,
Re F  Ima  x    Re F  Imb  x  




где символ  обозначает операцию корреляции.
В оптике -функция суть дифракционно-ограниченный точечный источник (пиксел).
Требование инволютивности (6) удовлетворяется при использовании пары прямого и обратного ФП,
отличающихся лишь знаком под экспонентой. При двукратном применении прямого ФП (7) имеет место
инверсия координат F  F  Im  x     Im   x  , учет которой эквивалентен выполнению условия (6).
Таким образом, в алгебре с Фурье-дуальными определяющими операциями в качестве минимального
элемента о(x) выступает -функция, а максимального, Фурье-дуального минимальному, Const(x) = 1 .
В качестве операции умножения примем обычное умножение. Операция умножения в оптике
реализуется при освещении транспаранта волновым фронтом. Тогда операция абстрактного сложения,
Фурье-дуальная умножению, определяется в соответствии с (2). Получаем формулировку известной
теоремы Бореля о свертке –Фурье-образ свертки двух функций равен произведению их Фурье-образов, т.е. в
качестве абстрактного сложения выступает свертка
F  Ima  x   Imb  x    F  Ima  x   F  Imb  x   
,
(8)
F  Ima  x   Imb  x   ,
где символ * обозначает операцию свертки двух функций

S     Ima  x   Imb  x  


 Im  x  Im    x dx .
a
b

В силу свойства инволютивности (6) свертка вычисляется методом двойного ФП, т.е.


S  Ima  x  ,Imb  x    F F  Ima  x    F  Imb  x   .
(9)
Здесь, как и в дальнейшем изложении, в целях упрощения выкладок мы пренебрегли инверсией
координат, возникающей вследствие двукратного применения прямого ФП.
Операция свертки (абстрактного сложения) в оптике реализуется методом Фурье-голографии (ФГ)
[5].
Замечание 1. Заметим, что алгебра с Фурье-дуальными определяющими операциями есть алгебра
нечетких множеств – даже в случае определения исходных элементов модели как четких множеств, уже
однократное применение операции абстрактного сложения ведет к преобразованию четких множеств в
нечеткие
 Ima ,Imb :U  0,1 ;S(Ima ,Imb ) :U  0,1 .
Замечание 2. В алгебре Фурье-дуальных операторов операция сложения определена не поточечно, но
учитывает внутреннюю коррелированность как фундаментальный атрибут информации, отличающий ее от
-коррелированного шума.
Замечание 3. Оператор Фурье-преобразования в общем случае представляет собой отображение в
пространство комплексных функций. Отсюда c неизбежностью следует необходимость применения для
реализации Фурье-дуальности (9) технологий, обеспечивающих регистрацию и восстановление
комплексных функций. Для волн любой природы и частотного диапазона (оптических, радио, и.т.д.)
единственной на сегодня технологией, удовлетворяющей этому требованию, является голография.
Замечание 4. В силу ограниченности (пространственной или временной) как U, так и области
определения Фурье-образа F(o(x))Supp= [-Max,Max], -функция в реальности имеет ненулевую ширину и
описывается в Фурье-области функцией  xmax
1 при x    xmax , xmax 
u  x  
0 при x    xmax , xmax 
x
max
 F (u( x )) 
xmax

u( x ) exp(  j 2 x )dx  2 xmax Sinc(2 xmax )
 xmax
где [- xmax , xmax ] – область определения U, Sinc – обозначение Вудварда для функции вида Sin(x)/x.
Аналогично, в силу ограниченности области определения Фурье-образа [-Max,Max], -функция на U также
описывается функцией, определяемой аналогично.
Если U=XY, т.е. плоскость, то для прямоугольной области определения
 xmax , ymax  2 xmax Sinc(2 x xmax )2 ymax Sinc(2 y ymax ) ,
а для области определения с осевой симметрией (т.е. круглой апертуры радиуса rmax)
2
 r   rmax
max
2 J 1  2 rmax 
,
2 rmax
где J1 – функция Бесселя первого рода первого порядка.
Элементы модели
Для любого элемента модели можно определить четыре связанных с ним элемента: дуальный,
дополнительный, инверсный и противоположный. Определения дуального и дополнительного элементов
очевидны.
Инверсный элемент Imi для элемента Im относительно операции S определяется [6] из условия
(10)
S  Im,Im i   o  
Противоположный элемент Imo определяется условием
Imo  x   Im   x 
(11)
где x, как и ранее, – обобщенная координата элемента Im на оси элементов модели. Пользуясь свойством
симметрии ФП, получим
F  Im   x    F *  Im  x   ,
где звездочка – символ комплексного сопряжения. Отсюда, используя определение вычитания как сложения
с аддитивно противоположным элементом [6], получим:


S  Im  x  ,Imo  x    F F  Im  x   F  Imo  x    Im  x   Im  x 
т.е. операция корреляции  в алгебре Фурье-дуальных операций суть вычитание.
Операция корреляции в оптике реализуется в той же схеме, что и операция свертки – схеме
голографии Фурье. Свертка реализуется в – 1 порядке дифракции, корреляция – в +1 порядке дифракции.
3. РЕАЛИЗАЦИЯ НЕЧЕТКИХ ЛОГИК МЕТОДОМ ФУРЬЕ-ГОЛОГРАФИИ
Определение 6 (по Л.Заде [7]). Лингвистической переменной (ЛП) называется набор Y,
Tm(Y),U,G,M, где Y – название ЛП, Tm(Y) – терм-множество, U – универсальное множество, G – множество
синтаксических правил, порождающее термы множества Tm(Y), M – множество семантических правил
(семантическое правило каждому лингвистическому значению Y ставит в соответствие его смысл m(Y) ,
причем m(Y) обозначает нечеткое подмножество множества U). В рамках настоящей статьи ограничимся
рассмотрением реализации семантических правил из M.
Нетрудно видеть, что адекватная схеме ФГ алгебра F  Im  ,F ,, ,o,u суть алгебра нечеткозначной
логики [4], множество элементов модели F  Im   Im Im :U   0,1 суть решетка нечетких множеств.
Соответственно, метод логико-лингвистического моделирования (ЛЛМ) Л.Заде может быть реализован на
этой алгебре методом Фурье-голографии при представлении смысла входных ЛП посредством нечетких
чисел, что и было показано в [8]. Однако обратим внимание на то, что модель не запрещает представление
смысла ЛП любым изображением Im и не накладывает на Im ограничений, обычно накладываемых на
множества, представляющие смысл ЛП (нормальность, унимодальность и выпуклость). Таким образом,
алгебра нечеткозначной логики F  Im  ,F ,, ,o,u реализуется и при обработке схемой ФГ изображений Im,
не удовлетворяющих требованию унимодальности. Следовательно, возможна реализация идеи ЛЛМ и при
обработке произвольных изображений, в том числе, аналогов паттернов внутренней репрезентации (ПВР).
Тем самым, в рамках данной модели и ее голографической реализации возможна интеграция двух форм
мышления – логической и образной. При этом эталонные ПВР задаются не формализовано, а посредством
обучения системы – записи голограммы. Иными словами, речь идет уже об интеграции нечетких и
нейронных систем.
Однако, в рамках такого подхода возникает проблема, отсутствующая в классическом подходе Л.Заде
[7] – интерпретация смысла, представленного унимодальным множеством очевидна, но для придания
методу Заде биологической мотивированности мы отказались от требования унимодальности Im.
Непосредственная же интерпретация смысла, представленного многомодальным множеством ведет к …
шизофрении.
Для наглядности изложения предложенного подхода к решению проблемы интерпретации
рассмотрим его на примере реализации композиционного правила вывода «Обобщенный Modus Ponens»,
связывающего набор входных ЛП с одной выходной ЛП (заключением). Используем классический пример
вывода «Если яблоко большое и красное, то оно хорошее». Нетрудно видеть, что проблема интерпретации
разделяется на две:
1. Интерпретация смыслов входных ЛП, представленных в соответствии с требованием на биологическую
мотивированность в виде изображений – аналогов ПВР, которые обозначим Imin ;
2. Интерпретация смысла логического заключения ImOut.
Примем достаточно очевидное с практической точки зрения условие, что заключение, формируемое
системой ImOut, должно удовлетворять требованиям к нечетким числам, в первую очередь – требованию
унимодальности. В следующем разделе покажем, что это условие удовлетворяется выбором семантического
оператора.
Тогда остается первая проблема - проблема объединения двух моделей – описывающей реальную
схему Фурье-голографии и предложенной Заде, т.е. оперирующей НЧ. Обратим внимание, что при
реализации метода ЛЛМ Л.Заде алгеброй Фурье-дуальных операторов существует «внутренний» этап –
вычисление Фурье-образов и их перемножение. Поэтому решение задачи интерпретации будем искать не в
пространстве ПВР, а в Фурье-пространстве, а именно – приравняем действительные части Фурье-образов
реально обрабатываемых системой ПВР Imin и абстрактных нечетких чисел, которые обозначим FN (от Fuzzy
Numbers)
(12)
Re  F  Imin    Re  F  FN   .
Выражение (12) связывает характеристики изображений, обрабатываемых схемой ФГ, с характеристиками
нечетких чисет, используемых в абстрактном описании – увеличение моды НЧ сопровождается
расширением его функции принадлежности [4], что в соответствии с (3.1) ведет к уменьшению разрешения
изображения Imin – увеличению размеров его элементов. Таким образом, два подхода – абстрактноалгебраический, использующий представление смысла ЛП посредством НЧ и биологически
мотивированный (нейросетевой) объединяются и согласовываются в Фурье-пространстве.
4. ЗАКЛЮЧЕНИЕ
Таким образом, схема голографии Фурье строит алгебру нечетких множеств. Нечеткость в данном
случае возникает не по прихоти автора модели, а как математическая формализация реального физического
явления – дифракции. Соответственно, и физическая обусловленность порождаемой логики позволяет
объединить в одном методе два понятия образа – биологически мотивированное как картины нейронной
активности коры мозга (паттерна внутренней репрезентации) и формальное как вектора в абстрактном
пространстве признаков и, тем самым, интегрировать две формы мышления – логическую и образную.
Литература
1.
Прибрам К. Нелокальность и локализация: голографическая гипотеза о функционировании мозга в процессе
восприятия и памяти// Синергетика и психология. Вып. 1: Методологические вопросы: Пер. с англ. – М.: МГСУ
"Союз", 1997.
2.
3.
4.
5.
6.
7.
8.
9.
Кузнецов О.П. Неклассические парадигмы в искусственном интеллекте // Известия РАН: Теория и системы
управления. –1995. – №5. – С.3-23.
Новак В., Перфильева И., Мочкорж И., Математические принципы нечеткой логики: Пер. с англ. – М.: Физматлит,
2006.
Аверкин А.Н., Батыршин И.З. и др. Нечеткие множества в моделях управления и искусственного интеллекта/ Под
ред. Д.А. Поспелова. – М.: Физматлит, 1986.
Dubois D., Prade H. Fuzzy Numbers: An Overview// Analysis of Fuzzy Information/ Ed. by J.C.Bezdek. – Boca Raton FL:
CRC Press, 1987. – Vol.1.- P.3-39.
Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений: Пер. с англ. –
М.: Мир, 1976.
Павлов А.В. Реализация логико-лингвистических моделей методом Фурье-голографии// Известия РАН: Теория и
системы управления. – 2003. – №2. – C.118-125. .
Павлов А.В. Математические модели оптических методов обработки информации // Известия РАН: Теория и
системы управления. – 2000. – №3. – C.111-118.
Павлов А.В. Об алгебраических основаниях Фурье-голографии// Оптика и спектроскопия. – 2001. – Т.90. – Вып.3. –
С.515-520.
Download