Гуревич И., Яшина В.

advertisement
90
ОПИСАТЕЛЬНАЯ ТЕОРИЯ АНАЛИЗА ИЗОБРАЖЕНИЯ.
МОДЕЛИ И МЕТОДЫ
И. Гуревич1, В. Яшина1
1Dorodnicyn
Computing Center of the Russian Academy of Sciences, Vavilov str., 42, 119991
Moscow, Russian Federation, igourevi@ccas.ru, werayashina@mail.ru
Данная статья посвящена основам, главным направлениям, аксиоматическим и
формальным структурам Описательной Теории Анализа Изображения (ОТАИ)
обеспечивающей методологию, математические и вычислительные методы
автоматизации анализа и оценки изображений (АОИ). Основное назначение
теоретического аппарата ОТАИ – структурирование множества методов, способов
и представлений использующихся в АОИ. Конечная цель ОТАИ – автоматизация
извлечения изображения: а) автоматический выбор способов и алгоритмов
распознавания изображения, оценки и понимания; б) автоматическая проверка
качества необработанных данных и их пригодность для процесса решения
проблем распознания изображения. ОТАИ обеспечивает математическую базу
извлечения изображения. Не требующие доказательств и формальные структуры
Описательной Теории Анализа Изображения обеспечивают пути и средства
представления и описания изображений для их анализа и оценки. Основной вклад
аксиом – Описательные Модели Изображения: их определение, классификация,
свойства, соотношения и условия генерации.
Введение
Автоматизация обработки, анализа, оценки
и понимания изображения является одной
из
решающих
точек
теоретической
компьютерной науки имеющей решающую
значимость для применения, в частности,
для многообразия разрешимых типов
проблем
и
для
возрастающей
эффективности их решения.
Роль изображения как анализируемого и
оцениваемого объекта в принятии решения
о его специфических и неотъемлемых
свойствах. Изображение – это смесь и
комбинация исходных (необработанных,
«действительных») данных и способов их
представления,
вычислительной
и
физической природы и моделей объектов,
событий и процессов представления в виде
изображения.
Проблемы специфики, сложности и
различия анализа и оценки изображения
(АОИ) происходят из необходимости
добиться некоторого баланса между такими
высоко противоречивыми факторами как
задачи и цели проблемы решения, природа
визуального восприятия, пути и средства
приобретения,
формирования,
воспроизведения
и
передачи,
и
математическое,
вычислительное
и
технологические средства допустимые для
АОИ.
Мы можем полагать, что основные
противоречия связаны с «изобразительной
природой» изображения и «формальной»
(символьной) основой АОИ: хорошо
известно, что получение пользы от
представления данных об изображении
необходимо для уменьшения последнего до
формы «неизображения».
Данная статья посвящена аксиоматическим
и
формальным
конструкциям
Описательной
Теории
Анализа
Изображения (ОТАИ) [2]. Разработка
методологии,
математических
и
вычислительных методов автоматизации
АОИ.
Описательная Теория Анализа
Изображения
Принятая за стратегическую задачу,
автоматизация извлечения изображения,
требует обеспечение анализа изображения
профессиональными
и
конечными
91
пользователями
со
следующими
возможностями:
1)
автоматизированное
планирование,
проверка
и
адаптация
методов
и
алгоритмов
распознания,
оценки
и
понимания изображения;
2) автоматизированный выбор методов и
алгоритмов
распознания,
оценки
и
понимания изображения;
3) автоматизированная проверка качества
исходных изображений и их пригодность
для решения проблем распознавания
изображения;
4)
стандартные
схемы
методов
распознавания, оценки, понимания и
исправления изображения.
Автоматизация извлечения изображения
возможна благодаря комплексу методов
анализа, понимания и распознавания
изображения.
Задача
анализа
изображения
(АИ)
основывается на знание об изображении,
которые
могут
базироваться
на
интеллектуальном решении об объектах,
состояниях и сценах, представленных на
изображении.
Машинное зрение, основанное на методах и
средствах
математического
АИ,
функционально
представляет
собой
технический
аналог
живое
зрение
(идеально – человеческое зрение). АИ
обеспечивает уменьшение изображения до
распознаваемой
формы,
то
есть
составление формальное описание – модель
– изображения. Основные подпроблемы:
сегментация (кластеризация изображения
на непересекающиеся фрагменты), выбор
признаков характеризующих структуру и
содержание изображения, вычисление
характерных значений пригодных для
синтеза модели изображения и синтез
модели.
Распознавание изображения состоит из
наладки и решение проблем распознавания
образа для случаев, когда необработанные
данные
даны
в
виде
отдельного
изображения, набора изображений и
моделей
изображения.
Результаты
распознавания определяют к какому классу
относится изображение, его фрагменты или
некоторые объекты на изображении или
кластеризация
объектов,
подлежащих
распознаванию, на
непересекающиеся
подмножества (классы).
Основные проблемы АИ: 1. Сравнение
изображения для классификации с одним
изображением, набором изображений и
сериями изображений. 2. Исследование
изображения
для
некоторых
регулярных/нерегулярных/объект/признак/
фрагмент/простой случаев или заданных
тип/форма.
3.
Накопление
ряда
изображений. 4. Сегментация изображения
(для однородных областей, групп объектов,
выбранных признаков). 5. Автоматический
выбор описания изображения (основной
цвет, специфические объекты, выбор
признаков) используемых для синтеза
модели изображения. 6. Предварительная
обработка изображения до распознаваемой
формы (построение модели изображения).
7. Проблемы анализа изображения путем
разложения и синтеза. 8. Проблемы 1-7 для
динамических изображений со сложным
фоном и с учетом путей получения,
формализации
и
представления
изображения.
В процессе решения данных подпроблем
автоматические/взаимодействующие
системы
АИ
сталкивается
со
специфическими подпроблемами, такими
как:
а) выделение значимых 2D объединяя
значения интенсивность-положение-время
посредством группировки объектов на
изображении – пиксели по схожести
значений яркости или по сходству
неразрывности или сходству изменения или
постоянству времени; основные классы:
границы, зоны и вектора;
б) выделять 3D поверхности, объемы,
границы, тени, преграды, глубину, цвет,
движение, используя группы пикселей и их
характеристики;
в) групповая информация в уникальных
физических объектах;
г)
преобразование
изображениецентрированного представления в мирцентрированное представление;
д) выбор объектов зависимых от системных
целей и модели мира;
е) вывод зависимости между объектами;
ж)
составление
последовательного
внутреннего описания.
92
Понимание изображения рассматривается
как
подражание
способностям
человеческого зрения. В частности, как
источник информации высокого уровня
(абстракция) об изображении или серии
изображений, а особенно в качестве
источника знаний о 3D мире по 2D
изображениям и формирование описания
3D
сцен
представленных
как
2D
изображение(я).
Результат
понимания
изображения есть символьное описание
изображения в терминах его элементов,
зависимости между ними и свойствами
изображения.
Описание
может
гарантировать решение, принимаемое в
реальной 3D среде (распознавание 3D
объектов, автоматическая навигация и так
далее). Процесс понимания изображения
осуществляется сложением результатов
обработки
изображения,
анализа
и
распознания со знаниями о сцене.
В АИ используется широкий спектр
математических
методов
алгебры,
геометрии,
дискретной
математики,
математической
логики,
теории
вероятности, математической статистики,
производящих вычисления так же как
методы
математической
теории
распознавания
образов,
цифровой
обработки сигналов и физики (в частности,
оптики).
Переход
к
удобной,
надежной
и
эффективной автоматизации извлечения
изображения непосредственно зависит от
ввода и развития теоретических средств
АОИ.
Естественным
путем
преодоления
указанных
противоречий
между
«живописной природой» изображения и
«формальными» (символьными) основами
АОИ является введение ориентированных
на
распознавание
образов
моделей
изображения и необходимых средств и
методов
предварительной
обработки
изображения до распознаваемой формы без
потери информации. Тщательное изучение
проблемы дает возможность ее решения
посредством теории создания разумных
связей между природой изображения,
приложениями
АОИ,
философией
распознавания образов, представлениями и
моделями
изображения,
АОИ
преобразованиями и соответствующими
информационными технологиями.
В целом успех АОИ зависит главным
образом от успехов предварительной
обработки изображения до распознаваемой
формы, которая может быть принята как
соответствующий
алгоритм
анализа/распознавания изображения. Это
доказывает, что предварительная обработка
изображения до распознаваемой формы
является важным вопросом использования
АИ,
в
частности,
для
принятия
квалифицированного решения на базе
извлечения изображения. Основные задачи
и проблемы предварительной обработки
изображения до распознаваемой формы
это: 1. Формальное описание изображений:
1) изучение и формирование моделей
изображения; 2) изучение и формирование
представлений изображения с помощью
различных моделей. 2. Описание классов
изображений
приводимых
к
распознаваемой форме: 1) ввод новых
математических параметров проблемы
распознавания изображения; 2) создание и
изучение связей между различными
моделями представления изображения и
исходных параметров изображения; 3)
изучение
и
использование
эквивалентностей
изображения.
3.
Развитие, изучение и применение языка
алгебры
для
описания
процедуры
приведения изображения к распознаваемой
форме.
Разработка
искомой
математической
теории
движется
по
направлению
алгебраизации,
основанной
на
Алгебраических
Подходах
при
Распознавании Образов и Классификация
Проблем (Ю. Журавлев [8]), который
специализируется на случае представления
исходных данных в форме изображения –
ОТАИ (И. Гуревич [2,3]) и развитии
алгебры изображения и описательной
алгебры изображения (ОАИ). ОТАИ
предоставляет
разнообразие
математических
и
вычислительных
методов для автоматизации АОИ.
ОТАИ дает возможность решения проблем,
связанных с разработкой формального
описания изображений
как
объекта
распознавания, а так же синтез процедур
распознавания и понимания изображения.
93
Анализ проблем основан на исследовании
внутренних
структур и
содержания
изображения как результат процедуры
«формирования» из примитивов, объектов,
описаний, свойств и признаков.
Данный
подход
характеристики
изображения – только операционный. Это
подразумевает, что цель процесса ОАИ
(включая синтез формального описания,
анализ, оценку и распознавание) –
проблема выбора пути – может быть
обоснованна
как
последовательность/комбинация
преобразований,
объединенных
с
вычислением ряда промежуточных и
конечных (вынесение решения) оценок.
Преобразования
задаются
соответствующими классами. Последние
задаются описательным способом – как
некоторый набор базовых прототипов и
соответствующий набор генерирующих
преобразований,
функционально
завершающихся
выделением
соответствующих классов допустимых
преобразований.
Процесс ОАИ осуществляется в виде пути
–
последовательности
допустимых
преобразований. Он представляет собой
путь в пространстве формальных описаний
изображения. Последнее играет двойную
роль
существующих
одновременно
объектов
и
результатов
ОАИ
преобразований.
Описательное
пространство иерархично и включает в себя
модели изображений различных типов.
Модели могут соответствовать различным
морфологическим
и
градуированным
уровням представления изображения. Они
могут представлять различные аспекты
свойств и характеристик изображения, и
могут
быть
реализованы
как
многоуровневые,
многоаспектные
и
многомодельные описания изображения.
Это позволяет выбрать и изменить уровни
и аспекты описания изображения, детально
разработанные для прикладных близких
проблем.
Главная цель теоретического аппарата
ОТАИ – структурирование множества
методов, операций и представлений
используемых в ОАИ. Конечная цель
ОТАИ – автоматическое извлечение
изображений: а) автоматический выбор
методов и алгоритмов для распознавания,
оценки и понимания изображения; б)
автоматическая
проверка
качества
исходных данных и их пригодность для
решения
проблем
распознавания
изображения.
ОТАИ предоставляет математическую
основу
извлечения
изображения:
специализация Алгебры Журавлева на
случае
распознавания
изображения;
стандартизация анализа и распознавания
изображений в проблемах распознавания;
стандартизация описательного языка для
процедур
анализа
и
распознавания
изображений; способы применения общего
математического аппарата для работы над
алгоритмами анализа и распознавания
изображения и над моделями изображения.
ОТАИ основана на: описательной модели
процедуры распознавания изображения;
специальные математические настройки
проблемы
анализа
изображения;
приведение изображения к распознаваемой
форме;
алгебраизация
извлечения
изображения; генерирующие принципы и
основы
преобразований
и
моделей;
множество моделей изображения – мультимодельное представление изображения;
введение знаний в процесс извлечения
изображения.
Угловой камень ОТАИ – описательная
модель
процедур
распознавания
изображения (Рис. 1).
Рис. 1. Описательная модель процедуры
распознавания изображения
{J} – множество идеальных изображений;
{ J *}
–
множество
наблюдаемых
R
изображений;
{J }
–
множество
изображений – результаты распознавания;
{T F
}множество
допустимых
преобразований
предназначенных
для
R
формирования изображения; { T
} –
множество допустимых преобразований
предназначенных
для
распознавания
изображения;
{K i }
–
изображения
соответствующего класса.
94
В проблемах распознавания образов
представление исходных данных в форме
изображения плохо структурировано и
«неформализовано».
Таким
образом,
невозможно, как правило, применение
алгоритмов
распознавания
образов
непосредственно к данным, то есть
невозможно устанавливать и решать
проблемы распознавания изображения как
стандартную
проблему распознавания
образов.
Необходимо
привести
изображение к распознаваемой форме,
преодолевая данные условия – создание
формальных
описаний
изображения
(модель
изображения),
принимать
операторы распознавания и как результат
получения возможности использования
исходных параметров для приблизительной
оценки изображений/фрагментов сходства
изображений.
Предварительное положение алгебраизации
извлечения изображения – это разработка
формальных систем представления и
преобразования
изображения,
удовлетворяющие
следующим
требованиям:
а) каждый объект представляет собой
иерархическую структуру, построенную с
помощью
ряда
операций
алгебры
изображений, применяемых для набора
элементов изображений;
б) объекты – точки, множества, модели,
операции, морфизмы;
в)
каждое
преобразование
–
это
иерархическая структура, построенная
рядом операций алгебры изображений на
наборе базовых преобразований.
ОТАИ
представляет
структуру
и
применение двух типов определенных
формальных систем – специальные версии
алгебры – алгебра изображений [7] и
алгебра описания изображения [4,6].
Использование генеративных принципов
основано на обобщенных побуждающих
определениях (определение класса объекта
по набору исходных объектов и набору
правил получения новых объектов класса
из определенных объектов) и на концепции
У. Гренандера комбинаторных регулярных
структур [1].
Описание
изображения
(или
его
комплексного объекта) составляется в
форме
иерархической
структуры,
включающей в себя «более простые»
объекты. Это позволяет использовать и
подробно
представлять
информацию,
содержащуюся в изображении. Таким
образом,
возможно
получение
неограниченного
числа
описаний,
используя ограниченное количество малых
(примитивных) элементов и ограниченное
количество генеративных (составляющих)
правил и применять столько раз, сколько
требуется
последним
исходным
и
генерированным объектам.
Таким образом, формализованное описание
изображения
устанавливается
рядом
объектов, извлеченных из изображения,
взаимосвязанных
структурными
отношениями и составленных с помощью
генеративных преобразований. Применение
генеративных
принципов
и
основ
преобразований и моделей используется
для разложения проблемы на простые
задачи, устанавливающих соответствия
между базовыми простыми задачами и
базовыми простыми преобразованиями и
комбинации
базовых
алгоритмов
и
моделей.
Процедура извлечения информации из
изображения использует различные виды
знания: на субъектной области, на
проблеме сущности и специфики, на
законах логики, математики и физики и
условиях контроля объекта визуализации,
на
направлениях
и
способах,
использующих
для
получения
изображения, регистрации и формализации
и ряда других. Знания применяются для
формирования
моделей
изображения
(выбор
примитивов
и
признаков
изображения, аспектов, типов и уровней
формализации) и для конструирования
модели процесса распознавания и для их
контроля (генерация гипотез о конечной
информации,
выбор
эвристических
преобразований, остановка правил). Знания
главным
образом
ограничены
семантической и контекстной информацией
и рядом логических и физических условий.
Основными
инструментами
ОТАИ
являются
Описательная
Алгебра
Изображений (ОАИ) [4,6], Описательные
Модели Изображения (ОМИ) и Множество
Моделей и Разностороннее представление
95
изображений с помощью Формирующих
Описание Деревьев [5].
ОАИ – это математический язык,
разработанный для описания, сравнения и
стандартизации
алгоритмов
анализа,
обработки и распознавания изображений.
Она дает возможность получать гибких и
стандартизированных по разработке и
выполнению схем алгоритмов извлечения
изображений.
Проблемы, объекты и преобразования
извлечения
изображения
строят
иерархические структуры с помощью
применения операций ОАИ к набору
простых задач, элементам изображения и
базовым преобразованиям.
Возможно различие методов решения
подзадач, используя операций анализа
изображения как элемент ОАИ и исходного
набора схем технологии извлечения
изображения.
ОМИ – это математические объекты,
дающие
представление
о
носимой
информации в изображениях и в заголовках
(контексте)
изображения
в
форме
приемлемой для алгоритма распознавания.
Подписи под изображениями могут
содержать информацию о субъектной
области, месте действия, освещении,
воспринимающих элементах, системах
получения и создания изображения,
положении
наблюдателя
и
другой
«применяемой» семантике и полезной
информации. ОМИ были введены для
определения
процесса
распознавания
изображения [2] таким образом, что
приведение изображения к распознаваемой
форме могло быть выполнено как
преобразование исходного изображения в
модель
изображения,
которая
удовлетворяет алгоритму распознавания.
Место Искусства в Извлечении
Изображения
Состояние
искусства
в
извлечении
изображения характеризуется следующими
тенденциями: Множество и Объединение,
Многочисленными Классификаторами и
Мульти-модельным Представлением.
ОТАИ предлагает математическую и
методологическую базу для решения
проблемы извлечения изображения.
Наиболее важные – критические точки
применения решения проблем извлечения
изображения следующие:
1. Точная постановка проблемы.
2.
Корректное
и
"исчислимое"
представление исходных и обработанных
данных для каждого алгоритма на каждом
уровне обработки.
3. Автоматический выбор алгоритма:

разбиение процесса решения на
основные уровни;

выделение
путей
возможных
улучшений
решения
("точки
разветвления");

накопление и применение опыта
решения проблем;

выбор для каждого уровня решения
проблемы базовых алгоритмов, базовых
операций и базовых моделей (операндов);

классификация базовых элементов.
4.
Определение
производительности
каждого шага обработки и вынесения
решения:

анализ, оценка и использование
специфики исходных данных;

многообразие
математических
инструментов,
используемые
для
определения производительности;

приведение исходных данных к
необходимым
параметрам
выбранных
алгоритмов.
Дальнейшее развитие ОТАИ должно
обеспечить необходимые средства путем
преодоления критических точек.
Аксиоматика
Данная часть описывает аксиоматику и
формальные
структуры
ОТАИ,
предоставляющей
пути
и
методы
представления и описания изображений для
их анализа и оценки. Основные вклады –
это
ОМИ:
его
формулировки,
классификация, свойства, связи и условия
создания.
Как известно, невозможно устанавливать и
решать
проблему
распознавания
изображения как стандартную проблему
распознавания изображения – стандартные
алгоритмы
распознавания
не
воспринимают изображения как входные
данные. Таким образом, преодоление этих
условий необходимо путем приведение
96
распознаваемого
изображения
к
распознаваемой форме – составление
формального
описания
изображения
(модель
изображения)
приемлемого
операторами распознавания.
Наша основная цель – установка
совокупности моделей изображения –
пространство моделей, то есть установка их
структур, типов элементов и классов
допустимых
преобразований.
ОМИ
используются для нормировки исходных
данных для алгоритмов распознавания.
ФОД – это инструмент для классификации
и предоставления любой информации,
которая может быть использована для
формирования модели изображения. ФОД
может быть использовано для упрощения
выбора и построения моделей изображения.
В частности, ФОД используется для
создания и объединения нескольких частей
представлений
изображения
(мультимодельное представление). Они так
же могут быть использованы для создания
новых типов сложных классификаций
предоставляющих применение различных
операторов
распознавания
различных
многоаспектных
частных
моделей
изображения и комбинация результатов.
ОМИ – это математический объект
представления
информации
носимой
изображениями и подписями изображений
в форме, удовлетворяющей алгоритму
распознавания. Понятие ОМИ было
использовано
для
введения
модели
процедуры распознавания изображения:
шаг
приведения
изображения
к
распознаваемой форме заключается в
построении
нескольких
моделей
изображения для исходных изображений, в
то время как модели удовлетворяют
алгоритмам распознавания.
Введены следующие классы ОМИ: Рмодели (параметрические модели), Gмодели (генерирующие модели), Т-модели
(модели преобразования или обработки) и
I-модели (само исходное изображение).
Сейчас, основываясь на общих принципов
ОТАИ, обозначенных в первой части
статьи, введем аксиомы и базовые
определения для ОМИ.
Аксиома 1: Каждое изображение I
однозначно соответствует совокупности
множеств ( {I 0 } , {t } , {M } ), где {I 0 } -
множество исходных данных (смотри
следующую лемму), {t } - множество
преобразований,
применяемых
ко
множеству исходных данных, и {M } множество результатов преобразований,
применяемых к исходным данным.
Иллюстрация аксиомы 1 на схеме 1:
(1)
~
~


t:  I ~ I 0    M 
   

Рассмотрим каждое из множеств подробно.
Лемма: Множество исходных данных {I 0 }
состоит из двух множеств {I } и {B} :
1)
множество
реализаций
{I }
изображения I  {I } необработанного
изображения I, представляющего заданный
объект или сцену, с условием, что
I   {( x, f ( x))}xD f это множество точек x ,
принадлежащих определенной области
реализации изображения D f , и множество
f ( x)
значений
в
каждой
определенной области D f .
точке
2) {B} - это данные, прямо или косвенно
характеризующие изображение, например,
информация о возможном существовании
на изображении объектов различной
природы. Другими словами множество {B}
- это семантическая и контекстная
информация о изображении.
Определенная
область
реализации
изображения – это подмножество nмерного дискретного пространства zn. Если
мы рассматриваем плоскость, то n=2.
Определение 1: Любой элемент I 
множества представлений необработанных
изображений {I } называется I-модель
изображения.
Рассмотрим множество преобразований
{t } .
Аксиома 2: Множество преобразований
задается
множеством
{t }
{S } ,
структурированных
элементов
множеством производящих правил {R} и 3
подмножествами преобразований {tT } ,
{tP } , {tG } : 1) процедурные преобразования
{tT } ; 2) параметрические преобразования
97
{tP } , 3) генерирующие преобразования
{tG } .
Определение 2: Структурный элемент
S {S } - это двумерный пространственный
объект, если свертка его и изображения
приводит к сегментации на фрагменты,
разделяющие
области
применения
различных преобразований.
Определение
3:
Процедурное
преобразование
с числом
tT {tT }
аргументов r изображений {I i }1...r - это
операция, применяемая к изображениям
и
которая
использует
{I i }1...r ,
преобразования исходных изображений к
другим изображениям, изображению или
фрагментам изображения.
В случае введения аксиоматики, процедура
преобразования tT {tT } с максимальным
числом r элементов I-моделей изображения
{I i}1...r - это операция, применяемая к Iмоделям изображения {I i}1...r , и которая
использует
преобразование
I-моделей
изображения
к
I-моделям
других
изображений, изображения или фрагментам
изображения. Здесь операндами данных
операций могут быть как I-модели одного
исходного изображения, так и I-модели
различных исходных изображений.
Определение
4:
Параметрическое
преобразование tP {tP } изображения I –
это операция, применяемая к изображению
I, и которая применяет преобразования
исходного изображения в числовую
характеристику p, которая связана со
свойствами
геометрических
объектов,
характеристиками
и
конфигурациями
освещенности,
сформированные
регулярными
повторениями
геометрических
объектов
и
характеристиками освещенности исходного
изображения.
Как множество реализаций изображения,
так и семантическая и контекстная
информация о изображении могут быть
использованы для вычисления числовой
характеристики p.
Определение
5:
Генерирующее
tG {tG }
преобразование
это
преобразование, допускающее генерацию
нескольких частичных представлений,
отражающих
специфические
свойства
(черты, характерные признаки, особые
качества) анализируемого изображения.
Определение представления будет дано
ниже.
Примеры такого преобразования – функции
представления
кривых,
функция
дизъюнкции, конъюнкции, кодирования
изображения.
Определение 6: Правила генерации R это
правила
построения
модели
изображения с помощью изображения и
генерирующих
преобразований,
определяющие строгий порядок операций
применяемых
к
изображению
для
построения
модели
изображения.
Определение модели изображения будет
дано ниже.
Определение
7:
Генерирующее
преобразование tG будет правильным
для данного изображения, тогда и только
тогда,
когда
существуют
правила
генерирования,
приводящие
к
формированию
модели
генерации
изображения
посредством
данного
генерирующего преобразования tG и
изображения.
Определение
модели
генерации будет дано ниже.
Определение
8:
Представление
изображения ( I ) - это формальная схема
получения
стандартизированных
формальных описаний форм, плоскостей и
точек, составляющих изображение и связи
между ними.
Определение 9: Модель изображения
M (I )
- это формальное описание
изображения, составленное для реализации
представления изображения.
Определение
10:
Реализация
представления изображения – это
применение представления изображения
реализующее
изображение
исходного
изображения с конкретными значениями
параметров преобразования, включающих
представление.
Определение 11: Корректная модель
изображения – это элемент из множества
возможных
моделей
изображения,
полученных реализацией представления
изображения, состоящей из множества
преобразований {t } множества исходных
данных {I 0 } .
98
Теорема: Любой результат m из множества
{M } результатов преобразований {t } ,
примененных к множеству исходных
данных {I 0 } - это корректная модель
изображения.
Иллюстрация
связей
между
представлением изображения и моделями
изображения дано на схемах 2, 3.
(2)
{( I )}  {t , S}:{I }  {M }
(3)
{( I )}( p)  {t1, t2 ,...tn , S }( p) :{I } {I}  M1 {M }
Определение 12: Т-представление T (  )
изображения I – это определенный
совокупностью
множеств
({I }  {I },{B}  {B},{S}  {S},{tT }  {tT }) ,
где
множество
процедурных
преобразований {tT }  {tT } и множество
{S}  {S}
структурных
элементов
применяется к множеству I-моделей
{I }  {I } , к тому же может быть
использована семантическая и контекстная
информация {B}  {B} ,  - это параметры
процедурных
преобразований
и
структурирования элементов. Множество
возможных Т-представлений обозначается
как {T (  )} .
(4)
~
 T  p  ~ I ', B, S , t T 
 
~
~ 
 T  p   S , t T ,  p  : S , I ' , B
 
 
Утверждение 1: Любое Т-представление
T (  ) {T (  )} изображения генерирует
множество
Т-моделей
изображения
0
{M T }

установкой
параметров
процедурных
преобразований
и
структурных элементов. Множество всех
возможных Т-моделей изображения {M T } .
Утверждение
2:
Любая
Т-модель
изображения M T  {M T } формирует новую
реализацию изображения, это I-модель
M I  I   {M T }  {I '} .
Пусть {I } - это множество реализаций
изображения I. 3D изображение может
содержать
множество
электронных
{I } .
реализаций
изображения
2D
изображение
может
быть
описано
множеством фрагментов изображения.
Пусть {tT }  {t j ( j )}1...r - это множество
процедур преобразования {I } ,  j - это
параметры процедурных преобразований tj.
Тогда
Т-представление
задается

({
I
},{
t
(

совокупностью множеств
j
j )}1...r ) .
Данный
случай
процедурных
преобразований
применим
для
изображений, но структурный элемент не
используется, то есть {S }   . Это Тпредставление изображений формирует
множество
Т-моделей
изображения
0
по
средством
MT ( I )  {t j ( j }1...r ({I })
установки
параметров
процедурных
преобразований: операции применяются
для реализации изображения параллельно и
последовательно.
Определение 13: Р-представление P (  )
изображения I – это точное определение
посредством
совокупности
множеств
({I }  {I },{B}  {B},{t P }  {t P }) ,
где
множество
параметрических
преобразований {tP }  {tP } применено к
множеству I-моделей ({I }  {I }) , к тому
же может использоваться семантическая и
контекстная информация {B}  {B} ,  параметры
параметрических
преобразований. Множество возможных Рпредставлений – это { P (  )} .
(5)
~
 T  p  ~ I ', B, t P 
 
~
~
 T  p   t P ,  p  : I ' , B
 
 
Утверждение 3: Любое Р-представление
 P (  ) { P (  )} изображения формирует
множество
Р-моделей
изображения
0
{M P } посредством установки параметров

параметрических
преобразований.
Множество
возможных
Р-моделей
изображения - {M P } .
Пусть I , I  - это I-модели исходного
изображения I.
Statement
3:
Any
P-representation
 P (  ) { P (  )} of image generates the set
of image P-models {M 0 P } by setting the
parameters  of parametric transformations.
99
The set of all possible image P-models is
{M P } . Цветные изображения могут
храниться в формате RGB ( I  ) и в формате
полутоновых изображений ( I  ). Пусть
где
{tP }  { f1 (1 ), f 2 ( 2 ),... f n ( n )} ,
f1 , f 2 ,... f n1
функции
вычисления
признаков I-модели изображения I   {I } ,
и f n1 1 , f n1  2 ,... f n - функции вычисления
признаков I-модели изображения I   {I } ,
параметры
функций
1 ,  2 ,...,  n
вычисления
признаков.
Тогда
Рпредставление задается как совокупность
множеств ({I , I },{ f1 (1 ), f 2 ( 2 ),... f n ( n )}) .
Р-представление формирует множество Рмоделей изображения I посредством
установки
параметров:
0
0
M P ( I )  ( f1 ( 1 )( I ), f 2 ( 2 )( I ),..., f n1 ( 0n1 )( I ),
f n1 1 ( 0n1 1 )( I ), f n1  2 ( 0n1  2 )( I ),..., f n ( 0n )( I ))
- вектор числовых признаков.
Определение 14: G-представление G (  )
изображения I задается совокупностью
множеств
{I }  {I },{S}  {S},{B}  {B},{tG }  {tG },{R},
, где  - параметры генерирующего
преобразования, генерирующих правли и
структурных
элементов.
Множество
возможных G-представлений - {G (  )} .
~
 T  p  ~ I ', S , B, t G , R
 
~
~ 
 T  p   R, t G , S  p  : I ' , S 
 
 
(6)
Рис. 2. Связь между введенными понятиями
Утверждение 4: Любое G-представление
G (  )  {G (  )} изображения формирует
множество
G-моделей
изображения
0
{M G } посредством установки параметров
генерирующего
преобразования,
генерирующих правил и структурных
элементов. Множество возможных Gмоделей - {M G } .
Связи между всеми введенными понятиями
схематично представлены на Рис. 2.
Заключение
В данной статье объясняются основные
позиции
ОТАИ.
ОТАИ
предлагает
математическую и методологическую базы
для
решения
задачи
извлечения
изображения. Дальнейшее развитие ОТАИ
может представить необходимые способы
преодоления критических точек извлечения
изображения.
В части «Аксиоматика» была дана
классификация и определение основных
типов моделей изображения на базе
классов представления, даны модели
построения.
Построены
формальные
100
определения
и
структуры
будут
использованы
для
определения
и
формирования
мульти-модельных
представлений,
основанных
на
инструментах ФОД.
Признания
Данная
работа
была
частично
подтверждена
Российским
Фондом
Основных Исследовательских Грантов ном.
05-01-00784, 07-07-13545, 06-01-81009,
проекта «Описательная Алгебра с одним
законченным
объединением
моделей»
Программы
Базовых
Исследований
«Алгебраические и Комбинированные
Техники Математической Кибернетики»
Департамента Математических Наук РАН,
проекта
номер
2.14
Программы
Президиума Российской Академии Наук
«Фундаментальные
Проблемы
Компьютерных Наук и Информационных
Технологий».
Список источников
1. U. Grenander. General Pattern Theory. Oxford
University Press, Oxford, 1993.
2. I.B. Gurevitch. Descriptive Technique for Image
Description, Representation and Recognition //
Pattern Recognition and Image Analysis: Advances
in Mathematical Theory and Applications in the
USSR. – 1991. - Vol.1, No. 1. - P. 50 - 53.
3. I.B. Gurevich. The Descriptive Approach to Image
Analysis. Current State and Prospects // Proceedings
of 14th Scandinavian hi Conference, SCIA2005,
Joensuu, Finland, June 2005 /H. Kalviainen, J.
Parkkinen, A. Kaarna (Eds.).- Springer-Verlag
Berlin Heidelberg, 2005.- LNCS. 3540.- P. 214-223.
4. I.B. Gurevich, V.V. Yashina. Descriptive Image
Algebras with One Ring. In Pattern Recognition and
Image Analysis: Advances in Mathematical Theory
and Application, 2003, 13(4), 579-599. MAIK
“Nauka/Interperiodica”, Moscow.
5. I.B. Gurevich, V.V. Yashina. Generating Descriptive
Trees // Proceedings of the 10th International Fall
Workshop on Vision, Modeling, and Visualization.Infix, 2005.- P.367-374.
6. I.B. Gurevich, V.V. Yashina. Operations of
Descriptive Image Algebras with One Ring // Pattern
Recognition and Image Analysis: Advances in
Mathematical Theory and Applications. - MAIK
"Nauka/Interperiodica"/Pleiades Publishing, Inc.,
2006.- vol. 16, no.3.- P. 298-328.
7. G.X. Ritter, G.X., J.N.Wilson, Handbook of
Computer Vision Algorithms in Image Algebra,.
2001, CRC Press Inc., 2nd Edition.
8. Zhuravlev, Yu.I., 1998. An Algebraic Approach to
Recognition or Classification Problems. In Pattern
Recognition and Image Analysis: Advances in
Mathematical Theory and Applications, 8(1), 59–
100. MAIK “Nauka/Interperiodica”, Moscow.
Download