Чабан Л.Н. УМК Теория и алгоритмы распознавания образов

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ
ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ГЕОДЕЗИИ И КАРТОГРАФИИ» (МИИГАиК)
Утверждено
Учебно-методической
комиссией МИИГАиК
Протокол от _________ 2014 года
УМК
ПО ДИСЦИПЛИНЕ УЧЕБНОГО ПЛАНА ООП
«ТЕОРИЯ И АЛГОРИТМЫ РАСПОЗНАВАНИЯ ОБРАЗОВ»
Направление подготовки
120100 Геодезия и дистанционное зондирование
Профиль подготовки
Профиль1: Исследование природных ресурсов методами дистанционного
зондирования
Квалификация (степень)
бакалавр
Форма обучения
очная
Москва 2014 г.
1. Цели освоения дисциплины
Целями освоения дисциплины «Теория и алгоритмы распознавания образов»
являются формирование общекультурных и профессиональных компетенций,
определяющих готовность и способность бакалавра геодезии и дистанционного
зондирования к использованию теоретических знаний и методических приемов
построения автоматизированных систем распознавания объектов земной поверхности в
задачах тематической обработки аэрокосмической информации.
2. Место дисциплины в структуре ООП ВПО
Данная учебная дисциплина входит в раздел «Б.2. Профессиональный цикл.
Вариативная часть. Обязательные дисциплины» ФГОС ВПО по направлению подготовки
«Геодезия и дистанционное зондирование».
Данная учебная дисциплина должна изучаться параллельно с дисциплинами,
«Методы цифровой обработки изображений» и «Автоматизированная обработка
аэрокосмической информации» после дисциплин «Математические методы обработки и
анализа пространственных данных», «Теория вероятности и математическая статистика»
ООП подготовки бакалавра по профилю «Исследование природных ресурсов методами
дистанционного зондирования».
Данная учебная дисциплина предшествует изучению дисциплин «Методы
геоинформационного анализа и прогнозирования природно-технических систем»,
«Космический мониторинг» ООП подготовки бакалавра по профилю «Исследование
природных
ресурсов
методами
дистанционного
зондирования»,
формирует
общекультурные компетенции, необходимые для прохождения учебной и
производственной практик.
Схема междисциплинарных связей
Дисциплина
Математические
методы обработки и
анализа
пространственных
данных
Дисциплина
Теория и алгоритмы
распознавания образов
Дисциплина
Теория вероятности и
математическая
статистика
Дисциплина
Методы цифровой
обработки изображений
Дисциплина
Автоматизированная
обработка
аэрокосмической
информации
Дисциплина
Методы
геоинформационного
анализа и
прогнозирования
природно-технических
систем
Дисциплина
Космический
мониторинг
3. Компетенции обучающегося, формируемые в результате освоения
дисциплины
В результате освоения дисциплины «Теория и алгоритмы распознавания образов»
обучающийся должен демонстрировать следующие результаты образования:
1. Знать:
- математические основы алгоритмов тематической классификации многозональных
аэрокосмических изображений;ПК-9
- условия применения, преимущества и недостатки указанных алгоритмов;ПК-9
- методы оценки качества результатов тематической классификации и способы
сокращения ошибок классификации;ПК-9
- методы отбора наиболее информативных признаков на основе корреляционного и
факторного анализа исходных данных;ПК-4
- основные подходы к распознаванию пространственных объектов по текстурным и
структурным признакам;ПК-1
- принципы построения систем распознавания, правила их декомпозиции и оценки
эффективности.ПК-10
2. Уметь:
- разрабатывать технологические схемы распознавания объектов земной
поверхности на основе существующих программно-инструментальных средств
тематической классификации аэрокосмических изображений;
- выполнять оценку информативности исходных данных и сокращение размерности
задачи на основе отбора наиболее информативных признаков;
- осуществлять выбор наиболее эффективных алгоритмов тематической обработки
для конкретных типов аэрокосмической информации;
- оценивать качество результатов классификации, выполнять их тематическую
интерпретацию и постклассификационную обработку для перехода к тематической
карте.
3. Владеть:
- навыками работы с инструментарием тематической классификации изображений и
сопутствующими процедурами в программно-инструментальной среде пакета
тематической обработки аэрокосмической информации ERDAS Imagine.
4. Структура и содержание дисциплины
Общая трудоемкость дисциплины «Теория и алгоритмы распознавания образов»
составляет 4 зачетные единицы, 144 часа.
4.1. Структура преподавания дисциплины
2.
3.
4.
5.
6.
Анализ результатов и
оформленение
курсовой работы
1
Сбор и обработка данных
для курсовой работы
7
Контрольные работы
Основные понятия
теории распознавания
образов.
Построение систем
распознавания в
тематической
обработке данных ДЗ
Методы распознавания,
основанные на
классификации
измеряемых
параметров.
Пространство
признаков.
Алгоритмы
распознавания без
обучения. Кластерный
анализ.
Выбор признаков.
Корреляционный
анализ данных.
Распознавание с
обучением.
Статистические методы
классификации.
Практические работы
1.
Формы текущего
контроля
успеваемости (по
неделям
семестра)
Форма
промежуточной
аттестации
(по семестрам)
самостоятельная
работа
лекции
Раздел
дисциплины
Неделя семестра
№
п/п
Семестр
Виды учебной работы, включая
самостоятельную работу
студентов
и трудоемкость
(в часах)
2
7
2
2
7
3
2
2
2
4
Собеседование
3-14
Контрольная
работа - 2
4
Собеседование
3-14
7
4
5
4
4
2
8
Собеседование4-5, контрольная
работа - 5
7
6
7
4
2
2
4
7
7-9
6
4
2
8
Собеседование6, контрольная
работа - 7
Собеседование7-9
Контрольная
работа - 9
8.
9.
10
11.
Обучение
статистических
классификаторов.
Методы оценки
качества
распознавания.
Логические методы
распознавания.
Распознавание образов,
представленных
пространственными
конфигурациями.
Промежуточная
аттестация
7
10
2
2
7
11
2
1
7
12
2
4
7
13
14
2
4
3
15
2 часа-консультация
7.
Собеседование10
8
4
Собеседование-11
7
Контрольная
работа -13
Контрольная
работа -14
Экзамен - 7-й
семестр
Курсовая работа –
7-й семестр
4.2. Содержание дисциплины и требования к уровню его освоения
Условные обозначения:
1. Качество усвоения знаний (А):
А1 - знания, предусматривающие деятельность по воспроизведению;
А2 - знания, предполагающие применение в ситуациях, аналогичных
обучающим;
А3 - знания, использующиеся в задачах, требующих установления новых связей
между понятиями;
А4 - знания, предполагающие способность достраивать систему связей новыми.
2. Уровень усвоения умений (Б):
Б1 - ученический – умение пользоваться системой понятий при
алгоритмической деятельности с внешне заданным алгоритмическим
описанием (подсказкой);
Б2 - (типовой – алгоритмический – уровень) – умение пользоваться системой
понятий в ситуации, аналогичной обучающей;
Б3 - (продуктивный эвристического типа) – умение применять систему знаний в
ситуациях, требующих перестройки связей между уже сформированными
понятиями;
Б4 - (продуктивный творческого типа) – умение достраивать сформированные
системы понятий новыми, самостоятельно сформированными.
3. Степень научности (В):
В1 - (феноменологическая) – описательное изложение фактов и явлений;
каталогизация объектов, констатация их свойств и качеств (известен
определенный
ряд
однородных
факторов),
это
использование
преимущественно естественного языка и житейских понятий;
В2 - (аналитико-синтетическая) – объяснение природы и свойств объектов и
закономерностей явлений, часто качественное или полуколичественное
(известны сущность первого порядка и свойства объектов и явлений,
механизмов, управляющих функционированием анализируемых фактов и
процессов);
В3 - (прогностическая) – объяснение явлений данной области с созданием их
количественной
теории,
моделирование
основных
процессов,
В4 -
аналитическим
представлением
законов
и
свойств
(известны
закономерности функционирования объектов конкретного вида);
(аксиоматическая) – объяснение явлений с использованием высокой
степени общности описания (большой объем материала и широкое
использование научного языка, глубина проникновения в сущность явлений
– известны общие законы функционирования объектов любой природы).
Раздел 1. Основные понятия теории распознавания образов.
Требуемая степень усвоения содержания раздела: А2Б2В1
Введение. Задачи и содержание курса. Значение изучения дисциплины в общей системе
подготовки студентов по данной специальности. Связь курса с другими курсами. Обзор
литературы по курсу.
Основные понятия теории распознавания образов. Методологические подходы к задаче
распознавания образов. Принципы построения систем распознавания. Классификация
систем распознавания.
Раздел 2. Построение систем распознавания в тематической обработке данных ДЗ.
Требуемая степень усвоения содержания раздела: А2Б2В1
Особенности систем распознавания в задачах обработки аэрокосмической информации.
Основные компоненты систем распознавания в тематической обработке данных ДЗ.
Принципы декомпозиции задачи. Значение интерактивного режима. Факторы, влияющие
на качество распознавания.
Раздел 3. Методы распознавания, основанные на классификации измеряемых
параметров. Пространство признаков.
Требуемая степень усвоения содержания раздела: А2Б2В1
Постановка задачи классификации образов, заданных набором измеряемых
параметров. Основные методы решения. Описание классов в пространстве признаков.
Разделяющие и решающие функции. Геометрическая и аналитическая интерпретация
задачи. Программные средства анализа пространства признаков в пакетах обработки
данных ДЗ.
Раздел 4. Алгоритмы распознавания без обучения. Кластерный анализ.
Требуемая степень усвоения содержания раздела: А2Б2В1
Группировка образов с использованием функций расстояния. Задачи кластерного анализа.
Области применения кластерного анализа.
Методы выявления (выращивания) кластеров. Односвязывающие и полносвязывающие
методы. Метод k ближайших соседей, алгоритм максминного расстояния.
Кластеризация при заданном количестве групп. Алгоритмы класса ISODATA.
Дисперсионно-ковариационные критерии качества кластеризации. Использование
алгоритмов кластерного анализа при тематической обработке данных ДЗ –
неконтролируемая классификация. Методы анализа и интерпретации результатов
неконтролируемой классификации.
Раздел 5. Выбор признаков. Корреляционный анализ данных.
Требуемая степень усвоения содержания раздела: А2Б2В1
Понятие статистической связи между признаками. Корреляционная матрица и схема ее
получения из доступной выборки образов. Метод нахождения максимального
собственного числа и соответствующего собственного вектора корреляционной матрицы.
Задачи факторного анализа. Области применения факторного анализа. Постановка задачи
в модели главных компонент. Общая схема решения задачи.
Раздел 6. Распознавание с обучением. Статистические методы классификации.
Требуемая степень усвоения содержания раздела: А2Б2В1
Обоснование применения статистических методов при распознавании образов,
представленных набором параметров. Понятие статистической гипотезы. Основные
стратегии принятия решения (Байеса, минимаксная, Неймана-Пирсона).
Условие минимума ср. байесовского риска. Отношение правдоподобия и правило
принятия решения для нормально распределенных значений признака. Сложная
статистическая гипотеза, формула Байеса. Байесовская стратегия в случае многомерных
нормально распределенных признаков. Расстояние Махаланобиса. Условие линейного
вида разделяющих функций.
Раздел 7. Обучение статистических классификаторов.
Требуемая степень усвоения содержания раздела: А2Б2В1
Методы получения обучающих данных. Понятие статистической разделимости
классов. Меры статистической разделимости. Выбор метода классификации на основе
предварительной оценки качества классификации. Использование файла расстояний для
оценки качества обучения.
Раздел 8. Методы оценки качества распознавания.
Требуемая степень усвоения содержания раздела: А2Б2В1
Итоговая оценка качества классификации. Методы устранения ненадежно
классифицированных точек. Нечеткая классификация, основания для ее применения.
Раздел 9. Логические методы распознавания.
Требуемая степень усвоения содержания раздела: А2Б2В1
Условия и сфера применения логических методов классификации. Способы описания
классов с помощью логических высказываний. Алгоритм вычисления оценок.
Раздел 10. Распознавание образов, представленных пространственными
конфигурациями.
Требуемая степень усвоения содержания раздела: А2Б2В1
Задачи синтеза и анализа образов. Синтез линейных и площадных структур. Методы
описания текстур. Гистограммные признаки первого и второго порядка. Сегментация
изображений. Распознавание конфигураций, основанное на принципе сравнения с
эталоном.
Раздел 11. Структурное (синтаксическое) распознавание образов.
Требуемая степень усвоения содержания раздела: А2Б2В1
Принципы структурного (синтаксического) распознавания образов. Понятие
формальной грамматики. Типы грамматик. Дерево вывода. Синтаксический разбор
образов. Распознавание образов, представленных графами.
+
+
+
+
+
+
ПК-29
+
+
ПК-28
+
ПК-15
+
+
+
+
+
+
+
+
ПК-25
+
+
+
+
+
+
+
+
+
+
+
ПК-13
+
+
+
+
+
+
+
+
+
+
ПК-10
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
ПК-9
+
+
ПК-7
+
+
+
+
+
+
+
+
+
+
ПК-4
+
+
+
+
+
+
+
+
+
+
ПК-1
2
8
8
18
12
20
12
7
13
6
106
ОК-9
Раздел 1
Раздел 2
Раздел 3
Раздел 4
Раздел 5
Раздел 6
Раздел 7
Раздел 8
Раздел 9
Раздел 10
Итого
ОК-7
Количество
часов
ОК-5
Темы,
разделы
дисциплины
ОК-1
4.3 Соотношение разделов учебной дисциплины и формируемых в них компетенций
Компетенции
Σ общее
количество
компетенций
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
9
13
10
11
12
11
11
11
10
7
5. Образовательные технологии
При реализации программы дисциплины «Тоерия и алгоритмы распознавания
образов» в часы, отведенные для аудиторных занятий (34 часа), занятия проводятся:
в виде лекций с использованием слайдов и слайд-фильмов, иллюстрирующих
изучаемые технологические процессы;
в виде лабораторных работ с использованием автоматизированных рабочих мест
(АРМ) тематической обработки изображений и динамического картографирования.
в виде контрольных работ, включающих теоретические вопросы проектирования
систем и алгоритмов распознавания образов.
Самостоятельная работа студентов под руководством преподавателя подразумевает
подготовку аналитической курсовой работы по использованию изученных алгоритмов
распознавания в технологиях тематического дешифрирования данных ДЗ.
6. Оценочные средства для текущего контроля успеваемости, промежуточной
аттестации по итогам освоения дисциплины и учебно-методическое
обеспечение самостоятельной работы студентов
6.1. Основные этапы подготовки курсовой работы.
- Выбор репрезентативного многозонального космического снимка для тематического
дешифрирования; сбор доступных экономико-географических данных на территорию
представленного на снимке региона.
- Оценка информативности выбранного типа данных ДЗ, выбор классов для
выполнения тематической классификации, анализ их спектральных признаков.
- Выполнение неконтролируемой классификации и интерпретацию полученных
результатов с использованием различных методик их анализа.
- Подготовка и контроль качества обучающих данных для выполнения
контролируемой классификации.
- Выполнение контролируемой классификации с использованием различных
алгоритмов и технологических решений, реализованных в пакете ERDAS Imagine.
- Сравнительный анализ полученных результатов и разработка рекомендаций по
построению системы распознавания применительно к поставленной задаче тематической
классификации.
6.2. Контрольные вопросы и задания для промежуточной аттестации по итогам
освоения дисциплины (по разделам):
2. Основные компоненты алгоритма распознавания как формальной системы.
3. Этапы проектирования систем распознавания.
4. Критерии оценки эффективности систем распознавания.
5. Особенности проектирования систем распознавания при тематической обработке
данных ДЗ.
6. Параметрические и непараметрические методы классификации, обоснование их
применения.
7. Применение алгоритмов кластерного анализа (неконтролируемой классификации)
при тематическом дешифрировании материалов ДЗ.
8. Влияние начальных условий и размерности данных на результат работы алгоритма
ISODATA.
9. Схема расчета матрицы корреляции признаков по заданному набору образов.
10. Постановка задачи факторного анализа, интерпретация главных компонент.
11. Теоретическое обоснование классификации образов по максимуму правдоподобия.
12. Влияние нарушения гипотезы о нормальном законе распределения признаков в
классе на результат классификации по расстоянию Махаланобиса.
13. Основные этапы обучения статистических классификаторов, методы проверки
качества обучения.
14. Обоснование применения логических методов распознавания, описание образов и
классов в логических методах.
15. Общая схема алгоритма вычисления оценок.
16. Методы описания текстур, гистограммные признаки первого и второго порядка.
17. Распознавание объектов на изображении с использованием функции взаимной
корреляции.
18. Понятие образа и класса в синтаксическом распознавании.
19. Описание многомерных структур на основе языка PDL.
Общие критерии оценки ответов студентов
Для отличной оценки
Наличие глубоких,
исчерпывающих знаний
предмета в объеме
освоенной программы;
знание основной
(обязательной)
литературы; правильные
и уверенные действия,
свидетельствующие о
наличии твердых знаний
и навыков в
использовании
технических средств;
полное, четкое, грамотное
и логически стройное
изложение материала;
свободное применение
теоретических знаний при
анализе практических
вопросов.
Для хорошей
оценки
Для удовлетворительной оценки
Те же
требования, но
в ответе
студента по
некоторым
перечисленны
м показателям
имеются
недостатки
принципиальн
ого характера,
что вызвало
замечания или
поправки
преподавателя.
Те же требования, но
в ответе имели место
ошибки, что вызвало
необходимость
помощи в виде
поправок и
наводящих вопросов
преподавателя.
Для
неудовлетворительной оценки
Наличие ошибок
при изложении
ответа на основные
вопросы
программы,
свидетельствующих
о неправильном
понимании
предмета; при
решении
практических задач
показано незнание
способов их
решения, материал
изложен
беспорядочно и
неуверенно.
7. Учебно-методическое и информационное обеспечение дисциплины
а) основная литература:
1. Л.Н.Чабан. Теория и алгоритмы распознавания образов. Учебное пособие.
М.МИИГАиК, 2004.- 70с.
2. Л.Н.Чабан. Автоматизированная обработка аэрокосмической информации для
картографирования пространственных данных. Учебное пособие. М.МИИГАиК, 2013 96с.
3. Л.Н.Чабан.
Тематическая
классификация
многозональных
(многослойных)
изображений в пакете ERDAS Imagine. Методические указания для лабораторного
практикума. М.МИИГАиК -2006. – 42с.
4. Кашкин В. Б. Сухинин А. И. Дистанционное зондирование Земли из космоса.
Цифровая обработка изображений: Учебное пособие. М.: Логос, 2001. – 264 с.
5. Ту Дж., Гонсалес Р. Принципы распознавания образов. // М.: Мир. 1978.- 413с.
6. А.Л.Горелик, В.А.Скрипкин. Методы распознавания. М., Высшая школа, 1977. – 220с.
7. Гонсалес Р, Вудс Р. Цифровая обработка изображений. Москва: Техносфера, 2006.
8. Р.Каллан. Основные концепции нейронных сетей. Москва-С.П.-Киев, Издательский
дом «Вильямс», 2003. – 287с.
б) дополнительная литература:
1. Дуда Р., Харт П. Распознавание образов и анализ сцен: Пер. с англ./Под
ред.В.Л.Стефанюка.,М.,Мир,1976.
2. К.Фу. Структурные методы в распознавании образов. М., Мир, 1977. – 320с.
3. Классификация и кластер. Ред. Дж.Вэн Райзин. М.Мир, 1980г.
4. Э.М.Браверман, И.Б.Мучник. Структурные методы обработки эмпирических
данных. М., Наука, 1983.
5. Прэтт У. Цифровая обработка изображений. М., Мир, 1982.
6. Адзерихо К.С., Киселевский Л.И., Костюкевич С.Б., Краснопрошин В.В..
Физические основы дистанционного зондирования. Минск, Ун-т, 1991.
7. Дюран Б., Одел П. Кластерный анализ. М., Статистика, 1977.
в) программное обеспечение и Интернет-ресурсы:
1. Пакет обработки данных дистанционного зондирования ERDAS Imagine
2. Программный комплекс RSI ENVI для обработки данных дистанционного
зондирования.
3. http://old.ulstu.ru/people/SOSNIN/umk/Image_Recognition_and_Scene_Analysis/chapte
rs/ch03.htm
4. http://www.andaim.ru/computer_engineering/object_detection_and_recognition
5. http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D0%BF%D0%BE%D0%B7
%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BE%D0
%B1%D1%80%D0%B0%D0%B7%D0%BE%D0%B2
6. http://prand.ru/content/raspoznavanie-obrazov
Авторы: Чабан Людмила Николаевна, доцент
Download