На правах рукописи Специальность 05.13.01- «Системный анализ, управление и обработка

advertisement
На правах рукописи
Руденко Ольга Валентиновна
ВЫСОКОТОЧНОЕ НЕЙРОСЕТЕВОЕ РАСПОЗНАВАНИЕ
В СИСТЕМАХ ТЕХНИЧЕСКОГО ЗРЕНИЯ
Специальность 05.13.01- «Системный анализ, управление и обработка
информации (информационные и технические системы)»
АВТОРЕФЕРАТ
диссертации на соискание ученой степени
кандидата технических наук
Краснодар – 2011
2
Работа выполнена в ФГБОУ ВПО «Кубанский государственный
технологический университет»
Научный руководитель:
доктор физико-математических наук, доцент
Усатиков Сергей Васильевич
Официальные оппоненты:
доктор технических наук, профессор
Плахотнюк Александр Николаевич;
кандидат технических наук, профессор
Бухонский Михаил Иванович
Ведущая организация:
ФГБОУ ВПО «Кубанский государственный
университет»
Защита диссертации состоится «7» декабря 2011 г. в 1400 часов на
заседании диссертационного совета Д 212.100.04
в ФГБОУ ВПО
«Кубанский государственный технологический университет» по адресу :
350072, г. Краснодар, ул. Московская, 2 , Г-251
С диссертацией можно ознакомиться в библиотеке Кубанского
государственного технологического университета
Автореферат разослан «7» ноября 2011 г.
Ученый секретарь
диссертационного совета Д 212.100.04
канд. техн. наук, доцент
Власенко А.В.
3
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы
Последние десятилетия для автоматизации производства активно
ведутся разработки систем технического зрения (СТЗ). Для повышения
эффективности функционирования СТЗ необходимо постоянно пополнять
арсенал методов и средств предварительной обработки изображения и
построения классификаторов, сочетающих требуемые показатели по
быстродействию и достоверности идентификации. Перспективные СТЗ
экспертного уровня точности для объектов природного происхождения в
задачах
пищевой
и
зерноперерабатывающей
промышленности
рассмотрены в работах А.Ю. Шаззо с сотр., Русанова И.А. с сотр. и др. на
основе различных методов распознавания: статистических, нейросетей
(НС), байесовских сетей и т.д. Нейросетевые алгоритмы и технологии
построения нейросетевых экспертных систем разработаны в трудах как
зарубежных, так и российских ученых: А.Н. Горбанем, В.В. Кругловым,
Е.М. Миркесом, В.А. Дуниным-Барковским и др. Основная трудность при
разработке
НС
с
заданными
свойствами
является
отсутствие
теоретического проектирования их топологий и предсказание точности
распознавания. В связи с этим изучение возможной достижимой для НС
точности распознавания массовых объектов с сильной внутриклассовой
визуальной вариабельностью и разработка соответствующих методов,
гарантирующих достаточную заданную точность, является актуальной
задачей.
Цель работы: разработка методов и алгоритмов по применению в
СТЗ нейронных сетей для распознавания с достаточной заданной
точностью массового количества объектов природного происхождения с
сильной визуальной внутриклассовой вариабельностью.
Предмет исследования: совокупность математических моделей и
основных
архитектур
нейронных
сетей,
позволяющих
проводить
4
классификацию
объектов
с
большой
визуальной
внутриклассовой
вариабельностью, реализуемых программно на нейроимитаторах.
Объект исследования: процесс распознавания экспертного уровня
точности объектов природного происхождения.
Основными задачами исследования являются:
1) совершенствование методик и технологий для распознавания
объектов
природного
происхождения
с
большой
визуальной
внутриклассовой вариабельностью в промышленных СТЗ с заданной
точностью;
2) отбор информативных признаков, участвующих в классификации;
3) выбор топологии и обучение нейронной сети;
4) создание «обучающей» базы данных программного комплекса
нейросетевого распознавания;
5) разработка программного обеспечения, позволяющего проводить
высокоточное распознавание, на основе нейронных сетей;
6) оценка точности распознающего алгоритма;
7) обоснование эффективности нейросетевого метода распознавания по
сравнению с другими методами.
Методы исследования. В диссертации использованы методы
системного анализа, распознавания образов, компьютерного зрения,
нейронных сетей, математической статистики, спектрального анализа.
Положения, выносимые на защиту:
1) выбор типа признакового пространства для распознавания объектов
с большой визуальной внутриклассовой вариабельностью;
2) выбор типа пользовательской топологии и подбор методов обучения
нейронной сети для высокоточного распознавания;
3) оценка точности работы нейронной сети на реальном наборе данных;
4) блок экспертной системы на основе нейронной сети для контроля
качества пищевой продукции.
5
Научная новизна работы:
 повышение точности распознавания с использованием нейронной
сети на основе объединения геометрических параметров и цветовых
составляющих
объектов
пищевой
и
зерноперерабатывающей
промышленности;
 предложена методика выбора топологии и методов обучения
нейронной сети для задачи высокоточного распознавания;
 проведены
экспериментальные
исследования
по
проверке
эффективности разработанной системы.
Достоверность и обоснованность научных результатов и выводов
основана
на
корректности
постановок
задач
и
используемого
математического аппарата, адекватности математических моделей и
согласованностью
теоретических
расчетов
с
экспериментальными
результатами.
Практическая значимость. Результаты работы использованы при
разработке программного обеспечения базы данных для лабораторного
стенда экспертного уровня для целей семеноводства и для создания блока
распознавания сырья экспертной системы мониторинга показателей
безопасности и качества.
Реализация и внедрение результатов работы. Диссертационные
исследования выполнены в рамках госбюджетной темы НИР №8.5.06-10
«Исследования
математических
моделей
для
естественнонаучных
приложений» по кафедре Общей математики КубГТУ и гранта РФФИ и
Администрации Краснодарского края №08-07-99033-р_офи 2008-2009 г.г.
Результаты работы внедрены на кафедре Пищевой инженерии и
высоких технологий (КубГТУ, г. Краснодар) и в Краснодарском научноисследовательском
институте
хранения
и
переработки
сельскохозяйственной продукции ГУ КНИИХП (г. Краснодар).
6
Публикации. Основные положения диссертации достаточно полно
изложены в 7 печатных работах, из них 5 статей (3 статьи в изданиях из
перечня ВАК для публикации научных результатов диссертаций на
соискание ученой степени доктора и кандидата наук) и 2 тезиса докладов.
Получено
2
свидетельства
о
государственной
регистрации
программы для ЭВМ № 2011613332 и №2011615407.
Апробация
работы.
Основные
результаты
диссертации
обсуждались на международной, всероссийской и региональной научных
конференциях:
 V Международная научная конференция «Научный потенциал XXI
века», Ставрополь, 2011 г.;
 конференция получателей грантов регионального конкурса РФФИ и
Администрации Краснодарского края «Юг», 2007-2008 гг.;
 I межвузовская научно-практическая конференция «Автоматизированные
информационные
и
электроэнергетические
системы,
Краснодар, 2010 г.
 международная научно-практическая конференция «Хлебобулочные,
кондитерские и макаронные изделия XXI века», Краснодар, 2011 г.
Объем и структура работы. Диссертационная работа включает в
себя введение, 4 главы, заключение, список используемой литературы из
95 наименований и 3 приложения. Работа изложена на 125 страницах,
содержит 41 рисунок и 19 таблиц.
СОДЕРЖАНИЕ РАБОТЫ
Во введении показана актуальность работы, ее научная новизна,
теоретическая и практическая значимость. Приведена цель и поставлены
задачи диссертационного исследования.
В первой главе проведен аналитический обзор существующих
подходов к разработке СТЗ, позволивший сделать выводы, определяющие
направление диссертационного исследования. Определены математичес-
7
кие методы, составляющие алгоритм формализованного подхода
построению СТЗ. Исследованы модели
позволяющих
повысить
точность
к
информативных признаков,
распознавания
по
сравнению
с
существующими методами. Выбрано программное обеспечение для
имитационного моделирования работы сети.
Делается вывод о том, что методы идентификации объектов для
решения ряда актуальных задач селекции и семеноводства, управления
технологическими процессами и др. не обладают экспертным уровнем
точности
распознавания.
Установлено,
что
наличие
большой
вариабельности оптических свойств внутри одного класса объектов
природного происхождения является основной проблемой идентификации.
В
результате
проведенного
анализа
существующих
методов
идентификации выбраны искусственные нейронные сети как один из
наиболее перспективных подходов для решения ряда задач с объектами
пищевой и зерноперерабатывающей промышленности.
Во второй главе рассмотрен системный подход к созданию
классификатора на основе нейронной сети; методы решения задачи
распознавания в системах технического зрения; рассмотрены варианты
принятия решения.
Процесс системного анализа включает ряд этапов, реализация
которых необходима для решения проблемы. Сочетание этих этапов в
определенной последовательности, диктуемой структурой проблемы и
причинно-следственными связями, и приводит к системному решению.
Алгоритм распознавания изображений состоит из трех компонент:
1)
преобразование
исходного
изображения
(предобработка
и/или
математическое преобразование); 2) выделение ключевых характеристик
(анализ главных компонент, генетический алгоритм и др.); 3) механизм
классификации:
статистические методы,
функций, нейронная сеть и т.п. (рис. 1).
метод
дискриминационных
8
Начальное представление
изображения
Предобработка
Выделение признакового
пространства
Преобразование
Отделение от фона
Выделение границ
Ориентация и масштаб
Методы
классификации
Метод главных компонент
Генетический алгоритм
Факторный анализ
Фурье-анализ
Вейвлет-анализ
Метод
дискриминантных
функций
Статистические
методы
Нейронные сети
Рисунок 1 – Структура метода распознавания
Каждый компонент системы нужно разработать так, чтобы для
системы в целом обеспечить достижение поставленных перед ней цели с
требуемой эффективностью.
Для обеспечения инвариантности объектов по отношению к
геометрическим трансформациям является предварительная обработка
изображения и приведение его к стандартной позиции, масштабу и
ориентации. Для начальной обработки изображения применен метод
цветовых
гистограмм
для
выполнения
пороговой
бинаризации
полутоновых изображений. Алгоритм определяет наличие в изображении
пикселей двух классов – текстовых и фоновых. После проведения
операции
бинаризации
происходит
поиск
смежных
областей
в
изображении. На основе разделения изображения на смежные области
создается массив объектов, который представляет собой изображение,
сохраненное в отдельной матрице (отдельный объект и его контур).
Контур плоского изображения некоторого компонента задается в виде
дискретного набора (xi, yi), 1 ≤ i ≤ n, декартовых координат точек на
плоском замкнутом контуре без самопересечений.
Окраска объекта представлена в виде матрицы пикселей (зерно на
рис. 2).
9
Рисунок 2 – Представление окраски зерна пиксельной матрицей
Каждый пиксель разложен на цветовые компоненты в пространстве
R, G, B-палитры,
R -красный,
G -зелёный,
B -синий.
Для получения
характеристик окраски и формы объектов более предпочтительным
является дискретное вейвлет (wavelet) – преобразование, представляющее
собой свёртку исходного сигнала с низкочастотными и высокочастотными
фильтрами, порождающими грубую аппроксимацию и детализирующие
коэффициенты. Получение коэффициентов вейвлет – преобразования
наиболее эффективно с
помощью вейвлетов Хаара. Результирующий
спектр состоит из спектров цветовых компонент R, G и B, взятых

независимо друг от друга. Вычисленный вейвлет – спектр Z ={Z0, …, ZN-1}
функций цвета Rc, r  , Gc, r  и Bc, r  , где c и r – координаты пикселя,
образует векторное пространство X размерности n, которое называется
признаковым пространством. Когда исходное признаковое пространство
задано, осуществляется отбор меньшего числа наиболее информативных
признаков
(формирование
размерности).
Основными
признакового
методами,
пространства
применяемыми
меньшей
совместно
с
нейронными сетями, являются генетический алгоритм, метод главных
компонент (АГК) и факторный анализ. Применение генетического
алгоритма для понижения признакового пространства
потребовало
больших временных затрат. В пакете Statistica 6.1 реализован нелинейный
вариант АГК, основанный на применение автоассоциативных сетей. У
такой сети число выходов совпадает с числом входов, а все нейроны
10
имеют особое свойство. Если число элементов промежуточного слоя
сделать меньше числа входов/выходов, то это заставляет сеть "сжимать"
информацию,
представляя
ее
в
меньшей
размерности.
Критерий
«каменистой осыпи» при применении факторного анализа позволяет
быстро оценить количество главных факторов и оставить признаки с
наибольшей дисперсией. Для достижения требуемой точности оставлено
100 коэффициентов вейвлет – спектров.
В третьей главе определены принципы построения и предложена
методика создания НС для высокоточного распознавания в СТЗ.
Нейронную сеть можно представить, как некоторую многомерную
функцию
F:X→Y,
аргумент
которой
принадлежит
признаковому
пространству входов, а значение – выходному признаковому пространству.
Каждый нейрон нейронной сети выполняет суммирование сигналов,
поступающих от других нейронов, которые прошли через нелинейное
преобразование. Таким образом, персептрон аппроксимирует зависимости,
которые в общем случае являются функциями многих аргументов, причем
эту аппроксимацию персептрон выполняет с помощью суммы функций,
каждая из которых является функцией только одного аргумента. Теорема
Хехт-Нильсена обобщила теорему Колмогорова и Арнольда о том, что
любая непрерывная функция n переменных f(x1, x2, ... xn) всегда может
быть представлена в виде суммы непрерывных функций одного
переменного и показала, что она может быть аппроксимирована помощью
двухслойной нейронной сети с прямыми полными связями с n нейронами
входного слоя, (2n +1) нейронами скрытого слоя с заранее известными
ограниченными функциями активации (например, сигмоидальными) и m
нейронами выходного слоя с неизвестными функциями активации.
В качестве инструмента для построения искусственной нейронной
сети были использованы три наиболее известных и популярных пакета –
11
STATISTICA Neural Networks 6.1 (SNN), NeuroPro 0.25 и пакет Neural
Networks Toolbox(пакет расширения MatLab 7.0.1).
Экспериментальная установка (рис. 3), разработанная на кафедре
Пищевой инженерии и высоких технологий и на кафедре Общей
математики (КубГТУ, г. Краснодар), включает следующие этапы создания
«обучающей» базы данных (БД) для спектрального анализа плоского
изображения и последующего распознавания изображений:
1)
фото/видеосъёмка плодов на однотонном фоне; для «обучающей»
БД – известного сорта, для рабочего режима – сортосмеси,
подлежащей распознаванию;
2)
применение алгоритмов отделения фона и выделения пиксельных
изображений отдельных единичных плодов;
3)
установление центра масс объекта, угла поворота относительно
начальной системы координат и размера каждого изображения,
перенос начало координат в центр масс объекта и поворот осей
координат таким образом, чтобы ось абсцисс проходила вдоль
максимального удлинения объекта;
4)
нормализация
размера
зависимости
от
объекта
разрешения
таким
образом,
анализируемого
чтобы
вне
изображения
геометрические размеры всех объектов совпадали;
5)
проведение
дискретного
вейвлет
–
преобразование цветовых
составляющих всех точек (пикселей), принадлежащих выделенной в
предыдущих
коэффициенты;
пунктах
отбросить
области;
упорядочить
незначащие
элементы
полученные
полученного
упорядоченного массива;
6)
для «обучающей» БД – сохранить полученные данные в БД
единичных вейвлет – спектров;
7)
для нейросетевых (НС) методов распознавания БД единичных
вейвлет – спектров является обучающей выборкой;
12
8)
для рабочего режима вейвлет – спектр элементов сортосмеси,
подлежащей распознаванию, подаётся на вход разработанной НС.
Выход НС идентифицирует элементы сортосмеси.
Рисунок 3 – Схема лабораторной установки и этапы создания
«обучающей» БД: 1 – ёмкость с непрозрачными стенками, 2 – матовое
стекло, 3 – отверстие для фотоаппарата, 4 – лампы искусственного
освещения, 5 – поддон для зерна, 6 – зёрна
Объектами исследований являлись: элитные сорта нешлифованного
риса, рис шлифованный и шелушенный, бобовые и масличные культуры,
тритикале и пшеница. Сорта риса Краснодарский 424, Лиман, Кулон,
Регул, Изумруд произведены на сортучастках ВНИИ риса (рис.4). . Более
1000 зерновок дали материал для составления обучающей, тестирующей и
контрольной выборки. Анализ объектов исследования показал, что
показатель L/A(отношения длины к ширине риса) у исследованных сортов
риса варьирует в широком диапазоне. При сопоставлении показателей
уровня варьирования L/A обнаружены существенные отличительные
особенности.
Пределы
варьирования
показателя
L/A
существенно
превышают пределы доверительной области, что не позволяет точно
осуществлять идентификацию риса.
13
а
б
в
г
д
е
ж
з
и
к
Рисунок 4 а – сорт Краснодарский 424; б – сорт Лиман; д – сорт Кулон;
ж – сорт Регул; и – сорт Изумруд; б, г, е, з, к – вариабельность
контура соответствующего сорта
Для создания нейросетей важной задачей является нахождение
оптимального размера сети – такого числа скрытых слоёв и нейронов в
слоях, которые дадут минимум ошибки обобщения. Использовано два
подхода: теоретический, как следствие из теорем Арнольда-КолмогороваХехт-Нильсена и практический, с использованием “кривых обучения” –
зависимостей ошибок обучения и обобщения от размеров нейросети.
Оптимуму соответствуют локальные минимумы или моменты выхода
графиков на асимптоты (рис. 5б). Эксперимент поводился для задачи
классификации
5
сортов
не
шлифованного
риса.
Архитектура:
многослойный персептрон с 249 нейронами на входе, в промежуточном
слое находилось от 1 до 126 нейронов (рис. 5а).
40
ошибка обобщения,%
35
30
25
20
15
10
5
0
10
20
30
40
50
60
70
80
90
100
110
кол-во нейронов промежуточного слоя
а)
б)
Рисунок 5 а – топология сети,  – нейроны входного слоя,
□ – нейроны с сигмоидной функций активации; б – зависимость
ошибки распознавания от количества нейронов в скрытом слое
14
Необходимое количество нейронов в скрытых слоях персептрона
определяется по формуле, являющейся следствием из теорем АрнольдаКолмогорова-Хехт-Нильсена :
 Q

 N w  N y 
 1N x  N y  1  N y ,
1  log 2 Q 
 Nx

N yQ
(1)
где Ny – размерность выходного сигнала, Q – число обучающих
примеров; Nw – необходимое число синаптических связей; Nx –
размерность входного сигнала.
Оценив с помощью этой формулы необходимое число синаптических
связей Nw, рассчитано необходимое число нейронов в скрытых слоях.
Число нейронов скрытого слоя двухслойного персептрона будет равно:
N
Nw
. И теоретические вычисления и кривая обучения определяют
Nx  Ny
оптимальный размер от 40 до 50 нейронов в промежуточном слое.
По требованию теоремы Хехт-Нильсена в нейронных сетях как для
первого (скрытого), так и для второго (выходного) слоя использованы
сигмоидальные передаточные функции с настраиваемыми параметрами.
При заданном наборе обучающих примеров
ошибки,
обучение
нейронной
сети
является
и виде функции
многоэкстремальной
невыпуклой задачей оптимизации. Ее целью является нахождение на
многомерной поверхности самую низкую точку. Отталкиваясь от
случайной точки поверхности, алгоритм обучения постепенно отыскивает
глобальный минимум. Для сети типа Многослойный персептрон (MLP)
очень хороший результат показывает метод сопряженных градиентов и
классический алгоритм обратного распространения ошибки. Ошибка
обучения для построенной нейронной сети вычисляется путем сравнения
выходных и целевых (желаемых) значений. Из полученных разностей
формируется функция ошибок. Функция ошибок – это целевая функция,
требующая минимизации в процессе управляемого обучения нейронной
15
сети. С помощью функции ошибок можно оценить качество работы
нейронной сети во время обучения.
Чтобы оценить полученный метод классификации, был проведен
эксперимент по разделению 5 сортов не шлифованного риса с помощью
нейронной сети (табл. 1).
Таблица 1 – Матрица классификации для многослойного персептрона в
Statistica 6.1
Класс
Доля
(кол-во)
правил. ( %)
Регул
Изумруд
Красн.-424
Кулон
Лиман
Регул
Изумруд
98
100
266
0
0
284
2
0
1
0
0
0
Красн.-424
97
0
0
181
1
1
Кулон
97
2
0
1
132
3
Лиман
97
1
0
1
2
135
Всего
98,5
269
284
185
136
139
Архитектурой сети является двухслойный персептрон (рис. 6),
функция активации – сигмоидная (логистическая), функция ошибки
–
SOS(равна сумме (взятой по всем наблюдениям) квадратов разностей
целевых и фактических значений). Для определения способности сети
заданной конфигурации решить задачу, оценивали константу Липшица
сети (2) и сравнивали ее с выборочной оценкой (3).

 n  sup F x   F  y
 / x  y  , где F –вектор-функция от входных сигналов (2)
x, y


 t  max f x i   f x j  / x i  x j , где fi – значения функции в точках xi
i j
(3)
В случае  n   t сеть не способна решить задачу. Выборочная
константа Липшица равна в нашем эксперименте 1,79 при норме разности
векторов входных сигналов 1,57. Для снижения значения константы
Липшица функция активация заменена на гиперболический тангенс.
16
Рисунок
6 – Архитектура сети:  – нейроны входного слоя,
□ – нейроны с сигмоидной функций активации
○ – нейроны с функцией активации гиперболический тангенс
«Бинарное» – т.е. настройка на основной сорт и примеси –
разделение для НС более эффективно. Так, задача разделения двух
проблемных для НС сортов Регул и Лиман решается с помощью сети
встречного распространения (LVQ) в Neural Networks Toolbox: все зёрна
(24 зерна сорта Регул и 35 зерна сорта Лиман) опознаны полностью.
Выделение 188 зёрен сорта Изумруд из смеси с добавлением 10
зёрен сорта Лиман, 10 зёрен сорта Кулон и 9 эллипсоидных примесей дало
нулевую ошибку распознавания. Обучение проведено методом обратного
распространения и методом сопряжённых градиентов. Выборочная
константа Липшица равна 0,963 при норме разности векторов входных
сигналов 2,076.
Нулевую ошибку распознавания дало также выделение с помощью
вероятностной нейронной сети (ВНС) 189 зёрен сорта Лиман из смеси с
добавлением 29 зёрен сорта Изумруд и зерен тритикале. Сеть LVQ
полностью распознала тестовые выборки из смеси двух сортов Лиман и
Изумруд (39 – Изумруд и 42 – Лиман), Изумруд и Краснодарский 424
(38 – Изумруд и 45 – Краснодарский 424). Сеть LVQ состоит из входного
слоя нейронов и слоёв Кохонена и Гроссберга. Время их обучения для
задач распознавания почти в 100 раз меньше времени обучения сетей с
обратным распространением. На смеси сортов Изумруд (43 шт.),
17
Краснодарский (49 шт.), Кулон (49 шт.) показана ошибка распознавания
0,7 % (1 зерно Кулона не опознано).
Более сложной задачей классификации является разделение зерен
шлифованного и шелушенного риса одного сорта. У шелушенного риса
при предварительной очистке удаляется только шелуха, поверхностный
слой. Поэтому он имеет более темную окраску, чем рис шлифованный. Из
115 шлифованных зерен были правильно классифицированы все (100 %
точность), а из 121 шелушенных – 2 были классифицированы как
шлифованные (98,35 % точности).
При обработке шлифованного риса самым трудно отделимым
засорителем является битое стекло, так как по цвету и полупрозрачности, а
иногда и по форме, оно имеет большое сходство с зерновкой. В 121
шлифованное зерно было добавлено 20 кусочков битого стекла, по форме
и размеру наиболее близкие к зерновкам. Все примеси были выделены с
100 % результатом.
Таблица 2 – Сравнение точности распознавания для различных
программных реализаций для пяти сортов нешлифованного риса
Сорта/Метод
Дискрим. анализ
%
NeuroРro 0.25
%
Statistica (MLP)
%
MatLab (PNN) %
Регул
Изумруд
Красн.-424
Кулон
Лиман
Всего
89,2
99,3
93,5
92,6
100
94,77
82,9
100
100
86
80
89,87
98,0
100
97
97
97
98,5
79,0
97,5
100
100
75
93,5
В четвертой главе рассмотрены вопросы практического применения
приложений, созданных на основе разработанных методов и алгоритмов.
Для развития пищевой промышленности необходимо внедрение
экспертных систем (ЭС) мониторинга показателей безопасности и качества
18
в процесс производства. Инспекция сырья является одним из этапов
технологического процесса, от качества проведения которой зависит в
дальнейшем качество конечного продукта, и проводится с целью удаления
непригодных для переработки семян и плодов, а также посторонних
примесей и предметов. Рассмотрена нейросетевая реализация блока
распознавания
вычислительного
ядра
ЭС.
В
нейросетевом
блоке
видеоизображение семян и плодов, подвергнутое спектральному вейвлетпреобразованию,
является
входом
многослойной
нейронной
сети,
выходной нейрон которой принимает решение об отбраковке и др.
Одним их этапов технологического процесса является разделение
масличных культур на сорта и выделение неочищенных зёрен из общей
массы. Для разделения использовались сорта Сур (рис. 7а) и Мастер,
которые относятся к гибридным сортам подсолнечника. Архитектура сети:
многослойный персептрон с 48 входами, одним промежуточным слоем и
двумя выходами, функция активации нейронов – логистическая, функция
ошибок SOS (равна сумме (взятой по всем наблюдениям) квадратов
разностей целевых и фактических значений). Все 46 зерен сорта Мастер
были правильно классифицированы (100 % правильной классификации), а
2 зерна сорта Сур из 34 были неправильно классифицированы как сорт
Мастер
(95
%
правильной
классификации).
Наличие
ошибки
распознавания обосновано высокой вариабельность сортов, особенно у
сорта Сур (рис. 7б). Отделение очищенного зерна подсолнечника дает 100
% распознавание.
а)
б)
Рисунок 7 а – зерно сорта Сур; б – вариабельность контура
подсолнечника сорта Сур
19
Объектом исследования были сорта кукурузы (рис. 8), которые
используются
в консервной промышленности. Архитектура сети –
многослойный персептрон с 54 входными нейронами, промежуточный
слой из 34 нейронов и один нейрон на выходе (рис. 9). Функция активации
нейронов – логистическая, функция ошибок SOS (равна сумме (взятой по
всем
наблюдениям)
квадратов
разностей
целевых
и
фактических
значений). Контрольная производительность равна 1, тестовая – 0,928,
ошибка обучения – 0,000110. Для нейронной сети классификации мера
производительности
обозначает долю правильно классифицированных
наблюдений. Обучение – алгоритм обратного распространения на 100 эпох
и метод сопряженных градиентов с восстановлением сети с наименьшей
контрольной ошибкой. Из 42 негодных для консервирования зерен только
одно зерно ошибочно было признано годным (97,62 %
правильной
классификации). Поскольку отбраковка шла по внешним повреждениям,
такой
процент
ошибки
является
допустимым
для
консервной
промышленности.
а
б
в
Рисунок 8 а – Исходные изображения кукурузы, б – вариабельность
контуров пригодных зёрен, в – отбракованных зёрен.
Третьим объектом исследования был консервированный зелёный
горошек (рис. 9). Архитектура сети – многослойный персептрон с 250
нейронами на входе, два промежуточных слоя по 127 нейронов и один на
выходе. Функция активации нейронов – логистическая, функция ошибок
SOS (равна сумме (взятой по всем наблюдениям) квадратов разностей
20
целевых и фактических значений). Контрольная производительность равна
0,937, тестовая –
0,9937, ошибка обучения – 0,00199. Алгоритмы
обучения: первый этап – алгоритм обратного распространения в 100 эпох,
второй этап – метод сопряженных градиентов. Для обоих этапов
применялась затухающая регуляризация весов с параметром 0,01. Из 22
горошин с внешними повреждениями только одно зерно было признано
годным к консервированию (95,45 % правильной классификации).
а
б
в
Рисунок 9 а – Исходные изображения отбракованных зерен горошка,
б – вариабельность контуров пригодных зёрен, в –
отбракованных зёрен
Решена задача выделения примеси тритикале сорта Авангард из
пшеницы сорта Победа-50. Сорт Авангард является сортом тритикале
кормового назначения. Зерно данного сорта крупное, удлиненное, светлокрасное (рис. 10а). По внешним признакам сильно напоминает зерна
пшеницы. Наличие зерен тритикале в виде примеси для пшеницы при
переработке в хлебопекарную муку
изменяют ее качество в сторону
ухудшения. Сорт пшеницы Победа-50 относится к полукарликовым
высококачественным зимостойким сортам озимой мягкой пшеницы. Зерно
крупное, янтарно-коричневое, яйцевидно-удлинённой формы (рис. 10б).
а
б
в
г
Рисунок 10 а – Тритикале Авангард; б – вариабельность контура
тритикале; в – пшеница Победа-50; г – вариабельность
контура пшеницы
21
Из 60 зерен сорта Авангард только одно зерно тритикале было
опознано как пшеница (98,33 % точности), все 72 зерна пшеницы Победа50 были правильно классифицированы(100 % правильной классификации).
Таким образом, применение стандартной топологии нейронной сети – многослойного персептрона, без изменения функции активации и
функции ошибки, с использованием градиентных методов обучения
первого и второго порядка позволило провести достаточно качественную
оценку качества входной продукции для разных видов овощных и
масличных культур.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ И ВЫВОДЫ.
1.
В результате системного исследования показано, что для решения
ряда актуальных задач селекции и семеноводства, управления
технологическими процессами и др., необходимое повышение
эффективности функционирования СТЗ до экспертного уровня
точности,
для
происхождения
распознавания
с
сильной
массовых
объектов
внутриклассовой
природного
вариабельностью,
достигается методом нейронных сетей.
2.
Обоснован выбор признакового пространства на основе вейвлет преобразований Хаара для распознавания объектов с большой
визуальной внутриклассовой вариабельностью.
3.
Составлена обучающая база данных из вейвлет - спектров функций
цвета для программного комплекса нейросетевого распознавания
объектов природного происхождения, имеющих сильную визуальную
вариабельность внутриклассовых свойств.
4.
Предложен подход к построению нейронной сети на основе
многослойного персептрона, позволяющей провести распознавание
максимально
обучения.
уровня
точности,
выбран
подходящий
алгоритм
22
5.
Проведены
эксперименты
по
проверке
работоспособности
и
эффективности разработанной нейронной сети на различных объектах
природного происхождения. Применение нейросетевого механизма
классификации позволяет провести 98,5 % правильного разделения по
сортам злаковых, масличных и бобовых культур, а также производить
100 % выделение примесей из сортосмеси.
6.
Разработано
программное
обеспечение
для
базы
данных
для
лабораторного стенда экспертного уровня распознавания сортов
злаковых, масличных и бобовых культур.
7.
Программно реализована система распознавания сортов и выделения
примесей нейросетевого блока экспертной системы контроля качества
при производстве консервов из растительного сырья.
Основные публикации по теме диссертации
Статьи в журналах, рекомендуемых ВАК для публикации результатов
диссертаций на соискание ученой степени доктора и кандидата наук:
1.
Руденко О.В. База данных обучающей выборки для высокоточного
распознавания плоских изображений сортов злаковых и масличных
культур / Руденко О.В., Горонков К.А.,
Усатиков C.В. // Журнал
«Фундаментальные исследования». М., 2011. Вып. 8. Ч. 2. С. 342-346.
2.
Руденко О.В. Нейросетевое распознавание в технических системах
зерноперерабатывающей и пищевой промышленности / Руденко О.В.,
Усатиков C.В. // Современные проблемы науки и образования. 2011.
№ 3 (Электронный журнал).
3.
Руденко О.В. Блок распознавания растительного сырья экспертной
системы мониторинга показателей безопасности и качества при
производстве консервов / Бородихин А.С., Горонков К.А., Руденко О.В., Троянова Т.Л., Усатиков С.В. // Журнал «Фундаментальные
исследования». М., 2011. Вып.8. Ч. 3. С. 607-612.
23
Другие издания
1.
Руденко О.В. О точности распознавания по контуру изображений
злаковых культур при помощи нейронных сетей / Усатиков С.В.,
Руденко
О.В.,
Горонков
К.А.
//
Обозрение
прикладной
и
промышленной математики. М., 2009. Т. 16. Вып. 3. С. 567-569.
2.
Руденко О.В. Возможности распознавания изображений злаковых
культур с помощью нейронных сетей // Материалы I Межвузовской
научно-практической конференции «Автоматизированные информационные и электроэнергетические системы», Краснодар, 2010.
С. 138-141.
3.
Руденко
О.В.
Топология
нейронной
сети
высокоточного
распознавания сортов зерновых культур / Усатиков С.В., Руденко О.В., Горонков К.А. // Обозрение прикладной и промышленной
математики, М., 2010. Т. 17. Вып. 5. С. 780-781.
4.
Руденко
О.В.
Высокоточное
нейросетевое
распознавание
в
технических системах зерноперерабатывающей промышленности /
Усатиков С.В., Руденко О.В. // Материалы II международной научнопрактической
конференции
«Хлебобулочные,
кондитерские
и
макаронные изделия XXI века», Краснодар, 2011. С. 275-278.
Свидетельство о регистрации программ.
1.
Нейросетевая модель для классификации сортов риса: Свидетельство
о государственной регистрации программы для ЭВМ №2011613332 (в
Реестре программ для ЭВМ) от 28.04.2011/ Руденко О.В.
2. Программная оболочка для базы данных обучающей выборки для
высокоточного распознавания плоских изображений сортов зерновых
культур: Свидетельство о государственной регистрации программы
для ЭВМ №2011615407 (в Реестре программ для ЭВМ) от
11.07.11/Усатиков С.В., Горонков К.А., Руденко О.В.
24
Подписано в печать 25.10.2011. Печать трафаретная.
Формат 60x84 1/16. Усл. печ. л. 1,35. Тираж 100 экз. Заказ № 548.
Отпечатано в ООО «Издательский Дом-Юг»
350072, г. Краснодар, ул. Московская 2, корп. «В», оф. В-120, тел. 8-918-41-50-571
e-mail: olfomenko@yandex.ru
Сайт: http://id-yug.narod2.ru
Download