Институт энергосбережения и энергоменеджмента Кафедра автоматизации

advertisement
Институт
энергосбережения и
энергоменеджмента
Кафедра автоматизации
управления
электротехническими
комплексами
Автор: ст. Марченко А.А.
Руководитель: доц. Тышевич Б.Л.
Постановка задачи:
Исследование структуры, параметров,
функций активации алгоритмов обучения
нейронной сети эмулятора (НМЭ) для
адаптации графиков изменения уровня
радиационного фона, и нейронной сети для
прогнозирования (НСП) изменения уровня
радиационного фона. Наиболее точная
НМЭ и НСП будут базовыми при
создании
системы
прогнозирования
изменения радиационного фона.
Рассматривались многослойные сети, построенные с
помощью пакета прикладных программ MATLAB.
Карта размещения автоматизированных постов
контроля Чернобыльской зоны отчуждения
Автоматизированный пост контроля
(АКП)
Месячные графики изменения уровня радиации
полученные с помощью АКП
Понятие о нейроподобном
элементе и процессе его
обучения :
 Модель нейрона
 Модель процесса
обучения ИНС
Широкий спектр применения НС
объединяют общие характеристики
и свойства объектов:
 сложность или невозможность
математического описания;
 наличие стохастических составляющих в
процессах;
 большое количество нескоррелированных
параметров;
 выраженная нелинейность, нестационарность
в характеристиках;
 наличие параметрических и внешних
возмущений и т.д.
Общие и конкретные преимущества
и свойства НС по сравнению с
другими классическими подходами:
 способность решать неформализованные
задачи;
 параллелизм обработки информации;
 единый и эффективный принцип обучения;
возможность прогнозирования во времени
для процессов, которые зависят от многих
переменных.
Наиболее актуальные задачи в
идентификации и прогнозировании
радиационной ситуации, которые
можно решить с помощью НС:
Идентификация графика изменения уровня с
помощью нейронной модели-эмулятора НМЭ;
прогнозирование уровня с помощью
нейронной сети для прогноза НСП краткосрочное, среднесрочное и долгосрочное;
прогнозирование тенденции в изменении
уровня (нарастание или спад);
прогнозирование влияние погодных условий
на уровень радиации (в перспективе).
Критерии используемые для оценки
наилучшего результата для НМЭ и НСП
•Критерий регулярности:
 рег 
N
 (a
i 1
i
 ti )
N
t
i 1
2
i
аi – выход нейронной сети для входа pi;
ti – целевой выход для входа pi.
•Максимальная относительная погрешность
аппроксимации:
ai  ti
  max(
100%)
ti
2
 min
Примеры функций активации(ФА):
Сигмоидальная,
Полулинейная
логистическая
Полулинейная с
насыщением
Линейная с
насыщением
Линейная
Радиальнобазисная
Сигмоидальная
Треугольная (гиперболическая)
ДВУХСЛОЙНАЯ «КЛАССИЧЕСКАЯ»
НЕЙРОННАЯ СЕТЬ С РАЗЛИЧНЫМИ
ФУНКЦИЯМИ АКТИВАЦИИ
Х1,Х2 – компонент
входного вектора;
Wij – вес синапса;
S1,S2 – результат
суммирования;
Двухслойная сеть прямого
распространения
Y – выходной
сигнал нейрона;
Наилучший график полученный для
двухслойной НС (ФА=tansing,poslin) :
- критерий регулярности рег = 0,00036974 = 369,74e-6;
- максимальная относительная погрешность  = 8,3417%.
ТРЕХСЛОЙНАЯ «КЛАССИЧЕСКАЯ»
НЕЙРОННАЯ СЕТЬ
С РАЗНЫМИ ФУНКЦИЯМИ АКТИВАЦИИ
Наилучший график полученный для
трёхслойной НС(ФА=tansing,poslin,purelin):
- критерий регулярности рег = 0,00025156 = 251,56e-6;
- максимальная относительная погрешность  = 4,9629%
ЧЕТЫРЁХСЛОЙНАЯ «КЛАССИЧЕСКАЯ» НС.
СТРУКТУРНАЯ МОДЕЛЬ MATLAB:
Наилучший график полученный для
четырёхслойной НС
(ФА=tribas,tansing,poslin,purelin):
- критерий регулярности рег = 9,5331e-5=95,331е-6;
- максимальная относительная погрешность  = 3,9543%.
Влияние типов функций активации и
количества слоев на качество работы НМЭ:
Первый слой
Второй слой
Третий слой
Четвёртый слой
Количес Функци Количес Функци Количес Функци Количе Функци
тво
я
тво
я
тво
я
ство
я
нейроно активац нейроно активац нейроно активац нейрон активац
в
ии
в
ии
в
ии
ов
ии
10
tansig
1
poslin
10
tansig
5
poslin
1
purelin
10
logsig
5
poslin
1
purelin
10
radbas
5
poslin
1
purelin
10
tribas
5
poslin
1
purelin
20
tansig
10
tribas
5
poslin
1
purelin
20
tribas
10
tansig
5
poslin
1
purelin
20
radbas
10
tansig
5
poslin
1
purelin
Критери
и
качества
рег / 
369,74e-6
8,3417%
251,56е-6
4,929%
458,22е-6
7,238%
332,64е-6
6,0433%
247,54е-6
5,0497%
208,31е-6
5,5734%
95,331е-6
3,9543%
104,34е-6
4,0568%
Выводы:
 В процессе проведения тренировки по разным
алгоритмам было выявлено, что наиболее быстро
нейросеть тренировалась по методу ЛевенбергаМарквардта (trainlm).
 Как следует из сравнительной таблицы по всем
проведенным опытам, с увеличением слоев,
идентификация той нейросети лучше, в которой
первый слой имеет ФА tribas.
 Чем проще ФА следующего слоя по сравнению с ФА
предыдущего слоя, тем качественнее
идентификация исследуемого процесса.
 Исследования нейронных сетей как
идентификаторов сложных процессов позволило
определить необходимую достаточность по
допустимому качеству идентификации для
прогнозирования уровня радиационного фона.
В качестве НМЭ была принята (при
достаточном уровне точности) классическая
трехслойная сеть с 16 нейронами и  = 4,9629%
Четырехслойная нейронная сеть с 36
нейронами, при более высокой точности
требует значительно большего времени
обучения для значительного объема входных
данных.
Возможность
прогнозирования стохастических процессов
с помощью нейронных сетей
Все прогнозы отличаются как по точности, так
и по сроку прогнозирования. Можно выделить 3
вида прогноза:
- краткосрочный (до 5-10% от размера обучающей
выборки);
- среднесрочный (от 5-10% до 30-40%);
- долгосрочный (от 30-40% до 100%).
Оценка качества прогнозирования стохастического
процесса нейронными сетями различного типа и
конфигурации
Вид прогнозиро Название нейр
вания
онной сети
Долгосрочное
Долгосрочное
Долгосрочное
Каскадная
Каскадная
Конфигурация нейронной
сети
20tansig+10tribas+5poslin
+1purelin
20tansig+10tribas+5poslin
+1purelin
Рекуррентная
20tribas+10tansig+5poslin
Элмана
+1purelin
Среднесрочное
Каскадная
Среднесрочное
Каскадная
Краткосрочное
Классическая
Краткосрочное
Сеть с РБФ
20radbas+10tansig+poslin
+1purelin
20radbas+10tansig+poslin
+1purelin
20tribas+10tansig+5poslin
+1purelin
400radbas+1purelin
Алгоритм
обучения
сети
Критерий регул
ярности р, *10-6
Максимальная
относительная
погрешность
, %
trainlm
606,22
5,5524
trainbfg
5746,9
13,028
trainbfg
471,2
4,3464
trainlm
1787,8
8,3801
trainbfg
239,17
3,3347
trainlm
73,707
1,3948
-
0,85095
0,12987
Выводы:
 Наилучшие результаты долгосрочного прогнозирования
получены при использовании каскадных сетей
и рекуррентной сети Элмана
(для нее  р = 471,2 е-6,  = 3,3464%).
Для среднесрочного прогнозирования лучше
подошли каскадные нейросети
(р =239,17 е-6,  = 3,3347%).
Для краткосрочного прогнозирования
лучше подошли «классическая»
(р = 73,707 е-6,  = 1,3948%)
и сеть с РБФ ( р = 0,85095,  = 0,12987%).
Исследования нейронных сетей для прогнозирования уровня
радиационного фона и различных стохастических процессов с
помощью нейронных сетей требует более подробных
исследований.
Функциональный состав системы
Download