Анализ точности нейросетевого решения задачи

advertisement
ISBN 978-5-7262-1376-7. НЕЙРОИНФОРМАТИКА – 2011. Часть 2
1
О.А. МИШУЛИНА1, М.Б. БАКИРОВ2, И.А. КРУГЛОВ1
Национальный исследовательский ядерный университет «МИФИ»,
Москва
2
Центр материаловедения и ресурса, Москва
mishulina@gmail.com, testm@orc.ru, i-kruglov@yandex.ru
АНАЛИЗ ТОЧНОСТИ НЕЙРОСЕТЕВОГО РЕШЕНИЯ
ЗАДАЧИ ВОССТАНОВЛЕНИЯ
МЕХАНИЧЕСКИХ ХАРАКТЕРИСТИК МЕТАЛЛА
В статье рассматривается задача оценивания механических характеристик металла на основе данных диаграммы индентирования. В работе
проведено исследование особенностей экспериментальных и модельных
данных и показана плохая обусловленность решаемой задачи. Для повышения точности оценок предложено использовать нейросетевую структуру. Приводятся результаты моделирования и обсуждаются вопросы точности и устойчивости оценок механических характеристик металла в
условиях неточных измерений.
Ключевые слова: нейросетевая структура, механические характеристики
металла, плохо обусловленная задача, повышение точности
Введение
Такие механические характеристики металла, как предел текучести,
временное сопротивление, показатель деформационного упрочнения, характеристики пластичности являются основополагающими при проектировании и эксплуатации конструкций. Традиционно эти базовые механические характеристики определяются путем испытания образцов на растяжение [1]. Образцы, изготовленные из металла испытуемого оборудования, во время эксперимента деформируются на специальной испытательной машине в области упругих, а затем и необратимых пластических деформаций, имитируя возможное поведение материалов в критических
ситуациях работы оборудования. На основе результатов эксперимента
строится диаграмма растяжения, которая отражает зависимость относительного удлинения образца от приложенной к нему нагрузки.
Описанный метод относится к классу разрушающих и не всегда может
быть применён на практике к оборудованию, находящемуся в эксплуатации. В качестве примера можно привести контроль механических харакУДК 004.032.26(06) Нейронные сети
164
ISBN 978-5-7262-1376-7. НЕЙРОИНФОРМАТИКА – 2011. Часть 2
теристик металла корпуса ядерного реактора в процессе его эксплуатации.
В подобных ситуациях могут быть применены только методы, не наносящие существенных повреждений исследуемому изделию. Одним из них
является метод кинетического индентирования [2, 3].
Метод кинетического индентирования основан на непрерывной регистрации параметров процесса упруго–пластического вдавливания индентора в исследуемый образец под действием нагрузки, приложенной перпендикулярно поверхности образца. Таким образом достигается качественная аналогия с испытанием на растяжение образца. Определение
твёрдости материала путём внедрения в поверхность образца жёсткого
индентора привлекает исследователей относительной простотой и возможностью применения для экспресс-оценки текущего состояния металлических конструкций. Известно немало теоретических и экспериментальных работ, в которых делались попытки связать характеристики твёрдости материалов с другими их свойствами (пределом текучести, временным сопротивлением) или же восстановить диаграмму одноосного растяжения (сжатия). Однако до сих пор не существует строгого теоретического подхода, связывающего параметры диаграмм индентирования и растяжения.
В работе рассматривается метод восстановления диаграммы растяжения по характеристикам диаграммы индентирования, основанный на
нейросетевой обработке экспериментальных данных.
Постановка задачи и предварительный анализ данных
Задача, поставленная в работе, состоит в определении механических
характеристик металла σiT (предел текучести) и m (показатель упрочнения) и восстановлении диаграммы растяжения σ(ε) (зависимость удлинения образца ε от нагрузки σ) по диаграмме индентирования F(h) (зависимость глубины индентирования h от приложенной к индентору силы F).
Кроме представления результатов индентирования в форме диаграммы
F(h), для целей последующей обработки может быть использован другой
способ – задание коэффициентов полиномиальной аппроксимации диаграммы F(h) или аппроксимации сплайнами.
Таким образом, рассматриваются две модели напряженнодеформированного состояния металла: σ(ε) и F(h). Под прямой задачей
понимается построение модели F(h) при известной модели σ(ε) (известных характеристиках σiT и m), а под обратной задачей – построение σ(ε)
УДК 004.032.26(06) Нейронные сети
165
ISBN 978-5-7262-1376-7. НЕЙРОИНФОРМАТИКА – 2011. Часть 2
на основании F(h). В этой терминологии целью работы является решение
обратной задачи.
Основой для решения задачи является набор экспериментальных данных. Каждый пример набора обозначим вектором  x p  , y  p   ,

p = 1, 2,…, P, где p – номер примера; x p   x1 p  , x2 p  ,..., xN p 

– вектор
полученных в эксперименте (физическом или модельном) значений, характеризующих диаграмму индентирования; y  p  – значение одной из
механических характеристик металла (σiT или m). В качестве компонентов
вектора x  p  могут использоваться аппроксимирующие коэффициенты
полиномиальной аппроксимации диаграммы индентирования, абсолютные и относительные значения глубин индентирования при различных
уровнях нагрузки или другие характеристики диаграммы. Формально задача состоит в нахождении на основании имеющегося набора данных такого функционального отображения y  (x) , которое для произвольных
входных значений x  x1, x2 ,..., x N  в заданном диапазоне позволит определить искомую величину y с удовлетворительной точностью. В работе
предлагается строить функциональное отображение y  (x) в классе
нейронных сетей.
Поскольку при регистрации экспериментальной диаграммы индентирования неизбежны погрешности, для определения величины y с погрешностью не выше y необходимо, чтобы для входных значений
x  x1, x2 ,..., x N  , неразличимых с точки зрения погрешности измерений,
выходные значения y, формируемые нейронной сетью, отличались не более чем на y . Для исследования свойств функции (x) и возможности
оценивания с требуемой точностью характеристик σiT и m на основе параметров диаграммы индентирования проведена серия экспериментов.
Проанализируем располагаемую выборку данных на предмет наличия
в ней групп примеров, имеющих близкие по значениям векторы входов.
Будем считать, что вектор x  p1  отличается от вектора x  p2  (
p1 , p2  1, 2,..., P , p1  p2 ) не более чем на l %, если
N
xi p1   xi p2 
i 1
xi p2 

 0, 01l N .
УДК 004.032.26(06) Нейронные сети
(1)
166
ISBN 978-5-7262-1376-7. НЕЙРОИНФОРМАТИКА – 2011. Часть 2
При проведении исследования рассматривались два способа формирования вектора x p . В первом варианте в качестве компонентов вектора использовались коэффициенты аппроксимации диаграммы индентирования
кубической параболой, во втором – значения глубин вдавливания индентора на разных уровнях нагрузки (уровни нагрузки варьировались). Проведенный анализ показал, что при любом способе формирования вектора
x  p  для множества диаграмм индентирования (выборочных примеров),
для которых векторы x  p  отличаются не более чем на 1 % в смысле критерия (1), значения характеристик σiT и m могут отличаться на десятки и
даже сотни процентов (см. табл. 1).
Таблица 1
Расхождение выходных значений в выборочных примерах
Средний / максимальный процент расхождения значений выходов в группах,
где входы различаются не более чем на
1%
σiT
m
Тип входов
Коэффициенты полиномиальной аппроксимации
Глубины индентирования при
уровнях нагрузки 50, 100 и
200Н
0.8 / 13.6
2.3 / 33.3
18.2 / 46.2
60.4 / 180.0
Данные, представленные в табл. 1, позволяют заключить, что задача
определения значений механических характеристик металла по диаграмме
индентирования является плохо обусловленной. Другой вывод из проведенного анализа состоит в предпочтительности использования коэффициентов аппроксимирующей параболы для оценки искомых механических
характеристик металла.
Экспериментально установлено, что на одном многослойном персептроне не удается решить поставленную задачу с требуемым уровнем точности во всей области рассматриваемых значений σiT и m. Среднеквадратичный критерий, используемый при обучении многослойного персептрона, обеспечивает минимизацию статистически осредненной ошибки и
допускает значительные локальные погрешности воспроизведения функции, которую он реализует. В работе предлагается более сложная органиУДК 004.032.26(06) Нейронные сети
167
ISBN 978-5-7262-1376-7. НЕЙРОИНФОРМАТИКА – 2011. Часть 2
зация нейросетевой модели функции (x) , которая реализуется на
нейросетевой структуре.
Нейросетевая структура
Основная идея, лежащая в основе архитектуры предлагаемой нейросетевой структуры, заключается в использовании нескольких многослойных
нейронных сетей (МНС) [4], реализующих функцию (x) и обучающихся
на различных выборках, с последующим выбором лучшей оценки, привлекая решение соответствующей прямой задачи. Схема нейросетевой
структуры представлена на рис. 1.
МНС 2
МНС K
2
Сеть принятия
решения
МНС 1
Блок сравнения результатов
Характеристики диаграммы
индентирования
1
iT , m
МНС
Рис. 1. Нейросетевая структура для решения обратной задачи восстановления
механических характеристик металла по данным диаграммы индентирования
УДК 004.032.26(06) Нейронные сети
168
ISBN 978-5-7262-1376-7. НЕЙРОИНФОРМАТИКА – 2011. Часть 2
В основе нейросетевой структуры лежат два блока нейросетей. Первый блок (верхняя группа сетей на рис. 1) состоит из K МНС, каждая из
которых решает обратную задачу, то есть по выборочным данным x p  ,
p  1, 2,..., P (коэффициентам аппроксимирующего полинома для диаграммы индентирования) формирует оценки механических характеристик
y  p , k  , k  1, 2,..., K , p  1,2,...,P . Ввиду плохой обусловленности обратной задачи каждая из сетей МНС-k обеспечивает удовлетворительную
точность лишь в некоторых локальных областях пространства входных
признаков, расположение которых обусловлено рядом факторов, связанных с процедурой обучения (состав обучающей выборки, случайная инициализация сети и пр.). Для каждого входного вектора признаков x  p 
формируется K предварительных оценок ~
y  p,k  для σiT и m. Из них необходимо выбрать несколько наиболее правдоподобных. Для этой цели используются результаты работы второго блока нейросетевой структуры
(см. рис. 1), состоящего из одной МНС, решающей прямую задачу. Поскольку прямая задача, в отличие от обратной, хорошо обусловлена, то
такая сеть может быть обучена на воспроизведение диаграмм индентирования с заданной степенью точности [5]. Для каждой из K первичных оценок ~
y  p,k  нейросеть, решающая прямую задачу, вычисляет значения коэффициентов аппроксимирующей параболы x p,k  . Наиболее правдоподобными считаются те оценки ~
y  p,k  , для которых диаграммы индентирования, задаваемые вектором параметров x p , k  , расположены ближе всего
к исходной диаграмме, задаваемой вектором x p . Блок сравнения результатов по изложенному правилу отбирает M лучших оценок для σiT и m,
которые передаются на вход сети принятия решения (многослойный персептрон). Эта сеть формирует окончательное значение оценки механических характеристик.
Главной особенностью описанного нейросетевого подхода является
способ косвенной оценки точности нейросетевого решения обратной задачи аппроксимации функции путем решения хорошо обусловленной
прямой задачи. Предложенный способ позволяет отобрать группу сетей,
которые при заданном входном векторе дают наиболее точный результат.
Обучение нейросетевой структуры
УДК 004.032.26(06) Нейронные сети
169
ISBN 978-5-7262-1376-7. НЕЙРОИНФОРМАТИКА – 2011. Часть 2
Для обучения НС структуры использован набор данных, содержащий
86 модельных примеров, в которых диаграмма индентирования рассчитана методом конечных элементов. Из располагаемого набора данных случайным образом отобраны 80% примеров для обучения нейросетевой
структуры, а 20% оставлены на её тестирование. Для проверки качества
обучения каждой из сетей (отдельно от всей структуры в целом) из обучающей части дополнительно выделялись валидационные примеры. Таким образом, каждая сеть в составе структуры обучалась на индивидуальном подмножестве примеров, случайно отобранном из общей обучающей
части выборки. Использованная схема составления обучающих и тестовых выборок основана на идее метода кросс-валидации [6].
На рис. 2 представлены результаты тестирования обученной НС структуры для 30 различных случаев разбиения исходного набора данных на
общую обучающую и тестовую части согласно описанной выше схеме.
Приведенные результаты были получены для K=10 нейронных сетей в
первом блоке НС структуры (см. рис. 1). Каждая сеть состояла из двух
рабочих слоёв, содержащих 3 (для m) или 5 (для iT ) нейронов в каждом
слое. Функции активации нейронов рабочих слоёв – сигмоидальные (гиперболический тангенс), выходного нейрона – линейные. На вход сети
принятия решения поступало M  2 лучших значения, отобранных по
результатам работы сети, решающей прямую задачу (блок 2 на рис. 1).
Экспериментально установлено, что выбранное значение параметра M
является оптимальным.
УДК 004.032.26(06) Нейронные сети
170
ISBN 978-5-7262-1376-7. НЕЙРОИНФОРМАТИКА – 2011. Часть 2
Рис. 2. Гистограммы относительных ошибок для нейросетевой структуры
и отдельной НС
Помехоустойчивость нейросетевого решения
Поскольку при выполнении реальных измерений неизбежно возникновение ошибок, необходимо проверить полученное нейросетевое решение
на помехоустойчивость. Под уровнем шума в n % , будем понимать добавление к значению глубины индентирования h в каждой точке диаграммы случайной ошибки, распределенной по нормальному закону с нулевым математическим ожиданием и среднеквадратическим отклонением,
0.01nh
равным
. В табл. 2 приведены показатели точности работы сетей
3
на тестовой части выборки для случаев, когда оценка параметра iT или
m формируется одной сетью и нейросетевой структурой.
Таблица 2
Результаты тестирования при 5 % уровне шума
Тип модели
Показатель
МНС
σiT
m
УДК 004.032.26(06) Нейронные сети
НС структура
σiT
m
171
ISBN 978-5-7262-1376-7. НЕЙРОИНФОРМАТИКА – 2011. Часть 2
точности
Средняя относительная ошибка
Максимальная относительная
ошибка
14,0 %
23,4 %
10,8 %
18,3 %
47,8 %
110,8 %
26,4 %
63,8 %
Данные в табл. 2 соответствуют средним результатам для 100 проведенных экспериментов. Каждый эксперимент состоял в разбиении случайным образом (с сохранением заданных пропорций) исходного набора
данных на обучающую, тестовую и валидационную части, обучении одной сети и нейросетевой структуры решению обратной задачи и сравнении результатов их работы на тестовой выборке. Как видно из приведенных результатов, НС структура позволяет добиться большей точности
решения обратной задачи.
Заключение
В работе рассмотрена задача построения оценок механических характеристик металлов на основе результатов кинетического индентирования.
Показано, что рассматриваемая задача является плохо обусловленной и не
может быть решена на одной многослойной нейронной сети с требуемой
точностью. Предложена нейросетевая структура, которая предполагает
использование комитета нейронных сетей. Экспериментально показано,
что с использованием нейросетевой структуры достигается статистически
значимое повышение точности оценок механических характеристик исследуемого металла в условиях реальных погрешностей измерений диаграммы индентирования.
Предложенная методика может быть применена и в других приложениях, в которых типовые решения не позволяют обеспечить требуемую
точность аппроксимации функции многих переменных.
УДК 004.032.26(06) Нейронные сети
172
ISBN 978-5-7262-1376-7. НЕЙРОИНФОРМАТИКА – 2011. Часть 2
Список литературы
1.
Малинин Н.Н. Прикладная теория пластичности и ползучести. –
М.: Машиностроение. 1975. 400 с.
2.
Бакиров М.Б. Потапов В.В. Фролов И.В. Разработка расчётноэкспериментальных методик получения механических характеристик на
основе метода кинетического индентирования // «Мир измерений», № 8.
2006. С. 5–11.
3.
Бакиров М.Б. Зайцев М.А. Фролов И.В. Математическое моделирование процесса вдавливания сферы в упруго-пластическое полупространство // «Заводская лаборатория. Диагностика материалов». Том 67,
№ 1. С. 48–59.
4.
Хайкин С. Нейронные сети: полный курс, 2-е издание. – М.: Издательский дом «Вильямс». 2006. 1104 с.
5.
Бакиров М.Б., Киселев И.А., Круглов И.А., Мишулина О.А.
Нейросетевой подход к восстановлению механических характеристик металла по результатам кинетического индентирования // XII Всероссийская
научно-техническая конференция «Нейроинформатика-2010». Сборник
научных трудов. Часть 2. М.: МИФИ. 2010. С. 218–226.
6.
Efron B. Tibshirani R. An introduction to the bootstrap. London:
Chapman and Hall. – 1993.
УДК 004.032.26(06) Нейронные сети
173
Download