Построение нейросетевой модели идентификации

advertisement
Д.В. ПОЛУПАНОВ, Е.Г. ЛЕХОВА
Башкирский государственный университет, Уфа
demetrious@mail.ru, lekhova_e@mail.ru
ПОСТРОЕНИЕ НЕЙРОСЕТЕВОЙ МОДЕЛИ
ИДЕНТИФИКАЦИИ ПОТЕНЦИАЛЬНОЙ
НЕПЛАТЕЖЕСПОСОБНОСТИ ПРЕДПРИЯТИЙ
НА ОСНОВЕ БАЙЕСОВСКОГО ПОДХОДА
Рассматривается задача диагностики потенциальной неплатежеспособности предприятий. В качестве основного инструментария использованы
нейросетевые парадигмы самоорганизующихся карт Кохонена. Для повышения качества моделей использованы методы байесовской регуляризации
и селекции признаков.
Ключевые слова: самоорганизующиеся карты Кохонена, кластеризация, неплатежеспособность, байесовская регуляризация
Введение
Основная цель работы состоит в разработке модели диагностики неплатежеспособности как элемента процесса принятия решений при антикризисном управлении предприятием.
Высокая экономическая цена банкротств предприятия обуславливает
необходимость в моделях, предсказывающих подобные события. К настоящему времени существует множество как зарубежных, так и отечественных источников, содержащих рекомендации по диагностике платежеспособности предприятий, но возникает проблема выбора определенной методики, которая соответствовала бы предприятию конкретной отрасли и
условиям, в которых оно находится. В западной практике широкое распространение получила модель Альтмана и ее модификации [1]. Эти модели были разработаны в экономических условиях, отличных от российских, потому их использование приводит к значительным отклонениям
прогноза от фактических данных. Для получения объективной оценки
финансово-экономического состояния предприятия возникает необходимость создания эффективной методики оценивания неплатежеспособности, адаптированной к условиям конкретных отрасли и региона.
Предупреждение о несостоятельности предприятий можно получить
на основе моделирования с помощью нейронных сетей, в частности, самоорганизующихся карт Кохонена [2].
Постановка задачи
Требуется провести сегментацию предприятий («банкрот» - «не банкрот»). Из данных Госкомстата Республики Башкортостан построена выборка по 33 предприятиям, 24 из которых нормально работающие предприятия,
9 - обанкротились. При построении модели использовались данные за год
до банкротства.
Рассматривается следующая система факторов, содержащихся в публичной отчетности (бухгалтерский баланс (форма № 1), отчет о прибылях и
убытках (форма № 2)): р1 – оборотные активы; р2 – краткосрочные обязательства; р3 –запасы; 4 р4 – денежные средства; р5 – объем реализации; р6 –
основные средства; р7 – собственный капитал; р8 – дебиторская задолженность (платежи по которой ожидаются в течение 12 месяцев после отчетной
даты); р9 – дебиторская задолженность (платежи по которой ожидаются
более чем через 12 месяцев после отчетной даты); р10 – баланс; р11 – долгосрочные обязательства; р12 – краткосрочные финансовые вложения; р13 –
прибыль до налогообложения; р14 – внеоборотные активы; р15 – затраты в
незавершенном производстве.
На основе данной системы факторов была сформирована система показателей, охватывающая наиболее часто встречаемые в литературе показатели (коэффициенты) финансовой деятельности предприятия, которые можно
разделить на 4 группы.
1. Показатели оценки финансовой устойчивости: коэффициент финансовой независимости x1  p7 p10 ; отношение суммарных обязательств к
суммарным активам x2   p11  p2  p10 ; отношение обязательств к собственному капиталу x3   p11  p2  p7 ; коэффициент дебиторской задолженности x4   p8  p9  p10 .
2. Показатели платежеспособности: коэффициент текущей ликвидности
x5  p1 p2 ; отношение оборотных активов к объёму реализации
x6  p1 p5 ; коэффициент обеспеченности денежных средств и расчётов,
запасов и затрат собственными средствами x7   p7  p14  p1 .
3. Показатели деловой активности: общий коэффициент оборачиваемости x8  p5 p10 ; отношение объема реализации к собственному капиталу б;
отношение объема запасов к оборотным активам x10  p3 p1 .
4. Показатели рентабельности продаж: коэффициент рентабельности
продаж: x11  p13 p5 ; рентабельность оборотных активов x12  p13 p1 ;
рентабельность использования всего капитала x13  p13 p10 .
Самоорганизующиеся карты Кохонена
как основной инструментарий моделирования
С точки зрения моделирования, необходимо решить задачу кластеризации предприятий с использованием вектора признаков x1 , , x13  . Как
известно, эффективным инструментарием её решения являются самоорганизующиеся карты Кохонена (SOM). Рассмотрим некоторые положения
теории SOM, необходимые для дальнейшего описания рассматриваемых
моделей [2]. Процесс обучения SOM характеризуется, во-первых, окрестностью взаимодействия k-го нейрона с i-м вектором обучающей выборки:
d2
(1)
hk i  exp(  k i2 ) ,
2
где dk i – расстояние взаимодействия по евклидовой мере;  – параметр
гауссова распределения, определяемый по формуле
t
(2)
(t )  0 exp(  ) .
1



В (2) 0 – начальное значение величины  в алгоритме SOM;  1 – некоторая константа. Во-вторых, скоростью изменения весов при обучении, характеризуемой параметром (t ) , экспоненциально изменяющимся в зависимости от номера повторного прогона обучающей выборки (фактически
от времени t):
t
(3)
t   0 exp(  ) t  0,1,2,... ,
2
где  2 – еще одна константа алгоритма SOM.
Байесовский подход к регуляризации нейросетевых моделей
кластеризации экономических объектов
Вопросам регуляризации моделей, используемых в экономикоматематическом моделировании, уделяется достаточное внимание, поскольку это улучшает их адекватность и повышает качество получаемых
решений. В частности, данный вопрос проработан С.А. Шумским применительно к использованию нейронных сетей для случаев, когда выполняются условия соответствия исходных данных гауссовым смесям распределения плотности вероятности кластеризуемых объектов [3].
Однако имеются классы прикладных задач, в которых не выполняется
требование возможности представления данных в виде смеси гауссовских
распределений в силу сильного искажения исходных данных и их малого
объема [4]. В этой связи актуальным является вопрос теоретического
обоснования регуляризации нейросетевых кластеризаторов при невыполнении указанных требований.
Причиной неудовлетворительного качества кластеризации с помощью
нейросетевых инструментариев является возможным сильная зависимость
результатов кластеризации от параметров настройки SOM.
В работах [4-5] исследуются методы предрегуляризации и регуляризации нейросетевых моделей на основе байесовского подхода в условиях
искажения информационного пространства признаков. Применительно к
SOM особая идея заключается в следующем. Вводится критерий качества
кластеризации
 d 2 xim , xцm 
M Nm
q 
m1 i 1
1
CM2
  d xцl , xцm 
M
M
,
(4)
2
i 1 l i 1
где q  1, Q и Q – соответственно номер гипотезы-нейросети в байесовском ансамбле и их общее количество; N m – число элементов, попавших в
m-ый кластер; x цm – центр m-го кластера в n-мерном евклидовом пространстве признаков; d x im , x цm  – евклидово расстояние от исследуемого
объекта x im до центра своего m-го кластера; d x цl , x цm  – расстояние между l-ым и m-ым кластерами; C M2 – число сочетаний из M по 2; М – количество кластеров.
Главные идеи байесовского подхода [3], применительно к кластеризации следующие.
 Выбор ансамбля априорных гипотез-нейросетей hq x, W  , где W –
множество параметров модели (синаптических весов), осуществляется из
фиксированного класса (семейства) H мета-гипотез (SOM).
 Апостериорная фильтрация обученных гипотез-нейросетей осуществляется по критерию, оценивающему качество кластеризации (4) как
по плотности группировки объектов вокруг центров кластеров (числитель
отношения (4)), так и по удалению кластеров друг от друга (знаменатель в
(4)).
 После фильтрации гипотез-нейросетей осуществляется усреднение
критерия качества разбиения векторов x на кластеры по (4) на отфильтрованном ансамбле гипотез-нейросетей.
В предлагаемом методе байесовской регуляризации нейронной сети
формула Байеса непосредственно не используется для апостериорной
оценки вероятности P hq | D | H  , где P() – апостериорная вероятность
выбранных гипотез-нейросетей; hq  – множество априорно выбранных
гипотез-нейросетей в ансамбле; H – мета-гипотеза
h  H ; D – множеq
ство данных, поскольку для оценки указанной вероятности через функцию правдоподобия требуется априорное знание аналитической формы
закона распределения кластеризуемых векторов x, например, в виде гауссовой смеси. Такого знания у нас нет. Поэтому апостериорные вероятности P hq | D | H  , несущие информацию о качестве разбиения данных D
на кластеры, в предлагаемом методе, оцениваются косвенно путем фильтрации гипотез – нейросетей hq  по критерию (4).
Фильтрация гипотез-нейросетей для случая с большим разбросом качества разбиения осуществляется следующим образом. Организуется итерационный процесс пошагового отбора (удаления из ансамбля) гипотезнейросетей hq с низким качеством кластеризации (4), т.е. большим зна-


чением  q hq x, W  | D | H :

q : q  0 ; q  1, Q ,
где q

(5)
– номер гипотезы–нейросети, успешно прошедшей процедуру
фильтрации;  0 – желаемое значение качества фильтрации, определяемое
в предварительных вычислительных экспериментах; D  xij i 1, N – совоj 1, N
купность вектор-строк данных.
После фильтрации (5) уточненные значения центров кластеров x цm  и
соответствующего им критерия качества разбиения (H) по (2.3.3) находятся как усредненные на отфильтрованном байесовском ансамбле величины:
Q*
 xцm,q
Q*
 H q

*
; H  
.
(6)
Q
Q
В случае, если SOM в байесовском ансамбле имеют большой разброс по
критерию качества кластеризации (4), требуется осуществить процедуру
регуляризации. Одним из подходов может служить селекция признаков.
Имеются различные способы её осуществления. Например, скалярная селекции признаков, сущность которой состоит в оценке дискриминантной
x цm 
q* 1
*
q* 1
способности каждого отдельного признака x j путем проверки соответствующих статистических гипотез о законах распределения плотности
вероятности анализируемого признака в разных кластерах [4-5]. Другой
способ, использованный нами при проведении вычислительного эксперимента, заключается в следующем. Использованы основы корреляционного
анализа и алгоритм построения минимального вершинного покрытия графа выделенных показателей [6]. Рассчитываются коэффициенты корреляции между каждыми двумя возможными показателями. Число значений
показателей равняется количеству рассматриваемых предприятий. Строится граф, вершинами которого являются показатели. Вершины смежные,
если коэффициент корреляции между показателями достаточно велик (по
модулю не менее 0,5 согласно шкале Чеддока). Из них выделяется одна.
Если вершина не коррелируется ни с какой другой, ее тоже выделяют.
Выделенные вершины формируют минимальное вершинное покрытие
построенного графа.
Проведение вычислительных экспериментов
Первоначально был сформирован байесовский ансамбль априорных
гипотез-нейросетей по всем 13 признакам. Варьировалось две эвристики,
параметры 1 и 2 (формулы (2) и (3)).
Таблица 1
Дискретные уровни варьирования параметров представлены в табл. 1.
Уровни варьирования
Уровни указанных параметров подбипараметров SOM
рались путем предварительных вычислительных экспериментов [4]. Предва1 140 280 420 560 700
рительные вычислительные экспери2 125 250 375 500 625
менты по выбору параметров адаптивного процесса обучения проводились по алгоритму начальной ширины
функции топологической окрестности, начальной скорости обучения,
числа эпох (итераций) процесса модификации весов. Были выбраны следующие параметры, которые затем фиксировались во всех SOM: T  500 ;
 0  4 ; 0  0,3 . Таким образом, был образован байесовский ансамбль из
25 SOM.
Результаты оценки качества кластеризации представлены в табл. 2 .
Значение радиуса обучения (1) и скорости обучения (3) представлены в
момент T  500 . Обобщенный показатель (4), оценивающий косвенно
вероятность нейросетей-гипотез, изменяется в таблице на множестве из 25
сетей ансамбля в довольно широких пределах: от 0,75 до 1,81.
Графическое представление кластеров соответствующих этим критериям представлены на рис. 1 (случаи А и Б).
Таблица 2
Оценка качества разбиения на кластеры по всем априорным гипотезам
1
(t )
2
(t )
q
1
(t )
2
(t )
q
140 0,112463 125 0,005495 1,588838 420 1,21631 500 0,11036 0,99328
140 0,112463 250 0,040601 1,583204 420 1,21631 625 0,1348
1,38268
140 0,112463 375 0,079079 1,637859 560 1,63794 125 0,0055
0,78898
140 0,112463 500 0,110364 1,565609 560 1,63794 250 0,0406
0,85674
140 0,112463 625 0,134799 1,232432 560 1,63794 375 0,07908 0,81729
280 0,610709 125 0,005495 1,083644 560 1,63794 500 0,11036 0,81233
280 0,610709 250 0,040601 1,083644 560 1,63794 625 0,1348
0,83647
420 1,216306 375 0,079079 1,386822 700 1,95817 125 0,0055
1,10877
280 0,61071 500 0,11036 1,77027
700 1,95817 250 0,0406
0,76145
280 0,61071 625 0,1348
1,22481
700 1,95817 375 0,07908 1,15771
420 1,21631 125 0,0055
1,12742
700 1,95817 500 0,11036 0,75684
420 1,21631 250 0,0406
1,35053
700 1,95817 625 0,1348
1,14922
420 1,21631 375 0,07908 1,38682
Рис. 1. Результаты разбиения на кластеры при значениях критерия качества
кластеризации q  0,75 (случай А) и  q  1,81 (случай Б)
Желаемое
значение
качества
фильтрации выберем 0  1,5 . Как
видно из рис. 1 и табл. 2, качество
кластеризации не может быть признано удовлетворительным. Возможные варианты – фильтрация гипотез
или переход к селекции признаков.
Далее для улучшения качества
кластеризации была сокращена размерность информационного пространства на основе построения минимального вершинного покрытия
графа выделенных показателей (рис.
2). Тесной взаимосвязью обладают
Рис. 2. Минимальное покрываю- следующие показатели: х1, х2, х8, х12,
х13; и х9, х3; х11 и х7. После снижения
щее
размерности были проведены дублимножество коррелированных
рующие расчеты при тех же параметфинансовых коэффициентов
рах, что и для модели, построенной с
использованием всех 13 признаков. Результаты представлены в табл. 3.
Таблица 3
Оценка качества разбиения на кластеры по всем априорным
гипотезам-нейросетям Кохонена после селекции признаков
1
(t )
2
(t )
q
1
(t )
2
(t )
q
140 0,112463 125 0,005495 1,176682 420 1,216306 500 0,110364 0,967583
140 0,112463 250 0,040601 1,175750 420 1,216306 625 0,134799 0,957405
140 0,112463 375 0,079079 1,183448 560 1,637937 125 0,005495 0,808984
140 0,112463 500 0,110364 1,193150 560 1,637937 250 0,040601 0,785918
140 0,112463 625 0,134799 1,194437 560 1,637937 375 0,079079 0,821249
280 0,610709 125 0,005495 1,273290 560 1,637937 500 0,110364 0,927222
280 0,610709 250 0,040601 1,160047 560 1,637937 625 0,134799 0,812560
280 0,610709 375 0,079079 1,169325 700 1,958167 125 0,005495 0,730403
280 0,610709 500 0,110364 1,169449 700 1,958167 250 0,040601 0,779819
280 0,610709 625 0,134799 1,183006 700 1,958167 375 0,079079 0,805129
420 1,216306 125 0,005495 0,871477 700 1,958167 500 0,110364 1,288288
420 1,216306 250 0,040601 0,950186 700 1,958167 625 0,134799 0,846798
420 1,216306 375 0,079079 1,123394
Обобщенный показатель (4), оценивающий косвенно вероятность
нейросетей-гипотез, изменяется в таблице на множестве из 25 сетей ансамбля в пределах от 0,73 до 1,28. Графическое представление кластеров,
соответствующих этим критериям, представлено на рис. 3 (случаи А и Б).
Уточнённые значения центров кластеров и соответствующего им критерия качества   1,01 говорят об улучшении модели.
Рис. 3. Результаты разбиения на кластеры при значениях критерия качества кластеризации q  0,73 (случай А) и  q  1,28 (случай Б)
Окончательно результаты моделирования представлены в табл. 4.
Здесь указана вероятность попадания в кластер предприятий на байесовском ансамбле.
Таблица 4
Вероятность попадания в кластер
№
Состояние
1
1
2
1
3
1
4
1
Вероятность поСостояпадания №
ние
в кластер,
%
1
100
1
2
1
100
1
3
1
92
1
4
100
1
1
Вероятность поСостояпадания №
ние
в кластер,
%
2
100
1
7
3
100
1
2
2
100
0
3
100
2
0
Вероятность попадания
в кластер,
%
88
100
100
100
5
1
100
6
1
100
7
1
96
8
1
100
9
1
100
1
100
1
96
1
0
1
1
5
1
6
1
7
1
8
1
9
2
0
2
1
2
2
1
100
1
100
1
84
1
92
1
96
1
100
1
96
4
2
5
2
6
2
8
2
9
3
0
3
1
3
3
0
100
0
100
0
100
0
100
0
100
0
100
0
100
Как видно из таблицы, все предприятия, оказавшиеся в дальнейшем
банкротами (отмечены 0), были отобраны в свой кластер со 100 %-ной
вероятностью. Наименьшая вероятность отнесения нормально работающего предприятия (отмечены 1) в соответствующий кластер составляет
84 %. С вероятностью меньше 100 % в свой кластер попадает 8 предприятий из 24. Таким образом, предложенная методика идентификации потенциальной неплатежеспособности предприятия на основе самоорганизующихся карт Кохонена состоятельна.
Выводы
На основе факторов, содержащихся в публичной отчетности предприятия), сформированы кластерообразующие показатели для создания модели диагностики финансового состоянии предприятия. Использован метод байесовской регуляризации при построении самоорганизующихся
карт Кохонена. Применена методика выделения наименьшего числа существенных показателей, основанная на корреляционном анализе. Построена модель идентификации потенциальной неплатежеспособности
предприятий.
Авторы благодарят заслуженного деятеля науки Республики Башкортостан д-ра тех. наук профессора С.А. Горбаткова за ценные советы по
обсуждению работы.
Список литературы
1. Антикризисное управление как инструмент финансовой стабилизации предприятия/ Чалдаева Л. А.// Экономиечский анализ: теория и практика, 2009. №10. С.26-33.
2. Кохонен Т. Самоорганизующиеся карты. М.: БИНОМ. Лаборатория
знаний, 2011.
3. Шумский С.А. Байесова регуляризация обучения // «Нейроинформатика– 2002»: Сб. науч. тр. Ч. 2. М.: МИФИ, 2002. С. 30-93.
4. Нейросетевое математическое моделирование в задачах ранжирования
и кластеризации в бюджетно-налоговой системе регионального и муниципального уровней / С.А Горбатков, Д.В. Полупанов и др. Уфа: РИЦ БашГУ,
2011.
5. Гобатков С.А., Рашитова О.Б. Регуляризация процесса кластеризации
на нейронных сетях с использованием байесова подхода // «Нейроинформатика–2010»: Сб. науч. тру. В 3-х частях. Ч.3. М.: НИЯУ МИФИ, 2010. С.
245-255.
6. Рахимкулова Г.3. Аналитическая модель оценки платежеспособности предприятия // Обозрение прикладной и промышленной математики,
2004. Т. 10. №2. С.510-511.
Download