Будина Е.С. Построение коллективной модели оценки

advertisement
Математическое программирование и распознавание образов
321
ПОСТРОЕНИЕ КОЛЛЕКТИВНОЙ МОДЕЛИ ОЦЕНКИ
КРЕДИТОСПОСОБНОСТИ
Будина Е.С.
e-mail: es@chelinvest.ru
В работах [1, 2] предложена экспертная система, позволяющая на
основе знаний и опыта эксперта в области кредитования и имеющегося набора кредитных историй строить скоринговые модели, которые,
по мнению эксперта, имеют минимальный риск принятия ошибочного решения. Скоринговая модель представляет математическую модель, с помощью которой на основе кредитной истории “прошлых
клиентов” определяется вероятность возврата долга в срок конкретным потенциальным заемщиком. Скоринг на основе ряда информативных признаков о клиентах обеспечивает определение принадлежности клиентов различным группам, например, таким как “кредитоспособные клиенты” и “некредитоспособные”.
В указанной экспертной системе скоринговая модель строится в
виде дерева решений: сначала на основе правил, полученных от эксперта, а затем достраивается на основе имеющихся данных о ранее
выданных кредитах с использованием алгоритма С4.5 [4]. При анализе возможно использование экспертом нечетких значений и высказываний. Для выбора атрибута разбиения множества примеров
в алгоритме С4.5 используется теоретико-информационный критерий: выбирается проверка по такому из атрибутов, который дает
максимум отношения информационного выигрыша при разбиении
по нему к оценке потенциальной информации, получаемой при разбиении множества примеров на n подмножеств, где n — число потомков узла.
Недостатком рассмотренной модели является наличие субъективизма в предпочтениях эксперта. В докладе рассмотрен способ построения коллективной модели оценки кредитоспособности заемщиков, на основе моделей, предложенных несколькими экспертами в
области кредитования.
Будем считать, что эксперты используют один и тот же набор кредитных историй, характеристик и общий критерий ветвления в алгоритме С.4.5. Отличаются модели только набором правил, используемых экспертами и порядком их следования. Пусть
322
Труды XXXVIII Молодежной школы-конференции
{E1 , E2 , . . . , En } — множество экспертов, {P1 , P2 , . . . , Pk } — используемые ими правила. Будем рассматривать случай, когда каждый
элемент среднего уровня соединен с элементом верхнего уровня, но
не всегда с каждым элементом нижнего уровня. Для ранжирования
правил относительно цели используется иерархический синтез [3],
состоящий из следующих шагов.
Шаг 1. Структурировать исходную задачу как иерархию целей.
Иерархия целей строится следующим образом: верхний уровень
(цель A) соответствует нахождению оптимального ранжирования
правил, средний уровень соответствует системам предпочтений экспертов E1 , E2 , . . . , En , а нижний уровень — всем используемым экспертами правил P1 , P2 , . . . , Pk .
Шаг 2. На основе иерархической структуры построить бинарую
(k ×n) матрицу B соотвествий между экспертами и правилами. Матрица B содержит элементы bij = {0, 1}: если правило Pi используется
для построения модели экспертом Ej , то bij = 1, в противном случае
bij = 0.
Шаг 3. Для каждого элемента иерархии построить матрицы
парных сравнений элементов иерархии следующих уровней: [A] и
[Ei ], i = 1, 2, . . . , n. Для установления относительной важности элементов иерархии следует воспользоваться шкалой отношений (см.
табл. 1). Данная шкала позволяет экспертам ставить в соответствие
степеням предпочтения одного сравниваемого правила перед другим
некоторые числа.
При использовании указанной шкалы эксперт, сравнивая два
правила в смысле достижения цели A, расположенной на вышележащем уровне иерархии, должен поставить число в интервале
от 1 до 9 или обратное значение. Для этого в иерархии выделяют элементы двух типов: элементы–родители и элементы–потомки.
Элементы–потомки воздействуют на соответствующие элементы вышестоящего уровня иерархии, являющиеся по отношению к первым
элементами–родителями. Матрицы парных сравнений строятся для
всех элементов–потомков, относящихся к определенному родителю.
Парные сравнения производятся в терминах доминирования одного элемента над другим в соответствии со шкалой отношений. При
проведении парных сравнений следует отвечать на вопросы: какой
из двух сравниваемых элементов важнее или имеет большее воздействие. Если элемент E1 доминирует над элементом E2 , то клетка
Математическое программирование и распознавание образов
Степень
значимости
1
3
5
7
9
2, 4, 6, 8
323
Таблица 1: Шкала отношений
Определение
Объяснение
Одинаковая значимость
Некоторое
преобладание
значимости одного
действия
над другим
Существенная
значимость
Очевидная или
очень сильная
значимость
Абсолютная значимость
Промежуточные
значения между
двумя соседними суждениями
Два действия вносят одинаковый вклад в достижение цели
Существуют соображения в
пользу предпочтения одного из действий, однако эти
соображения
недостаточно
убедительны
Имеются надежные данные или
логические суждения для того,
чтобы показать предпочтительность одного из действий
Убедительное свидетельство в
пользу одного действия перед
другим
Свидетельства в пользу предпочтения одного действия перед
другим в высшей степени убедительны
Ситуация, когда необходимо
компромиссное решение
матрицы, соответствующая строке E1 и столбцу E2 , заполняется целым числом, а клетка, соответствующая строке E2 и столбцу E1 заполняется обратным к нему числом.
Шаг 4. Для построенных матриц найти максимальные собственные значения λi , i = 0, 1, . . . , n и главные собственные векторы
WA , WEi i = 1, 2, . . . , n, элементы которых считать равными приоритетам соответствующих элементов следующего уровня иерархии.
324
Труды XXXVIII Молодежной школы-конференции
Шаг 5. Построить матрицу
где
E1 E2 ... En

P1
d11 d12 ... d1n
P  d21 d22 ... d2n
D= 2 
...  ...
... ... ...
Pk
dk1 dk2 ... dkn
dij =
0,
WEi j ,


,

если bij = 0,
в противном случае.
Шаг 6. Для повышения приоритета правил, образующих большие группы, и снижения приоритета правил в группах с их относительно небольшим числом, построить следующий структурный критерий, отображаемый диагональной матрицой L:
E1
r1 /N
 0
L=
 ...
0

E2
0
r2 /N
...
0
... En
...
0
...
0
...
...
... rn /N


,

где rj — число правил Pi , используемых экспертом Ej ; N =
k
P
rj —
j=1
количество всех используемых экспертами правил.
Шаг 7. Вычислить ненормированный вектор приоритетов правил относительно цели A:
X = D L WA .,
Вычислить матрицу K для нормирования значений вектора приоритетов правил:

 −1
k
P
0
...
0
xi



 i=1

−1

k
P




...
0
0
x
i
K =
,
i=1




...
...
...
...


−1


k
P
0
0
...
xi
i=1
Математическое программирование и распознавание образов
325
где xi , i = 1, 2, . . . , k — значения координат ненормированного вектора приоритетов правил. Нормированный вектор приоритетов правил
принять равным
W = K · X.
Используя найденный вектор приоритетов W, можно построить
коллективную скоринговую модель в виде дерева решений следующим образом: сначала на основе множества правил P1 , P2 , . . . , Pk ,
упорядоченного в соответствии с вектором приоритетов W, причем
если wk = 0, то соответствующее правило для построения скоринговой модели не используется, затем дерево достраивается на основе
имеющихся данных о ранее выданных кредитах.
Список литературы
[1]. Будина Е.С. Проблемы оценки кредитоспособности заемщика.
// Вестник ЮУрГУ. Серия “Рынок: Теория и практика”. Вып.
2. №1(56). 2006. С. 113–119.
[2]. Будина Е.С., Панюков А.В. Проблемы оценки кредитоспособности физического лица. // III Всероссийская конференция “Проблемы оптимизации и экономические приложения”: Материалы
конференции (Омск, 11–15 июля 2006). Омский филиал Института математики им. С.Л. Соболева СО РАН. Омск: Изд-во ОмГУ, 2006. С. 175
[3]. Андрейчиков А.В., Андрейчикова О.Н. Анализ, синтез, принятие решений в экономике — М.: Финансы и статистика, 2000.
368 с.
[4]. J. Ross Quinlan C4.5: Programs for Machine learning. — San Mateo:
Morgan Kaufmann Publishers, 1993.
Download