бюро оценки и анализа кредитных рисков и его модели

advertisement
БЮРО ОЦЕНКИ И АНАЛИЗА КРЕДИТНЫХ РИСКОВ
И ЕГО МОДЕЛИ
Е. Д. Соложенцев
На Российском рынке появилась Интернет услуга по оценке и анализу кредитных
рисков физических и юридических лиц (www.inorisklab.com), использующая логиковероятностную (ЛВ) теорию риска с группами несовместных событий (ГНС), которая
отвечает требованиям соглашения «Базель II» к методам количественной оценки
кредитных рисков и резервирования. Эта ЛВ-теория риска с ГНС превосходит
существующие скоринговые методики по точности, устойчивости и прозрачности,
снижает кредитные потери банка и повышает его конкурентоспособность.
1. Введение
Кредитование является основным видов деятельности коммерческих и
государственных банков. Каждый банк индивидуален, так как обслуживает различных
клиентов в разных районах и регионах, отраслях и сферах банковских услуг, и должен
иметь ЛВ-модели кредитного риска физических и юридических лиц, построенные на
собственной статистике. Индивидуальности банков способствует также конкуренция.
В настоящее время на рынке имеются скоринговые методики и программные
продукты для оценки кредитного риска на основе линейного и квадратичного
дискриминантного анализа, нейронных сетей и data mining. ЛВ-теория кредитного риска с
ГНС разительно отличается от распространенных скоринговых методик и имеет .
следующие особенности [1] :
• Использование логического сложения событий вместо арифметического
сложения баллов или других показателей;
• Адекватная логическая формулировка сценария кредитного риска;
• Применение базы знаний (БЗ) по кредитам в виде системы логических уравнений
вместо традиционной базы данных (БД);
• Построение логической и вероятностных моделей кредитного риска;
• Определение вероятностей событий с учетом ГНС и формулы Байеса;
• Корректная формулировка целевой функции для идентификации модели риска
по статистическим данным;
• Использование специальных логических Software.
2. Содержание услуги
Бюро оказывает услугу банку, заключающуюся в оценке и анализе кредитных
рисков и состоящую из двух частей [2]:
1) Построение модели кредитного риска по статистике банка, вычисление
атрибутов риска множества кредитов банка и анализ кредитной деятельности банка
модели риска;
2) Оценка риска кредита заемщика, вычисление атрибутов риска и анализ риска
кредита.
Дополнительно могут быть выполнены обучение персонала банка, оптимизация
описания кредита банка с выбором оптимальных чисел параметров и градаций для
параметров, интервалов разбиения отдельных параметров (суммы кредита, срока кредита,
возраста клиента и др.), выполнение совместных исследований.
Логико-вероятностная модель кредитного риска имеет следующие достоинства:
• В два раза большая точность в распознавании хороших и плохих кредитов;
•
•
•
В семь раз большая робастность (устойчивость классификации кредитов);
Абсолютная прозрачность в оценке и анализе риска кредита, множества кредитов
банка и самой модели риска;
Возможность управлять кредитным риском, изменяя асимметрию распознавания
хороших и плохих кредитов, число параметров и градаций, описывающих кредит.
ЛВ-теория оценки и анализа кредитных рисков и специальные логические Software
создавались и исследовались в течение около 10 лет. Апробация выполнялась на данных
западного банка (1000 кредитов) и двух российских банков (по 500 кредитов физических и
юридических лиц). Для западного банка кредитный риск в среднем уменьшался с 28% до
17%. Для российских банков кредитный риск в среднем уменьшался с 10% до 5%.
В течение месяца банкам предлагается бесплатное обслуживание для отработки
технологии пересылки данных по E-mail и для оценки точности, прозрачности и
эффективности построенной ЛВ-модели кредитного риска. Защита информации
осуществляется на основе представления данных по кредитам, результатов их оценки и
анализа в обезличенном виде (в виде набора чисел).
3. Сущность ЛВ-теории кредитного риска
Подробно ЛВ-теория кредитного риска с ГНС рассмотрена в работах [3-6]. Ниже,
опуская математические описания и определения, изложены только основные положения
этой ЛВ-теории риска неуспеха.
Описание кредита. Кредит описывается параметрами, каждый из которых имеет
градации. На практике число параметров может быть до 40 и число градаций в параметре
до 30. Например, кредиты физических лиц в одном из банков описывались следующими
признаками (параметрами) и их градациями (Табл. 1).
Параметр успешности кредита - Y (2 градации). Параметры кредита: Z1 – срок
кредита (4 градации), Z2 – сумма кредита (6), Z3 – цель кредита (3), Z 4 – кредитная история
в банке (3), Z 5 – владение пластиковыми картами банка (4), Z 6 – жилищные условия (3), Z 7
– наличие дорогостоящего имущества (3), Z8 – возраст заемщика (3), Z9 – должностной
уровень (4), Z10 – стабильность занятости (время работы в указанной компании) (4), Z11 –
доход по месту работы (5), Z12 – количество неработающих в семье (3).
Представление статистики банка по кредитам. Статистические данные по
кредитам банка рассматриваются как база данных (БД). Однако в ЛВ-теории риска база
данных должна быть преобразована в базу знаний (БЗ). Делается это просто. Значения
параметров, имеющих непрерывные значения (срок, сумма кредита, возраст и т.д.),
разбиваются на интервалы, которым присваиваются номера или градации (параметры
1,2,8,10,11). То есть, целые и дробные значения параметров и параметра эффективности
кредита заменены дискретными значениями (градациями).
Данные по кредитам банка представляются в табличном виде (табл. 2). В строках
находятся кредиты i=1,2,…,N. В столбцах таблицы находятся параметры кредита Z1,…,Zj,
…., Zn. В свою очередь, параметры имеют градации Zjr , r=1,2,…,Nj ; j=1,2,…,n,
находящиеся в клетках таблицы. В последнем столбце находится параметр эффективности
кредита Y, имеющий две градации: градация 1 («хороший», кредит возвращен) или
градация 0 («плохой», кредит не возвращен).
Таким образом, в табл. 2 выделяются конечные и счетные множества кредитов,
параметров для описания кредита и градаций для каждого параметра.
Параметры и градации рассматриваются как случайные величины или событияпараметры и события-градации, приводящие с определенной вероятностью к неуспеху
кредита. События-градации для каждого параметра образуют ГНС, для которой
используются неклассические правила теории вероятностей и формула Байеса [3-5].
События-параметры и события-градации обозначим логическими переменными и
будем применять к ним правила логического исчисления. В итоге мы получаем систему
логических уравнений с левой и правой частями, или систему логических высказываний,
или табличную базу знаний (БЗ). С каждой логической переменной левой и правой части
БЗ свяжем вероятности ее истинности и ложности. Наибольшее возможное число разных
событий-кредитов равно произведению чисел градаций N1, N2,…,Nj,…,Nn в параметрах,
описывающих кредит. Число кредитов в статистике банка должно быть не меньше 20*n,
где n – число параметров для описания кредитов.
Таблица 1. Параметры и градации кредитов физических лиц
Номер
признака
Наименование параметра
1
Срок кредита
2
Сумма кредита
3
Цель кредита
4
Кредитная история в банке
5
Владение пластиковыми
картами банка
6
Жилищные условия
7
Наличие в собственности
дорогостоящего имущества
Номер
градации
1
2
3
4
1
2
3
4
5
6
1
2
3
1
2
3
1
2
3
4
1
2
3
1
2
3
8
Возраст заёмщика
9
Должностной уровень
10
Стабильность занятости
(период работы в указанной
компании)
11
Доход чистый по основному
месту работы
12
Количество неработающих
членов семьи
1
2
3
1
2
3
4
1
2
3
4
1
2
3
4
5
1
2
3
Градации параметра
До 6-ти месяцев и менее
От 6-ти месяцев и до 1,5 года
От 1,5 года до 5-ти лет
От 5-ти до 15 лет
До 45 000 р.
От 45 000 р. До 100 000 р.
От 100 000 р. До 200 000 р.
От 200 000 р. До 300 000 р.
От 300 000 р. До 500 000 р.
От 500 000 р. и более
Экспресс-кредиты
Потребительский
На приобретение жилья
Добросовестная кредитная история
Приемлемая кредитная история
Не пользовался кредитами
Нет карты
VISA Electron (Cirus/Maestro, ICB-card)
VISA Classic (Eurocard/Mastercard Mass)
VISA Gold (Eurocard/Mastercard Gold)
Наличие в собственности дома. квартиры.
Проживает в муниципальной квартире, арендует квартиру
Другие варианты
Нет такого имущества
Автомобиль, выпущенный не ранее 3 лет, до обращения за
кредитом
Рыночные ценные бумаги на сумму эквивалентную не менее
1000$
18 – 25 лет
26 – 50 лет
50 – 75 лет
Менеджер высшего звена, руководитель фирмы
Менеджер среднего звена, начальник отдела
Специалист высокой квалификации
Специалист
До 2 года
От 2 до 4 лет
От 4 до 6 лет
Свыше 6
До 10 000 руб.год
От 10 000 руб.год до 15 000 руб.год
От 15 000 руб.год до 30 000 руб.год
От 30 000 руб.год до 50 000 руб.год
От 50 000 руб.год и более
Нет таковых
Менее 2-х
2 и более
Сценарий риска неуспеха кредита является адекватным, ассоциативным и
формулируется для всего множества возможных событий (разных кредитов). Неуспех
кредита происходит, если происходит какое-либо одно, какие-либо два, …. или все
инициирующие события-параметры. Заметим, что ни одна из известных скоринговых
методик не использует такой сценарий риска.
Таблица 2. Представление статистики по кредитам в виде табличных БД и БЗ
Номера
кредита
Параметр 1,
Z1
1
2
…
i
…
N
Параметр j ,
Zj
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
Zjr
…
Параметр n,
Zn
Параметр
эффективности
кредита, Y
…
…
…
Yr
Структурная модель кредитного риска, представленная на рис.1, описывает
многокомпонентную систему из множества кредитов, отдельных кредитов, параметров
кредита и градаций параметров. Она соответствует сценарию риска неуспеха кредита и
описанию кредита с помощью градаций параметров. Структурную модель риска называют
еще граф-моделью риска. События-параметры и итоговое событие связаны логическими
связями «ИЛИ». События-градации для каждого события-параметра составляют ГНС.
Множество кредитов
Кредит 1
……
Кредит i
…
Параметр j
…
… Града-
… Града-
Параметр 1
Градация 1
ция r
ция Nj
……
Кредит N
Параметр n
Градация 1
Параметр
успешности Y
… Градация r
… Града-
ция Ny
Рис.1. Структурная модель (граф-модель) кредитного риска
Логическая и вероятностная модели кредитного риска. Событиям-параметрам и
событиям-градациям поставлены в соответствие логические переменные с теми же
идентификаторами. Логическая переменная Zj равна 1 с вероятностью Pj, если параметр j
привел к неуспеху, и равна 0 с вероятностью Qj=1-Pj в противном случае. Логическая
переменная Zjr, соответствующая градации r параметра j, равна 1 с вероятностью Pjr и
равна 0 с вероятностью Qjr=1-Pjr . Вектор Z(i)=(Z1,…, Zj,…, Zn) описывает объект i из
таблицы 2. При задании объекта i вместо логических переменных Z1 ,…,Zj ,…,Zn
подставляются переменные Zjr для градаций признаков именно этого объекта i.
Используется логическое сложение событий.
Логическая функция (Л-модель) риска неуспеха кредита
Y = Z1 ∨ Z 2 ∨ K ∨ Z j ∨ ... ∨ Z n .
(1)
Л-модель риска неуспеха кредита после ее ортогонализации:
Y = Z1 ∨ Z 2 Z1 ∨ Z3 Z 2 Z 1 ∨ ....
(2)
В-модель (В-полином) риска неуспеха кредита:
P = P1 + P2Q1 + P3Q1Q2 + ...
(3)
"Арифметика" В-модели риска такова, что для события Y величина риска находится в
пределах [0, 1] при любых значениях вероятностей инициирующих событий-параметров.
Риск кредита. Схема классификации кредитов приведена на рис. 2. Риск кредита
вычисляется на вероятностной модели кредитного риска, если известны вероятности
событий-градаций. Последние определяются при идентификации ЛВ-модели кредитного
риска по статистическим данным банка. При решении задачи идентификации вычисляется
также допустимый риск Pad по заданному коэффициенту асимметрии распознавания
хороших и плохих кредитов [3, 6]
“плохие” кредиты
“хорошие” кредиты
0
Pmin
Pmax
Pad
1
Рис.2. Схема классификации кредитов
Идентификации В-модели риска неуспеха кредита. Задача идентификации Вмодели риска сформулирована следующим образом [1, 3, 6].
Заданы: таблица статистических данных о кредитах, имеющая N кредитов, из которых Ng
хороших и Nb плохих кредитов, и В-модель риска (3);
Требуется определить: вероятности Pjr , r=1,2,…,Nj; j=1,2,…,n событий-градаций и
допустимый риск Pad , разделяющий кредиты на хорошие и плохие;
Целевая функция: максимизация числа корректно классифицируемых кредитов:
F = Nbb + Ngg ⇒ MAX ,
(4)
Pjr
где Ngg , Nbb - соответственно числа кредитов, классифицируемых как хорошие и плохие и
статистикой и В-моделью (совпадающие оценки).
Из выражения (4) следует, что точность В-модели риска в классификации хороших
Eg и плохих кредитов Eb и в целом Em равна:
Eg = ( Ng − Ngg ) / Ng ;
Eb = ( Nb − Nbb ) / Nb;
Em = ( N − F ) / N .
(5)
Допустимый риск Pad определяется при заданном отношении некорректно
классифицируемых хороших и плохих кредитов из-за неэквивалентности ущерба при их
неправильной классификации
E gb = (Ng - Ngg ) / (Nb - N bb ).
(6)
Задача идентификации является нелинейной задачей оптимизации и решается
алгоритмическим итеративным методом с использованием моделирования Монте – Карло
или градиентов [1, 3, 6].
Анализ кредитного риска. Прозрачность риска кредита и результатов оценки и
анализа кредитной деятельности банка обеспечивается вычислением вкладов параметров
и градаций в риск кредита, в средний риск всего множества кредитов банка и в точность
(целевую функцию) модели кредитного риска.
Вклады определяются на компьютере вычислением разности между значениями
характеристик после идентификации ЛВ-модели и значений этих характеристик при
придании соответствующим вероятностям событий-градаций нулевых значений.
Таким образом, на каждом уровне структурной модели риска (рис. 1), вычисляются следующие характеристики (атрибуты) кредитного риска:
1. Количественные оценки риска градации параметра кредита:
• вероятность неуспеха для кредита,
• относительная вероятность неуспеха среди градаций параметра,
• вероятность-частота в множестве кредитов,
• вклад в точность модели риска;
2. Количественные оценки риска параметра кредита:
• средняя вероятность неуспеха,
• структурный вес и значимость в модели риска,
• вклад в риск кредита,
• вклад в средний риск множества кредитов;
3. Количественные оценки риска кредита:
• риск неуспеха,
• возможные потери,
• цена за риск,
• вклад в риск множества кредитов;
4. Количественные оценки риска множества кредитов:
• допустимый риск,
• средний риск,
• коэффициент асимметрии распознавания хороших и плохих кредитов,
• средние потери,
• допустимые потери,
• число кредитов,
• число опасных кредитов,
• энтропия рисков опасных кредитов.
Эти атрибуты полностью определяют риск и используются для управления кредитной
деятельностью банка [4, 5]. По результатам анализа атрибутов риска градаций,
параметров, кредитов и множества кредитов возможно оптимизировать саму модель
кредитного риска для повышения ее точности с определением оптимального числа
параметров, градаций в каждом параметре и асимметрии распознавания хороших и
плохих кредитов.
Банк может использовать простую формулу для цены (процента) за риск кредита:
C i =Cad + k (Prisk - Pad),
(5)
где: Ci – стоимость i-го кредита; Cad – цена за допустимый риск; k - коэффициент.
3. Технологии построения и использования ЛВ-модели кредитного риска
Технология построения и использования ЛВ-модели кредитного риска включает в себя
следующие операции [ ]:
1. Табличное <<стандартное>> представление статистических данных о кредитах.
2. Построение сценарной и структурной моделей кредитного риска.
3. Определение событий-параметров и событий-градаций.
4. Определение групп несовместных событий (ГНС).
Дискретизация распределений случайных событий-градаций.
Построение логической модели кредитного риска.
Ортогонализация логической модели кредитного риска.
Построение вероятностной модели кредитного риска.
Идентификация (оптимизация) В-модели кредитного риска по статистике банка
с учетом ГНС и формулы Байеса.
10. Выбор коэффициента асимметрии распознавания хороших и плохих объектов.
11. Определение допустимого кредитного риска.
12. Вычисление количественных атрибутов риска для градаций, параметров, кредита и
множества кредитов.
13. Анализ кредитной деятельности банка по значениям атрибутов риска.
14. Управление кредитной деятельностью банка с назначением оптимального числа
параметров, градаций в каждом параметре и асимметрии распознавания кредитов.
5.
6.
7.
8.
9.
4. Описание заказов и результатов
Детально Заказы 1, 2 и Результаты 1, 2 описаны в [2]. Ниже приведены только
краткие описания.
Заказ 1. Банк (кредитное предприятие) представляет статистические данные по
выданным ранее кредитов. Файл со статистикой в обезличенном виде создается банком
самостоятельно, затем архивируется и отправляется по e-mail. Обновление статистики и
построение новой ЛВ-модели кредитного риска проводится периодически через 1-4
квартала по договоренности с заказчиком.
Форма обезличенного файла по статистике кредитов банка
N
n
N1, N2, … , Nn
Y1
Z11
Z21
…
Zn1
Y2
Z12
Z22
…
Zn2
………………………………….
YN
ZN2 ZN2 …
ZNn,
где N – число кредитов;
n – число параметров;
N1, N2, …,Nn – число градаций в каждом параметре;
Y1, Y2,…,YN – признак успешности кредита (1 - «хороший»; 0 - «плохой») ;
Z11, …,ZNn – значение градаций параметров.
Данные заказчика служат для обучения ЛВ-модели риска. Числа хороших и плохих
кредитов подсчитываются по файлу автоматически. Также подсчитываются числа
одинаково описанных кредитов и устанавливается какие градации параметров не
используются для описания кредитов. Это позволяет контролировать данные Заказа 1 и
результаты обучения ЛВ-модели риска. Для кредитного риска юридических лиц
категории клиентов представляются в виде градаций 1, 2, 3, …параметра «категория
клиента». Этот параметр располагается в последнем столбце таблицы и для него
вычисляются дополнительные атрибуты риска.
Заказ 2. Банк дает заказ на оценку и анализ кредитного риска одного или
нескольких заемщиков в обезличенном виде:
Z1, Z2,…, Zn – номера градаций по каждому параметру.
Результаты 1. Построение В-модели кредитного риска банка занимает время до
12 часов. Атрибуты риска для градаций, параметров и множества кредитов банка
отсылаются заказчику в виде файла по E_mail. Сообщаются также показатели качества
(атрибуты) модели риска: ее точность и асимметрия распознавания.
Для юридических лиц для «категорий клиентов» вычисляются дополнительно
следующие атрибуты: частоты категорий во всех кредитах, в «плохих» и в «хороших»
кредитах, а также среднее значение риска кредитов для категорий. Это позволяет оценить
адекватность разделения клиентов на категории.
Результаты 2. Атрибуты кредитного риска одного или нескольких кредитов
отсылаются заказчику по E-mail в виде файла в течение 8 часов.
Литература
1. Соложенцев Е. Д. Сценарное логико-вероятностное управление риском в бизнесе и
технике. 2-е издание, СПб.: Бизнес-пресса, 2006, 560 с.
2. htpp:// www.inorisklab.com
3. Solojentsev E. D. Scenario Logic and Probabilistic Management of Risk in Business and
Engineering. Springer: 2004.-391 p.
4. Соложенцев Е.Д., Карасев В.В. Логико-вероятностные модели риска в бизнесе с
группами несовместных событий. Экономика и математические методы, 2003. №1.
5. Соложенцев Е. Д., Степанова Н. В., Карасев В. В. Прозрачность методик оценки
кредитных рисков и рейтингов. СПб.: Изд-во С.-Петербургского ун-та, 2005, 196 с.
6. Степанова Н. В., Соложенцев Е. Д., Рыбаков А. В. Логико-вероятностная модель оценки
кредитного риска физических лиц в коммерческом банке. Управление финансовыми рисками, 2005, № 4.
СОЛОЖЕНЦЕВ Евгений Дмитриевич
Заведующий Лабораторией интегрированных интеллектуальных систем автоматизированного
проектирования Института проблем машиноведения РАН, Профессор Санкт-Петербургского
государственного университета аэрокосмического приборостроения, Заслуженный деятель науки РФ.
Автор более 150 научных работ, в том числе 6 книг. Создал научные основы построения систем
автоматизированной доводки сложных объектов. Разработал логико-вероятностную теорию риска неуспеха
с группами несовместных событий для проблем классификации, инвестиций, эффективности, менеджмента,
взяток и коррупции. Председатель оргкомитета Международных научных школ «Моделирование и анализ
безопасности и риска в сложных системах» (СПб., ИПМаш, 2001-2007 гг.).
Адрес: Соложенцев Евгений Дмитриевич
Большой пр., 61 В.О.
ИПмаш РАН
199178 Санкт-Петербург
Тел.: (812)321-47-66; Факс: (812)321-47-71;
E_mail: risk@sapr.ipme.ru; URL: http://www.ipme.ru/ipme/labs/iisad/sapr1.htm
Download