Структура и методы фронт офисной подсистемы выявления заявок подозрительных на мошенничество

advertisement
Структура и методы фронт-офисной
подсистемы выявления заявок,
подозрительных на мошенничество,
при потребительском кредитовании
Дмитрий Козлов Управление операционных рисков и контроля
Владимир Левин Отдел скоринга и оценки рисков розничных портфелей
Департамент рисков ОАО Банк ЗЕНИТ
Содержание
1. Объект, предмет, субъекты и схемы
мошенничества
2. Методы противодействия мошенничеству
3. Методы выявления внешнего мошенничества
4. Система противодействия мошенничеству
2
Объект, предмет, субъекты мошенничества
Объект мошенничества :
«Мошенничество – это особый вид деятельности субъекта, который ищет белые
пятна в нормах и традициях экономического поведения, в предметах и
способах экономической деятельности, в способах контроля над
экономической деятельностью, в уголовном законодательстве и в практике
правоохранительных судебных органов».
Предмет мошенничества– процесс взаимодействия заемщика с системой
принятия решения о степени кредитоспособности заемщика (возможности
выдачи кредита на приемлемых для банка условиях).
Субъектами внешнего мошенничества при экспресс-кредитовании являются:
3
•
Организованные преступные группировки, привлекающие к организации
потока мошеннических заявок третьих лиц, нуждающихся в наличных
средствах.
•
«Серые (Черные) брокеры», предлагающие услуги по организации
необходимых документов, требуемых банками, и по организации
подтверждений по телефонам, указанным в анкетах;
•
Мошенники-одиночки, самостоятельно искажающие персональные данные в
анкетах.
Часть 1
Методы противодействия
мошенничеству
4
Часть 1
1. Предпосылки к созданию Системы
2. Объекты, предмет, субъекты и схемы
мошенничества
3. Методы выявления и противодействия
мошенничеству
5
•
Таксономия методов противодействия мошенничеству
•
Математические методы, используемые в задачах Data mining
•
Алгоритм вычисления меры близости сравниваемых объектов
•
Логико-вероятностная модель мошенничества
Предпосылки к созданию Системы
1.
Бурный рост потребительского кредитования
2.
Опасности периода вывода на рынок новых продуктов
3. Необходимость оптимизации стоимости кредитного
конвейера
4. Наличие глубоко проработанных математических
методов выявления признаков мошенничества
6
Схемы внешнего мошенничества
Организованные преступные группировки, действующие без привлечения
сотрудников банка:
•находят людей, срочно нуждающихся в деньгах, для которых получение
кредита в банке практически невозможно в силу кредитных политик банков;
•убеждают их, что возвращать кредит не потребуется, никаких серьезных
последствий от невозврата кредита данному лицу со стороны банка не грозит;
•изменяют данные клиента с целью получения положительного решения по
кредиту, используют потерянные паспорта с переклеенными фотографиями;
•подтверждают место работы клиента и место проживания по подставным
телефонам.
Часто втягивают в преступную деятельность сотрудников банка.
Серые (Черные) брокеры:
•помогают подделать справки о доходах и трудовые книжки;
•подтверждают место работы клиента по подставным телефонам;
•изменяют данные клиента в документах кредитного проекта для получения
положительного решения.
7
Субъекты и схемы внутреннего
мошенничества
1. Кредитные эксперты (КЭ), принимающие заявки от клиентов
2. Старшие кредитные эксперты (СКЭ), обрабатывающие заявки и принимающие
решение о кредитовании на основании данных о проверке персональных данных
клиента и результатах скоринговой оценки характеристик Анкеты клиента,
а) по разным причинам личного характера помогающие организовать получения
кредитов физическими лицами по анкетам с искаженными персональными
данными,
б) привлеченные внешними преступными группировками к организации преступного
кредитного конвейера одобрения фальсифицированных анкет,
в) организующие преступные группировки с привлечением третьих лиц,
используемых для вывода средств из банка посредством получения ссуд
мошенническим образом.
Это сотрудники Банка, заинтересованные в большом объеме выдаваемых кредитов,
если в качестве показателя качества их работы за отчетный период (пресловутого
KPI – КПЭ) выступает количество выданных кредитов и объем портфеля:
8
Таксономия методов противодействия
мошенничеству
Пассивные методы:
• Метод резервирования денежных средств под операционные риски
(модель, предложенная ЦБ РФ в №232П-ФЗ и модель Базельского
комитета).
•
Метод поддержки размера капитала адекватного риску (модели BIA, SA,
ASA, AMA Базельского комитета, а также модель капитала «Н1»,
описанная в №110И-ФЗ).
• Метод страхования (полис «ВВВ»).
Активные методы:
• Методы предотвращения мошенничества.
9
•
Метод выявления (модели простых правил; повышения прозрачности и
открытости совершенных транзакций; модель интеллектуального
анализа данных Data Mining [1] и нейро-сетевые модели).
•
Метод ограничения возможных потерь (модели лимитирования
операций; прямого директивного управления; мониторинга).
•
Метод оперативного взвешивания риска (скоринговые модели; модель
«взвешенного риска»)
Таксономия методов противодействия
мошенничеству 2
10
*) Products & Services
http://www.businessdataminers.com/products/products.htm
Таксономия методов противодействия
мошенничеству 2
Методы по месту в бизнес-процессе
а) препроцессный анализ
б) постпроцессный анализ
в) портфельный анализ
Классификация Richard Wheeler и Stuart Aitken
• взвешенный матричный метод
• алгоритм ближайшего сосед
• мульти-алгоритмический подход
Классификация по Naeimeh Laleh и др.
•
•
•
•
•
11
Методы (алгоритмы) распознавания с «учителем».
Методы (алгоритмы) распознавания с частичным использованием
«учителя».
Методы, использующие комбинацию результатов использования
различных алгоритмов.
Методы, не использующие «учителя».
Методы (алгоритмы), работающие в реальном времени.
Алгоритм вычисления меры близости
сравниваемых объектов 1
- k-ый сравниваемый объект, (например кредитный проект, анкета),
k = 0 – объект, предъявленный на классификацию,
, k = 1,2,…, nB множество объектов, с которыми
выполняется сравнение (базовые объекты), B –
мощность множества базовых объектов,
Ch kj - j-я характеристика в k-го объекта,
k
– общее количество характеристик в k-го объекта,
Ak
n
n kj , ( j = 1, 2 ,... n )
– общее количество полей в j-й характеристике,
- значение i-го поля j-той характеристики k-го объекта,
Fj,ki
- индикатор совпадения/различия значений полей i-тых полей j-тых
характеристик,
match/ off
I j,i
 1, Fj,0i = Fj,ki 
match
1
2
I j,i (Fj,i , Fj,i ) =  0
k 
 0, Fj,i ≠ Fj,i 
 1, Fj,0i ≠ Fj,ki 
off
1
2
I j,i (Fjl,i , Fjl,i ) =  0
k 
12
 0, Fj,i = Fj,i 
, для определения меры близости - совпадения
описания объектов,
, для определения расстояния – не совпадения
описания объектов.
Алгоритм вычисления меры близости
сравниваемых объектов 2
Для характеристики j , 1 <= j <= n k
, сравниваемых объектов, рассчитывается мера
близости / нормированное расстояние по Хеммингу (НБХ/ НРХ) для j-той
характеристики предъявляемого объекта базового объекта/множества
D
match / off
j
1 nl match / off 0 k
= ∑ I j,i
(Fj,i , Fj,i )
n j i=1
Далее, рассчитывается мера близости / взвешенное расстояние с учетом
установленных весов характеристик
w j = {w1 , w2 ,...wn }
DW
match / off
(A , A ) = ∑ w D (A , A )
n
0
k
0
j
j =1
k
j
рассчитанная, взвешенная по важности характеристик, мера близости
Аналогично рассчитывается НРХ/НРБ при сравнении с уже выделенным и/или
проклассифицированным m-ым кластером
m match / off
W
D
(A , С ) = (n ) ∑ D
0
−1
m
m
nm
k =1
W
match / off
(A , A )
0
k
Суммарный объем взвешенных совпадений - величина - сравнивается с
предварительно установленным граничным уровнем совпадений (ГУС)
13
Часть 2
Система выявления и
противодействия
мошенничеству
СВПМ
14
СВПМ. Содержание
•Методологическая основа
•Информационное обеспечение
•Информационная структура БД кредитного проекта
•Структура Анкеты.
•Представление знаний Системы о предметной области в виде
правил
•Формальные постпроцессные признаки мошеннических кредитов
Процессы и процедуры выявления мошенничества
•
Проверка на совпадение персональных данных заявителя с
данными заявителей из СНЗ и СНК
•
Проверка внутренних несоответствий между данными текущего
проверяемого кредитного проекта
•
Проверка на «приукрашивание данных» среди архивных анкет
запрашиваемого типа кредита
•
Проверка на «приукрашивание данных» среди архивных анкет всех
типов потребительских кредитов
•
Проверка несоответствий по группе однородных характеристик
•
Итоговая оценка мошеннического характера кредитного проекта и
принятие окончательного решения
15
Процедуры Системы по выявлению внутреннего мошенничества
СВПМ. Методологические основы
Методологическую основу составляют 3 «линии обороны».
1. Использование «стоп-листов». Абсолютное сравнение
персональных данных заемщика из ПА и из списка реальных и
потенциальных заемщиков-мошенников.
2. Выявление с помощью правил продукции (принятия решения)
противоречий внутри документов кредитного проекта между не
ортогональными (независимыми) характеристиками, появляющимися
из-за желания Заемщика приукрасить свои характеристики и получить
ссуду на большую сумму, чем он реально может обслуживать и
вернуть.
3. Использование элементов теории нечетких множеств, а именно,
алгоритма нечетких соответствий для определения близости, в
статистическом понимании, рассматриваемого Кредитного проекта с
множествами хороших/плохих/мошеннических проектов из накопленной
БД
16
Часть 2
Информационное обеспечение
•Информационная структура БД и БЗ кредитного проекта
•Структура Анкеты.
•Представление знаний Системы о предметной области в виде
правил продукции
•Формальные постпроцессные признаки мошеннических кредитов
Процессы и процедуры выявления мошенничества
•Проверка на совпадение персональных данных заявителя с
данными заявителей из СНЗ и СНК
•Проверка внутренних несоответствий между данными текущего
проверяемого кредитного проекта
•Проверка на «приукрашивание данных» среди архивных анкет
запрашиваемого типа кредита
•Проверка на «приукрашивание данных» среди архивных анкет всех
типов потребительских кредитов
•Проверка несоответствий по группе однородных характеристик
17
•Итоговая оценка мошеннического характера кредитного проекта и
принятие окончательного решения
Процедуры Системы по выявлению внутреннего мошенничества
СВПМ. Информационное обеспечение 1
1.
Анкета – документ, заполняемый заявителем, и
содержащий информацию о клиенте, содержит описание
характеристик, существенных для оценки желания и способности
расплачиваться по ссуде некоторого максимального объема
2.
Кредитная заявка – запрашиваемые параметры ссуды
(объем, ставка, срок и т.д.)
3.
Описание обеспечения по ссуде, (если таковое имеется)
4.
Принятое решение по проекту
5.
Информация по обслуживанию долга заемщиком (для
выданного кредита)
• Плановый и реальный платежные календари
• Оценки исполнения обязательств заемщиком
18
СВПМ. Информационное обеспечение.
Множества и подмножества кредитов
ВК
НК
НПК
НМК FPS
НМК
ХК
КПМ
ПК
ВК - выданные кредиты
НК – не выданные кредиты, по причине
наличия признаков мошенничества (НМК) и не
выданные прочие (НПК).
Среди ВК имеются
«Хорошие» кредиты (ХК)– вовремя
обслуживаемые или завершенные вовремя или
досрочно кредитные проекты
«Плохие» кредиты – действующие и/или
имеющие постпроцессные признаки дефолта, в
том числе и полученные мошенническим путем
(КПМ), а также списанные кредиты (СК).
Из НМК для удобства и ускорения
обработки данных выделяется список
неблагонадежных заявителей (СНЗ). Из списка
КПМ – список ненадежный кредиторов (СНК).
СК
«черная зона» - практически полная уверенность в том, что заемщик мошенник,
«белая зона» - практически полная уверенность заемщик – добропорядочный клиент банка,
«серая зона», в которой имеющейся информации или применяемых методов оценки заемщика
недостаточно для принятия однозначного решения.
19
СВПМ. Информационное обеспечение. Анкеты
Структуры
Характеристики кредитного проекта (Анкеты) подразделяются на два класса:
•
валидные – соответствующие реальным,
•
невалидные – искаженные в сторону повышения оценки
кредитоспособности.
Однородные
Не однородные
А также на
•
Проверяемая анкета (ПА) – анкета на входе Системы
•
Хранимая анкета (ХА) – анкета, которая хранится в базе данных Системы и
может входить в различные подмножества хороших/плохих и т.п. анкет.
•
•
•
значимые, (влияющие на принятие решения)
•
информационные, несущие избыточную, но полезную информацию для
выявления искажений
Искажения и/или информационная избыточность представляется гиперкубом
конкордации данных : ось – шкала значений поля характеристики
• «0» - независимые (ортогональные атомы информации)
• «1» клетки с соответствующими друг другу информационными атомами и
• «-1» с противоречащими друг друга атомами информации
20
СВПМ. Информационное обеспечение.
БЗ. Правила продукции 1
Каждое правило, содержит условную и заключительную
части.
В условной части правила находится либо одиночный факт,
либо несколько фактов, соединенных конъюнкцией.
В заключительной части правила находятся факты,
которыми необходимо пополнить рабочую память, если
условная часть правила является истинной.
(i) Q; P; A > B; N;
- идентификатор правила
- сфера применения
- условие применения
- ядро: «если выполняется условие А, то следует
выполнить действие В»
N
- постусловие: некое действие после
выполнения В
(i)
Q
P
A>B
21
СВПМ. Информационное обеспечение.
БЗ. Правила продукции 2
•
Правила продукции, отражающие знания о предметной
области, в частности правила проверки несоответствия (ППН) или
экспертные правила.
•
Метаправила, управляющие процессом (последовательностью)
проверок
•
Правила агрегирования результатов отдельных проверок.
•
Конструктор строит выражения (логические, числовые), из значений
полей характеристик ПА в виде дизъюнктивных нормальных форм,
составленных из логических функций, выражающих истинность или
ложность ограничений на значения полей характеристик.
22
Примеры ППН
•
«Если Возраст (в годах)/доход (в тыс. руб.) <= К», где К – параметр,
то Имеются явные признаки мошенничества, заявку отклонить»
•
«Если количество заявления данного клиента, поданных ранее,
больше 0 и в них имеются различия в персональных данных, то имеются
косвенные признаки мошенничества, продолжить проверки»
•
«Если Адрес регистрации совпадает с адресом работы
или адрес фактического места проживания совпадает с адресом
места работы
то есть вероятность того, что заемщик – мошенник».
СВПМ. Процессы и процедуры выявления
мошенничества
1.
Проверка на совпадение персональных данных заявителя с
данными заявителей из СНЗ и СНК
2.
Проверка внутренних несоответствий между данными
текущего проверяемого кредитного проекта
3.
Проверка на «приукрашивание данных» среди архивных
анкет запрашиваемого типа кредита
4.
Проверка на «приукрашивание данных» среди архивных
анкет всех типов потребительских кредитов
5.
Проверка несоответствий по группе однородных
характеристик
6.
Итоговая оценка мошеннического характера кредитного
проекта и принятие окончательного решения
23
СВПМ. Процессы и процедуры выявления
мошенничества
И н ициал изация процедур
п роверки
на наличие
м ош енни ч ес тв а
П роцедуры яд ра С истем ы
АПП
Расчет оценок
признаков
м ош енни ч ес тв а
И м ею т ся
явны е признаки
м ош енничест в
а,
заявку
от клонит ь
АПНС
БД
Наличие явны х
признаков
м ош енни ч ес тв а
Да
Да
ППН
Н аличие косвенны х
признаков
м ош енни ч ес тв а
ХА
Э ксперт ны й
анализ
признаков
Р азреш ено
привлечение СКЭ к
данной проверке
Нет
СНЗ
Нет
Нет
С КЭ признал
признаки
сущ ественны м и
ГО Х
СНК
Да
Н ет
П ереход к следую щ ей
проверке
Список проверок
исчерпан
Да
Н ет
Расчет
и н тегр а л ь н о й
оценки
м о ш енн ич е ств а
Да
«б елая зона»
«черная зона»
Да
Н ет
24
П р и знако в внеш него
м ош енничест ва не
вы явлено
В ы явлен ы ко свенны е
признаки
м ош енничест ва
В ы со ка вер о ят но ст ь
внеш него
м ош енничест ва
СВПМ. Проверка на совпадение персональных
данных заявителя с данными из СНЗ и СНК
ППН для сличения ПДЗ с «кредитным кладбищем»
«Если фамилия заемщика в ПА полностью совпадают с
фамилией заемщика в СНК и имя заемщика в ПА полностью
совпадает с именем заемщика в СНК и отчество заемщика в ПА
полностью совпадает с именем заемщика в СНК
<и другие персонифицированные данные заемщика (ПДЗ)
найдены в СНК>
то данный кредитный проект имеет явные признаки
мошенническим и занести указатель на ПА в СНЗ»
Аналогичное ППН используется для сличения
персонифицированных данных с «анкетным кладбищем» - СНК и
СК.
Дальнейшие действия определяются метаправилами Системы.
25
«Если сверка ПДЗ с СНЗ дала положительный результат
и/или сверка ПДЗ с СНК дала положительный результат
то в выдаче кредита отказать и проверки закончить».
СВПМ. Проверка внутренних несоответствий
между данными проверяемого кредитного проекта
Автономная проверка целостности и/или искажений данных
в самой Кредитной заявке проводится на соответствие
логическим эмпирическим Правилам, созданным при анализе
гиперкуба конкордации данных Кредитного проекта.
Смотри примеры некоторых ППН.
•
«Если Возраст (в годах)/доход (в тыс. руб.) <= К», где К –
параметр, то Имеются явные признаки мошенничества,
заявку отклонить»
•
«Если Адрес регистрации совпадает с адресом работы
или адрес фактического места проживания совпадает с
адресом места работы
то есть вероятность того, что заемщик – мошенник».
Результат итожится метаправилом.
«Если сумма взвешенных несовпадений ПА больше ГУС,
то выполнить проверку по однородным характеристикам».
26
СВПМ. Проверка на «приукрашивание данных»
среди архивных анкет совпадающего типа
• Текущая ПА сравнивается с ХА, совпадающими по типу
запрашиваемого кредита с использованием АПНС.
• Формируется множество ссылок на ХА, «похожих» на проверяемую
анкету (МПА), согласно правилу
«Если сумма взвешенных совпадений ПА и ХА меньше ГУС, то
указатель на ХА помещается в список указателей на множество анкет,
похожих на ПА»
• СКЭ на основе экспертного анализа совпадений делает/уточняет
заключение о возможности наличия мошенничества. Система выдает
резюме
• резюме 1 «Проверка на «приукрашивание» выявила значимые признаки
мошенничества, в выдаче кредита отказать»
• резюме 2 «Проверка на «приукрашивание» не дала результатов,
требуется проведение проверки по всему архиву заявлений-анкет по
потребительским кредитам»
27
СВПМ. Проверка несоответствий по группе
однородных характеристик
Большое количество характеристик и полей несколько размывает
чувствительность к искажениям данных в анормальных кредитных
проектах
1. Адресная группа характеристик:
• Адрес регистрации
• Адрес фактического проживания
• Адрес предыдущего проживания
• Адрес организации (основной работы)
• Адрес дополнительной работы
• Адрес предыдущей работы
• Адрес работы супруга
28
2. Телефонная группа характеристик
• Домашний стационарный телефон места проживания
• Домашний стационарный телефон места регистрации
• Рабочий стационарный телефон 1
• Рабочий стационарный телефон 2
• Мобильный рабочий телефон 1
• Мобильный рабочий телефон 2
3. Образовательные заведения
4. Научные титулы и звания
5.Профессия
….
СВПМ. Итоговая оценка мошеннического
характера кредитного проекта и принятие
окончательного решения
C учетом весовых коэффициентов значимости выполненных проверок.
1 Nt
Fraud =
wt s Pt s
∑
Nt s =1
рассчитанной величине по шкале «белой/серой/черной»
По
принимается окончательное решение о статусе Кредитного проекта
зоны
Вероятность / уверенность
в мошенничестве
№
1
2
3
29
Зона
от
по,
включительно
0
0,15
0,151
0,751
0,75
1
Резолюция
Действия
белая
В проекте отсутствуют
признаки мошенничества
Продолжить андерайтинг
Кредитного проекта
серая
В проекте притсутствуют
косвенные признаки
мошенничества
Учесть полученный результат
в дальнейшем андерайтинге
Кредитного проекта
черная
В проекте притсутствуют
явные и косвенные признаки
мошенничества
В кредите отказать. Занести
результаты в БД.
СВПМ. Процедуры Системы по выявлению
внутреннего мошенничества 1
Симбиоз с другими мероприятиями по предотвращению
внутреннего мошенничества
•
проверка на программно-аппаратных комплексах выявления
неискренности
•
типовые действия, направленные на борьбу с любыми
мошенническими действиями
•внутренний аудит Системы: регистрация и запись действий
пользователей;
•«проигрывание» выполненных действий при расследовании
инцидентов;
•детальный анализ прошедших событий;
•определение противоправных действий в реальном времени
на основе правил;
30
СВПМ. Процедуры Системы по выявлению
внутреннего мошенничества 2
Основной диагностический признак:
Характеристики потока заявок в разрезе по каждому
КЭ/СКЭ:
•
скользящее среднее (СС) за данный период (неделя,
месяц и т.д.) объема множества анкет из архива, похожих на
проверяемую анкету в расчете на одну заявку по анкетам,
обработанным на данной точке приема заявок за данный
период.
•
интенсивность поступления заявок с увеличенным
объемом множества анкет из архива, похожих на проверяемую
анкету в расчете на одну заявку.
•
возможность анализа применения новых правил
к прошлым событиям, сохраненным в БД
31
Итоги и результаты
1. Проанализированы методы, положенные в основу функционирования, и
изложены принципы построения локальной FPS-системы предотвращения
мошенничества при потребительском экспресс-кредитовании.
2.Основной методологический принцип системы - поиск несоответствий в
документах кредитного проекта,
3.В качестве базовой процедуры в большинстве проверок использован
алгоритм из области искусственного интеллекта алгоритм поиска нечетких
совпадений - АПНС
4. Использование АПНС в совокупности с правилами продукции позволил
создать несложную систему противодействия мошенничеству посредством
выявления препроцессных и постпроцесных признаков внешнего и
внутреннего мошенничества, которая может встраиваться в существующие
системы кредитного конвейера.
32
Спасибо за внимание!
Козлов Дмитрий Николаевич
Левин Владимир Владимирович
33
d.kozlov@zenit.ru
8-916-126-8459
v.levin@zenit.ru
Download