Использование методов фрактальной теории при

advertisement
С.А. ГОРБАТКОВ, И.И. БЕЛОЛИПЦЕВ,
С.А. ФАРХИЕВА
Финансовый университет при Правительстве Российской Федерации
(Уфимский филиал)
sgorbatkov@mail.ru, red7315@gmail.com, ok-xi@yandex.ru
ИСПОЛЬЗОВАНИЕ МЕТОДОВ ФРАКТАЛЬНОЙ ТЕОРИИ ПРИ
РАНЖИРОВАНИИ ОБЪЕКТОВ НАЛОГОВОГО КОНТРОЛЯ
Для решения задач налогового администрирования и повышения собираемости
налогов
построена
нейросетевая
информационноматематическая модель налогового контроля. Детально рассмотрен вопрос оценки вероятности нарушения налогового законодательства налогоплательщиками с использованием элементов фрактальной теории.
Ключевые слова: налоговые доначисления, байесовский подход,
фрактальная размерность, минимальное покрытие
Введение
Осуществление эффективной налоговой политики является одной из
стратегических задач государства. В Основных направлениях налоговой
политики РФ на период 2012-2014 гг. предполагается разработать эффективные механизмы борьбы с налоговыми нарушениями [1]. При этом, по
мнению руководителя ФНС РФ Мишустина М.В., необходимо совершенствовать процедуру проведения камеральных проверок налогоплательщиков [2]. Для рационального использования бюджетных средств и трудовых ресурсов, выездные налоговые проверки должны проводиться адресно, на основе оценки вероятности нарушения налогового законодательства налогоплательщиком. Для решения поставленной задачи необходима
разработка информационно-математических моделей, позволяющих
надежно выявлять нарушителей налогового законодательства. В работах
[3-6] был предложен и разработан в деталях метод построения гибридной
нейросетевой модели (ГНСМ) налогового контроля с последующим синтезом оптимального плана выездных налоговых проверок.
Целью данной работы является углубленное изучение вопроса об
оценке вероятности нарушения налогового законодательства налогоплательщиком.
При составлении плана проверок должны соблюдаться следующие
принципы:
1) план проверок формируется после подачи налогоплательщиками
последней налоговой декларации (квартального отчета) в момент времени
t0 . Появление значительных относительных отклонений (1) может свидетельствовать о нарушении g-ым налогоплательщиком налогового законодательства и является основанием для включения его в план проверок;
 g ,i   yi  hi ( X ,W )  / yi
,
(1)
t t0
2) большие отклонения вида (1) на момент составления плана проверок
могут быть вызваны и объективными причинами (неудачная сделка, повлекшая за собой убытки, форс-мажор и т.д.). Поэтому необходимо учитывать предысторию появления у данного налогоплательщика таких отклонений и оценить вероятность нарушения данным налогоплательщиком
налогового законодательства;
3) проведение выездных проверок, в первую очередь, преследует цель
получения максимальных налоговых доначислений. Очевидно, что величина возможных доначислений зависит от масштаба предприятия, который нужно учитывать при составлении плана проверок.
Методы ранжирования налогоплательщиков
для составления плана выездных проверок
Для составления плана проверок все предприятия-налогоплательщики
ранжируются в порядке убывания критерия { g } , который учитывает
вышеперечисленные условия. В [5] предлагалось вычислять { g } следующим способом:
 g   g  P( g   g )  M g ;  g  M [ g ,t ]  U g ;
(2)
где g – номер предприятия; P( g   g ) – вероятность того, что текущее
(по времени t) значение отклонения  g для g-го налогоплательщика будет
больше его математического ожидания, смещенного вверх на полуширину
доверительного интервала Ug; M[] – оператор математического ожидания
временного ряда { g ,t } , который считается стационарным процессом; Mg
– коэффициент масштаба предприятия.
В качестве Ug принимается половина размаха отклонения  g на отфильтрованном байесовском ансамбле [5]:




1
*
*
(3)
U g  [max 
*  min 
* ]t t0 ; q  1, Q ,
g
,
t
,
q
g
,
t
,
q
2
где t0 – момент последнего наблюдения, для которого синтезируется план
выездных проверок.
Вероятность P( g   g ) учитывает предысторию появления у g -го
налогоплательщика больших отклонений от эталонной поверхности

Yˆ ( X ,W , t ) t t0 . Коэффициент масштаба Mg в (2) вычисляется как отношение величины расходов каждого предприятия к максимальному значению
по всей группе предприятий. Использование критерия (2) возможно только в том случае, если значения рядов { g ,t } распределены по нормальному закону, что выполняется далеко не всегда. Проверить гипотезу о нормальном распределении стандартными статистическими методами,
например, по критерию согласия Пирсона, невозможно, так как ряды
{ g ,t } содержат всего 8–16 значений. Соответствие рядов { g ,t } нормальному распределению можно приближенно установить по величине
показателя Херста H [7]:
H  log( R / S ) / log( N / 2) ,
(4)
где R  max{ g ,t }  min{ g ,t } , i  1, N
размах отклонений  g ,t ; S –
среднеквадратическое отклонение (gq,t) .
Если для некоторого временного ряда 0,5  H  1 , то этот ряд является
персистентным, или трендоустойчивым. Чем ближе значение H к единице, тем более коррелированны значения ряда { g ,t } . Если для некоторого
ряда 0,5  H  1 , то это означает, что ряд { g ,t } не является случайным, а
содержит тренд, значит можно предположить, что данный налогоплательщик систематически нарушает налоговое законодательство.
В качестве альтернативы вероятностному критерию (2) предлагается
проводить ранжирование налогоплательщиков на основе вычисления величины фрактальной размерности D временных рядов { g ,t } . Если уровни ряда { g ,t } независимы, то величина D будет стремиться к величине
топологической размерности плоскости, то есть D  2 . Если же значения
ряда { g ,t } не являются независимыми, то величина D будет значитель-
но меньше 2. Отношение 1 / D трактуется как оценка вероятности нарушения налогового законодательства налогоплательщиком в (2).
Существует несколько способов определения фрактальной размерности временного ряда. В данной работе предлагается использовать 2 из
них:
1) Фрактальная размерность может быть найдена с помощью показателя Херста:
(5)
DH  2  H ,
где DH – величина фрактальной размерности; H – показатель Херста.
Тогда критерий ранжирования (2) запишем в виде:
 g   g  M g / DH .
(6)
Недостатком этого метода ранжирования налогоплательщиков является тот факт, что для получения приемлемой оценки показателя Херста
необходимо иметь достаточно большое количество данных (несколько
сотен значений временного ряда) [8], в противном случае использование
оценки DH могут быть неточными.
Наиболее перспективный способ ранжирования налогоплательщиков
основан на вычислении величины размерности минимального покрытия
D [8]:
 g   g  M g / D , D  1   ,
(7)
где D – размерность минимального покрытия;  – индекс фрактальности.
Индекс фрактальности  является локальной фрактальной характеристикой временного ряда. В [8] показано, что точность определения D ,
намного выше, чем точность определения других фрактальных характеристик, таких как клеточная размерность Dc или показатель Херста.
Размерность минимального покрытия определяется следующим образом: пусть временной ряд { g ,t } задан функцией f (t ) на отрезке [a, b] .
Разобьем отрезок [a, b] на равные интервалы длиной   (b  a) / m . Минимальная площадь покрытия графика функции f (t ) на отрезке [a, b]
будет равна сумме площадей прямоугольников с основанием  и высотой,
равной разности Ai () между максимальным и минимальным значением
функции f (t ) на каждом отрезке [ti 1 , ti ] (рис. 1).
Рис. 1. Построение минимального покрытия 1
Полную площадь минимального покрытия S () можно найти как:
m
S ()  V f () , V f ()   Ai () ,
(8)
i 1
где V f () – сумма амплитуд функции f(t) на отрезке [a, b] . Очевидно, что
S () зависит от выбора величины . Индекс фрактальности  определяется из соотношения:
V f ()   при   0 ,
(9)
где   D  1 .
Для определения D необходимо построить график зависимости
V f () от  в двойных логарифмических координатах и определить  как
тангенс угла наклона прямой к оси X, взятый с обратным знаком и затем
вычислить D из (9).
Результаты вычислительных и натурных экспериментов
По данным квартальных налоговых деклараций 24 сельскохозяйственных предприятий за период с 2006 по 2009 гг. была сформирована исход-

ная база данных D  Yi , X i
i N
i 1
, где i – номер вектор-строки наблюде-
ний, состоящая из 276 наблюдений.
1
Рисунок заимствован из [8].
Для построения ГНСМ налогового контроля был создан ансамбль из
10 гипотез-нейросетей, принадлежащих к одному классу H (многослойный персептрон с обратным распространением ошибки обучения и линейной активационной функцией в выходном слое). Нейросети ансамбля
различаются видом активационных функций и количеством нейронов в
скрытых слоях, архитектурой и смещениями в активационных функциях.
До обучения сетей были реализованы следующие процедуры предобработки (предрегуляризации) данных для повышения однородности и информативности данных (подробно описаны в [3,5]):
1) проведен корреляционный анализ, в результате из 16 первоначальных показателей, были отобраны только 6 значимых;
2) была решена задача оптимальной кластеризации данных методом kсредних. Так как в качестве входных факторов использовались удельные
величины, и данные изначально были достаточно однородны, был сформирован единственный кластер;
3) проведена процедура удаления «противоречивых» вектор-строк
наблюдений.
После обучения сетей, согласно байесовскому подходу к регуляризации [9], была проведена их фильтрация. Процедуру фильтрации прошли 8
сетей. Адекватность ГНСМ была установлена с осредненной апостериорной вероятностью P*  0,95 .
Для составления плана выездных
проверок предприятияналогоплательщики ранжировались по критерию отбора { g } по правилам (2), (6) и (7). Для проверки гипотезы о нормальном распределении
рядов { g ,t } был рассчитан показатель Херста (4). Значения H для всех
предприятий попали в интервал 0,5  H  1 , а это значит, что распределения рядов { g ,t } отличны от нормального и содержат тренд. А значит,
использование вероятностного критерия (2) нежелательно.
Оптимальные планы проверок строились по правилам (6) и (7). Для
расчета значений { g } были получены оценки фрактальной размерности
DH и размерности минимального покрытия D для всех 24 предприятий
по 8 независимым НСМ, прошедших процедуру фильтрации. В целом, для
большинства предприятий оценка фрактальной размерности D оказалась
большее оценки DH по Херсту. На рис. 2 приведен пример лог-лог зависимости V f () для предприятия №2, построенной для НСМ1.

Рис. 2. Зависимость V f () в двойном логарифмическом масштабе для
временного ряда остатков { g ,t } , длиной 16 наблюдений
Как видно из рисунка, уравнение регрессии построено с очень высоким значением коэффициента детерминации R 2  0.99 . Это говорит о
том, что оценка фрактальной размерности D была определена достаточно точно. Заметим, что для всех 24 предприятий коэффициент детерминации R 2 не опускался ниже 0,75.
Сравним планы выездных проверок, полученные по правилам (6) и (7)
Предположим, что в распоряжении налоговых органов есть двенадцать
проверяющих бригад, т.е. G*  12 . Очередность попадания конкретного
предприятий в отрезок   [1; G* ] не имеет значения. В обоих наборах планов проверок (по (6) и по (7)) среди первых 12 значений повторяются 10
номеров предприятий. На данном этапе построения ГНСМ осуществляется второй этап оценки адекватности. Можно утверждать, что адекватность
ГНСМ установлена с доверительной вероятностью PGCV  10 / 12  0.83 .
Окончательные планы выездных проверок получим путем ранжирования всех предприятий по осредненному критерию  g .
Сравним результаты моделирования с результатами налоговых проверок, проводившихся на предприятиях, участвовавших в вычислительном
эксперименте. В таблице 1 приведены оптимальные планы выездных проверок по (6) и (7) и величина налоговых доначислений, полученных по
результатам выездных проверок (указаны первые 12 номеров предприя-
тий согласно оптимальным планам и 12 номеров предприятий с наибольшими доначислениями).
Из таблицы видно, что из 12 предприятий, допускавших грубое нарушение налогового законодательства, в окончательные планы проверки
попало 10. Таким образом, ГНСМ налогового контроля достаточно точно
идентифицирует нарушителей налогового законодательства и может существенно повысить эффективность работы налоговой службы в части
налогового контроля.
Таблица 1
Сравнение результатов моделирования с итогами выездных
налоговых проверок
Очередность проведения
проверки
1
2
3
4
5
6
7
8
9
10
11
12
Оптимальный
Оптимальный
Результаты проведеплан проверкок план проверкок
ния проверок
по (6)
по (7)
№
№
№
Доначислеg
g
предпр.
предпр.
предпр.
ния, руб.
11
0,2027
11
0,1984
11
7002076
22
0,0727
22
0,0590
9
3140252
9
0,0634
9
0,0473
8
2780893
14
0,0439
14
0,0423
24
1911636
3
0,0271
21
0,0323
21
1700531
21
0,0225
3
0,0227
22
1520399
8
0,0208
15
0,0209
16
1427865
24
0,0187
10
0,0185
10
1384382
2
0,0161
8
0,0175
13
1371761
12
0,0156
2
0,0146
3
1366995
30
0,0151
24
0,0141
14
1041774
10
0,0131
30
0,0129
2
839696
Заключение
Показано, что ряды остатков, характеризующие искажение налогооблагаемой базы налогоплательщиками не являются случайными. Этот факт
является сигналом о возможном нарушении налогового законодательства.
Вероятность нарушения налогового законодательства налогоплательщиком можно, рассчитав фрактальную размерность ряда остатков. Результаты моделирования согласуются с результатами реальных налоговых проверок.
Дальнейшие исследования будут посвящены разработке методики отбора факторов для включения в модель. Кроме того, предложенные в работах [3-6] концепции построения нейросетевых моделей для сложных
условий моделирования могут успешно использоваться для решения других прикладных задач, например, при диагностике банкротств.
Список литературы
1.
Основные направления налоговой политики Российской Федерации на 2012 год и на плановый период 2013 и 2014 годов . URL:
http://www.minfin.ru.
2.
Мишустин М.В. Механизм государственного налогового администрирования в России: Дисс. канд. экон. наук. М., 2003.
3.
Горбатков С.А., Полупанов Д.В., Макеева Е.Ю., Бирюков А.Н.
Методологические основы разработки нейросетевых моделей экономических объектов в условиях неопределенности / Под ред. д.т.н., профессора
Горбаткова С.А. Монография. М.: Издательский дом «Экономическая
газета», 2012.
4.
Горбатков С.А., Белолипцев И.И., Фархиева С.А. Приближенный
метод байесовской регуляризации и двухступенчатая оценка адекватности
гибридной нейросетевой модели // «Нейроинформатика – 2011»: Сб.
научн. трудов. В 3-х частях. Ч.2. М.: НИЯУ МИФИ, 2011. С. 144-154.
5.
Нейросетевое математическое моделирование в задачах ранжирования и кластеризации в бюджетно-налоговой системе регионального и
муниципального уровней: монография / С.А. Горбатков, Д.В. Полупанов,
А.М. Солнцев, И.И. Белолипцев, М.В. Коротнева, С.А. Фархиева,
О.Б.Рашитова. Уфа: РИЦ БашГУ, 2011.
6.
Горбатков С.А., Полупанов Д.В. Методы нейроматематики в
налоговом контроле / Под ред. д.т.н., проф. С.А. Горбаткова. Уфа: РИЦ
БашГУ, 2008.
7.
Петерс Э. Хаос и порядок на рынках капитала. М.: Мир, 2000.
8.
Дубовиков М.М., Крянев А.В., Старченко Н.В. Размерность минимального покрытия и локальный анализ фрактальных временных рядов.
// Вестник РУДН, 2004. Т. 3. №1. С. 81-95.
9. Шумский С.А. Байесова регуляризация обучения // «Нейроинформатика– 2002»: Сб. научн. трудов. Ч. 2. М.: МИФИ, 2002. С. 30-93.
Download