СеменычевÐ&#39

advertisement
УДК 338.27
 2014 Семёнычев В.К., Коробецкая А.А.
ИДЕНТИФИКАЦИЯ МУЛЬТИТРЕНДОВОЙ
ЭВОЛЮЦИОНИРУЮЩЕЙ МОДЕЛИ С МУЛЬТИПЛИКАТИВНОЙ
ЛИНЕЙНО-ЭКСПОНЕНЦИАЛЬНОЙ СТРУКТУРОЙ
В статье рассмотрены различные варианты мультрендовой
структуры модели, предложена модель жизненного цикла на основе
мультипликативного взаимодействия линейного и экспоненциального
тренда. Охарактеризована область применения модели. Предложены
методы идентификации модели и проведено исследование их точности,
выбран наилучший метод идентификации, обеспечивающий точность
модели по R2 свыше 0,75, а ошибку прогноза по kT2 менее 20% при уровне
шума Kn/s 0-30%.
Ключевые слова: мультитрендовая модель, эволюция, жизненный
цикл, идентификация, алгоритм RPROP, метод «имитации отжига».
Одной из широко распространенных задач эконометрического
моделирования является идентификация параметров тренда Tt ,
различной степени сложности, как с линейным, так и с нелинейным
вхождением параметров. Число применяемых моделей тренда
велико и исчисляется десятками.
Менее распространенными являются мультитрендовые [1]
структуры рядов динамики, включающие в себя несколько
взаимосвязанных или независимых трендов.
Наиболее простым вариантом является алгебраическое
взаимодействие
двух
трендов,
например,
аддитивное,
мультипликативное или пропорционально-мультипликативное:
Tt  Tt I  Tt II ,
(1)
I
II
Tt  Tt  Tt ,
(2)
Tt  Tt I (1  Tt II ) .
(3)
Такие
структуры
позволяют
описывать
сложную
эволюционирующую динамику, когда-либо один тренд постепенно
сменяется другим, либо формируется новая динамика, существенно
отличающаяся от динамики исходных трендов Tt I и Tt II .
Взаимодействие вида (1) и (3) в большей степени
соответствует первому случаю эволюционирующей динамики, если
модели трендов Tt I и Tt II имеют асимптотические уровни. Примеры
такой динамики представлены на рисунке 1. График (а)
соответствует сумме экспоненциальных трендов, график (б) –
сумме импульсных дробно-рациональных трендов, а график (в) –
пропорциональному
взаимодействию
обобщенной
экспоненциальной и импульсной модели. В каждом случае можно
отчетливо визуально выделить на графике участки, на которых
доминирует одна из составляющих тренда. Эволюция проявляется
в виде постепенного перехода от одной доминирующей модели
тренда к другой.
Yt
Yt
Tt  Tt I  Tt II
Yt
Tt  Tt I  Tt II
Tt  Tt I (1  Tt II )
0
(а)
0
t
(б)
t
0
(в)
t
Рис. 1. Примеры взаимодействия трендов вида (1) и (3) со сменой
доминирующего тренда
Второй случай чаще может быть представлен структурой (2).
При этом в итоговом графике сложно или невозможно выделить
участки, соответствующие исходным моделям. Тем не менее,
полученная динамика также может быть эволюционирующей, с
выделением участков эволюции за счет точек экстремума, перегиба
и асимптотических уровней. На рисунке 2 (а) представлено
взаимодействие линейного и симметричного импульсного тренда,
в результате формируется асимметричная импульсная модель. На
рисунке 2 (б) отображается взаимодействие степенного и
экспоненциального трендов.
Yt
0
Yt
Tt  Tt I  Tt II
(а)
t
0
Tt  Tt I  Tt II
(б)
t
Рис. 2. Примеры взаимодействия трендов вида (1) и (2) без смены
доминирующего тренда
В данной статье в качестве примера мультипликативного
взаимодействия трендов (2) рассматривается модель в виде
произведения линейного тренда на экспоненциальный:
Tt  Tt I  Tt II  ( A0  A1t )e  t .
(4)
До настоящего времени данная модель не была исследована
на предмет особенностей динамики, методов ее идентификации и
областей возможного применения.
Возможные формы динамики модели (4) в зависимости от
сочетания знаков параметров представлены на рисунке 3. При
отрицательных значениях A0 форма динамики будет аналогичной,
но точка пересечения с осью ординат будет находиться в области
отрицательных значений.
Yt
Yt
t
A0
A0>0 A1>0 α>0
A0>0 A1<0 α>0
t
Yt
Yt
t
A0>0 A1>0 α<0
t
A0>0 A1<0 α<0
Рис. 3. Форма динамики модели (4) при различных знаках
параметров A0, A1, α
Наибольший практический интерес представляет форма
динамики при A0>0, A1>0, α>0, соответствующая жизненному циклу
продукта (ЖЦП). Под продуктом в данном случае понимается некий
товар, услуга или выпускающий их субъект экономики в целом.
Показателем ЖЦП может являться объем продаж в денежных
или натуральных единицах, доля рынка, валовая выручка и др.
На рисунке 4 представлено влияние значений параметров на
форму кривой. Стрелками показано направление увеличения
значений параметров.
Yt
Yt
Yt
A1
A0
α
t
t
Рис. 4. Форма динамики модели (4) при изменении значений
параметров A0, A1, α
t
Параметр A0 отмечает точку пересечения с осью ординат и
соответствует уровню ЖЦП в начальный момент времени.
Параметры A1 и α совместно определяют высоту ЖЦП, а также
скорость и продолжительность спада.
Модель имеет единственный экстремум и единственную
точку перегиба. Точка экстремума определяется по формулам:
 A

A1  A0
A
, Tt   1 exp  0  1 .

A1
 A1

t 
Точка перегиба имеет координаты:
t  
 A

2A1  A0
2A
, Tt   1 exp  0  2  .

A1
 A1

Указанные точки позволяют выделить в модели три стадии
эволюции и ЖЦП: быстрый рост с замедлением, насыщение и
медленный спад (рисунок 5).
Yt
0
t*
t**
рост насыщение
спад
t
Рис. 5. Выделение стадий ЖЦП в динамике модели (4)
Динамика модели (4) во многом схожа с динамикой известной
модели [2], показанной в качестве примера на рисунке 2 (б):
Tt  A0t  e t .
(5)
Однако есть и различия. Модель (5) всегда проходит через
начало координат, а модель (4) может начинаться с любого
значения, заданного параметром A0. Модель (5) имеет две точки
перегиба, что позволяет выделить четыре стадии ЖЦП. В то же
время модель (5) обладает большей нелинейностью (оба
образующих ее тренда нелинейны), что может затруднить ее
идентификацию.
Модель (4) в большей степени подходит для описания
жизненного цикла «ожидаемых» товаров, для которых характерен
высокий интерес с самого начала продаж. К ним относятся фильмы,
книги, некоторые программы и видеоигры, мобильные устройства,
в особенности - продолжения, ремейки и новые версии уже
известных продуктов. Для этих товаров характерна широкая
известность производителя или линейки продукта, масштабная
предпродажная маркетинговая кампания. В некоторых случаях
стадия роста полностью вырождается и после нескольких первых
дней продаж объемы начинают снижаться.
Идентификация модели (3) может быть выполнена
различными методами. В данном исследовании были рассмотрены
и сравнены три подхода к идентификации.
Первый
подход
–
конструирование
обобщенной
параметрической ARMA-модели с помощью Z-преобразования [3].
Раскрыв скобки в модели (4), получим:
Tt  A0e t  A1te t .
Прямое и обратное Z-преобразование приводит к следующей
ARMA-модели:
Tt  2Tt 1  Tt 2 ,   e .
Параметры идентифицируются с помощью
применения метода наименьших квадратов (МНК):
n
двукратного
  arg min  Yt  2Yt 1  Yt 2  ,


2
t 2
    ln(  ),
A0 , A1
n


 arg min  Yt   A0  A1t  e  t .
A0 , A1
t 1
2
Второй
подход
основан
на
методе
итерационной
параметрической
декомпозиции
[4]
с
независимой
идентификацией, образующую модель трендов. Однако в данном
случае невозможно выделить доминирующий тренд на первом
этапе
декомпозиции,
поэтому
необходимы
начальные
приближения, которые можно получить с помощью метода
«имитационного отжига» [5].
Найденные с помощью «имитационного отжига» начальные
приближения параметров подставляются в модели Tt I  A0  A1t и
Tt II  Ae t для уточнения параметров путем итерационной
параметрической декомпозиции.
Третий подход ориентирован на численном решении МНК для
модели в целом. С помощью «имитации отжига» определяется
область локального минимума функции квадратичной ошибки
(начальное приближение). Затем с помощью алгоритма RPROP [6]
осуществляется спуск к найденному минимуму.
Предложенные методы были исследованы на точность
идентификации с помощью генерации тестовых выборок.
Дисперсия аддитивной стохастической компоненты задавалась
через коэффициент шум/сигнал Kn/s (отношения дисперсии
стохастической компоненты к дисперсии мощности тренда) в
диапазоне значений 0-30%. Объем выборки задавался равным 24,
36, 48 наблюдениям, а глубина прогноза назначалась в 12
наблюдений.
При каждом наборе параметров было сгенерировано по 50
выборок, всего 63 000 выборок.
Диапазон варьирования значений параметров модели
представлен в таблице 1. При выбранных значениях параметров
точка максимума модели находится в пределах выборки, а точка
перегиба – на прогнозной части или в конце рабочей выборки. В
прогнозную часть выносятся этапы насыщения и спада.
Таблица 1.
Диапазоны значений параметров для генерации тестовых выборок
n=24
n=36
n=48
min
min min max шаг max шаг max mаx
A0
10
50
10
10
50
10
10
50
10
A1
30
70
20
20
80
20
20
80
20
α
0,05
0,07 0,01 0,04 0,06 0,01 0,03 0,05 0,01
В результате исследования было установлено, что первый и
второй способы идентификации в подавляющем большинстве
случаев не позволяют получить удовлетворительную по точности
модель.
В то же время третий способ («имитация отжига» + RPROP)
позволяет идентифицировать модель с высокой точностью.
На рисунке 6 показаны зависимости коэффициента
детерминации R2 (показателя точности моделирования) и второго
коэффициента Тейла kT2 (показателя точности прогнозирования)
от уровня шума Kn/s при использовании третьего способа
идентификации модели.
Как видно из графиков, R2 во всех случаях превышает 0,75,
характеризуя
высокую
точность
моделирования.
Второй
коэффициент Тейла оказывается менее 20%, что тоже
подтверждает высокую точность прогнозирования.
Заметим, что реально используемый в эконометрической
практике диапазон уровня шума обычно не превышает 10-15 %, что
позволяет говорить о широкой области применения данного
способа идентификации.
Рис. 6. Выделение стадий ЖЦП в динамике модели (4)
Небольшая доля выборок (3-4%) была идентифицирована
неверно даже в условиях отсутствия шума из-за неудачного выбора
начального приближения. Однако вероятностный характер
«имитации отжига» при работе с каждой конкретной выборкой
позволяет добиться получения другого, более точного начального
приближения.
Таким образом, для идентификации модели (4) наилучший
результат обеспечивает численный метод решения МНК по
алгоритму RPROP с выбором начального приближения по методу
«имитации отжига».
Возможно использование и других численных методов,
однако во всех предыдущих исследованиях именно RPROP
показывал
наилучшую
сходимость
при
более
низкой
вычислительной сложности.
Рекомендуется использовать модель для ЖЦП товаров с
быстрым выходом на рынок и продолжительным насыщением и
спадом в целях прогнозирования стадии спада. Однако возможно и
другое
применение
модели
для
описания
различных
эволюционирующих процессов.
Литература
1. Перстенева Н.П. Количественные методы измерения
трансформации социально-экономических систем: Монография /
Н.П. Перстенева. – Самара: Изд-во НОАНО ВПО СИБиУ, 2012. – 80 с.
2. Hammond G.P., Mackay R.M. Projections of UK oil and gas supply
and demand to 2010 // Applied Energy. Volume 44, Issue 2, 1993, Pages
93–3. Семёнычев, В.К. Идентификация экономической динамики на
основе моделей авторегрессии / В.К. Семёнычев. – Самара: АНО
«Изд-во СНЦ РАН», 2004. – 243 с.
3.Семёнычев, В.К. Метод параметрической итерационной
декомпозиции тренд-сезонных рядов аддитивной структуры /
В.К. Семёнычев, Е.В. Семёнычев, А.А. Коробецкая // Вестник
Самарского муниципального института управления. – Самара: Издво «СМИУ», 2010. – № 1 (12). – С. 63-71.
4.Жиглявский А.А., Жилинскас А.Г. Методы поиска
глобального экстремума. – М.: Наука, 1991.
5.Осовский, С. Нейронные сети для обработки информации /
Пер. с польского И.Д. Рудинского. – М.: Финансы и статистика, 2002.
– 344 с.
Download