k  Y D

advertisement
ПЕРЕПАРАМЕТРИЗАЦИЯ НЕЛИНЕЙНЫХ МОДЕЛЕЙ РЯДОВ
ДИНАМИКИ
В.К.Семёнычев, Е.В.Семёнычев
В рядах динамики Yk экономических показателей обычно выделяют
детерминированную Dk и стохастическую  k компоненты (здесь
k - номер
наблюдения уровней во времени). Детерминированная компонента Dk может
состоять из сумм и/или произведений тренда Tk , модель которого в общем
случае нелинейна по параметрам, и нелинейных по параметрам сезонной S k
или
циклической
Ck
колебательных
компонент.
Компоненты
Tk ,
S k , Ck специфицируют, параметризируют и, как правило, затем прогнозируют.
Стохастическую компоненту  k , которую большинство исследователей
считают в реальной экономической практике аддитивной по отношению к
Dk , используют при проверке адекватности модели статистическим данным
и при взаимокорреляционном анализе с другими рядами динамики.
В случаях, когда модели трендов Tk линейны по параметрам
(например, в алгебраических полиномах) или они могут быть путем
линеаризированы (для небольшого количества моделей осуществляются
переход к обратным значениям для переменных или логарифмирование) для
идентификации обычно применяют метод наименьших квадратов (МНК).
Реализация МНК над преобразованными рядами динамики, а не над
исходными, как правило, обуславливает погрешность моделирования и,
особенно, прогнозирования. Кроме того, для применения большинства
линеаризующих преобразований принимают «искусственные», удобные
предположения о месте вхождения аддитивной стохастической компоненты
 k в структуру модели, или о мультипликативности  k , её логнормальном
законе распределения и т.д. [1]. Что же касается применения нелинейного
МНК для параметризации трендов, то он даёт смещённые, порой
несостоятельные и неэффективные оценки, а процесс их нахождения
существенно зависит от выбора начальных условий [1].
Известное моделирование одновременно и тренда и колебательных
компонент
осуществляется
чаще
непараметрическим
методом
(последовательной сезонной декомпозицией ряда, получением средних
индексов
сезонности,
сводимых
к
одному
периоду
колебательной
компоненты, и последующим аналитическим выравниванием трендов) или
сложными параметрическими методами (аппроксимацией одной гармоникой,
несколькими членами ряда Фурье, использованием моделей Брауна,
Уинтерса и др.) [1, 2].
В известных методах моделирования основная доля погрешности будет
обусловлена тем, что требуется выборка уровней ряда динамики на
длительности от 4 до 10 периодов колебательной компоненты, на которой
модель (и параметры) тренда, колебательной компоненты предполагаются
стационарными.
Для метода сезонной декомпозиции
могут быть существенны
погрешность параметризации модели тренда, так как она производится не по
исходной выборке, а после двух её преобразований, и, особенно,
погрешность прогноза уровней ряда в силу того, что он применяет для
интервала
упреждения
средние
сезонные
индексы.
Какое
–
либо
использование стохастической компоненты, получаемой после двукратного
преобразования
исходного
ряда
динамики
и
соответствующего
элиминирования Dk , проблематично. В известных параметрических методах
неформализован выбор значения параметра сглаживания, ограничено
количества идентифицируемых ими моделей трендов с колебательными
компонентами.
Проблему идентификации широкого класса нелинейных по параметрам
моделей тренд-сезонных (тренд-циклических) рядов динамики по одной и
той
же,
короткой
выборке
позволяет
решить
подход,
названный
перепараметризацией, и заключающийся в том, что для уровней Yk
исходного ряда строится модель авторегрессии. При этом вид модели
детерминированной компоненты Dk определяет порядок авторегрессии, а
часть её параметров преобразуется (перепараметризируется) в коэффициенты
авторегрессии, через получаемые МНК–оценки которых на первом этапе
идентификации они и рассчитываются. На втором этапе идентификации,
используя уже рассчитанные оценки параметров модели, находят и МНКоценки оставшихся параметров [3].
На обоих этапах МНК-оценки являются решением систем нормальных
линейных алгебраических уравнений (СЛАУ) невысокого порядка (обычно
до шестого-восьмого). Авторегрессии конструируются применением Z –
преобразования [4] для детерминированных компонент Dk ряда динамики,
выполнением
несложных
преобразований
в
области
комплексной
переменной и последующим переходом к оригиналам.
Покажем суть перепараметризации на примере простой и едва ли не
самой популярной в эконометрической практике модели тренд-сезонного
ряда
Yk  A1k   A0  A3 sin( k    )   k  1 ( )  0 
 2 sin  0  3 sin  0 k    4  cos  0  A5 cos  0   ,
(1)
которой, как можно показать, при k  6 соответствует авторегрессия
шестого порядка
Y  21 Yk 1  2Yk 2  2Yk 3  2Yk 4  Yk 5   12 Yk 2  2Yk 3  Yk 4  
2Yk 1  3Yk 2  4Yk 3  3Yk 4  2Yk 5  Yk 6   k ,
(2)
где 1  2cos  , 4  3 cos , 5  3 sin , а «новая» стохастическая
компонента равна
   1  2 k 1  2k 2  2k 3  2k 4  k 5   12  k 2  2k 3  k 4  
2k 1  3k 2  4k 3  3k 4  2k 5  k 6 .
,
Заметим, что с учётом обозначения для  k можно называть (2) и
моделью авторегрессии-скользящего среднего.
Используя (2), найдём МНК-оценку 1 из нормального линейного
уравнения, к которому приводит условие
10  arg min  Y   Y 1  2Y 2  Y 3   2 Y 1  Y 2  Y 3   Y 4  ,
N
1
2
 4
где N - объём выборки.
Оценку частоты гармонической компоненты  , с учётом принятых
обозначений в (2), определит соотношение
   1/   arccos  10 / 2  .
Заметим, что в известных методах параметризации модели (1) частота
 (период T  2 /  ) предполагается известной, хотя на практике частота,
амплитуда и фаза колебательных компонент, особенно циклической,
являются медленно эволюционирующими.
Подставляя  0 в (1), определим, решая соответствующую нормальную
СЛАУ шестого порядка, МНК-оценки остальных параметров: 10 , 00 и
 
0
3
       
0
4
2
0
5
2 1/ 2


,  0   arctg 50 / 04 .
Как показали исследования на репрезентативных тестовых выборках,
данный метод даёт
удовлетворительную точность моделирования в
диапазоне отношения мощностей шум/полезный сигнал до 20% на выборках
в 18 – 24 наблюдений, т.е. на выборке помесячных наблюдений за полтора –
два года, позволяя моделировать и прогнозировать эволюционирующий
тренд-сезонный ряд динамики. Коэффициент детерминации при увеличении
объёма выборки больше 18-24 наблюдений практически не растет, а MAPE
оценка погрешности прогноза растет незначительно. Близкие характеристики
точности имеют и разработанные на той же теоретической основе методы
идентификации
80-ти
моделей многокомпонентных
рядов динамики,
образуемых сочетаниями моделей трендов и колебательных компонент.
Приведём основные нелинейные модели трендов, к которым может
быть применена перепараметризация.
1.Гиперболические полиномы
1
,
i i  3.
a

(
k

)
i 0 i
m
Tk  
2.Дробно-рациональные функции
Tk  A(k )  B  C /(k ) ,
1
Tk 
A0 (k )2  A1 (k )  A2
,
A(k ) 2  B (k )
Tk 
.
(k )2  C
3.«Квазиполиномы»
Tk 
m

I 1
Ai (k ) Bi exp(Ci k )Cos(i (k )  i );
которые при m  4 дают больше двадцати широко используемых в
эконометрической практике моделей: суммы экспонент, произведения
экспонент на алгебраические полиномы, на гармоники и т.д. [4]).
4.Восемь логистических (S – образных) кривых [4], из которых
представим лишь наиболее известную модель Верхулста (Перла-Рида)
Tk 
1
A0  A1 exp  Ci (k ) 
и логистическую функцию Рамсея
Tk  C 1  1  a(k )  exp(a(k )  .
Для моделирования и прогнозирования существенной эволюции
амплитуд сезонных колебательных компонент ряда динамики может быть
осуществлена
перепараметризация моделей
с аддитивным вхождением
колебательной компоненты
Yk  k 

an sin n  bn cos n (k )n  k ,

n1

частным случаем которой является Yk  k  3 (k )sin  ()     k ,
и с мультипликативным вхождением колебательной компоненты

Yk  k {1  D    an sin n  bn cos n }  k ,
n1
где D  1 .
3
Заметим, что в авторегрессиях некоторых моделей трендов (например,
для логистических моделей, обобщенных обратных функций, гиперболических
полиномов)
«новая»
стохастическая
k
компонента
будет
иметь
гетероскедастический характер, даже при гомоскедастичности исходной  k ,
поэтому следует применять для идентификации обобщенный МНК. При
параметризации
некоторых
моделей
(например,
для
гиперболических
полиномов) получим нестационарные параметрические авторегрессии: наряду
со значениями уровней ряда динамики они содержат и номера наблюдений.
Большинство предложенных методов моделирования и прогнозирования,
использующих перепараметризацию, прошли проверку на тестовых и реальных
выборках.
Использованные источники
1.Айвазян С.А., Мхитарян В.С. Прикладная статистика: Теория вероятностей и
прикладная статистика. - М.: ЮНИТИ – ДАНА. 2001. - 656 с.
2.Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования временных рядов.
- М.: Финансы и статистика. 2003. - 416 с.
3.Семёнычев В.К. Идентификация экономической динамики на основе моделей
авторегрессии. – Самара: АНО «Изд - во СНЦ РАН». 2004. - 243 с.
4.Деч Г. Руководство к практическому применению преобразования Лапласа и Z преобразования. - М.: Наука. 1971. - 288 с.
Download