Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования

advertisement
Правительство Российской Федерации
Федеральное государственное автономное образовательное учреждение
высшего профессионального образования
«Национальный исследовательский университет
«Высшая школа экономики»
Факультет Мировой Экономики и мировой политики
Кафедра международных валютно-финансовых отношений
ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
На тему «Скрытый марковский процесс как феномен, лежащий в основе
ценообразования на фондовом рынке США»
Студент группы № 461
Аль-Рубайи Михаил Михайлович
Руководитель ВКР
Евстигнеев Владимир Рубенович
доктор наук
заведующий кафедрой
международных валютно-финансовых отношений
Москва, 2013 г.
2
Оглавление
Введение ....................................................................................................................................................2
Теоретические основы скрытого марковского процесса. .............................................4
Скрытый марковский процесс ..................................................................................................4
Стационарное распределение ...................................................................................................7
Выбор рассматриваемых котировок .....................................................................................8
Составные части состояний .......................................................................................................9
Алгоритм для расчета матрицы переходных вероятностей ................................ 11
Практическое применение модели ......................................................................................... 14
Анализ эффективности модели на реальных данных ............................................. 15
Стационарное распределение. ............................................................................................... 29
Заключение ........................................................................................................................................... 35
Введение
С целью прогнозирования ценовых процессов на фондовом рынке на данный
момент выведено большое количество теорий. Значительная часть из них
3
представляет
собой
модели,
большинство
из
которых
основаны
на
авторегрессионной модели. Но было выявлено, что такие модели не всегда хорошо
справляются
с
прогнозированием
процессов,
которые
ассоциируются
со
значительно растущим или падающим рынком. В попытках решить эту проблему
был изобретен класс Марковских моделей переключения.
Одной из первых была разработана простая марковская цепь, которая
оценивает вероятности выпадения определенных котировок на рынке, если
использовать эту модель в этой области. Сразу можно понять, что этот механизм
очень неэффективен в приложении к фондовому или валютному рынку, так как
существует очень большой набор значений котировок.
После того, как стала явной неэффективность применения обычной
марковской цепи, стала использоваться модель, которую называют скрытым
марковским процессом. Данная модель предоставляет большие возможности для
прогнозирования рынка, так как в ее основе могут лежать не только котировки
рассматриваемой акции, но можно учитывать большой набор других показателей, в
числе который могут оказаться не только сами котировки, но и факторы, которые
на них влияют (решения совета директоров, законодательные акты, природные
катаклизмы и др.).1 К сожалению, учесть нечисленные показатели математически
представляет собой значительную сложность, так как необходимо не только
вычислить для начала очевидные взаимосвязи, но и перевести эти решения в
числовой формат. Естественно, такие алгоритмы существуют, и они успешно
применяются на фондовом рынке. В их основе лежит анализ поступающих
новостей, некоторые из которых могут быть ложью, с чем и столкнулась
американская биржа весной 2013 года. В данной работе такие механизмы
рассматриваться не будут по ряду причин.
Целью данной работы является исследование того, как можно применить
модель скрытого марковского процесса для прогнозирования курса акций на
1
Bourlard H. Introduction to hidden markov models
4
примере фондового рынка США. Одной из основных задач является выяснение
взаимосвязи между эффективностью прогнозирования модели, ее различными
параметрами и общими характеристиками исторических котировок акций или
индексов.
Теоретические основы скрытого марковского процесса.
Скрытый марковский процесс
Скрытый
марковский
процесс
является
удобным
средством
для
моделирования динамичных процессов, из-за чего его можно эффективно
5
использовать при прогнозировании на финансовых рынках. Ключевая особенность
данной модели в том, что состояния, которые лежат в основе модели, не
наблюдаются явным образом, а находятся через параметры, которые будут
описаны позже. Основной идеей данной модели можно назвать попытку прогноза
наблюдения, основываясь на том, какой значение приобрела наблюдаемая
величина на предыдущем периоде.
Основными составляющими скрытого марковского процесса являются
следующие параметры:2
1)
последовательность состояний процесса
2)
последовательность наблюдений
3)
начальный вектор вероятностей для состояния
4)
матрица переходных вероятностей для состояний
5)
матрица вероятностей для наблюдений
Формально, на математическом языке скрытый марковский процесс
обозначается в терминах матриц переходных вероятностей для состояний и
наблюдаемых величин, используя условное обозначение вероятности P(AlB)
-
вероятность появление наблюдения А при состоянии В.
Очень часто данная модель записывается как функция от пяти параметров
a=(S,V,A,B,p), в которой данные параметры соответствуют пяти элементам из
списка, приведенного выше. Также необходимо учесть, что сумма вероятностей
перехода из состояния А в другие должна быть равна единице, как и сумма
вероятностей появления наблюдений для каждого отдельного состояния.
Стоит отметить, что в данной работе рассматривается стандартная модель
скрытого марковского процесса, когда как существуют несколько ее модификаций.
Основной проблемой в использовании данного метода на практике является
определение пяти ее параметров 3 . Во-первых, необходимо определить вид
2
Labiner R.L. A tutorian on hidden markov model and selected application in speech recognition// Proceeding of the
IEEE. Vol 7. № 2. 1989
6
состояний и их природу, так как, к примеру, на финансовом рынке, они могут
зависеть от нескольких котировок или от четырех видов цены одной акции (
максимальная, минимальная, цены закрытия и открытия). Ввиду того факта, что
котировка может принимать очень много значений, то вероятность выпадения
какой-либо одной сводится практически к нулю. Из-за этого, если работать со
скрытым марковским процессом на финансовом рынке, приходится считать эти
вероятности равными, что позволяет не учитывать их в модели, что будет показано
позже. По этой причине построение матрицы переходных вероятностей для
состояний
будет
основано
на
выделении
нескольких
групп
котировок
(доходностей). И значения вероятностей в такой матрице будут означать
вероятности перехода между этими группами. Одним из ключевых вопросов в
применении
модели
скрытого
марковского
процесса
является
выяснение
оптимальных границ для групп состояний, так как их выбор оказывает самое
сильное действие на прогноз и, следственно, на получаемую доходность на рынке.
Выделяют также и другие проблемы, но в рамках данной работы предстоит решить
только эту, так как она больше всего имеет отношение к прогнозированию.
Стоит отметить тот факт, что часто процесс применения данной модели к
реальным данным сводится к поиску матрицы переходных вероятностей для
состояний, в основе которой лежат границы, разделяющие состояния, и длина
периода, на которой эта матрицы рассчитывается. Критичность выбора этих трех
показателей будет показана позже.
Можно выделить тот факт, что качество подобранных параметров можно
оценивать двумя способами:
1)
минимизировать ошибку на обучаемой выборке
2)
максимизировать накопленную доходность на тестируемой выборке
3
Zhang N. Prediction of financial time series with hidden markov models: Shandong university, China, 2001
7
Скорее всего, эти два пути равнозначны, но в данной работе будет использован
первый из них.
Стационарное распределение
Учитывая тот факт, что, используя короткие скользящие периоды (50 – 200
наблюдений), учитываются только относительно непродолжительные тенденции
ценового процесса, должен быть какой-то способ все же определить некоторое
стабильное распределение вероятностей на таком скользящем периоде. Такой
выход был найден. Изначально данное распределение было предложено в теореме,
которую называют теоремой Перрона и которая была позже дополнена
Фробениусом для общего случая. Идея состоит в том, что можно вычислить такой
вектор, используя собственные вектора и собственные значения матрицы
переходных вероятностей. 4 Далее будет приведен алгоритм, по которому можно
вычислить предполагаемое стационарное распределение.
так как у нас есть матрица переходных вероятностей, предлагается
1)
вычислить вектор-столбец, значения в котором будут равны разнице единицы с
каждым элементов на диагональной матрице.
Далее составляется матрица аналогичная изначальной, только по диагонали
2)
там находятся значения из вектора, полученного на предыдущем шаге
Вычисляются
3)
собственные
значения
и
собственные
вектора
полученной матрицы
Согласно нижеприведенной формуле в течении n шагов вычисляется вектор,
4)
который и является стационарным распределением вероятностей. Изначально в
формуле нет вектора-строки (1,0,0,0,0). Он необходим лишь для того, чтобы более
удобно показывать получившийся вектор, так как изначально выводится матрица с
4
Беллман Р. Введение в теорию матриц // перевод Лидский В.Б. стр. 292-343
8
одинаковыми столбцами. E(d) –собственные вектора матриц, а λ(d) – собственные
значения матриц
T
5)

 e( d) 0 t


0
0
0
0








 ( d) 1 t
e
0
0
0

 0


  E( d)  1
 ( d) 2 t
P  ( 1 0 0 0 0 )  E( d )  
0
e
0
0
t d 
 0






 ( d) 3 t
0
0
e
0

 0





 ( d) 4 t 
0
0
0
e

 0


Стоит отметить, что решение сходится примерно на 8-9 шаге, то есть для
ускорения расчетов можно сразу задавать изначальное значение t равное 8.
Интересным является тот
факт, что получившееся распределение
вероятностей в очень большой степени схоже с другим распределением, которое
можно было получить намного раньше. Еще на том шаге, когда вычислялась
принадлежность прироста к определенному состоянию, мы могли получить
вероятности выпадения каждого состояния на скользящем периоде. Именно на это
распределение очень похоже получившееся стационарное. А так как простой
вариант, полученный в самом начале алгоритма, представляет собой стабильное
распределение состояний на периоде, то новое распределение можно с
уверенностью назвать стационарным, так как оно отражает вероятность появления
состояния на скользящем периоде.
Выбор рассматриваемых котировок
9
Для того, чтобы рассмотреть, как модель ведет себя в различных ситуациях,
было выбрано несколько акций и индексов,
которые вели себя по-разному с
течение 10 лет. Также в основу выбора входил тот факт, что объем торгов по этим
финансовым инструментам должен быть достаточно высок. S&P500 - в среднем за
10 лет индекс менялся не очень и был значительный спад вначале и конце периода.
Apple – очень значительный и, в целом, стабильный рост, хоть и с несколькими
спадами. Google – большой рост с 2004 года, но достаточно нестабильный, что,
скорее всего, связано с областью деятельности компании (Интернет). NASDAQ его динамика в некоторой степени похожа на динамику S&P500, но данный индекс
упал за 10 лет. Также стоит отметить тот факт, что за последние 2-3 года у них
тоже наблюдалась различная динамика, что позволит сравнить эффективность
моделей, которые обучаются и тестируются на схожих выборках.
Составные части состояний
Если немного отвлечься от практики, то можно рассматривать два типа
определения состояния на финансовом рынке: непрерывный и дискретный. Первый
вариант
подразумевает
выявление
функции
плотности
распределения
наблюдаемых величин. Как один из простых вариантов, можно использовать метод
окон Парцена-Розенблатта. Допустим, что эта функция построена и
следующей проблемой становится определение границ состояний. Дискретный же
случай позволяет сразу переходить к определению границ. Несмотря на этот факт,
на основе функции плотности вероятности можно приблизительно посмотреть,
каковы должны быть эти границы, хотя в случае большой обучаемой выборки
график распределения может быть очень сильно похож на график нормального
распределения и пользы от этого будет не очень много.
10
В целом, если использовать график функции плотности вероятности и искать
на нем некоторые ключевые моменты - заметные изменения значений плотности,
то это уже несколько упростит поиск оптимальных значений границ.
Теперь надо рассмотреть возможность состояний, которые определяются по
нескольким бумагам или индексам. В данном случае возникает две проблемы:5
определение таких бумаг в функцию, которые не будут снижать
1)
эффективность модели. В качестве этого можно привести следующий пример:
допустим, что две разные бумаги падают, тогда получается, что в среднем они
упали и падение первой бумаги будет соответствовать среднему падению. Но если
первая бумага упала, а вторая выросла, тогда среднее значение может оказаться как
равным нулю, так и отличным от него. В данном случае падение первой бумаги
может соответствовать не только падению среднего значения. В итоге получается
так, что одно и то же изменение первой бумаги имеет вероятность появиться в
минимум двух состояниях, что, скорее всего, снизит эффективность модели
Вторая проблема вытекает из попытки решить первую: поиск весов для
2)
различных бумаг, причем эти весы могут меняться с течением времени
Учитывая данные обстоятельства можно прийти к выводу, что использование
состояния, которое определяется ценой одного актива, является наиболее
оптимальным. Этот факт относится и к различным ценам одного актива ( открытия,
закрытия и др.). В этом случае различие в динамике цен схоже с наличием
шумового процесса, что снижает эффективность прогноза.
5
Lajos О., George K. M., Park N. A six state HMM for the S&P 500 stock market index: Oklahoma state university
11
Алгоритм для расчета матрицы переходных вероятностей
Для начала стоит сказать, что выборки по котировкам акций Apple, Google и
индексов NASDAQ и S&P500 были практически одинаковы за исключением
Google, которые разместили свои акции только в 2004 году. Таким образом,
минимальная выборка составила примерно 2400 значений, а максимальная – 3300.
На первый взгляд может показаться, что этот факт лишит возможности
рассматривать очень большие скользящие периоды на более маленькой по размеру
выборке, но в конце концов оказалось, что вариант со скользящим периодом в
больше 1500 наблюдений не является оптимальным для прогноза акций компании
Google.
Далее оценивается функция плотности распределения с помощью метода
окон Парцена-Розенблатта двумя способами: бутстраповский алгоритм, и метод
подстановки (plug-in). Для оценки функции плотности распределения в данной
работе были выбраны именно эти два алгоритма, так как первый из них достаточно
эффективен, если рассматривать периоды до 200 наблюдений, а второй на более
больших отрезках. В случае использования тестируемой выборки размером
меньше
200
можно
понять,
что
получаемый
график
недостаточно
репрезентативный для того, чтобы на его основе определять границы, которые
будут использоваться для дальнейшего прогноза. В идеальном случае необходимо
хотя бы каждые десять или двадцать шагов переоценивать распределение и менять
границы, но, к сожалению, на данный момент существует ряд причин, которые
препятствуют реализации данного алгоритма. Стоит отметить, что некоторое число
шагов после оценки границ прогноз является достаточно хорошим.
Также важно сказать, что при использовании более коротких тестируемых
выборок можно с большой долей вероятности предположить наличие шума,
который может очень значительно отразиться в матрице переходных вероятностей.
В качестве этого может быть приведен следующий пример:
известно, что на
протяжении последних лет акции какой-либо компании выросли в цене в три раза,
12
но
в течении некоторого периода (30 дней) были заметны очень сильные
изменения цены акций. Если в данном случае использовать скользящий период в
300 дней, то в матрице эти сильные скачки если и отразятся, то не сильно, так как
их буквально перевесят вероятности роста. Если же брать скользящий период в 5060 дней, то шум от скачков цен может оказать сильное влияние на отдельные
позиции в матрице переходных вероятностей, из-за чего автоматическая торговая
система будет неправильно воспринимать ситуацию и торговать на понижение. В
случае же с большими скользящими периодами шум менее заметен, что будет
показано дальше.
Следующим шагом является построение матрицы переходных вероятностей
для состояний. Как уже было сказано, оценивать вероятности для выпадения
отдельных значений котировок не имеет смысла. Теперь стоит объяснить, почему в
качестве состояний в данной работе используются группы котировок. Изначально
предполагалось, что необходимо определить вероятность выпадения определенных
котировок для различных состояний рыночной конъюнктуры. Проблема возникает
на том этапе, когда необходимо численно определить состояние рынка по
отношению к какой-то либо бумаге, а это довольно проблематично. В результате
было принято решение, которое является упрошенным вариантом определения
конъюнктуры и именно который и позволяет не высчитывать вероятности
выпадения котировок отдельно для каждого состояния. Идея состоит в том, что,
когда рынок располагает к росту цены какой-либо акции, то эти акции растут, но с
разной скоростью. Поэтому было принято решение разделить состояния на основе
доходностей по акциям. Естественно, данный выбор очень далек от реальной
ситуации, так как могут учитываться спекуляции, в результате которых
значительно растет волатильность и, следственно, неправильно высчитывается
матрица переходных вероятностей. Но такое негативное влияние спекуляций
сглаживается, если оценивать матрицу на большом скользящем периоде, что будет
показано ниже.
13
Если говорить конкретно о границах состояний, то для всех акций было
решено взять 5 различных состояний:
1)-a<x<a
2)-a>x>-b
3)b>x>a
4)-b>x
5)b<x
Отсюда понятно, что данные области были выбраны симметричными. Что
касается самих параметров «a» и«b», то первый из них был выбран одинаковым
для всех со значением 0.01, так как имеет смысл торговать только тогда, когда
отсутствует шумовой процесс, а данное значение минимальной границы отсекает
самые мелкие приросты, которые, скорее всего являются шумом.. Что же касается
второй границы, то она варьируется в зависимости от ценной бумаги, но
колеблется между 0.1 и 09 при плече равном 10.
Процесс построения матрицы происходит в три этапа:
1) распределение котировок по состояниям на предыдущем скользящем
периоде
2) далее рассчитывается количество переходов между состояниями
(из t-1 в t). В результате этого получаются 5 матриц со строками,
соответствующими номеру наблюдения. Значения в столбцах в этих матрицах
показывают, что совершился переход из состояния под номером столбца в
состояние с порядковым номером матрицы. Пр.: значение 1 в 3 столбце 2 матрицы
говорит о том, что в какой-то момент времени совершился переход из 3 состояния
во второе.
3) на этом этапе рассчитывается сама матрица переходных вероятностей.
Пример для одной строки (состояния): вычисляется сумма переходов из одного
состояния отдельно в каждое (таким образом, получается 5 значений), далее
каждое такое значение делится на сумму всех пяти и полученный вектор
14
показывает распределение вероятностей перехода из одного состояния во все
остальные на определенном скользящем периоде. В итоге получается матрица 5х5
со значениями, не превышающими единицу. Стоит отметить, что вероятность того,
что достаточно много из них будут равны нулю, растет с уменьшением
скользящего периода по вполне очевидным причинам.
На следующем шаге выявляется состояние, в котором скорее всего окажется
котировка на следующем шаге. Уже известно состояние, в котором находится
текущее наблюдение, затем ищется столбец в матрице переходных вероятностей,
которому соответствует максимальное значение в строке.
Для анализа эффективности модели построено торговое правило, согласно
которому акция покупается лишь в том случае, если ожидается, что на периоде t+1
будет рост, превышающий 0.01, и акция продается, если падение превышает такую
же величину.
Если внимательно рассмотреть данное торговое правило, то может
показаться, что параметр «b», который фактически отделяет сильные приросты от
слабых, здесь не обязателен. Действительно, в некоторых случаях этот параметр
можно практически приравнять к «а». И эффективность данного решения будет
варьироваться в зависимости от многих факторов, таких как волатильность, длина
скользящего периода, долгосрочный и краткосрочный ценовой тренд.
Практическое применение модели
15
Анализ эффективности модели на реальных данных
Перед выявлением наилучшего набора параметров можно выдвинуть
гипотезу о том, что существует несколько типов таких наборов, одни из которых
хорошо работают только в краткосрочной перспективе, а другие только в
долгосрочной. Это объясняется тем, что часто в течение долгого времени на рынке
может наблюдаться стабильная тенденция к повышению или понижению курса
акций. Гипотеза состоит в том, что в зависимости от состояния рынка следует
использовать некоторые определенные наборы параметров. Скорее всего они будут
несколько отличаться в зависимости от акции, то общая картина должна быть
одинаковой. Предположительно, данное явление может объясняться наличием
шумового процесса, который, как уже было сказано, может сильно повлиять на
значения в матрице переходных вероятностей.
Пусть первыми наблюдаемыми величинами будут рассмотрены акции
компании Apple Inc. На всем рассматриваемом периоде цена на эти акции имеет
заметную тенденцию к повышению, но также видны довольно резкие на общем
фоне падения, что скорее всего связано с неудачной политикой или другими
причинами. Также стоит подчеркнуть, что в феврале 2005 года был произведен
сплит акций, в результате чего стоимость одной бумаги упала в 2 раза, что
повлекло падение доходности для одной акции, хотя по факту держатели акций
практически ничего не потеряли, так как суммарная стоимость бумаг у них
осталась прежней. В рамках данной работы этот момент не очень важен, так как
резкое падение доходности по акции не скажется на матрице переходных
вероятностей в силу определенных причин, о которых будет рассказано позднее.
Целью является выявление значений ключевых параметров от таких
факторов как волатильность и длина скользящего периода. Возможно влияние и
других факторов, но об этом станет известно только после детального анализа
поведения модели на данных наблюдениях.
16
Для начала стоит повторить, что параметр «а» был выбран стабильным, так
как он отделяет совсем неприбыльные сделки от тех, у которых есть хотя бы
минимальная доля прибыли. Так же важно отметить тот факт, что при расчете
накопленной доходности не учитывалась комиссия брокера, но на качественное
сравнение разных наборов параметров это не должно повлиять. Данное упрощение
допустимо в рамках данной работы, так как основной целью является именно
выявление наилучших параметров, а не построение прибыльной рыночной
стратегии.
Ниже приведен график рыночной накопленной доходности по акциям Apple
Inc., если бы стратегия состояла в простом держании акций. Сравнивать
эффективность параметров предстоит не только между собой, но и по отношению к
рынку.
В качестве изменяемых параметров были выбраны значения «b» 0.02, 0.05,
0.1, 0.3, 0.5 и длина скользящего периода «n» равная 50, 100, 200, 500, 1000, 1500 и
2000 наблюдений. Как было сказано выше, в результате сплита доходность по
акции резко упала, но в рамках данной модели величина этого падения не важна,
так как она сильно выходит за рамки максимальных отклонений на всем
рассматриваемом периоде и всегда попадает только в одно состояние, что, если и
скажется на матрице вероятностей, то в очень незначительной степени. Сравнение
предлагается проводить отдельно внутри каждого из типов скользящих периодов
между отличающимися величинами параметра «b».
Первым рассмотрим скользящий период, равный пятидесяти наблюдениям.
Как можно заметить, ни одна из этих стратегий не опередила рынок на всем
участке, цена на котором выросла в 35 раз, когда как максимальная доходность,
которую принесла бы стратегия, используя данный скользящий период, равна 24.
Но стоит отметить тот факт, что эта стратегия, параметр «b» у которой равен 0.05,
является очень эффективной на участках с достаточно сильной волатильностью и
которые в целом не приводят к росту цены в долгосрочной перспективе. В данном
случае стратегия показывает очень большой прирост доходности в первой трети
17
тестируемой выборки. Можно заметить, что тот участок, на котором накопленная
доходность
очень
заметно
выросла,
характеризуется
не
самой
большой
нестабильностью, в результате чего накопленная доходность превысила рыночную
в 3-4 раза. Очевидным минусом является то, что проседания графика настолько же
резкие, как и его рост. Так же важен тот факт, что при данном скользящем периоде
достаточно хорошо угадывался рыночный тренд к повышению в отличие от других
вариантов, когда доходность падала, в то время как цена акции росла. Это можно
понять по тому, что на последней трети выборки кривая доходности почти
повторяла рыночную кривую. Еще одной из явных положительных сторон данного
выбора параметров является то, что почти при всех резких падениях цены акции на
рынке кривая доходности практически всегда оставалась примерно на том же
уровне. Но картину немного ухудшает падение эффективности прогноза после
таких резких изменений. Это связано именно с выбором скользящего периода.
Фактически при длине обучаемой выборки в пятьдесят наблюдений, значительная
часть матриц переходных вероятностей строится на шумовом изменении цены, изза чего в случае высокой волатильности модель показывает хорошие результаты, а
в случае стабильного роста с некоторым количеством шума эффективность падает.
Далее обратимся к рассмотрению того, как ведет себя модель на скользящем
периоде в 100 наблюдений. Если рассматривать попарно различные величины
параметра «b», то можно заметить, что в случае со скользящим периодом в 50
наблюдений кривая накопленной доходности ведет себя менее стабильно в
большинстве случаев. Очень хорошо заметна общая тенденция к росту
накопленной доходности на второй половине тестируемой выборки, когда как в
предыдущем случае (50 наблюдений), иногда наблюдались падения. Это можно
объяснить тем, что в данном случае малозначительные отклонения, вызванные
либо случайным процессом, либо другими факторами, не оказывают такое сильное
влияние на конечные значения в матрице переходных вероятностей.
Среди разных величин параметра «b» на данном скользящем периоде стоит
отметить 0.02 и 0.05, которые показали наибольшую накопленную доходность.
18
Благодаря первому из них достигнуты очень хорошие показатели в начале
тестируемой выборки, где, благодаря такому низкому значению параметра, удалось
уловить рост в цене акции, который, скорее всего, состоял так же из низких
значений приростов, которые не были так сильно учтены при вычислениях матриц
переходных вероятностей с большим значением параметра. Однако это явление
имеет и обратную сторону: на отрезках, на которых в течение значительного
периода времени наблюдался рост, более эффективным оказался параметр с
большим значением, так как он не учитывал количество мелких изменений цен,
достаточное для того, чтобы оказать влияние на построение матрицы. В итоге, с
точки зрения оптимальности стратегии, на данном скользящем периоде в качестве
оптимального значения параметра лучше выбрать наибольшее из двух значений –
0.5, так как накопленная доходность практически равная, но при большем значении
параметра кривая доходности более стабильна и почти также эффективна в начале
тестируемой выборки. Если же сравнивать лучшие варианты при скользящих
периодах в 50 и 100 наблюдений, то использование второго скользящего периода
представляет больший интерес с долгосрочной точки зрения, так как за тот же
самый временной период накопленная доходность на нем больше, чем при
скользящем периоде в 50 наблюдений. Тем не менее, с точки зрения качества
прогноза оба эти метода не очень эффективны, так как доходность выше рыночной
только на некоторых отрезках, но их можно применять в тех случаях, когда на
протяжении некоторого периода наблюдаются определенной степени волатильные
скачки цены.
Уже после анализа двух случаев становится видимой взаимосвязь между
эффективностью применения параметров и их значениями: при более низком
значении скользящего периода лучше присваивать параметру «b» меньшие
значения или близкие к параметру «а», так как в таком случае наблюдается
наилучшее соотношение между стабильностью кривой доходности и ее конечным
значением. Очевидно,
что данное мнение пока является нерепрезентативным
ввиду малой выборки, но все же эта зависимость наблюдается.
Это может
19
объясняться тем, что данная выборка наблюдений имеет достаточно высокую
степень волатильности, что, согласно гипотезе, может способствовать хорошим
показателям
эффективности
рассмотренных
наборов
параметров.
Данное
объяснение подтверждается тем фактом, что при параметре «b» 0.5 и скользящем
периоде 100 накопленная доходность практически равна тому значению, который
показывает набор при значении «b» 0.01, так как на тестируемой выборке
представлены в равной мере относительно стабильные и нестабильные участки,
что уравнивает оба набора. Чтобы проверить данные утверждения, далее будут
рассмотрены другие значения скользящих периодов.
Аналогично предыдущим случаям, в начальной части тестируемой выборки
при скользящем периоде в 200 наблюдений кривая доходности показывает
значительный рост. Более того, в большинстве случаев этот рост можно с
уверенностью назвать стабильным. Благодаря этому можно сказать, что при
наборах параметров «b» 0.02, 0.05 и 0.5 достигается относительное равенство
между эффективностью на участках с высокой и низкой волатильностью, хотя ни
одно из значений параметра «b» в данном случае не дало прирост доходности на
участке со стабильным ростом больший, чем был прирост рыночной цены. Но все
же стоит отметить тот факт, что значение «b» 0.05 позволило немного выиграть у
рынка на тестируемой выборке, хотя это произошло только лишь за счет роста
доходности в самом начале выборки, так как там наблюдалась довольно высокая
волатильность. И тем не менее, этот случай является первым, благодаря которому
получилось обыграть рынок. Так же стоит отметить, что при данном скользящем
периоде практически по всех случаях было заметно, что модель чувствует, при
разных параметрах в разной степени, что рынок в целом растет.
Результаты, показанные на скользящих периодах в 500, 1000 и 1500
наблюдений, в значительной степени схожи. Они также дают понять, что гипотеза
относительно эффективности использования более коротких скользящих периодов
в моменты сильной волатильности возможно, неверна. Это объясняется тем, что
при значениях «b» 0.3 и 0.5 модель очень плохо чувствует подъем рынка. Если же
20
посмотреть на графики накопленной доходности при использовании других
значений этого параметра, то можно заметить, что в таких случаях модель хорошо
чувствует рынок и практически повторяет его. Но это не касается самого начала
тестируемой выборки, перед которой был период с сильной волатильностью и
довольно частыми спадами и подъемами цены на коротком периоде. В результате
этого в самом начале тестируемой выборки модель во всех случаях приводила к
значительному спаду доходности, после чего успешно следовала за изменением
рыночной цены, так как на оставшемся участке в целом наблюдался рост, который
модель хорошо почувствовала. Больше всего это заметно на скользящем периоде в
1000 и 1500 наблюдений. Важно отметить, что отсутствие спада доходности во
втором случае объясняется тем, что к моменту начала торговли уже наблюдался
стабильный рост на протяжении примерно 700 наблюдений. В итоге можно
сказать, что самый последний из рассмотренных вариантов
(1500 наблюдений) на данный момент показывает наиболее стабильную картину.
Тем не менее, этот набор параметров эффективен лишь в случае стабильного роста
цен, что сводит его применение лишь к отдельным случаям, так как столь
долгосрочный рост наблюдается у маленького количества компаний.
Теперь рассмотрим последний из вариантов, когда скользящий период
равняется 2000 наблюдений. В этом случае опять наиболее эффективными
являются параметры «b» 0.02, 0.05 и 0.1, так как кривые накопленных доходностей,
построенные на их основании, опережают рынок. Также стоит отметить, что на
данной тестируемой выборке эти наборы параметров дали наилучший результат,
хотя на скользящем периоде в 1500 наблюдений итоговые значения доходности на
таком же отрезке были практически равны значениям доходности данного случая.
Самое заметное отличие от предыдущего скользящего периода в том, что в случаях
и «b» 0.05 и 0.1 модель хорошо себя показала на начальном отрезке, где
наблюдалось падение. В итоге получается, что на данной выборке лучше всего
использовать «b», равное 0.1. Это частично подтверждает гипотезу о том, что чем
21
стабильней тестируемая выборка, тем больший параметр «b» надо брать для
достижения хороших результатов.
Для проверки гипотезы о том, что при сильной волатильности наиболее
эффективны меньшие значения параметра «b», можно еще рассмотреть вариант со
скользящим периодом в 30 наблюдений. Как и ожидалось, набор 30 0.02 и 0.05 дает
очень хорошую картину, но на первый взгляд она может такой не показаться из-за
того, что итоговая накопленная доходность значительно ниже рыночной. Но в
данном случае очень важен тот факт, что на двух участках из четырех данный
набор показывает наилучшие результаты по сравнению со многими другими
случаями. Можно заметить, что эти два отрезка характеризуются не самой высокой
и не самой низкой степенью волатильности. На первом участке кривая доходности
показывает больший рост относительно рынка, но этот рост обеспечен резкими
спадами и падениями в самом начале выборки. Дальнейшее резкое падение не
было поймано ни одним из наборов параметров. Может сложиться мнение, что
второй участок незначительно отличается по степени волатильности от первого, но
отличие в том, что там наблюдается возрастающая тенденция и более мелкие
приросты,
из-за чего такое набор параметров сильно отвлекает матрицу
переходных вероятностей на шум. Третий участок очень схож с первым и в
результате доходность резко повышается. Несмотря на тот факт, что на четвертом
участке доходность растет, данные параметры применять не рекомендуется из-за
того, что этот рост ниже рыночного и на таком участке большая эффективность
достигается за счет больших скользящих периодов, которые учитывают шум в
меньшей степени.
В итоге можно сказать, что гипотеза относительно эффективности
применения меньших по значению параметров и более коротких скользящих
периодов на отрезках с сильной волатильностью кажется верной. Но стоит
отметить, что существует некая область волатильности, в которой данная гипотеза
верна, так как при очень сильных изменениях цен при всех наборах параметра «b»
наблюдаются различной степени падения доходности.
22
Так как рассмотрение только одной акции не является репрезентативным, то
необходимо проанализировать то, как работает модель и с другими акциями,
которые не характеризуются относительно постоянным ростом на протяжении
всего периода.
Если рассмотреть исторические изменения индекса S&P500, то
больше всего на графике заметно то, что за последние 10 лет произошло два
значительных падения, одно из которых относительно плавное, а другое скорее
всего вызвано мировым финансовым кризисом, из-за чего оно довольно резкое.
Как и в случае анализа акций Apple Inc., порядок рассмотрения будет такой
же: сравнение границ состояний внутри скользящего периода и последующее
выявление тенденций.
В данном случае стоит акцентировать внимание на том, что историческая
волатильность индекса S&P500 значительно выше, чем в предыдущем случае. Это
достаточно легко объясняется тем, что показатель индекса сильно зависит от
общего положения компаний, которые занесены в список, которое положительно
скоррелировано с конъюнктурой мирового рынка.
И так, если взять скользящий период в 50 наблюдений, то можно заметить,
что в большинстве случаев модель хорошо ловит рост рынка, причем это
происходит только с крайними значениями параметра «b». Это можно объяснить
тем, что при маленьких его значениях в матрице переходных вероятностей на
стадии роста превалируют значения переходов в положительные приросты на
отрезках относительно продолжительного роста. Если же говорить о хорошем
результате при «b», равным 0.9, то можно сказать, что этот результат наблюдается
только на стадии очень быстрого роста по сравнению с другими отрезками. В
результате такого значения границы вероятности приростов превалируют над
спадами, чего не наблюдается при границах в 0.1 и 0.3. В целом наилучшим
значение параметра «b» на скользящем периоде в 50 наблюдений является 0.02, так
как именно с ним модель раньше всего распознавала спады и кривая накопленной
доходности наиболее стабильная.
23
В некоторой степени похожая ситуация наблюдается и на скользящем
периоде в 100 наблюдений, когда лучшие результаты дают крайние значения
параметра «b». Если проанализировать распределение вероятностей состояний, то
можно увидеть, что при параметре «b» равным 0.5 чаще всего наблюдаются 2 и 3
состояния – приросты и падения, которые находятся между «b» и «а», но все-таки
за счет довольно продолжительного роста на протяжении более половины
тестируемой выборки преобладают приросты. Так же стоит отметить, что при
очень низкой волатильности кривая доходности во всех случаях падает или в
лучшем случае идет аналогично рыночной доходности. В данном случае низкая
волатильность наблюдалась при среднем росте, но все же вероятность роста цены
была не сильно выше вероятности падения,
в результате чего модель
предсказывала рост на скользящем периоде при периодическом наличии спадов. В
итоге на таких участках кривая доходности стремилась к рыночной кривой. Лучше
всего это заметно при параметре «b» 0.05 и 0.5, которые дают очень схожую
картину, но при 0.5 кривая более сглажена и дает больший прирост доходности. В
итоге оптимальным значением параметра «b» на таком скользящем периоде можно
считать 0.5, так как его результат по всем параметрам превосходит остальные.
На скользящем периоде в 200 наблюдений ситуация уже стабилизируется.
Здесь уже четко видно различия между разными значениями параметра «b». Так,
значения 0.02 и 0.05 дают самую стабильную кривую доходности по сравнению с
другими значениями. Наиболее оптимальную кривую доходности дает параметр
«b» равный 0.05, хотя эффективность параметра 0.5 близка, но в этом случае она
менее стабильна, так как большинство приростов находятся между «b» и «а», из-за
чего на начальном участке значения в матрице переходных вероятностей
получаются такие, что модель видит только преобладающую вероятность падения,
а в случае с 0.05 приросты разделяются, что приводит к лучшей обучаемости.
Такое наблюдается не только на начальном участке тестируемой выборки, но и на
втором показательном отрезке, где очень четко видно, что в случае с b=0.5 модель
видит только рост и кривая доходности в точности повторяет кривую рыночной
24
доходности. Если же параметр равен 0.05, то кривая доходности растет стабильно с
более мелкими спадами, чем кривая рыночной доходности. Именно из-за более
сглаженного характера кривой выбор параметра «b» равным 0.05 является
оптимальным. Но стоит отметить результат, показанный при параметре 0.1, когда
спад усиливается. Именно на этом участке данный параметр показывает
наибольший прирост доходности среди других значений. Но все же по общему
зачету оптимальным является параметр 0.05, при этом стоит учитывать, что на
реальных данных эти параметры необходимо пересматривать на каждом шаге, что
позволит значительно увеличить прирост доходности.
Как и в случае с акциями Apple Inc., скользящие периоды в 500 и 1000
наблюдений менее эффективны в сравнении с предыдущими вариантами.
Объяснением этому может служить тот факт, что существуют краткосрочные и
долгосрочные процессы. Первые из них хорошо прогнозируются скользящими
периодами до 300-400 (такие варианты не были рассмотрены, но вероятность этого
большая), а долгосрочные процессы хорошо прогнозируются намного большими
скользящими периодами. А, анализируя выборку, основываясь на приблизительно
400-1200 наблюдениям (это предположение), не получается захватить ни один из
двух
процессов.
Скорее
всего,
происходит
даже
некоторое
смешение
краткосрочных и долгосрочных процессов, т.е. оба типа процессов можно частично
наблюдать на таких участках. Если говорить точнее, краткосрочные процессы
абсолютно точно будут заметны, а долгосрочные представлены лишь частично, в
результате чего происходит недообучение модели и снижение эффективности
прогноза. Стоит отметит уже наметившуюся тенденцию того, что наиболее
эффективными величинами параметра «b» являются крайние значения -0.02, 0.05,
0.5 и выше. Причины такого явления уже были объяснены ранее.
Как и в случае с акциями Apple.Inc., большие скользящие периоды также
достаточно эффективны. Стоит отметить, что при величине периода 1500
наблюдений достигается максимальная накопленная доходность. Как и прежде,
распределение эффективности метода в зависимости от вечлиичны параметра «b»
25
остается таким же: наименьшая доходность получается при значениях 0.08-0.2.
Максимум достигается при 0.3 и далее уменьшается и остается стабильным на
уровне 1800% при b равным от 1.2, когда практически все приросты лежат ниже
этой границы.
В целом скользящий период в 2000 наблюдений очень похож на
предыдущий, но показывает немного большую накопленную доходность при
низких значениях «b» и в среднем такую же при высоких.
После анализа применения модели на примере индекса S&P500 можно
сделать несколько выводов:
1)
существует распределение эффективности (накопленной доходности) в
зависимости от верхней по модулю границы состояний. Если приводить в качестве
примера график функции, то он будет выглядеть примерно как парабола, ветви
которой стремятся к некоторой горизонтальной прямой.
2)
Вывод, сделанный на основе анализа акций Apple Inc. относительно
эффективности применения низких значений границ при маленьких скользящих
периодах может быть в некоторой степени справедлив и для этого случая.
Ключевой
отличительно особенностью акций Google от предыдущих
является то, что их волатильность очень высока. И этот факт является преградой
для использования модели, которая рассматривается в данной работе. Как
минимум выводы, сделанные на основе двух предыдущих массивов данных, могут
не соответствовать тем, которые будут получены в этом случае. Если
внимательно посмотреть на график накопленной рыночной доходности, то можно
заметить, что там не наблюдаются последовательности коротких промежутков,
которые имеют одинаковый характер. Следом за относительно спокойным
периодом может идти несколько очень коротких колебаний, а потом большое
колебание цены. В результате этого было выявлено, что на скользящих периодах
до 100 наблюдений модель не эффективна по вышеозначенным причинам: ценовой
26
процесс очень быстро изменяется. Максимум, что возможно на таких периодах,
это повторить рынок. Примером может служить скользящий период 100, с
параметрами «а» и «b» 0.02 и 0.1. В таком случае наблюдается
соотношение мелких приростов, средних и сильных
следующее
2,5:4:5,3. При таких
параметрах системы кривая доходности практически повторяет кривую рыночной
доходности на второй половине тестируемой выборки, где все-таки можно
разглядеть некоторые относительно продолжительные тенденции к росту, из-за
чего и преобладает вероятность роста и следование рынку. На первой же половине
выборки так же наблюдается рост, но он менее стабилен, из-за чего на таком
скользящем периоде матрица переходных вероятностей подвергается слишком
сильному влиянию отклонений рынка.
Учитывая тот факт, что в целом волатильность на больших участках
примерно одинаковая, можно предположить, что те длины скользящих периодов,
которые были неэффективны при использовании модели на предыдущих бумагах
(500, 1000 и иногда 1500 наблюдений) будут показывать большую эффективность в
этом случае.
Действительно, если рассмотреть скользящий период в 500 наблюдений,
обнаружится, что этот вариант достаточно показателен. На графике заметно, что в
некоторых случаях модель «ловит» падение рынка и его рост, что позволяет
сказать, что идея об «обратной» эффективности скользящих периодов по
сравнению с предыдущими случаями может быть верной. В случае со скользящим
периодом 500 наиболее оптимальный вариант параметров «а» и «b» 0.02 и 0.2.
Можно заметить, что в предыдущих случаях такое значение параметра «b» давало
низкую эффективность прогноза.
Как и ожидалось, при скользящем периоде в 1000 наблюдений кривая
доходности в целом удовлетворяет критериям эффективной модели. Если
посмотреть на график, то можно заметить, что на первой половине тестируемой
выборки график кривой доходности идет практически зеркально рыночной кривой.
Это объясняется тем, что на первых пятисот скользящих периодах
больше
27
половины отрезка наблюдался спад, из-за чего в матрице переходных вероятностей
преобладали значения, которые предсказывали дальнейший спад. На второй же
половине выборки кривая доходности практически совпадает с кривой рыночной
доходности, что говорит о том, что в целом на большом отрезке модель правильно
показывает тенденцию к росту, но это в тоже время плохо в том случае, если цена
будет резко падать. В результате получается, что данный набор параметров.
Так как с предыдущими бумагами скользящие периоды в 1500 наблюдений
были относительно эффективны или даже очень, то скорее всего в данном случае
это окажется не так. Действительно, с такой длиной обучающей выборки ситуация
примерно такая же, как и 1000 наблюдениями, но немного хуже. В целом,
максимально, что удалось добиться это то, что примерно на трети тестируемой
выборки кривая доходности немного
приближается к кривой
рыночной
доходности, но все же вариант с 1000 наблюдениями является более точным.
Тестирование
скользящего
периода
в
2000
наблюдений
является
нерепрезентативным, так как всего мы располагаем примерно 2200 наблюдениями.
Если же рассмотреть обучающую выборку, состоящую из 1800 наблюдений, то при
любых значениях параметра «b» больше 0.2 модель распознает рост и кривая
доходности практически совпадает с рыночной кривой, а в какой-то момент даже
немного выше нее.
После анализа акций компании Google Inc. можно сделать вывод о том, что
предыдущие умозаключения, которые были сделаны на основу двух бумаг,
должны быть ограничены по своему применению. Очевидно, что данный случай
резко отличается от предыдущих более высокой волатильностью. Также было
обнаружено, что наиболее эффективными являются такие наборы параметров,
которые были малоэффективны в других случаях. На основе этого можно сделать
вывод, что выбор области параметров («b» и величины скользящего периода)
зависит не только от волатильности на скользящем периоде, но и от волатильности
бумаги в целом. Если вспомнить описание примерной зависимости эффективности
28
модели от параметра «b», то в данном случае этот график скорее всего имеет
перевернутый вид.
Ценовой процесс индекса NASDAQ в некоторой степени схож с S&P500
из-за того, что это индекс, рассчитанный на основе цен акций компаний и с Google
по причине повышенной волатилности. Получается, что это нечто среднее между
ними и результаты могут выявить новые зависимости или подтвердить старые.
Если взять скользящий период в 50 наблюдений, то на общем фоне сильно
выделяются два набора параметров: 0.01 0.05 и 0.02 и 0.05. Общей их чертой
можно назвать почти зеркальное поведение кривой доходности относительно
рыночной кривой. Важно отметить, что на протяжении всей тестируемой выборки
оба набора дают кривые доходности выше рыночной. На текущий момент
получается, что этот случай ближе к первым двум (Apple и S&P500), так как там
низкие значения параметра «b» при коротких скользящих периодах давали
относительно хороший результат. Также стоит отметить, что при скользящем
периоде в 30 наблюдений и параметре «b» и «а» 0.1 и 0.01 картина практически
такая же, не считая немного пониженной доходности. При значении «а» 0.02
накопленная доходность минимум в 2 раза выше рассмотренных ранее случаев.
Таким образом, выводы, сделанные для первых двух бумаг, пока остаются
верными.
После того, как были рассмотрены все варианты границ состояний на
скользящем периоде в 100 наблюдений оказалось, что наиболее эффективны такие
же наборы параметров, но кривая доходности при этом выглядит менее
сглаженной (более чувствительна к подъемам и спадам). Тем не менее, данный
скользящий период дает более низкую доходность, чем в 50 наблюдений, несмотря
на тот факт, что она лучше реагирует на резкие спады. В итоге можно сказать, что
в режиме реального времени этот период лучше не использовать, так как резкие
29
падения либо очень сложно предсказать либо они уже известны и брокер сам
принимает решение.
При анализе результатов на скользящем периоде в 200 наблюдений было
выявлено, что наибольшая доходность обеспечивается за счет значения параметра
«b» 0.1 и 0.3. Из этого можно сделать вывод о том, что ценовой процесс этого
индекса немного ближе к акциям Google. Также можно отметить, что итоговая
накопленная доходность равняется той, которая была достигнута на скользящем
периоде в 50 наблюдений.
После рассмотрения скользящих периодов в 500, 1000 и 1500 наблюдений
стало понятно, что ценовой процесс данного индекса все же ближе к Apple и
S&P500, так как кривая доходности в лучшем случае повторяет рыночную кривую
при всех значениях параметра «b».
Так как к этому индексу применимы выводы, сделанные ранее для
вышеозначенных бумаг, то с большой вероятностью на скользящем периоде в 2000
наблюдений будет показана кривая доходности, которая находится выше рыночной
кривой. Действительно, это так и есть, при чем наилучший параметр «b» равняется
0.05, так как при всех остальных доходность ниже нуля или повторяет рыночную,
что опять же подтверждает выводы, которые касались акций Apple и индекса
S&P500.
Стационарное распределение.
Сравнение
эффективности
стационарного
распределения
для
репрезентативности предлагается провести на всех скользящих периодах для
каждой бумаги при границах, которые дали наиболее эффективный результат.
Далее термин «стандартная модель» будет применяться в отношении результатов,
которые были получены через матрицу переходных вероятностей. Значительная
30
часть графиков, которые будут рассмотрены далее, будут размещены в
Приложении №2.
Порядок
рассмотрения акций и индексов будет таким же. Сначала идет
Apple Inc. На скользящем периоде в 50 наблюдений на участке, где стандартный
подход давал доходность выше рыночной, оба стационарные распределения давали
доходность несколько ниже, чем рыночная. На втором же участке, когда обычный
метод начал давать значительную ошибку, хотя и хорошо среагировал на сплит
акций, оба стационарные распределения давали доходность значительно выше
обычного метода, но все же немного ниже рыночной. Из этого можно сделать
вывод о том, что по прежнему выбор скользящего периода с низкими значениями
границ состояний в моменты сильной волатильности оптимальнее стационарного
распределения. На отрезках же с меньшей волатильностью обычный подход дает
худший результат, так как он отвлекается на шум, а стационарное распределение в
значительной степени следует за рынком.
На скользящем периоде в 100 наблюдений лучшая граница b являлась 0.02 и
в целом стандартный метод является более эффективным, так как полученная через
него кривая доходности намного чаще превосходит рост кривой рыночной
доходности. Единственное падение зарегистрировано после сплита акций. Стоит
отметить, что стационарное распределение на первой части выборки дало прирост
доходности больший, чем рыночная, но в дальнейшем оба стационарных
распределения давали прирост доходности меньший по сравнению с рыночным и
тем, который давал стандартный метод.
Если взять скользящий период в 200 наблюдений, где лучшая верхняя
граница была 0.05, то окажется, что стационарное распределение
опять дает
меньшую эффективность по сравнению со стандартным методом. Однако в этом
случае кривая доходности на первом отрезке почти равняется кривой, полученной
через стандартный метод и намного выше рыночной. Но после отрезка с возросшей
волатильностью произошел спад, после чего оба стационарных распределения
давали доходность, схожую с рыночной, в то время как доходность стандартного
31
метода росла медленнее, чем рыночная. Из этого можно сделать вывод, что с
стационарное распределение на таком скользящем периоде становится почти таким
же эффективным, как стандартный метод.
Так как было выявлено, что на скользящих периодах в 500, 1000 и 1500
наблюдений ни один набор параметров не является достаточно эффективным,
предлагается рассмотреть оба из них.
На скользящем периоде в 500 и границей 0.02 оба стационарных
распределения дают чуть большую доходность, чем стандартный метод, но все
равно этот вариант неэффективен. Вариант с границей 0.1 рассматривать не стоит,
так как в этом случае стандартный метод не повторяет рынок, в результате чего
дает большую доходность, чем стационарное распределение. И все же стоит
отметить, что оба стационарных распределения чувствуют общую тенденцию
рынка и хотя бы не противоречат ей.
В случае скользящего периода в 1000 наблюдений наблюдается аналогичная
ситуация, хотя за счет того, что стационарное распределение повторяет рынок, его
конечный результат немного выше стандартного метода. В случае же с 1500
наблюдениями стационарные распределения повторяют рыночную кривую
доходности. Как минимум в этом случае можно сказать, что сравнивать
стационарное распределение на стабильных периодах со стандартной моделью
равносильно
просто
рассмотрению
эффективности
скрытого
марковского
процесса. Аналогичная ситуация происходит и на скользящем периоде в 2000
наблюдений.
В итоге можно сказать, что оба стационарных распределений вероятности
дают практически одинаковые результаты и достаточно эффективны на коротких
скользящих периодах до 200 наблюдений. Тем не менее, стандартная модель
показывает большую доходность на аналогичных периодах.
В качестве
заключения на основе данных по одной бумаге можно сказать, что стационарное
распределение эффективнее стандартной модели только тогда, когда стандартная
32
модель неэффективна в сравнении с рынком, то есть на скользящих периодах от
пятисот до полутора тысяч.
За счет того, что волатильность ценового процесса индекса S&P500
относительно низкая, кривая доходности, полученная обоими стационарными
распределениями, практически всегда повторяет рынок. Это говорит о том, что в
подавляющем большинстве случаев это почти безрисковая стратегия относительно
самого индекса. Стоит отметить, что на скользящий периодах до 200 кривая
доходности росла во время падений рынка. На более больших скользящих
периодах расхождение с рыночной кривой минимально. Это говорит о том, что все
же иногда использование стационарного распределения можно допускать, если не
существует возможности использовать модель скрытого марковского процесса. В
целом можно сказать, что как и с акциями Apple Inc., на долгосрочном периоде
проиграть
относительно
рынка
используя
стационарные
распределения,
практически нереально. На коротких отрезках все же выгоднее использовать
стандартную модель скрытого марковского процесса.
Как можно было предположить, стационарные распределения на примере
акций Google будут достаточно эффективны. Это вызвано тем, что они показывали
положительную доходность в моменты немного возросшей волатильности. А
акции этой компании очень волатильны по сравнению с предыдущими. На
скользящих периодах в 50 и 100 наблюдений они показывали доходность, которая
выше полученной стандартной моделью. Безусловно, этот метод лучше
стандартного, но он все еще не дает положительной доходности. В целом же
наблюдается некоторое следование рынку, так как кривая в основном либо идет
зеркально рыночной либо следует ей.
Тем не менее, использование таких
скользящих периодов при такой волатильности не является логичным.
На скользящем периоде в 200 наблюдений все три метода дают примерно
одинаковую кривую доходности, которая ниже рыночной. Схожая ситуация
33
наблюдается и при тестируемой выборке в 500 наблюдений, где и стандартная
модель выходила на одном отрезке выше рыночной кривой. Стационраные
распределения в данном случае имеют такую же кривую в принципе, но она падает
раньше, хотя итоговая накопленная доходность у всех трех методов практически
одинаковая.
Как и ожидалось, на скользящих периодах выше 1000 наблюдений
стационарные распределения вероятностей дают кривую доходности, которая
практически всегда совпадает с рыночной, в то время как стандартная модель дает
кривую ниже рыночной. В результате можно сказать, что для анализа цен акций с
такой большой волатильностью ни один из методов нельзя применять с большой
уверенностью.
В
крайнем
случае,
можно
использовать
стационарное
распределение вероятностей для безрисковой торговли относительно цены бумаги.
Так как было условлено, что характер поведения индекса NASDAQ
находится примерно между Google и S&P500, то можно ожидать, что
эффективность применения стационарного распределения в этом случае будет
заметно отличаться от рассмотренных ранее вариантов. Как оказалось, характер
кривой доходности, полученный этим методом, довольно сильно напоминает
кривую, полученную стандартной моделью. Важным на этот раз является тот факт,
что эта кривая на всех скользящих периодах до 1500 наблюдений выше кривой
стандартной модели и почти все всех случаях выше рыночной кривой. На
скользящих периодах в 1500 и выше наблюдений кривые двух стационарных
наблюдений немного расходятся, но характер изменений у всех четырех
одинаковый. В результате на таких периодах кривая стремится к тому, чтобы
повторять рыночную кривую доходности. Это приводит к тому, что на скользящих
периодах от 2000 и выше при слабой волатильности стандартная модель
показывает лучшие результаты, чем стационарное распределение. В итоге можно
сказать, что стационарное распределение можно с уверенностью применять к
34
акциям, чей ценовой процесс схож с индексом
NASDAQ по степени
волатильности. Наибольшая эффективность может быть достигнута на скользящих
периодах до 200 наблюдений.
Общие выводы, сделанные на основе проведенного анализа, будут
представлены в заключении. На данный момент можно с уверенностью сказать,
что модель скрытого марковского процесса может хорошо предсказывать курс
акций и индексов. Также стоит акцентировать внимание на том, что разные
значения скользящих периодов и границ состояний дают совершенно разную
доходность в зависимости от волатильности актива.
35
Заключение
По итогам анализа использования разных параметров модели скрытого
марковского процесса и стационарного распределения вероятностей были сделаны
следующие выводы:
1)
выявлено, что при сильной волатильности необходимо применять меньше по
значению скользящие периоды и меньшие верхние по модулю границы (параметр
«b» в данной работе).
2)
существует некоторая область, внутри которой первое утверждение верно,
так как и при очень сильной
и при слабой волатильности модель не верно
интерпретирует краткосрочные тенденции.
3)
в большинстве случаев, используя большие скользящие периоды, кривая
доходности редко оказывается сильно ниже рыночной кривой. Чаще всего
происходит либо следование тенденции рынка, либо доходность портфеля/акции
немного опережает рыночную.
4)
выявлена зависимость между накопленной доходностью и выбором
параметра «b»: график такой зависимости может быть представлен в виде
параболы, ветви которой стремятся к некоторой почти горизонтальной прямой.
Разумеется, это лишь приближенная зависимость, но суть от этого не меняется.
Также стоит уточнить, что этот вывод справедлив только для акций со средней или
слабой волатильностью.
5)
график зависимости, описанный в предыдущем пункте, имеет перевернутый
вид в случае с сильной волатильностью. Кроме того, в качестве переменной в этой
зависимости можно использовать не только верхнюю по модулю границу, но и
величину скользящего периода.
6)
стационарное распределение, которое было выведено описанным в первой
главе способом, очень близко к тому, которое можно получить более легким
способом и которое без сомнений является стационарным, так как рассчитано на
36
основе принадлежности прироста к определенному состоянию. Из этого может
быть сделан вывод, что полученное более сложным образом распределение можно
в некоторых случаях заменять более простым случаем.
7)
на скользящих периодах до 200 наблюдений стационарное распределение
показывает в среднем нулевой результат, изредка принося большую доходность,
чем рыночная. В целом можно сказать, что в случае не сильной волатильности
использование стационарного распределения не рекомендуется.
8)
важен тот результат, что на долгосрочном периоде почти невозможно
проиграть рынку, используя стационарное распределение, так как оно хорошо
распознает долгосрочный тренд. Но это нельзя назвать хорошим результатом,
потому что выиграть у рынка на такой модели практически не представляется
возможным.
9)
также в случае очень сильной волатильности не рекомендуется использовать
стационарное распределение вероятностей, так как цены изменяются слишком
резко и сильно, а модель не позволяет засечь такие изменения. Также можно
сказать, что в долгосрочном периоде можно использовать данный метод, но итогом
будет лишь то, что доходность будет равняться рыночной.
В итоге можно сказать, что модель скрытого марковского процесса может
быть применима для прогноза на фондовом рынке. Но необходимо учитывать тот
факт, что нельзя постоянно использовать один и тот же набор параметров.
Наилучшей стратегией будет пересмотр всех параметров на каждом шаге,
основываясь на том, какой из них принес наибольшую доходность на предыдущем
периоде в, к примеру, 10 наблюдений. Естественно, в зависимости от скорости
изменения цен длина этого периода должна меняться.
Download