Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования

advertisement
Правительство Российской Федерации
Федеральное государственное автономное образовательное учреждение
высшего профессионального образования
"Национальный исследовательский университет
"Высшая школа экономики"
Факультет мировой экономики и мировой политики
Магистерская программа «Мировая экономика»
Кафедра «Международные валютно-финансовые отношения»
МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ
На тему:
«Лингвистический фильтр информации в российском сегменте сети
Internet как способ прогнозирования котировок на рынке акций»
Магистранта группы
МВФО-2
Орешева Константина
Валерьевича
Научный руководитель
заведующий кафедрой,
Профессор, д.э.н.,
Евстигнеев Владимир
Рубенович
Консультант
Старший преподаватель,
к.э.н.,
Камротов Михаил
Владимирович
Москва, 2013 г.
Оглавление
Введение……………………………………………………………………...…3
Глава 1. Анализ биржевого сигнала.………………………………………….6
1.1. Теория обработки сигналов в финансах………………….…………..…..6
1.2. Структурная лингвистика.…………………………………………….…..9
1.3. Марковские процессы.…………………………………………………...12
Глава 2. Грамматика биржевого сигнала……………………………………15
2.1. Терминальные и нетерминальные символы как алфавит рыночных
состояний……………………..…………………………………………….….15
2.2. Матрицы переходных вероятностей……..……………………………...18
2.3. Динамические системы и вектор вероятности состояний………….….20
Глава 3. Торговая модель………………………………………………….….22
3.1. Построение торговой модели……………………………………………22
3.2. Результаты работы модели………………………………………………25
Заключение…………………………………………………………………….28
Список использованной литературы………………………………………...30
2
Введение
Мировой финансовый рынок представляет собой сложную систему,
которая выступает для эмитентов, посредников, а также инвесторов
неисчерпаемым источником информации, качество анализа которой
способно влиять на благосостояние каждой из трех перечисленных сторон,
участвующих в сделках на бирже. Как и в других естественных науках,
данные в экономике происходят из наблюдений и на данный момент не
могут быть получены в ходе контролируемого эксперимента. Таким
образом,
проблема
обработки
и
фильтрации
огромного
объема
информации является актуальной для исследователей и участников
финансовых торгов. Скорость совершения рыночных операций и эволюция
их качественных признаков говорит о том, что система в целом постоянно
переходит из одного состояния в другое, что позволяет сделать
предположение о некоторых правилах или вероятностях таких переходов.
Восприятие
сигнала
для
трейдера
сопоставимо
с
восприятием
человеческой речи. Язык этого общения может быть представлен в
контексте генеративной лингвистики, где информационное сообщение
само по себе компактно, и оболочка, в которую оно погружено, может
быть
четко
структурирована.
Согласно
концепции
формальной
лингвистики, над которой длительное время работал известный лингвист
Хомский, любая устная или письменная речь имеет в себе универсальный
скелет, который позволяет ребенку во всей полноте овладеть родным
языком без сравнимо мощных стимулов. Знание устройства скелета
биржевого сигнала может позволить аналитику сделать прогноз, который
будет
грамматически
согласован
с
известной
ему
информацией.
Представленный лингвистический подход вносит существенную новизну в
обработку рыночных данных.
Отметим, что в настоящее время отсутствует теоретическая база
для лингвистической фильтрации биржевого сигнала, что безусловно
усиливает практический интерес в исследовании данного вопроса.
3
Объектом исследования данной работы являются формальные
правила функционирования финансового рынка. Предмет исследования –
состояния рынка, представленные как структурные смысловые единицы с
сопутствующей их построению грамматикой.
Цель данной работы состоит в обнаружении грамматики биржевого
сигнала и использовании ее для прогноза. Результатом должен стать
алгоритм, превосходящий по своей эффективности пассивную стратегию
«купи-и-держи». Для достижения результата, заявленного в работе, были
поставлены следующие задачи:
1. Определить сущность структурной лингвистики, принципы и методы
формальной грамматики. После решения этой задачи должна
сформироваться общая основа, на фундаменте которой будут
раскрыты следующие аспекты.
2. Рассмотреть модель марковской цепи, описывающей эволюцию
состояний
биржевой
системы
и
предложить
вариант
их
систематизации для более глубокого понимания проблемы.
3. Построить вероятностный вектор прогнозных состояний с поправкой
на их собственную вероятность возникновения.
4. Продемонстрировать эффективность торговой стратегии для разных
типов комбинаций терминальных символов на разных видах данных.
Для решения поставленных задач автором использовались труды
отечественных, зарубежных авторов, данные крупнейших мировых
рейтинговых агентств и новостные сводки. Теоретическую основу
составили
работы
Ноама
Хомского,
Яромира
Вальтера,
Ричарада
Беллмана, а также И.Б. Ушакова, А.В. Богомолова и Ю. А. Кукушкина.
Были использованы такие методы исследования как наблюдение,
теоретический анализ, индуктивные и дедуктивные методы, а также
математический и статистический методы, применяемые в программной
среде Mathcad.
4
Данная выпускная квалификационная работа состоит из введения, трех
глав, заключения, библиографического списка и приложений.
Первая глава дает общие представления о структурной лингвистике и ее
применимости к анализу сигнала. В ней дается описание марковского
процесса как источника получения весов перехода системы из одного
состояния в другое.
Вторая
глава
нацелена
на
раскрытие
адаптации
концепции
лингвистического фильтра для реального биржевого сигнала. Проверяется
работа динамической системы и сходимость марковской матрицы к
вероятностному вектору.
Третья
глава
комментируется
выступает
работа
практической
торгового
частью
алгоритма,
его
и
в
ней
успешность
применительно к различным рядам данных.
В заключении подводятся итоги, пути дальнейшего развития, такие
как кластеризация структурных единиц, состоящих из терминалов, а также
внедрения иной характеристики, такой как базисные полиномы или
расстояние
Кульбака-Лейблера
ка
показатель
энтропии
в
виде
нетерминальной команды.
5
Глава 1. Анализ биржевого сигнала
1.1. Теория обработки сигнала в финансах
Обработка финансового сигнала является одним из подразделов
технологии обработки аналоговых и цифровых сигналов. Методы,
применяемые финансовыми аналитиками применимы в таких областях,
как сейсмология, медицина, экономика, физика, они используются для
распознавания речи, графических образов и т.д. Прогнозная сила
подобных количественных подходов может более точно оценить движения
цен на акции, цен опционов, курсов валют или других видов производных
инструментов.
История количественных финансов берет отсчет от Исаака Ньютона,
который потерял деньги в известном лопнувшем пузыре инвестиционной
«Компании Южных морей». Тогда выдающийся ученый признал, что
способен на вычисления движения небесных тел, но предсказания
поведения толпы, находящейся в панике, ему недоступны.
Современный этап начала обработки финансового сигнала часто
приписывают Клоду Шеннону. Шеннон был изобретателем современной
теории коммуникации. Он обнаружил способность измерить пропускную
способность канала связи путем анализа энтропии информации.
За долгое время продвинутые технологии обработки сигнала были
использованы различными хедж-фондами, но, как правило, такие фонды не
раскрывают свои секреты торговли. Некоторые ранние результаты
исследований в этой области обобщены во многих статьях и книгах, что
впоследствии выделило рассматриваемую область как отдельную в мире
прогнозирования на финансовых рынках.1
Достижения
в
области
компьютерных
сетей
и
доступности
высокопроизводительных вычислительных серверов оказали существенное
1
Thomas M. Cover, Joy A. Thomas, Elements of Information Theory, 2nd Edition, Wiley, 2006
6
влияние на создание рыночных возможностей для многочисленных услуг и
продуктов. Эти события являются стимулом для многих ученых и
инженеров взглянуть на множество существующих количественных
подходов в контексте финансов.
Вот
лишь
некоторые
темы,
представляющие
интерес
для
количественного финансового аналитика:
•
Фундаментальный
количественный
анализ
в
контексте
использования новостной модели
• Моделирование микроструктуры и макроструктуры рынка
• Стохастические методы при оценке волатильности
• Анализ рисков и проблемы актуарной математики
• Метод Монте-Карло в финансовой стратегии обработки сигналов
• Теория игр и аукционов в финансовых моделях
• Динамические системы оптимизации и управления портфелем
• Машинное обучение для финансовых приложений
• Методы высокочастотных торговых алгоритмов
• Инновационные алгоритмы обработки сигналов для электронной
торговли с учетом мгновенного поиска арбитража
• Использование нейронных сетей для оценки движения цены
По причине столь широкого разнообразия существующих методов
анализа целесообразно было бы разработать логику моделирования,
которая бы строилась на всем известной предпосылке, облаченной в
интерпретирующий ее математический аппарат.
Во временной области рассмотрения сигнала, значение исследуемой
функции известно для всей области подвергаемого анализу интервала в
случае непрерывного времени или в различных отдельных моментах в
случае
дискретного
времени.
Осциллограф
представляет
собой
инструмент, который обычно используется для визуализации реальных
сигналов во временной области. Во представленной области график
7
показывает, как сигнал изменяется с течением времени, тогда как в
частотной области график показывает, композицию сигнала в пределах
заданного частотного диапазона.
Если рассматривать временную область, то можно предположить,
что каждое элементарное событие, связанное с изменением цены, можно
рассматривать как определенное послание или сигнал, а их набор как
высказывание. Также можно предположить, что значительная часть таких
посланий содержит в себе шум, который не несет в себе фундаментальной
информации о происходящих изменениях в системе. Так, например,
существует ряд методов количественных финансов, направленных на
вычленение истинного генератора случайных событий и очистку его от
шума.2
2
Simon Haykin, Blind Deconvolution, New Jersey, 1994
8
1.2. Структурная лингвистика
В конце 50х годов прошлого века Ноам Хомский представил идею
создать языковую теорию, в которой бы использовались базовые научные
принципы, применяемые в естественных науках. Такая универсализация
могла бы позволить выделить общие признаки всех языков, их структуру и
объяснить
их
различия
на
базе
их
же
структурной
схожести.
Предпосылкой для такой идеи было то, что воспроизведение и обработка
речи в голове человека является когнитивной функцией, которой обладает
все человечество и обучение младенцев языку происходит практически
само собой для всех детей во всем мире при наличии не столь сильного
стимула в виде взрослого учителя, хотя сам по себе речевой аппарат
необычайно сложен. Базируясь на том, что люди с поврежденным речевым
центром могли выполнять все остальные когнитивные функции не
связанные
с
речью,
можно
предположить
о
наличии
единого
генеративного грамматического паттерна.
Порождающая грамматика может быть описана с помощью иерархии
Хомского, предложенной им в 1950 году. Она устанавливает ряд типов
формальных грамматик с увеличением выразительной силы. Среди
простейших типов выделяют регулярные грамматики. Хомский же
утверждает, что регулярные грамматики не являются адекватными в
качестве моделей для человеческого языка, поэтому на более высоком
уровне сложности говорят о контекстно-свободных грамматиках. Такая
грамматика может быть изображена как дерево. Лингвисты, работающие с
порождающей грамматикой, часто рассматривают такие деревья в качестве
основного объекта исследования. Согласно этой точке зрения предложение
выступает
не
подчиненными
просто
и
последовательностью
вышестоящим
областями,
слов,
а
связанными
деревом
в
с
узлах.
Изображение такого дерева представлено на рисунке 1.
9
рис.1
С точки зрения распознавания образов целью грамматической
индукции служит выяснение с учетом предположения известности
предложения
S,
какие
древовидные
структуры
соответствуют
наблюдаемому сигналу. В этом смысле задача грамматики представляет
собой проблему обработки данных с наличием неполноты, где полными
данными является строение деревьев, но наблюдать мы можем только
предложение S.
Наш интерес состоит в том, чтобы представить дискретный сигнал
как набор слов, связанных некой грамматикой. Необходимо в первую
очередь произвести разделение сигнала на эти слова-состояния и затем
присвоить им свою роль, которая выявит связь между ними. Наличие
формальных связующих правил позволит нам предполагать развитие
сигнала в будущем. Так, стенографистки, слыша определенные речевые
паттерны, могут составлять выдержку происходящего и в момент начала
фразы предполагать ее окончание. Стоит отметить, что это не сказывается
на существенные потери информации при декодировании сигнала.
10
При такой постановке задачи важным будет определить, что словами
в сигнале будут являться состояния, выраженные набором терминалов –
алфавитом.3 Нетерминальные команды нужны будут для очистки сигнала
от шума, а грамматики будут выступать вероятностными связями между
этими словами. Сам же сигнал – это черный ящик с данными.
3
Хопкрофт, Дж., Мотвани, Р., Дж. Ульман. Введение в теорию автоматов, языков и
вычислений. — М.: Вильямс, 2002
11
1.3. Марковские процессы
Один из сложившихся методов количественных финансов – это
математическое моделирование. Благодаря представлению эволюции
явлений как некоторых функций сохраняются свойства этих процессов,
что позволяет их комбинировать с другими доступными моделями. Первые
экономические модели были использованы во Франции при составлении
движения товаров. Это были таблицы, составленные физиократом Кенэ.4 В
любой
модели
можно
выделить
детерминистскую
и
случайную
составляющую. Предположим, система может находится в некоторых
счетных состояниях. Тогда нас будет интересовать, в каком состоянии и с
какой вероятностью окажется выбранная нами система в интересующий
нас момент времени.
Одним из примеров анализа последовательности состояний является
письменная речь. Буквы в словах - это цепи повторяющихся событий. Эти
последовательности полностью представимы с помощью терминалов –
букв алфавита. Есть определенные правила составления слов и с точки
зрения стохастического анализа, вероятность встретить подряд множество
согласных определенно выше в хорватском языке по сравнению с русским.
В теории вероятности и статистике, марковский процесс или процесс
Маркова, названный в честь русского математика Андрея Маркова,
является случайным процессом, удовлетворяющим некоторому критерию,
называемому
рассматривать
марковским
как
свойством.
процесс
«без
Марковский
памяти»:
процесс
процесс
можно
удовлетворяет
марковскому свойству, если можно сделать прогнозы относительно
будущего
состояния,
которые
будут
основаны
исключительно
на
нынешнем состоянии процесса. Качество прогноза будет таким же словно
нам была прекрасно известна история процесса. Условно принято считать,
4
Валтер Я. Стохастические модели в экономике. — М.: «Статистика», 1976
12
что для текущего состояние системы ее будущее и прошлое являются
независимыми.
Часто термин «марковская цепь» используется для обозначения
процесса Маркова, имеющего набор событий (конечных или счетных) в
дискретном пространстве состояний (1).
(1)
Графически представить марковский процесс можно в виде блок
схемы,
соединенной
графами
с
соответствующими
переходными
вероятностями, представленными на рисунке 2.
рис. 2
Такие и подобные им цепи событий описываются условными
вероятностями перехода, означающими, что при воздействии на вектор
исходных вероятностей матрицей переходных вероятностей, мы получим
вероятностное распределение на следующем шаге. Марковская цепь
является содержимым черного ящика, который представляет собой
элементарные событие, происходящие на фондовом рынке и неизвестные
невидимые нам вероятности переходов этих состояний, представляющие
собой не что иное, как грамматику биржевого сигнала.
13
Стоит заметить, что одним из примеров проявления марковского
процесса является случайное блуждание. Этот диффузионный процесс и
его производные более сложные разновидности используются для
описания движения котировок во времени. На рисунке 3 представлен один
из вариантов реализации случайного блуждания, когда состояния
переходят их одного в другое по неким случайным законам.
рис. 3
В своем исследовании мы попытаемся задать состояния и, применяя
более детерминистский подход, определить матрицу перехода состояний,
используя обучение на выборке интересующих нас динамических
показателей.
14
Глава 2. Грамматика биржевого сигнала
2.1. Терминальные и нетерминальные символы как алфавит
рыночных состояний
Грамматика – это мощный инструмент для анализа языка. Это набор
грамматических правил, согласно которым происходит формирование
устной или письменной речи. Приведем простой пример русской
грамматики:
предложение –> <субъект> <глагольная часть> <объект>
субъект –> Этот | Компьютеры | Я
глагольная часть –> <наречие> <глагол> | <глагол> | <->
наречие –> никогда
глагол –> является | управляют | говорит
объект –><существительное> | <существительные > |
существительное –> вселенная | миры | сыр | ложь
Использую данные простые правила можно породить несколько
простых предложений:
Это вселенная.
Компьютеры управляют миром.
Я являюсь сыром.
Я никогда не говорю ложь.
15
Согласно такому типу конструкции можно предположить, что после
фразы: «Компьютеры управляют…» последует скорее существительное,
чем наречие «безвольно» и тем более скорее мы встретим наречие, чем
глагол «говорю».
Основываясь на том, что грамматика дает нам возможность
проецировать саму себя, предсказывая некую событийность в будущем,
попробуем определить ее терминальные и нетерминальные части.
В русском языке терминалы – это, например, буквы алфавита. В
биржевом сигнале мы постараемся представить неизменяемые части,
посредством которых система общается с нами как «падение» или «рост».
Эти два элементарных события могут служить нам простым алфавитом,
который вменен рыночной системе. Несколько последовательных ростов
или падений, а также чередующийся рост или падения могут быть
представлены как элементарные слова, которые воспроизводит система.
⎛ 1
⎜ 1
⎜
⎜ 1
⎜ 1
⎜
⎜ 1
⎜ 1
⎜ 1
⎜
1
A4 := ⎜
⎜ −1
⎜ −1
⎜
⎜ −1
⎜ −1
⎜
⎜ −1
⎜ −1
⎜ −1
⎜
⎝ −1
1
1
1
1
1 −1
1 −1
−1 1
−1 1
−1 −1
−1 −1
1
1
1
1
1 −1
1 −1
−1 1
−1 1
−1 −1
−1 −1
1
⎞
⎟
−1
⎟
1 ⎟
−1 ⎟
⎟
1
⎟
−1 ⎟
1 ⎟
⎟
−1 ⎟
1 ⎟
⎟
−1
⎟
1 ⎟
−1 ⎟
⎟
1
⎟
−1 ⎟
1 ⎟
⎟
−1 ⎠
рис.4
16
На рисунке 4 изображена матрица состояний, в которой строки
отражают состояния системы. В то же время это элементарные слова,
интерпретирующие эти состояния.
Нетерминальными командами выбраны команды отчистки от шума,
которые будут отсекать состояния, близкие к нулевым изменениям
котировок.
Данный алфавит и вокабуляр может полностью задавать рыночный
процесс и на каждом шаге система будет переходить из одного состояние в
другое, которые вместе будут формировать 16 исходных. Грамматикой
будет являться вероятности этих переходов.
17
2.2. Матрицы переходных вероятностей
Для того, чтобы задать эволюцию состояний финансовой системы,
мы зададим стохастические матрицы, в которых будет отражена
вероятность
перехода
соответствующего
состояния
в
иное
соответствующее состояние из нашего набора высказываний. На рисунке 5
мы приведем пример такой матрицы.
рис.5
Она
обладает
замечательным
свойством
того,
что
сумма
вероятностей по каждой строке равна единице.
Так, например, элемент, занимающий второе место в столбце и
второе место в строке указывает на вероятность того, что состояние 2
сохранится на очередном шаге.
При достаточной продолжительности процесса система должна
достичь распределения, близкого предельному.
Составление такой матрицы будет основано на том, что состояния
системы выразимы ее вокабуляром. На каждом шаге, равном по длине
самому высказыванию из вокабуляра, мы будем отслеживать вероятность
перехода в то или иное состояние. На основе полученных весов мы и
составим стохастическую матрицу.
18
При
рассмотрении
однородных
цепи
Маркова
нас
будет
интересовать вопрос о том, какой терминальный знак будет открывать
следующее за текущим состояние. Этот шаг важен для составления
торгового правила.
Отдельно стоит сказать, что мы выделим нетерминальный аппарат
для
отсечения
шума,
чтобы
не
учитывать
терминальный
знак,
характеризующий событие, не относящееся ни к повышению, ни к
понижению.
19
Динамические системы и вектор вероятности состояний
Задав матрицы перехода и обучив марковскую матрицу на тестовой
выборке, интересно будет поставить вопрос о том, существует ли
стационарное распределение вероятностей.
Динамическая система – это концепция в математике, где
фиксированное правило описывает зависимость от времени точки в
геометрическом
пространстве.
Примеры
включают
математические
модели, которые описывают качание маятниковых часов, поток воды в
трубе и количество рыбы каждой весной в озере.
В любой момент времени динамическая система имеет состояния,
описываемые
определенным
множеством
действительных
чисел
(вектором), который может быть представлен точкой в соответствующем
пространстве
состояний
(геометрические
многообразия).
Некоторые
изменения в состоянии системы создают определенные изменения в ее
следующем состоянии. Эволюция состояний динамической системы
заключается в наличии фиксированного правила, которое описывает то,
что будущие состояния вытекают из текущего состояния. Правило считают
детерминированным, если за данный интервал времени только одно
будущее состояние следует из текущего состояния.
Предположим, что стохастическая матрица имеет только простые
характеристические числа.
20
Получим:
Тогда можно утверждать, что существует квазилинейное
распределение, и собственный вектор матрицы M является вероятностным
вектором. Впоследствии мы будем использовать этот метод для
кластеризации состояний системы и нормировки переходных
вероятностей.
21
Глава 3 Торговая модель
3.1. Построение торговой модели
Для нашего исследования мы будем использовать курсы валютных
пар евро-доллар, доллар-рубль и котировки некоторых компаний,
включенных в индекс Доу-Джонса, а также в индекс РТС. В данном случае
нас интересует Россия, так как интересно будет проверить гипотезу
наличия грамматики на рынке, который по мнению некоторых аналитиков
менее пригоден для более строгих математических моделей ввиду наличия
факторов, не связанных с стохастическими процессами.
Прежде всего перейдем из состояния логарифмических приростов в
состояние терминальных значений:
рис. 6
1
state0 t 0
1
0
2000
4000
6000
8000
4
4
1 .10
4
1.2 .10
4
1.4 .10
4
1.6 .10
1.8 .10
4
2 .10
4
4
2.2 .10
4
2.4 .10
2.6 .10
t
рис. 7
0.01
ut
thr
0.005
0
0.005
0
2000
4000
6000
8000
4
1 .10
4
4
1.2 .10
1.4 .10
4
4
1.6 .10
1.8 .10
4
2 .10
4
2.2 .10
4
2.4 .10
4
2.6 .10
t
рис. 8
34
33
S t, 2
32
31
0
4
4
1 .10
2 .10
4
3 .10
t
22
На рисунке 6 данные логарифмированные приросты доходностей
интерпретированы как «1» и «-1» соответственно для положительных и
отрицательных значений. Значения находящиеся в коридоре (-0.001;0.001)
извлечены.
Далее мы задаем вокабуляр из терминального алфавита:
⎛ 1
⎜ 1
⎜
⎜ 1
⎜ 1
⎜
⎜ 1
⎜ 1
⎜ 1
⎜
1
A4 := ⎜
⎜ −1
⎜ −1
⎜
⎜ −1
⎜ −1
⎜
⎜ −1
⎜ −1
⎜ −1
⎜
⎝ −1
1
1
1
1 −1
1 −1
1 −1
−1 1
−1 1
−1 −1
−1 −1
1
1
1
1
1 −1
1 −1
−1 1
−1 1
−1 −1
−1 −1
1
⎞
⎟
⎟
1 ⎟
−1 ⎟
⎟
1
⎟
−1 ⎟
1 ⎟
⎟
−1 ⎟
1 ⎟
⎟
−1
⎟
1 ⎟
−1 ⎟
⎟
1
⎟
−1 ⎟
1 ⎟
⎟
−1 ⎠
рис. 9
На следующем шаге мы используем оператор, который в цикле на
определенной части выборки обучается, выступая детектором состояний,
предвосхищающих текущее. По частотам переходов состояний мы вполне
можем реконструировать марковскую матрицу для 16 заданных состояний:
1
2
3
4
5
6
7
MATRIX = 8
9
10
11
12
13
14
15
16
1
0.08972
0.04619
0.04693
0.04987
0.05228
0.04719
0.05286
0.06715
0.05983
0.05372
0.04854
0.06866
0.06134
0.05414
0.05898
0.0612
2
0.06098
0.06843
0.04477
0.06037
0.05452
0.06171
0.05503
0.06534
0.06239
0.05666
0.04356
0.06418
0.05462
0.05878
0.05626
0.06582
3
0.06098
0.08127
0.04982
0.08486
0.05676
0.07018
0.06227
0.08167
0.06923
0.08609
0.05974
0.08582
0.06471
0.06342
0.05263
0.07044
4
0.06359
0.05731
0.06354
0.06037
0.04182
0.05989
0.04996
0.05808
0.04872
0.05298
0.05103
0.06269
0.05126
0.06265
0.06443
0.05774
5
0.06707
0.05988
0.06715
0.06562
0.06273
0.0853
0.06083
0.07441
0.06239
0.06402
0.06472
0.07463
0.0521
0.07502
0.05263
0.06005
6
0.06446
0.07699
0.08592
0.09886
0.06049
0.09498
0.09269
0.10345
0.06838
0.10596
0.05849
0.07463
0.06891
0.09203
0.08439
0.07621
7
0.06533
0.07956
0.04982
0.07087
0.07244
0.06897
0.0572
0.08439
0.05641
0.08094
0.05476
0.08358
0.06555
0.07579
0.05898
0.07275
8
0.04791
0.05389
0.05054
0.04899
0.05452
0.05929
0.05358
0.05535
0.04359
0.06843
0.05725
0.05597
0.0521
0.0611
0.04446
0.05774
9
0.05052
0.0556
0.05054
0.05337
0.06871
0.06231
0.05938
0.04265
0.06496
0.04489
0.06845
0.06343
0.04874
0.058
0.05808
0.07275
10
0.08014
0.08212
0.06282
0.06649
0.07842
0.06534
0.06734
0.05717
0.05983
0.05151
0.07965
0.05821
0.07059
0.07038
0.06352
0.05543
11
0.06359
0.0787
0.09531
0.08836
0.08962
0.06655
0.08762
0.0608
0.07521
0.07064
0.1033
0.0709
0.09328
0.06961
0.08621
0.05889
12
0.07056
0.05389
0.07365
0.06124
0.06945
0.05687
0.06662
0.05172
0.0641
0.05445
0.06845
0.06269
0.09244
0.07193
0.07713
0.06467
13
0.06272
0.05218
0.07437
0.04724
0.05302
0.05687
0.06662
0.05172
0.07607
0.05592
0.06721
0.04179
0.05042
0.05259
0.06715
0.06236
14
0.0601
0.0633
0.0722
0.05862
0.06423
0.05747
0.07314
0.04719
0.0735
0.07138
0.06472
0.04254
0.07059
0.06497
0.07441
0.06351
15
0.04443
0.0479
0.06209
0.04199
0.07394
0.04114
0.06155
0.05082
0.07179
0.04783
0.06409
0.04552
0.06218
0.0348
0.0608
0.0612
16
0.04791
0.04277
0.05054
0.04287
0.04705
0.04598
0.03331
0.04809
0.04359
0.03458
0.04605
0.04478
0.04118
0.0348
0.03993
0.03926
23
После составления матрицы мы проверим предельный переход,
связанный с работой динамической системы, на основе которой мы
получим вектор вероятностного распределения:
0.1
eigenvecs( W , "L" )
〈1〉
∑eigenvecs( W, "L" )
0.08
〈1〉
0.06
0.04
10
5
0
5
10
E
рис. 10
1
2
3
4
5
6
〈1〉
7
eigenvecs ( W , "L" )
= 8
〈1〉
eigenvecs ( W , "L" )
9
10
11
12
13
14
15
16
∑
1
0.0567
0.05779
0.06845
0.05645
0.06613
0.08169
0.06821
0.05438
0.05779
0.06712
0.07942
0.06613
0.05873
0.06386
0.05438
0.04277
рис. 11
Теперь мы пронормируем вероятностную матрицу, учитывая
абсолютные вероятности встречаемости состояния.
Торговая стратегия будет основана на прогнозировании первого
терминала текущего состояния. Ниже будут приведены результаты
торговли в сравнении с пассивной стратегией «купи-и -держи».
24
3.2. Результаты работы торговой модели
Котировки валютной пары доллар-рубль. Октябрь 2012 на минутных
интервалах. Красным выделена наша стратегия, синим – пассивная. На оси
ординат отмечена накопленная доходность на выбранном интервале.
0.12
0.1
0.08
0.06
Pt
market t
0.04
0.02
0
0.02
0.04
0.06
4
2.5 .10
3 .10
4
4
3.5 .10
4
4 .10
4
4.5 .10
5 .10
4
5.5 .10
4
6 .10
4
6.5 .10
4
7 .10
4
4
7.5 .10
4
8 .10
8.5 .10
4
4
9 .10
9.5 .10
4
5
1 .10
t
рис. 12
25
Котировки
пары
евро-доллар.
Март
2012
на
15-минутных
интервалах. Красным выделена наша стратегия, синим – пассивная. На оси
ординат отмечена накопленная доходность на выбранном интервале.
0.06
0.05
0.04
0.03
Pt
market t
0.02
0.01
0
0.01
4
2.5 .10
4
2.52 .10
4
2.54 .10
4
2.56 .10
2.58 .10
4
4
2.6 .10
4
2.62 .10
4
2.64 .10
4
2.66 .10
4
2.68 .10
4
2.7 .10
t
рис. 13
26
Котировки акций компании ОАО «Газпром». Март 2001 - Май 2001
на 15-минутных интервалах. Красным выделена наша стратегия, синим –
пассивная. На оси ординат отмечена накопленная доходность на
выбранном интервале.
1.1
1
0.9
0.8
0.7
0.6
Pt
market t
0.5
0.4
0.3
0.2
0.1
0
0.1
0.2
6500
6550
6600
6650
6700
6750
6800
6850
6900
6950
7000
7050
7100
7150
7200
t
рис. 14
27
Заключение
В ходе исследования были выполнены следующие задачи:
1. Определена сущность структурной лингвистики, принципы и методы
формальной грамматики.
2. Рассмотрены модели марковской цепи, описывающей эволюцию
состояний
биржевой
системы
и
предложены
варианты
их
систематизации для более глубокого понимания проблемы.
2. Построен вероятностный вектор прогнозных состояний с поправкой
на их собственную вероятность возникновения.
3. Продемонстрирована эффективность торговой стратегии для разных
типов комбинаций терминальных символов на разных видах данных.
Можно прийти к заключению, что в сигнале, полученном из
российского сегмента валютного и фондового рынков прослеживалось
наличие грамматики, позволившей сделать успешный прогноз на
интервал времени, в несколько раз превосходивший временной
промежуток, использовавшийся для обучения марковской матрицы.
Стоит отметить качественную положительную силу прогноза на
нерублевом
валютном
потенциальный
успех
рынке.
Более
торговой
важный
стратегии,
результат,
чем
основанной
на
использовании построенной модели, заключается в том, что сама
структура черного ящика данных оказалась в некотором роде
универсальной и позволила выявить правила эволюции состояний.
Дополнительно был использован вокабуляр из слов длиной 3
терминальных символа, но он был менее успешным в сравнении со
словами, собранными из 4 терминалов.
В качестве перспектив развития данной модели можно обозначить
концепцию создания терминальных символов, основанных на базисных
полиномах,
которые
бы
отражали
частотную
структурную
составляющую сигнала. Еще одной существенной доработкой может
28
быть создание предварительной кластеризации для определения
наиболее эффективного вокабуляра.
29
Список используемой литературы:
I.Нормативно – правовые акты.
1. Гражданский кодекс РФ Часть 1 от 30.11.1994 № 51-ФЗ (в редакции от
06.12.2011) //Собрание законодательства РФ, 05.12.1994, N 32, ст. 3301.
2. Федеральный закон «О рынке ценных бумаг» от 22.04.1996 № 39-ФЗ
(в редакции от 02.01.2013) //"Российская газета", N 79, 25.04.1996.
3. Федеральный закон «О защите прав и законных интересов инвесторов на
рынке ценных бумаг» от 5.03.1999 № 46-ФЗ (в редакции от 09.12.2012)
//"Российская газета", N 46, 11.03.1999.
4. Федеральный закон «Об ипотечных ценных бумагах» от 11.11.2003 №
152-ФЗ (в редакции от 29.12.2012) //"Парламентская газета", N 215-216,
19.11.2003.
5. Федеральный закон «Об инвестиционных фондах» от 29.11.2001 № 156ФЗ (в редакции от 02.07.2012) //"Российская газета", N 237-238, 04.12.2001.
6. Федеральный закон «Об акционерных обществах» от 26.12.1995 № 208ФЗ (в редакции от 19.04.2013) //"Российская газета", N 248, 29.12.1995.
7. Федеральный закон "О банках и банковской деятельности" от
02.12.1990 № 395-1 (в редакции от 19.05.2013) //"Российская
газета", N 27, 10.02.1996.
II.Монографии
1.Батяева Т.А., Столяров И.И. «Рынок ценных бумаг: Учебное пособие» М.:Инфра-М, 2008
2.Бернстайн П. «Фундаментальные идеи финансового мира. Эволюция» М.: Альпина Бизнес Букс, 2009
3.Боровкова В.А. «Рынок ценных бумаг» - Спб.: Питер, 2008
30
4.Буренин А.Н. «Управление портфелем ценных бумаг» - М.: Научнотехническое общество имени академика С.И. Вавилова, 2007
5.Бэрнхэм Т. «Подлые рынки и мозг ящера: как заработать деньги,
используя знания о причинах маний, паники и крахов на финансовых
рынках» - М.:Эксмо, 2008
6.Ван Хорн Дж.К. «Основы управления финансами» - М.: Статистика и
финансы, 2003
7.Дектерева О.И., Коршунова Н.М., Жукова Е.Ф. «Рынок ценных бумаг и
биржевое дело: Учебник» - М.: ЮНИТИ-ДАНА, 2003
8.Есипов В.Е., Маховикова Г.А. «Ценообразование на финансовом рынке:
Учебное пособие» - Спб.: Питер, 2001
9.Миркин Я.М. «Рынок ценных бумаг России: воздействие
фундаментальных факторов, прогнозов и политика развития» - М.:
Альпина Паблишер, 2002
10.Найман Э.Л. «Малая энциклопедия трейдера» - М.: Альпина Бизнес
Букс, 2007
11.Рубцов Б. «Современные фондовые рынки: Учебное пособие для вузов»
- М.: Дело, 2004
12.Рудык Н.Б. «Поведенческие финансы или между страхом и алчностью»
- М.: Дело, 2004
13.Твид Л. «Психология финансов» - М.: Аналитика, 2002
14.Шарп У., Александер Г., Бейли Дж. «Инвестиции» - М.:Инфра-М, 1999
31
III.Статьи из периодической литературы:
1.Сигал Е., Попов А., Рябов С., Чеховской Н. «Маркс возвращается»//РЦБ
№23(350), 2007, стр. 12-16
IV. Источники на иностранном языке.
1. Bishop C. Neutral networks for pattern recognition. Oxford University press,
2005
2. Jones P.T., Soros G. The Alchemy of Finance: Reading the Minds of the
Markets. – N.Y. John Wiley & Sons, Inc., 1994
3. Jung O, Shiller R., “Samuelson’s Dictum and the Stock Market”, Economic
Inquiry, Vol.43, №5
4. Samuelson P., “Introduction” to James Bicksler, Investment Portfolio
Decision-making. NYC.: Lexington Books, 1974
5. Shiller R. “Irrational Exuberance”, NYC.: Broadway Books, 2001
6. Stiglitz E.J. Information and the change in the paradigm in economics, Nobel
Prize Lecture, December 8, 2001
V.Интернет-ресурсы.
1.Официальный сайт рейтингового агентства Standard&Poors
http://www.standardandpoors.com
2.Финансовый агрегатор http://finance.yahoo.com/
3.Сайт издательского дома «Коммерсант» http://www.kommersant.ru/
32
Download