О некоторых особенностях интерпретации статистического R/S

advertisement
Вопросы геофизики. Выпуск 46. СПб., 2013 — (Ученые записки СПбГУ; № 446)
159
Б. В. Kиселев
О НЕКОТОРЫХ ОСОБЕННОСТЯХ ИНТЕРПРЕТАЦИИ
СТАТИСТИЧЕСКОГО R/S -АНАЛИЗА
Введение
В настоящее время наблюдается значительное повышение интереса как к чисто теоретическим и модельным исследованиям хаотических, фрактальных процессов, так и к
приложениям разработанного математического формализма и терминологии не только к различного рода физическим процессам и явлениям, но также в биологии и медицине, экономике и социологии, лингвистике и истории, и др. Одним из перспективных методов анализа динамики можно назвать статистический R/S-анализ, созданный
Г. Харстом [1,2], как итог изучения данных годичных стоков Нила. Метод Харста позволяет выявить в статистических данных такие свойства, как кластерность, тенденцию
следовать по направлению тренда, сильное последействие, сильную память, быструю
перемежаемость последовательных значений, фрактальность, наличие периодических
и непериодических циклов, различать «стохастическую» и «хаотическую» природу шума и т. п. Помимо основополагающей работы Г. Харста в развитии теории R/S-анализа,
его методологии и применении, значительную роль сыграли работы Б. Мандельброта
[3–5]. Содержательный разбор статистического R/S-анализа и его возможностей можно найти в монографии A. Ширяева [6], где показана тесная связь R/S-анализа (показателя Харста) с такими вероятностно-статистическими понятиями, как устойчивые
распределения, полет Леви и фрактальное броуновское движение. Следует отметить
монографию Федера [7]. Особую популярность R/S-анализ приобрел при исследовании
рыночных и экономических показателей [8, 9], большое количество работ Мандельброта
также связано с экономикой и финансами.
1. Метод Харста
В 1951 г. британский климатолог Г. Харст (Harold Edwin Hurst), проведший более
60 лет в Египте, участвуя в гидрогеологических проектах, связанных с Нилом, опубликовал работу, в которой излагался (экспериментально им обнаруженный) неожиданный эффект в поведении флуктуаций годичной водности Нила и ряда других рек. Суть
этого эффекта в следующем. Пусть x1 , . . . , xn — величины годичных уровней (скажем,
Нила в некоторой его части) за n последних лет. Оценкой их среднего значения будет
n
величина (1/n)Xn , где Xn = k=1 xk . Отклонение Xk за k последних лет от среднего
(эмпирического) значения, подсчитанного по данным за n,
k
Xn ,
n
и, следовательно,
и максимальным
отклонениями являются величины:
$
% минимальным
$
%
min Xk − nk Xn и maxk≤n Xk − nk Xn .
Xk −
k≤n
c
Б. В. Kиселев, 2013
Б. В. Kиселев
160
k
k
Rn = max Xk − Xn − min Xk − Xn
k≤n
k≤n
n
n
— величину, характеризующую степень отклонения кумулятивной величины Xk от их
среднего значения (k/n)Xn за последовательные n лет. В своей экспериментальной
практике Харст на самом деле оперировал не с величинами Rn , а с нормированными
величинами Qn = Rn /Sn (поэтому иногда метод Харста называют методом нормированного размаха), где S есть эмпирическое стандартное отклонение,
&
"2
! n
' n
'1 1
(
Sn =
x2k −
xk ,
n
n
Обозначим
k=1
k=1
вводимое с целью получения статистики, инвариантной относительно замены xk →
c(xk + m), k ≥ 1, что является желательным свойством, поскольку даже среднее значение и дисперсия величины xk , как правило, остаются неизвестными. Основываясь на большом фактическом материале наблюдений за стоками Нила в период 622–
1469 гг. (т. е. за 847 лет), Г. Харст обнаружил, что для больших значений n статистика
Rn /Sn ∼ cnH , или log(R/S) = H log(n) + log(c), где c — некая константа, а параметр
H, называемый теперь показателем Харста, оказался равен приблизительно 0,7. Если
в двойных логарифмических координатах построить график зависимости R/S от n и
определить угол наклона аппроксимирующей кривой, можно оценить значения показателя Харста. Из приведенных формул расчета показателя Харста на изменение его
величины и, как следствие, вид графической зависимости R/S влияют изменения размаха накопленного отклонения R и среднеквадратичного отклонения S. Учитывая, что
для реальных временных рядов различной природы (геофизических, биологических,
экономических) вид R/S-графика может быть сильно структурирован и показатель H
на разных масштабах могут существенно отличаться [10], представляется интересным
рассмотреть синхронность изменения величин R и S, оценить их роль в формировании
R/S-графика и в определении величины показателя H.
2. Построение и анализ R/S-, R- и S-графиков
В качестве тестовых примеров для исследования разумно взять реализации стандартных последовательностей: броуновского шума, броуновского движения и фрактальной функции Вейерштрасса—Мандельброта. Ряды построены с помощью программы «Fractan 4.4» (http://impb.ru/files.php). Длина каждой реализации 10000 точек. Рассмотрим в качестве основного примера действительную часть фрактальной функции
Вейерштрасса—Мандельброта W (t) [5, 11]:
n
∝
(1 − eib t )eiφn
W (t) =
,
b( 2 − D)n
n=−∝
где φn — произвольная фаза. Полагая φn = 0, получим простейший вариант W (t) —
косинусную фрактальную функцию Вейерштрасса—Мандельброта,
ReW (t) = C(t) =
∝
1 − cosbn t
.
b(2−D)n
n=−∝
О некоторых особенностях интерпретации статистического R/S-анализа
161
Рис. 1. Действительная часть фрактальной функции Вейерштрасса—Мандельброта и соответствующие
функции распределения амплитуды сигнала (50 градаций) при b = 1, 5: а — D = 1, 0; б — D =
1, 5; в — D = 2, 0
Б. В. Kиселев
162
Функция W (t) зависит от двух параметров b и D. Зависимость от b проста, так как b
определяет, какая часть кривой видна, когда t изменяется в заданном интервале. Обычно b = 1, 5. Параметр D принимает значения в диапазоне 1 < D < 2 и определяет зазубренность временного ряда. При значениях D, близких к 1,0, функция Вейерштрасса—
Мандельброта практически гладкая, но когда D возрастает и приближается к 2,0, функция начинает сильно флуктуировать, представляя собой шумовой согнал, накладывающийся на возрастающий тренд, и может служить моделью «1/f шума». Параметр D имеет смысл фрактальной размерности, при D < 1 функция не фрактальна. На рис. 1 представлены три реализации косинусной функции Вейерштрасса—Мандельброта (φn = 0)
при b = 1, 5 и D = 1, 0; 1,5 и 2,0, а также соответствующие функции распределения. На
рис. 2 приведены графики логарифмов значений R, S, R/S для этих реализаций. Был
вычислен показатель Харста для различных значений D = 1−2. Оказалось, что для лю-
Рис. 2. Графики логарифмов значений:
a — R, S, R/S в зависимости от логарифма n для реализации косинусной функции Вейерштрасса—
Мандельброта (при b = 1, 5 и D = 1, 0: 1 — R/S, 2 — R, 3 — S; D = 1, 5: 4 — R/S, 5 — R, 6 — S; D = 2, 0: 7 —
R/S, 8 — R, 9 — S); б — R/S в зависимости от lg n для приращений функции Вейерштрасса—Мандельброта
для значений D — 1,0; 1,2; 1,5; 1,8; 2,0 (расположение сверху вниз); в — S в зависимости от lg n для приращений функции Вейерштрасса—Мандельброта для значений D — 1,0; 1,2; 1,5; 1,8; 2,0 (расположение снизу
вверх).
О некоторых особенностях интерпретации статистического R/S-анализа
163
Рис. 3. Графики логарифмов значений R, S, R/S в зависимости от lg n для фрактального броуновского движения при H = 0, 8 (1 — R, 2 — R/S, 3 — S).
бой реализации функции Вейерштрасса—Мандельброта при D = 1, 0 − 1, 8 показатель
Харста остается неизменным: 1,0, и только со значения D = 1, 9 снижается от H = 0, 99
до H = 0, 91 при D = 2, 0. Чем можно объяснить подобный эффект? Как видно из рис. 2,
степень возрастания размаха R и среднеквадратичного отклонения S падает с возрастанием D почти синхронно, поэтому значения показателя Харста и вид R/S-графика
остаются неизменными. В данном случае метод Харста не реагирует на возрастание зазубренности ряда (увеличения шумовой составляющей), хотя функция распределения
трансформируется от квазиравномерного к нормальному распределению. Однако для
Б. В. Kиселев
164
приращений функции Вейерштрасса—Мандельброта показатель Харста уменьшается с
возрастанием D от 1 до 2:
D
1
H
0,88 0,83 0,76 0,68 0,6 0,54 0,41 0,31 0,23 0,14 0,12
1,1
1,2
1,3
1,4 1,5
1,6
1,7
1,8
1,9
2,0
В то же время изменения величины S для приращений функции Вейерштрасса—
Мандельброта или не происходит, или значение S стремится выйти на постоянный
уровень с увеличением масштаба (см. рис. 2, в). Соответствующие R/S-графики приведены на рис. 2, б. Анализ броуновского шума показал результат, аналогичный для
приращений функции ReW . Для броуновского движения, независимо от значения показателя H, наблюдается почти синхронное изменение R и S, что видно из рис. 3, б, где
показаны соответствующие графики, построенные для H = 0, 8. Хотя графики R и S
изрезаны, но синхронность их изменения приводит к тому, что R/S-график выглядит
как прямая линия.
Рис. 4. Пример, когда величина показателя Харста принимает отрицательное значение:
а — реализация магнитоэнцефалограммы больного эпилепсией; б — распределение значений ряда (50 градаций); в — графики логарифмов значений: 1 — R, 2 — S — звездочки, 3 — R/S
в зависимости от lg n.
О некоторых особенностях интерпретации статистического R/S-анализа
165
Выводы
Анализ исследования показал следующее. Вычисление показателя Харста может
быть недостаточным для корректных выводов и поэтому целесообразно рассмотреть
характер распределения значений временного ряда и проанализировать приращения.
На рис. 4 приведен экзотический пример, когда показатель Харста принимает отрицательное значение. Приведен пример магнитоэнцефалограммы больного эпилепсией
(ряд содержит 23 800 значений), рис. 4, а. Примерно на масштабе более 7–8 тысяч точек
происходит резкое возрастание величины S (на рис. 4, б это соответствует log n = 9),
что, по-видимому, можно объяснить существенной асимметрией распределения значений ряда относительно среднего уровня. Это подтверждается гистограммой (рис. 4,б )
распределения значений ряда, которая обладает острой вершиной и несимметричностью относительно центра распределения, что типично для распределений с «тяжелыми хвостами». Асимметрия привела к резкому возрастанию величины S, но не дала
значительного вклада в размах R, как следствие произошло уменьшение значений R/S
и этот участок графика дал оценку H = −1, 6. Анализ приращений дал аналогичный
результат.
Указатель литературы
1. Hurst H. Long-term storage capacity of reservoirs. American society of civil engineers. 1951.
Vol. 116. P. 770–898.
2. Hurst H. Methods of long-term storage in reservoirs. Proc. Inst. of Civilengineers. 1956. Vol. 5.
P. 519–543.
3. Мандельброт Б. Фрактальная геометрия природы. Институт компьютерных исследований. M., 2002. 656 с.
4. Mandelbrot B. B. Gaussian Self-Affinity and Fractals: Globality, the Earth, 1/f Noise and
R/S, H. Springer, 2001. 654 p.
5. Мандельброт Б. Фракталы, случай и финансы. Москва; Ижевск, 2004. 256 с.
6. Ширяев А. Н. Основы стохастической финансовой математики. М.: Фазис, 1998. T. 2.
428 с.
7. Федер Е. Фракталы. M.: Мир, 1991. 254 с.
8. Пэтерс Эдгар Э. Фрактальный анализ финансовых рынков. М., 2004. 304 с.
9. Пэтерс Эдгар Э. Хаос и порядок на рынках капитала. М.: Мир, 2000. 333 с.
10. Киселев Б. В. Статистический R/S-анализ (показатель Харста): учеб.-метод. пособие.
СПб.: Изд-во СПбГУ, 2012. 27 с.
11. Berry M. V., Lewis Z. V. On the Weierstrass-Mandelbrot Fractal Function, Proc. R. Soc.,
A370. 1980. P. 459–484.
Download