использование анализа временных рядов

advertisement
Серия «Естественные и физико-математические науки». 4/2014
УДК 551.524.3
С. Г. Михалап, Д. Э. Мингалёв, С. И. Евдокимов
ИСПОЛЬЗОВАНИЕ АНАЛИЗА ВРЕМЕННЫХ РЯДОВ
В ИЗУЧЕНИИ МНОГОЛЕТНИХ ТЕМПЕРАТУРНЫХ ИЗМЕНЕНИЙ
В статье рассматривается использование метода анализа временных рядов при
изучении многолетних среднемесячных колебаний температур. К временному ряду применяются такие методы, как сезонная декомпозиция, спектральный Фурье — анализ, регрессионный анализ. Построены описательные модели временного ряда, обладающие различной
степенью достоверности.
Ключевые слова: температура, климат, временной ряд, сезонная декомпозиция, моделирование.
В современном мире, где экологические проблемы имеют глобальный характер, резко повысился интерес к изучению разномасштабных климатических процессов, поскольку именно климат в первую очередь отражает ненаправленные антропогенные изменения [2, 5, 7, 8]. Климатология — наука, изучающая вопросы
климатообразования, описания и классификации климатов земного шара, антропогенные влияния на климат [1].
В настоящее время интенсивно развиваются прикладные ветви климатологии
— авиационная, строительная, транспортная, техническая и другие, которые имеют
определённые требования к климатической информации и методам получения данных, поскольку они отличаются от расчёта традиционных климатических показателей. В связи с потеплением климата последнего столетия и их негативными последствиями выполнено и опубликовано много работ с оценками сценариев изменений климата в будущем [7, 8, 10].
В целом, климат можно определять как многолетний режим погоды, описание и изучение которого опирается на многолетние наблюдения за метеорологическими величинами. Обработка многолетних наблюдений является одной из основных задач современной климатологии. Однако методы климатологической обработки являются самостоятельным разделом климатологии со своими специальными
средствами исследования и специфическими задачами, базирующимися на материалах, доставляемых климатологической обработкой метеорологических данных
[9, 10].
Исходные ряды наблюдений состоят из множества цифр, поэтому первичные
данные наблюдений предварительно систематизируются: составляются ряды данных, обобщённых за некоторые временные интервалы, ранжируются, вычисляются
базовые статистические характеристики.
Так как климатологические данные имеют все основные свойства статистических совокупностей, при статистической обработке данных возможно применение большинства методов вариационной статистики.
В то же время, климатические данные обладают и многими специфическими
свойствами [7, 9, 10]. Они, как правило, не являются стационарными, вследствие
существования суточных, годовых, периодических и многих ритмических измене17
Вестник ПсковГУ
ний. Связность метеорологических данных во времени и пространстве, отличающаяся многообразием, вносит множество трудностей в процесс обработки данных,
интерпретации и прогноза. Вследствие этого возможность использования общих
статистических приёмов заранее не гарантирует успех. Более того, имеется прямая
зависимость методов пространственного обобщения климатических данных от характера подстилающей поверхности, что часто выводит их за рамки возможности
применения вероятностно-статистического аппарата. Приходится прибегать к косвенным приближённым методам обработки данных и получения информации.
Основными этапами любого климатического анализа является:
– формирование климатологических рядов данных;
– получение общей климатической информации и оценка её точности;
– получение информации для прогноза климата;
– разработка климатических показателей для прикладных целей и их расчёт;
– пространственное обобщение климатической информации.
Один из методов вероятностно-статистического аппарата, который применим
для прогнозирования изменений климатических показателей, — это метод анализа
временных рядов.
Под временным (динамическим) рядом подразумевается упорядоченная совокупность значений переменных, измеряемых через строго определённый шаг
(лаг). Совокупность существующих методов анализа таких рядов наблюдений называется анализом временных рядов [3, 4].
Сущность процедуры анализа временных рядов заключается в выявлении
структуры ряда и использовании этих знаний для предсказания его поведения в будущем [4].
Главная цель настоящей работы — рассмотрение методического подхода к
анализу многолетних температурных рядов и выявление структурных составляющих временного ряда для построения аналитических и прогностических моделей.
Для достижения поставленной цели нами были поставлены следующие задачи:
– проанализировать исходную структуру временного ряда и выявить её закономерность;
– разложить временной ряд на его составляющие при помощи процедуры сезонной декомпозиции;
– выявить наиболее значимые характеристики ряда с целью их дальнейшего
использования в моделировании.
В качестве исходных материалов были использованы многолетние данные
температурного режима города Пскова, собранные и обработанные студентом естественно-географического факультета Псковского государственного университета
Д. Э. Мингалевым. Все процедуры расчёта и анализа данных были выполнены с
использованием программ MO Excel и Statistica 8.0.
Первым шагом в рассматриваемом анализе является выяснения природы
временного ряда, а именно, не являются ли все его колебания чисто случайным
стохастическим процессом. Такое стохастическое варьирование значений ряда называется «белым шумом». Для этого производится расчёт автокорреляционной
функции. Автокорреляционная функция показывает степень статистической взаи18
Серия «Естественные и физико-математические науки». 4/2014
мосвязи между величинами одного и того же ряда, но со сдвигом друг относительно друга во времени [3]. Если значения коэффициентов автокорреляции ряда на
всём его протяжении не выходят за рамки доверительных интервалов, то можно
считать данный ряд «белым шумом».
Рис 1. Многолетняя динамика среднемесячных температур мая г. Пскова
Одним из важнейших критериев применимости различных статистических
методов к анализируемой совокупности является её соответствие нормальному
распределению [6]. В мае распределение среднемесячных температур можно считать нормальным, что позволяет применять при анализе этой совокупности данных
различные статистические критерии (рис. 2).
Рис. 2. Гистограмма распределения среднемесячных температур мая (г. Псков)
Расчёт автокорреляционной функции показывает, что автокорреляция, которая соответствует шагу 9, выходит за рамки чисто случайного процесса, указывая
на существование гармоники с периодом, равным девяти годам (рис. 3).
19
Вестник ПсковГУ
Рис 3. Автокорреляционная функция временного ряда
среднемесячных температур мая (г. Псков)
Выявить наличие периодических составляющих в структуре временного ряда
можно при помощи спектрального анализа Фурье. Спектральный анализ Фурье позволяет построить периодограмму, которая по своей сути является функцией дисперсии от частоты или периода временного ряда. Её величина связана с конкретной
частотой или периодом и показывает вклад связанных с ними гармоник в варьирование значений анализируемого временного ряда [4].
Периодограмма выделяет два основных периода — пятилетний и девятилетний, что позволяет говорить о наличии в температурном ряду пяти- и девятилетних
циклических составляющих.
Рис. 4. Периодограмма ряда среднемесячных температур мая
20
Серия «Естественные и физико-математические науки». 4/2014
Вторым важным моментом анализа является выявление наличия или отсутствия во временном ряду трендовой составляющей. Тренд — величина, позволяющая
определить основную тенденцию временного ряда, т. е. стационарность или не стационарность происходящих в нём процессов. Выделение тренда осуществляется
методами многомерной регрессии (табл. 1).
Таблица 1
Тест полинома второй степени для среднемесячных температур мая (г. Псков)
Regression Summary for Dependent Variable: Observed
R = 0,28; R2 = ,077; F = 10,916; p < 0,00123; ошибка модели: 1,99
Beta
Std.Err.
— of Beta
Свободный член
Предсказанные
значения
0,278
0,084
B
–
0,000012
1,00
Std.Err.
— of B
3,45
t(131)
p-level
– 0,0003
0,9999
0,302
3,304
0,0012
Тестирование модели полинома показывает, что временной температурный
ряд имеет трендовую составляющую, однако её вклад, в целом, невелик, поскольку
ряд имеет большое количество экстремальных значений.
Таким образом, мы убедились, что анализируемый временной ряд имеет
тренд и циклические составляющие, что позволяет достоверно отличить его от белого шума и предположить наличие некоторой закономерности в многолетних колебаниях средних температур.
Для построения модели изменения среднемесячных температур в программе
Statistica 8.0 была выполнена процедура сезонной декомпозиции, смысл которой заключается в разделении временного ряда на трендовую и циклическую составляющие.
В результате проведения процедуры мы получаем такие показатели ряда, как
сезонная составляющая — закономерно повторяющаяся через определённый промежуток времени закономерность, тренд — основную тенденцию изменения временного ряда, сглаженный тренд — цикл — компонента, которая одновременно показывает тренд и присутствующие в ряду циклические компоненты, а также нерегулярные
компоненты, изменения которых носят случайный характер [6]. Каждая из названных
составляющих имеет различное значение в описании временного ряда (табл. 2).
Таблица 2
Оценка вклада различных составляющих в изменение параметров
исходного временного ряда
Элемент
R2
Ошибка
P-level
Сезонная компонента
0,08
1,98
0,001
Тренд
0,07
1,99
0,001
Цикл
0,40
1,60
0,000
Сглаженный тренд-цикл
0,47
1,50
0,000
Нерегулярные компоненты
0,69
1,15
0,000
21
Вестник ПсковГУ
Данные таблицы показывают, что наибольшее влияние на варьирование значений временного ряда оказывают нерегулярные компоненты и циклическая составляющая. Сглаженный тренд-цикл, хотя и превосходит циклическую компоненту по
значению коэффициента детерминации, является комбинацией циклической составляющей и тренда, роль которого в построении регрессионной модели невелика.
Рис. 5. Многолетняя динамика температуры в мае
и модели, построенные на основе составляющих временного ряда
(а — реальные данные; б — модель 1; в — модель 2)
В представленных моделях использованы следующие параметры сезонной
декомпозиции: тренд, сезонная составляющая и циклическая компонента.
Модель 1 включает в себя все три параметра, описывает происходящие во
временном ряду закономерности на 56 % и имеет вид:
22
Серия «Естественные и физико-математические науки». 4/2014
= −11,54 + 0,11 × + 1,06 ×
+ 1,53 × ,
где Tmay — среднемесячная температура в мае;
Se — сезонная компонента;
Tr — значение линейного тренда;
Cy — циклическая компонента.
Данная модель отличается весьма высокой предсказательной способностью,
однако она не всегда может учесть стохастические, экстремальные колебания температуры.
Модель 2 включает только тренд и сезонную составляющую и описывает
15 % закономерностей, происходящих во временном ряду. Модель имеет вид:
= −11,28 + 0,11 ×
+ 1,06 ×
,
где Tmay — среднемесячная температура в мае;
Se — сезонная компонента;
Tr — значение линейного тренда.
Данная модель не описывает экстремальных значений временного ряда, а
лишь учитывает многолетнюю тенденцию изменения температур с учётом циклической составляющей.
В представленной работе мы намеренно не включали в модели такие составляющие, как нерегулярные компоненты временного ряда, поскольку предсказать их
ежегодные значения не представляется возможным.
Таким образом, проанализированный ряд достоверно отличается от «белого
шума» и имеет выраженную трендовую, сезонные и циклические составляющие. Так
как значения временного ряд имеют нормальное распределение, это позволяет использовать при его анализе большинство методов параметрической статистики. Регрессионный анализ переменных сезонной декомпозиции показал, что рассматриваемый ряд значений среднемесячных температур в наибольшей степени зависит от нерегулярных составляющих, имеющих стохастический характер. Наибольшую значимость для прогнозирования имеет циклическая составляющая, с помощью которой
можно описать около половины закономерностей варьирования временного ряда.
Вклад тренда и сезонной компоненты незначителен. Построенные математические
модели обладают различной прогностической способностью и описывают общие закономерности изменение временного ряда, не предсказывая экстремальные изменения температур, которые обусловлены влиянием нерегулярных компонент.
Литература
1. Большой энциклопедический словарь. 2-е издание, переработанное и дополненное. М.: «Большая
Российская Энциклопедия», 2002. 1456 с.
2. Важнова Н. А., Верещагин М. А. О многолетней динамике приземного термического режима на
территории приволжского федерального округа (ПФО) во второй половине ХХ и начале XXI века
// Вестник Удмуртского университета. Биология. Науки о Земле. 2014. Вып. 1. С. 112–121.
3. Лопатников Л. И. Экономико-математический словарь: Словарь современной экономической науки. 5-е изд., перераб. и доп. М.: Дело, 2003. 520 с.
23
Вестник ПсковГУ
4. Пузаченко Ю. Г. Математические методы в экологических и географических исследованиях:
Учебн. пособие для студ. вузов. М.: Изд. Центр «Академия», 2004. 416 с.
5. Сун В., Балюнас С., Демирчан К. С., Кондратьев К. Я., Идсо Ш. Б., Постменьер Э. С. Влияние антропогенных выбросов CO2 на климат: нерешённые проблемы // Изв. РГО. 2001. Т. 133. Вып. 2.
С. 1–19.
6. Халафян А. А. STATISTICA 6. Статистический анализ данных. 3-е изд. Учебник. М.: ООО «Бином-Пресс», 2007. 512 с.
7. Шерстюков Б. Г., Салугашвили Р. С. Новые тенденции в изменениях климата Северного полушария Земли в последнее десятилетие. Труды ГУ ВНИИГМИ-МЦД. 2010. Вып. 175. С. 43–51.
8. Crowley T. J. Causes of climate change over the past 1000 years // Science. 2000. Vol. 289, No. 477.
P. 210–277.
9. Mahmut Firat, Fatih Dikbas, A. Cem Koc, Mahmud Gungor. Analysis of temperature series: estimation
of missing data and homogeneity test // Meteorological Applications. 2012. Vol. 19. Issue 4. P. 397–406.
10. Radić V., Pasarić Z., Šinik N. Analysis of Zagreb climatological data series using empirically decomposed intrinsic mode functions // Geofizika. 2004. Vol.21. No.1. P. 15–36.
S. Mikhalap, D. Mingalev, S. Evdokimov
USING TIME SERIES ANALYSIS IN THE STUDY
OF LONG-TIME TEMPERATURE CHANGES
The paper discusses the use of time series analysis methods in the study of long-term average monthly temperature fluctuations. Different methods such as seasonal decomposition, spectral
(Fourier) analysis, regression analysis are applied in this work. Descriptive models of the time
series with different p-levels have been elaborated.
Key words: temperature, climate, time series, seasonal decomposition, modeling
24
Download