Практикум по теме 1 - Международный банковский институт

advertisement
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Методические рекомендации по выполнению
контрольных работ
СОДЕРЖАНИЕ
Введение .......................................................................................... 2
Практикум по теме 1 ........................................................................ 3
Методические указания по выполнению практикума ................. 3
Решение типовых задач .............................................................. 3
Задания практикума ..................................................................... 5
Лабораторная работа 1.1. «Парная линейная регрессия» .... 7
Практикум по теме 2 ...................................................................... 10
Методические указания по выполнению практикума ............... 10
Решение типовых задач ............................................................ 10
Задания практикума ................................................................... 13
Лабораторная работа 2.1. «Множественная линейная
регрессия» ....................................................................................... 15
Лабораторная работа 2.2. «Мультиколлинеарность и
множественная линейная регрессия» ............................................ 19
Лабораторная работа 2.3. «Процедура отбора переменных в
модели множественной линейной регрессии» .............................. 21
Практикум по теме 3 ...................................................................... 21
Методические указания по выполнению практикума ............... 21
Решение типовых задач ............................................................ 21
Задания практикума ................................................................... 22
Лабораторная работа 3.1. «Метод Гольдфельда-Квандта
проверки гипотезы гомоскедастичности»....................................... 23
Лабораторная работа 3.2. «Критерий Дарбина-Уотсона» .... 24
Практикум по теме 4 ...................................................................... 25
Методические указания по выполнению практикума ............... 25
Решение типовых задач ............................................................ 25
Задания практикума ................................................................... 27
Лабораторная работа «Нелинейная регрессия» .................. 28
Практикум по теме 5 ...................................................................... 32
Методические указания по выполнению практикума ............... 32
Задания практикума ................................................................... 32
Лабораторная работа 5.1. «Макроэкономическая модель
Кейнса» ............................................................................................ 32
Практикум по теме 6 ...................................................................... 34
Методические указания по выполнению практикума ............... 34
Решение типовых задач ............................................................ 34
Задания практикума. .................................................................. 36
1
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Лабораторная работа 6.1. «Проверка случайности ряда
наблюдений» ................................................................................... 38
Лабораторная работа 6.2. «Сглаживание временного ряда»
.......................................................................................................... 40
Лабораторная работа 6.3. «Оценка тренда и периодической
составляющей»................................................................................ 41
Лабораторная работа 6.4. «Экспоненциальное сглаживание»
.......................................................................................................... 42
Введение
Целью выполнения контрольных заданий является более
глубокое усвоение материала курса эконометрики, развитие навыков
практического
анализа,
эконометрического
исследования
взаимосвязей экономических показателей.
Характерной особенностью эконометрического исследования
является необходимость анализа достаточно большого объема
эмпирических данных, выполнение многочисленных и порой
громоздких вычислений, поэтому основные задания предполагают
использование Microsoft Excel.
Практикум содержит как достаточно абстрактные задачи, целью
которых в первую очередь являет закрепление теоретического
материала, так и лабораторные работы, демонстрирующие
практические методики прикладного эконометрического исследования.
В то же время, лабораторные работы включают в себя задания
(например, вычисление непосредственно по формулам) целью
которых является выяснение студентами сути используемых
теоретических приемов и формул. Такие задания отмечены в тексте
звездочкой.
Практические задания и лабораторные работы выполняются с
использованием
Microsoft
Excel.
Практикум
не
содержит
систематического описания статистических функций Excel — в тексте
описано их использование в рамках рассматриваемых задач. Отчет по
лабораторной работе может быть представлен в виде файла Excel,
содержащего расчеты, формулы и необходимые пояснения. Исходные
данные, необходимые для выполнения работы, в практикуме не
приведены
и
предоставляются
преподавателем,
ведущим
практические занятия.
Перед выполнением заданий практикума рекомендуется
внимательно изучить материал контента, ответить на содержащиеся в
нем
вопросы
для
самостоятельного
изучения,
провести
самостоятельный анализ всех разобранных примеров.
2
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Практикум по теме 1
Методические указания по выполнению практикума
Целью практикума является более глубокое усвоение темы, а
также развитие следующих навыков:
 Обоснование выбора парной линейной модели;
 Построение модели выборочной парной линейной
регрессии;
 Оценка адекватности построенной модели, статистической
значимости коэффициентов, построение доверительных
интервалов, построение прогнозов;
 Проверка
основных
предположений
регрессионного
анализа.
Решение типовых задач
ТЗ 1.1. Вычислите для парной линейной регрессии значения
коэффициентов детерминации R 2 и корреляции rxy если известно, что
n  30 ,
100
 ei2  103 627,8 ,
x  10,6 ,
y  406,7 ,
i 1
n
(x  x )
i 1
i
2
 547,2 ,
100
( y  y)
i
i 1
S y  120 .
S x  4,34 ,
Проверьте
2
417 700,5 ,
значимость
rxy .
Вычислите коэффициенты выборочной парной линейной регрессии.
Проверьте статистическую значимость коэффициента b . Постройте
для него доверительный интервал. Постройте прогноз для значения
x p  17 и доверительные интервалы прогноза.
Решение.
Для вычисления коэффициента детерминации воспользуемся
определением:
30
R2  1 
( y  y )
i 1
30
i
( y  y)
i 1
2
i
1
2
103627,8
 0,7519
.
417700,5
i
Так как R 2  rxy2 , то
rxy  0,7519  0,8671 .
Для проверки статистической значимости
t -статистики
корреляции
вычислим значение
корреляции:
3
коэффициента
коэффициента
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
0,8671
tr 
28  9,21.
1- 0,86712
По таблице распределения Стьюдента с 28 степенями свободы и
для уровня значимости 5% определяем критическое (табличное)
значение: tтабл  2,0484 . Так как tr  tтабл , то гипотезу H 0 :  yx  0 следует
отклонить и, следовательно, признать коэффициент rxy статистически
значимым.
Для нахождения коэффициентов выборочной парной линейной
регрессии воспользуемся формулами связи коэффициентов с
выборочными характеристиками:
s
120
b  y rxy 
 0,8671  23,9752
sx
4,34
и
s
a  y  y rxy x  406,7  23,9752  0,8671  152,7969 .
sx
Для того, чтобы проверить статистическую значимость
коэффициента регрессии, прежде всего, необходимо вычислить
значение выборочного остаточного среднего квадратического
отклонения:
n
e
2
i
103627,8
 60,8358
n2
28
Теперь можно определить стандартную ошибку коэффициента:
S
60,8358
mb  ост 
 2,6007 ,
sx n 4,35 30
с помощью которой находим соответствующую t -статистику
b 23,9752
tb 

 9,21
.
mb 2,6007
Sост 
i 1

Так как tb  tтабл (значение tтабл , как и раньше, взято из таблицы
распределения Стьюдента при 28 степенях свободы и уровне
значимости 5%), то гипотезу H 0 :   0 следует отклонить и,
следовательно, признать коэффициент b статистически значимым.
Левая
граница
доверительного
интервала
для
этого
коэффициента, соответствующего уровню значимости 5%, имеет
значение b  mbtтабл  18,63 , правая граница — b  mbtтабл  29,28 .
Прогноз для значения x p  17 вычисляется непосредственной
подстановкой этого значения в уравнение регрессии:
4
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
y p  152,7969  23,9752  17  560,07 .
Стандартная ошибка прогноза функции регрессии (среднего
значения)
( x p  x )2
1
1 (17  10,6) 2
mEx ( y )  Sост

 60,8358

 20,01,
30 30
30
547,2
2
 ( xi  x )
i 1
а стандартная ошибка прогноза индивидуально значения
( x p  x )2
1
1 (17  10,6)2
my p  Sост 1 

 60,8358 1 

 64,04 .
30 30
30
547,2
2
 ( xi  x )
i 1
Тогда доверительный интервал прогноза среднего значения,
соответствующий 5% уровню значимости, имеет левую границу,
равную
и
правую
границу
—
y p  mEx ( y ) tтабл  519,09
y p  mEx ( y ) tтабл  601,06 . Левая граница доверительного интервала
прогноза индивидуального значения y p  my p tтабл  428,89 , правая
граница — y p  my p tтабл  691,26 .
Задания практикума
1.1. По выборке объемом 10 наблюдений получены следующие
результаты:
S  34,49 ,
2
x
10
 xi2  12000 ,
i 1
S  66,93 ,
2
y
10
x
i 1
10
y
i 1
2
i
i
 100 ,
10
y
i 1
i
 200 ,
10
x y
i 1
i
 21000 ,
i
 45000 . Оцените коэффициент корреляции rxy .
Проверьте его значимость.
1.2. Вычислите коэффициент корреляции, проверьте его
статистическую значимость
X
1
2
3
4
5
Y
0
2
3
5
6
1.3 По выборке объемом 10 наблюдений получены следующие
результаты:
10
x
i 1
10
y
i 1
2
i
 45000 .
i
 100 ,
Оцените
10
y
i 1
по
i
 200 ,
10
x y
i 1
методу
i
i
 21000
наименьших
коэффициенты парной линейной регрессии y на x .
5
10
x
i 1
2
i
 12000
квадратов
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
1.4. Вычислите коэффициенты выборочной парной линейной
регрессии, если известно, что Sост  26,5 , x  21, y  112,45 , S x2  64 ,
SY2  225 , rxy  0,8 .
1.5. По имеющимся данным оцените параметры парной
линейной регрессионной зависимости y     t .
t
1
3
6
y
4
5
8
1.6. Вычислите для парной линейной регрессии значения
коэффициентов детерминации R 2 и корреляции rxy если известно, что
n  100 ,
100
 ei2  1100 ,
y  470 ,
i 1
100
( y  y)
i
i 1
2
22500 ,
S x2  115 ,
S y2  225 .
Проверьте значимость rxy .
1.7. Вычислите для парной линейной регрессии значения
коэффициентов детерминации R 2 и корреляции rxy если известно, что
n  100 ,
100
,  ( yi  y )  10000 ,
2
y  470 ,
i 1
100
( y  y)
i 1
i
2
22500 ,
S x2  121 ,
S  225 .Проверьте значимость rxy .
1.8. Проверьте значимость выборочного коэффициента
корреляции
если
известно,
что
rxy  0,92
n  27, Sост  120000, x  171, y  28 .
1.9. Проверьте значимость и постройте доверительные
интервалы для коэффициентов парной линейной регрессии (в
таблице приведены результаты расчета с помощью функции
ЛИНЕЙН):
23,677
14
09724
7,0581
2,4164
28,
18105
23179
0,7742
57,
10261
90167
96,009
17851
28
32188
93
0,6662
872,89
1.10. Постройте доверительный интервал прогноза условного
математического ожидания (функции регрессии) если известно, что
x p  20 , x  10,83 , S x2  19,8, (в таблице приведены результаты расчета
с помощью функции ЛИНЕЙН):
2
y
6
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
23,677
14
09724
7,0581
2,4164
28,
18105
23179
0,7742
57,
10261
90167
96,009
17851
28
32188
93
0,6662
872,89
1.11.
Постройте
доверительный
интервал
прогноза
индивидуального значения, если известно, что x p  20 , x  10,83 ,
S x2  19,8, (в таблице приведены результаты расчета с помощью
функции ЛИНЕЙН):
23,677
14
09724
7,0581
2,4164
28,
18105
23179
0,7742
57,
10261
90167
96,009
17851
28
32188
93
0,6662
872,89
Лабораторная работа 1.1. «Парная линейная регрессия»
Задание
По выборке необходимо построить эмпирическую парную
линейную регрессию, проверить ее статистическую значимость и
построить прогноз.
1. Для заданных исходных данных постройте поле корреляции —
диаграмму зависимости показателя y от фактора x .
При построении выберите тип диаграммы «Точечная» (без
отрезков, соединяющих точки).
2*. Вычислите выборочные характеристики:
— выборочные средние x и y (функция СРЗНАЧ);
— выборочные дисперсии S x2 и S y2 (функция ДИСПР);
7
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
— выборочное среднее квадратические отклонения S x и S y
(функция СТАНДОТКЛОНП);
— выборочный коэффициент корреляции rxy (функция ПИРСОН
или КОРРЕЛ).
3. Вычислите коэффициенты выборочной линейной регрессии.
Для вычисления коэффициентов регрессии воспользуйтесь
встроенной функцией ЛИНЕЙН (функция находится в категории
«Статистические»), обратите внимание, что эта функция является
функцией массива, поэтому ее использование подразумевает
выполнение следующих шагов:
1) В свободном месте рабочего листа выделите область ячеек
размером 5 строк и 2 столбца для вывода результатов;
2) В Мастере функций (категория «Статистические») выберите
функцию ЛИНЕЙН.
3) Заполните поля аргументов функции:
Известные_значения_y — адреса ячеек, содержащих значения
признака y ;
Известные_значения_x — адреса ячеек, содержащих значения
фактора x ;
Константа — значение (логическое), указывающее на наличие
свободного члена в уравнении регрессии: укажите в поле Константа
значение 1, тогда свободный член рассчитывается обычным образом
(если значение поля Константа равно 0, то свободный член
полагается равным 0);
Статистика — значение (логическое), которое указывает на то,
следует
ли
выводить
дополнительную
информацию
по
регрессионному анализу или нет: укажите в поле Статистика
значение равное 1, тогда будет выводиться дополнительная
регрессионная информация (если Статистика=0, то выводятся
только оценки коэфициентов уравнения регрессии);
4) После того, как будут заполнены все аргументы функции,
нажмите комбинацию клавиш <CTRL>+<SHIFT>+<ENTER>.
Результаты расчета параметров регрессионной модели будут
выведены в виде следующей таблицы:
Значение коэффициента b
Значение коэффициента a
Стандартная ошибка mb
Стандартная ошибка ma
коэффициента b
коэффициента a
Стандартное отклонение
Коэффициент детерминации
2
остатков S ост
R
Число степеней свободы,
Значение F -статистики
равное n  2
8
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Регрессионная сумма
квадратов
Остаточная сумма квадратов
n
n
 ( yi  y )2
e
i 1
i 1
2
i
4*. Проверьте полученные значения коэффициентов a , b
непосредственным вычислением по формулам.
5. Запишите найденной уравнение эмпирической регрессии.
Дайте интерпретацию коэффициенту b . Вычислите по уравнению
эмпирической регрессии значения yi  a  bxi , i  1, n .
6. Постройте на корреляционном поле прямую выборочной
линейной регрессии по точкам yi  a  bxi , i  1, n .
7. Вычислите остатки ei  yi  yi .
8. Постройте график остатков (тип диаграммы — «Точечная»).
9. Найдите величину средней ошибки аппроксимации
1 n yi  yi
A 
100% .
n i 1 yi
10*. Вычислите коэффициент детерминации R 2 непосредственно
по формуле. Дайте интерпретацию. Сравните полученное значение
коэффициента детерминации с вычисленным ранее с помощью
функции КОРЕЛЛ выборочным коэффициентом корреляции.
11*. Рассчитайте значение S ост , стандартные ошибки параметров
линейной регрессии и коэффициента корреляции непосредственно по
формулам.
12. Вычислите значения t -статистик коэффициентов выборочной
регрессии. Проверьте статистическую значимость полученных
значений коэффициентов регрессии и коэффициента корреляции.
Табличные
значения
определите
с
помощью
функции
СТЬЮДРАСПОБР. Аргументы этой функции:
Вероятность — уровень значимости  (можно принять равным
0,05, т.е. 5%);
Степени_свободы — число степеней свободы, для парной
линейной регрессии равно n  2 , где n — число наблюдений.
13. Проверьте значимость в целом полученного уравнения
регрессии по критерию Фишера. Значение Fтабл определите с
помощью функции FРАСПОБР. Аргументы этой функции:
Вероятность — уровень значимости  (можно принять равным
0,05, т.е. 5%);
Степени_свободы1 — число степеней свободы числителя, для
парной регрессии равно 1 (т.к. один фактор);
Степени_свободы2 — число степеней свободы знаменателя,
для парной регрессии равно n  2 , где n — число наблюдений.
9
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
14. Вычислите доверительные интервалы параметров линейной
регрессии. Дайте им интерпретацию.
15. Постройте прогноз y p при значении фактора x на 30%
превышающего его среднее значение.
16. Вычислите стандартные ошибки прогноза функции регрессии
(среднего значения) и индивидуального значения, постройте
доверительные интервалы полученных прогнозов.
Дайте им интерпретации.
17. Получите результаты регрессионного анализа с помощью
средства
Регрессия
из
Пакета
Анализа
(Сервис/Анализ
данных/Регрессия). Пакет анализа, при необходимости, может быть
активирован в пункте Надстройки меню Сервис.
В бланке запроса этой процедуры поля Входной интервал y,
Входной интервал x, Константа имеют тот же смысл, что и для
функции ЛИНЕЙН.
В поле Метки поставьте флажок, если первая строка в
указанном диапазоне данных содержит названия столбцов.
Поставьте флажок в полях Остатки, График остатков, График
подбора для того, чтобы получить соответствующую дополнительную
информацию.
Практикум по теме 2
Методические указания по выполнению практикума
Целью практикума является более глубокое усвоение темы, а
также развитие следующих навыков:
 Обоснование выбора линейной модели с несколькими
факторами;
 Построение модели выборочной множественной линейной
регрессии;
 Оценка адекватности построенной модели, статистической
значимости коэффициентов, построение доверительных
интервалов, построение прогнозов;
 Проверка
основных
предположений
регрессионного
анализа.
Решение типовых задач
ТЗ 2.1.
Результаты расчетов параметров выборочной множественной
регрессии с помощью функции ЛИНЕЙН приведены в таблице:
26,87
17,33
88,65
10
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
8,07
0,84
70,82
349186
Известно также матрица
2,82
49,65
27
66568
29,90
#Н/Д
#Н/Д
#Н/Д
0,36
-0,01
-0,06
(X X ) 
-0,01
0,00
-0,01
-0,06
-0,01
0,03
и матрица выборочных парных коэффициентов корреляции
1
0,88
0,78
Q  0,88
1
0,68
0,78
0,68
1
Проверьте значимость коэффициентов выборочной регрессии и
всего уравнения в целом. Постройте доверительные интервалы
коэффициентов. Вычислите частные коэффициенты корреляции
между y и объясняющими переменными, проверьте их значимость.
Постройте прогноз для значений объясняющих переменных
x1  10,83, x2  4,73 . Постройте доверительные интервалы прогноза
функции регрессии и индивидуального значения.
Решение.
Для проверки значимости коэффициентов регрессии вычислим
соответствующие значения t -статистик:
b 17,33
b
26,87
tb1  1 
 6,15 , tb2  2 
 3,3 .
mb1 2,82
mb2 8,07
Для уровня значимости 5% по таблице распределения
Стьюдента с 27 степенями свободы находим критическое значение
tтабл  2,0518 . Так как tb1  tтабл и tb2  tтабл , то гипотезы H 0 : 1  0 и
H 0 :  2  0 отклоняются и коэффициенты признаются статистически
значимыми.
Из таблицы функции ЛИНЕЙН видно, что значение F -статистики
равно 70,82. По таблице распределения Фишера, для уровня
значимости 5%, степеням свободы  1  2 и  1  27 , находим
критическое значение Fтабл  3,1277 . Так как F  Fтабл , то гипотезу
H 0 : 1   2    k  0 следует отклонить и, следовательно, признать
построенное уравнение линейной регрессии статистически значимым.
b1 ,
Доверительный
интервал
для
коэффициента
соответствующий уровню значимости 5% имеет левую границу,
равную b1  mb1tтабл  11,55 и правую границу, равную b1  mb1tтабл  23,11 .
T
1
11
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Аналогичный доверительный интервал для коэффициента b2 имеет
границы b2  mb2 tтабл  10,3 и b2  mb2 tтабл  43,44 .
Для того чтобы вычислить частные коэффициенты корреляции
найдем, прежде всего, матрицу, обратную к матрице выборочных
коэффициентов корреляции:
6,09
-3,96
-2,06
1
Q  -3,96
4,43
0,07
-2,06
0,07
2,55
С помощью этой матрицы вычислим частные коэффициенты
корреляции:
3,96
2,06
ryx1|x2  
 0,76 , ryx2 |x1  
 0,52 .
6,09  4,43
6,09  2,55
Для того, чтобы проверить статистическую значимость частных
коэффициентов корреляции вычислим их t -статистики:
0,76
0,52
tryx |x 
 29  33,91 , tryx |x 
 29  17,65 .
1 2
2 1
1  0,762
1  0,522
Критическое значение определим по таблице распределения
Стьюдента для уровня значимости 5% и 29 степеней свободы:
tтабл  2,05 . Так как оба значения t -статистик больше критического
значения, то оба частных коэффициента корреляции признаются
статистически значимыми.
Точечный прогноз, соответствующий значениям объясняющих
x1  10,83, x2  4,73
переменных
вычислим
непосредственной
подстановкой
этих
значений
в
уравнение
регрессии
y p  88,65  17,33 10,83  26,87  4,73  403,41.
Для построения доверительных интервалов прогноза вычислим
стандартные ошибки прогнозов функции регрессии и индивидуального
значения
mEX ( y )  Sост x p ( XT X)1 xTp  49,65 0,033  9,07 ,
my p  Sост 1  x p ( XT X)1 xTp  50,47 .
Тогда доверительный интервал прогноза среднего значения,
соответствующий 5% уровню значимости, имеет левую границу,
равную
и
правую
границу
—
y p  mEx ( y ) tтабл  384,87
y p  mEx ( y ) tтабл  421,95 .
прогноза
Левая
индивидуального
граница
значения
граница — y p  my p tтабл  506,64 .
12
доверительного интервала
y p  m y p tтабл  300,18 , правая
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Задания практикума
2.1. Вычислите стандартную ошибку выборочной множественной
регрессии S ост , если известно, что y  178 , x  15 , S x  4,85 , n  50 ,
k  2 ,  ei2  750 .
2.2. Проверьте значимость коэффициентов выборочной
множественной регрессии, постройте для них доверительные
интервалы. В таблице приведены результаты вычислений с помощью
функции ЛИНЕЙН:
0,012529
0,277187
0,070162888
72,81473
0,284479
0,12873
0,129283079
18,75412
0,290445
9,046342
#Н/Д
#Н/Д
3,547553
26
#Н/Д
#Н/Д
870,956
2127,744
#Н/Д
#Н/Д
2.3.
Вычислите
стандартные
ошибки
коэффициентов
множественной выборочной регрессии, проверьте статистическую
значимость коэффициентов, если известно, что:
0,786
0,009
-0,101
-0,123
0,009
0,004
-0,008
-0,004
( X T X )1 
-0,101
-0,008
0,032
0,012
-0,123
-0,004
0,012
0,036
В таблице приведены результаты вычислений с помощью функции
ЛИНЕЙН:
19,72891 40,90148929 12,87525
14,1564391
0,876987 44,37601667
#Н/Д
#Н/Д
61,7864
26
#Н/Д
#Н/Д
365015,1 51200,00225
#Н/Д
#Н/Д
2.4.
Проверьте
значимость
уравнения
выборочной
множественной регрессии в целом. Вычислите скорректированный
коэффициент детерминации. В таблице приведены результаты
вычислений с помощью функции ЛИНЕЙН:
0,012529
0,277187
0,070162888
72,81473
0,284479
0,12873
0,129283079
18,75412
0,290445
9,046342
#Н/Д
#Н/Д
3,547553
26
#Н/Д
#Н/Д
870,956
2127,744
#Н/Д
#Н/Д
2.5. По ежемесячным данным за 6 лет построена выборочная
множественная регрессия y  12,23  0,91x1  2,1x2 . Зависимый признак
— объем потребления (в сотнях руб.), первый фактор —
располагаемый доход (в тыс. руб.), второй фактор — процент
банковской ставки по вкладам. Известны значения t -статистик
13
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
коэффициентов: tb1  123,7 , tb2  3,2 и коэффициента детерминации
R2  0,976 .
Дайте
интерпретацию
коэффициентам.
Проверьте
статистическую значимость коэффициентов. Найдите стандартные
ошибки коэффициентов. Проверьте статистическую значимость
коэффициента детерминации (значимость уравнения в целом по
критерию Фишера).
2.6.
Для
выборочной
множественной
регрессии
y  73,52  1,62 x1  2,25 x2 ,
отражающей
зависимость
среднего
душевого дохода (в руб.) от средней заработной платы в день (в руб.)
и среднего возраста (в годах), построенной по 30 наблюдениям
известны
выборочные
коэффициенты
корреляции
ryx1  0,84 ,
ryx2  0,21 , rx1x2  0,116 .
Дайте интерпретацию коэффициентам. Вычислите частные
коэффициенты корреляции, сравните их с парными.
2.7. Вычислите частные коэффициенты корреляции между y и
факторами, проверьте их значимость, если известна матрица
выборочных коэффициентов корреляции:
x1
x2
y
y
1
0,87
0,84
x1
0,87
1
0,71
x2
0,84
0,71
1
2.8. По выборке объемом 50 наблюдений значений x1 , x2 , x3
вычислена следующая матрица выборочных коэффициентов
корреляции:
x1
x2
x3
x1
1
0,45 -0,35
x2
0,45
1
0,52
x3
-0,35
0,52
1
Найдите частные коэффициенты корреляции
r12|3 , r23|1 , r13|2 ,
проверьте их статистическую значимость.
2.9.
Для
выборочной
множественной
регрессии
y  73,52  1,62 x1  2,25 x2 ,
являющейся
эмпирической
оценкой
зависимости среднего душевого дохода (в руб.) от средней
заработной платы в день (в руб.) и среднего возраста (лет), вычислите
средние коэффициенты эластичности и дайте им интерпретацию,
если известно:
Среднее значение
Среднее квадратическое
отклонение
14
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Доход
86,8
11,44
Зарплата
54,9
5,86
Возраст
33,5
0,58
2.10.
Для
выборочной
множественной
регрессии
y  73,52  1,62 x1  2,25 x2 ,
являющейся
эмпирической
оценкой
зависимости среднего душевого дохода (в руб.) от средней
заработной платы в день (в руб.) и среднего возраста (лет),
построенной по 30 наблюдениям, вычислены выборочные парные
коэффициенты корреляции ryx1  0,84 , ryx2  0,21 , rx1x2  0,116 и
коэффициент детерминации R2  0,72 .
Проверьте статистическую значимость уравнения в целом по
критерию
Фишера.
По
частному
проверьте
F -критерию
целесообразность включения в уравнение фактора x2 после фактора
x1 и наоборот — фактора x1 после фактора x2 .
Лабораторная работа 2.1. «Множественная линейная регрессия»
Задание
По выборке построить эмпирическую множественную регрессию,
поверить наличие мультиколлинеарности, статистическую значимость
коэффициентов и всего уравнения в целом, построить прогноз.
1. Исследуется зависимость ежемесячного дохода y от затрат
на рекламу x1 и числа торговых представителей x2 . Исходные данные
представлены выборкой объема n .
Постройте выборочные парные линейные регрессии — оценки
зависимости результативного признака y от каждого из факторов,
взятого по отдельности. В каждом случае постройте поле корреляции,
определите коэффициенты уравнения выборочной линейной
регрессии, коэффициент детерминации, коэффициент корреляции.
Для вычислений можно воспользоваться функцией ЛИНЕЙН.
2. Перед построением множественной регрессии проверьте
мультиколлинеарность факторов. Чем сильнее мультиколлинеарность
факторов,
тем
менее
надежны
оценки.
Для
проверки
мультиколлинерности (в случае двух факторов) можно вычислить
определитель X T X — если этот определитель существенно отличен
от 0, то проблемы мультиколлинеарности нет и можно найти
коэффициенты уравнения множественной регрессии.
15
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Для
вычисления
указанного
определителя прежде всего
1 x11 x12 


необходимо построить матрицу X  
 , затем построить
1 x x 
 n1 n 2 
транспонированную к ней матрицу X T . После этого следует
перемножить полученные матрицу, т.е. вычислить матрицу X T X и
вычислить ее определитель.
Для построения матрицы X T следует воспользоваться функцией
ТРАНСП (категория «Ссылки и массивы»). Можно также скопировать в
буфер обмена матрицу X , затем перейти на свободное место
рабочего листа и выполнить команду Правка/Специальная вставка …
Транспонировать.
Произведение матриц вычисляется с помощью функции
МУМНОЖ, аргументами которой являются адреса ячеек, в которых
записаны перемножаемые матрицы. Перемножаемые матрицы
должны удовлетворять условию соответствия размеров: матрица
размера m  n может быть умножена справа на матрицу размера n  k ,
в результате получится матрица размера m  k .
В случае множественной регрессии с двумя факторами матрица
X будет иметь размер n  3 , матрица X T — размер 3  n , а их
произведение — размер 3  3 .
Обратите внимание на то, что функция МУМНОЖ является
функцией массива! Поэтому перед использованием функции
МУМНОЖ необходимо
1) сначала выделить область размером m  k , в которой будет
записан результат вычислений.
2) затем с помощью Мастера Функций вставить функцию
МУМНОЖ и заполнить поля ее аргументов. После этого в левой
верхней ячейке выделенной области появится первый элемент
результирующей матрицы.
3) Для вывода всей матрицы нажмите комбинацию клавиш
<CTRL>+<SHIFT>+<ENTER>.
Для
вычисления
определителя
матрицы
необходимо
воспользоваться функцией МОПРЕД, единственным аргументом
которой является массив (матрица), определитель которой надо
вычислить.
3. Постройте матрицу Q , состоящую из выборочных
коэффициентов корреляции (значенияэлементов этой матрицы можно
получить с помощью функции КОРЕЛЛ или средства КОРЕЛЯЦИЯ из
Пакета Анализа):
16
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
rx1xk 
 1 rx1x2


r
1
r
x2 xk 
 xx
Q 2 1
.


 rx x rx x

1
k 2
 k1

Присутствие в этой матрице значений больших 0,8 обычно
свидетельствует наличии проблемы мультиколлинеаности.
4*. Для нахождения коэффициентов выборочной множественной
регрессии непосредственно по формуле необходимо прежде
всегонайти обратную матрицу  X T X 
1
с помощью функции МОБР.
Функция МОБР является функцией массива и используется
аналогично функции МУМНОЖ:
1) сначала необходимо выделить область ячеек, в которой будет
записана обратная матрица,
2) затем вставить функцию МОБР, заполнить поле ее аргумента
— единственным аргументом этой функции являются адреса ячеек, в
которых находится обращаемая матрица.
3) Для вывода всей матрицы нажмите комбинацию клавиш
<CTRL>+<SHIFT>+<ENTER>.
Коэффициенты
уравнения
множественной
регрессии
вычисляются в матричном виде по формуле (a, b1 ,
, bk )T   X T X  X T y
1
— для этого необходимо (последовательно)
1) умножить матрицу  X T X 
1
на матрицу X T ,
2) затем полученную матрицу необходимо умножить на вектор y .
Запишите уравнение регрессии в развернутой форме, дайте
интерпретацию коэффициентам.
5. Вычислите значения коэффициентов регрессии с помощью
функции ЛИНЕЙН. Для того чтобы использовать эту функцию в случае
множественной регрессии необходимо:
1) Сначала выделить на рабочем листе область размером
5  (k  1) , где k — число объясняющих переменных.
2) Затем заполнить поля аргументов этой функции, которые
имеют тот же смысл, что и в случае парной регрессии:
Известные_значения_y — адреса ячеек, содержащих значения
признака y ;
Известные_значения_x — адреса ячеек, содержащих значения
всех объясняющих перменых. Обратите внимание: выборочные
значения факторов должны располагаться рядом друг с другом (в
смежной области), причем предполагается, что в первом столбце
17
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
(строке) содержатся значения первой объясняющей переменной, во
втором столбце — второй и т.д.
Константа — значение (логическое), указывающее на наличие
свободного члена в уравнении регрессии: укажите в поле Константа
значение 1, тогда свободный член рассчитывается обычным образом
(если значение поля Константа равно 0, то свободный член
полагается равным 0);
Статистика — значение (логическое), которое указывает на то,
следует
ли
выводить
дополнительную
информацию
по
регрессионному анализу или нет: укажите в поле Статистика
значение равное 1, тогда будет выводиться дополнительная
регрессионная информация (если Статистика=0, то выводятся
только оценки коэффициентов уравнения регрессии);
В случае двух объясняющих переменных ( k  2 ) результаты
расчета параметров регрессии будут выведены в виде следующей
таблицы:
Значение
Значение
Значение
коэффициента b2
коэффициента b1
коэффициента a
Стандартная ошибка Стандартная ошибка Стандартная ошибка
mb1 коэфф. b1
mb2 коэфф. b2
ma коэфф. a
Оценка стандартного
Коэффициент
отклонения остатков
н/д
детерминации R 2
S ост
Значение F Число степеней
н/д
свободы n  k  1
статистики
Ост. сумма квадратов
Регр. сумма
n
н/д
квадратов  ( y  y )
 ( yi  yi )2
n
2
i 1
i
i 1
6*. Вычислите непосредственно по формуле множественный
коэффициент детерминации R 2 и скорректированный коэффициент
детерминации R 2 . Сравните полученные значения с коэффициентами
детерминации парных линейных регрессий, полученных в п. 1.
7. Вычислите по найденному уравнению выборочной
множественной регрессии значения yi  yi ( x1 , x2 ) .
8. Вычислите остатки ei  yi  yi .
9. Найдите величину средней ошибки аппроксимации A .
10*. Вычислите значение F статистики непосредственно по
формуле. Проверьте значимость уравнения регрессии в целом
используя F -тест.
18
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
11*. Вычислите стандартные ошибки коэффициентов регрессии:
ma , mb1 , mb2 непосредственно по формулам. Проверьте значимость
коэффициентов регрессии с помощью критерия Стьюдента.
12. Постройте доверительные интервалы для коэффициентов
регрессии.
13. Постройте матрицу Q , состоящую из выборочных
коэффициентов корреляции:
ryxk 
ryxk   1 ryx1 ryx2
 1 ryx1 ryx2




r
r
1
r
r
yx
 1

x1x2
x1 xk 
 yx1
r



Q  ryx2 rx2 x1
1
rx2 xk   yx2
.




 




r


r
r
r
1
yx
 yxk xk x1 xk x2
  k

Вычислите частные коэффициенты корреляции ryx1|x2 и ryx2 |x1 —
Q
вычисления удобнее проводить с помощью матрицы Q 1 . Сравните их
с парными коэффициентами корреляции, полученными в п. 1.
14. Вычислите стандартизованные коэффициенты регрессии и
частные коэффициенты эластичности.
15. Постройте прогноз y p для значений переменных на 30%
превышающих их средние значения.
16. Вычислите стандартные ошибки прогноза функции регрессии
(среднего значения) и индивидуального значения, постройте
доверительные интервалы полученных прогнозов.
Дайте им интерпретации.
17. Получите результаты регрессионного анализа с помощью
Пакета
Анализа
(Сервис/Анализ
данных
…
Регрессия).
Использование этой процедуры аналогично случаю парной линейной
регрессии, только при указании параметра Входной интервал_x
следует указать все столбцы, содержащие значения всех факторов.
Лабораторная работа 2.2. «Мультиколлинеарность и
множественная линейная регрессия»
Задание
Исследовать случай мультиколлинеарности
переменных, методы ее устранения.
19
объясняющих
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
1. С помощью функции КОРЕЛЛ или средства РЕГРЕССИЯ из
Пакета Анализа постройте матрицу выборочных коэффициентов
корреляции:
ryxk 
ryxk   1 ryx1 ryx2
 1 ryx1 ryx2


 
1 rx1x2
rx1xk   ryx1

 ryx1


Q   ryx2 rx2 x1
1
rx2 xk    ryx2
.




 


 
 ryxk

r
r
r
1
yx
x
x
x
x
k 1
k 2
 k
 

Проанализируйте
полученную
матрицу:
сделайте
предположения
о
наличии
или
отсутствии
проблемы
мультиколлинеарности и о наличии зависимой переменной.
2. Вычислите определитель | XT X | . Подтверждает ли его
значение Ваши предположения о мультиколлинеарности?
3. Вычислите коэффициенты выборочной множественной
регрессии y на x1 , x2 и x3 с помощью функции ЛИНЕЙН или Пакета
Анализа.
4. Проверьте статистическую значимость коэффициентов и всего
уравнения регрессии в целом.
5. Сделайте вывод о необходимости исключения объясняющей
переменной. Для проверки своего предположения постройте
регрессию исключаемой переменной на остальные и проверьте ее
значимость.
6. Постройте регрессию показателя на факторы, оставшиеся
после
исключения.
Проверьте
статистическую
значимость
коэффициентов и всего уравнения регрессии в целом. Исчезла ли
проблема мультиколлинеарности?
7. Сравните значения коэффициента детерминации и
скорректированного коэффициента детерминации для «длинной»
регрессии с полным набором факторов и «короткой» регрессии с
факторами, оставшимися после исключения.
8. Вычислите частные коэффициенты корреляции между
показателем y и каждым фактором, а также между факторами. Для
упрощения расчетов следует предварительно найти обратные
матрицы Q 1 и Q 1 .
9*. Вычислите коэффициенты регрессии вручную по формуле.
Сравните с результатами расчетов с помощью ЛИНЕЙН.
Q
20
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Лабораторная работа 2.3. «Процедура отбора переменных в
модели множественной линейной регрессии»
Задание
Изучить процедуру пошагового отбора наиболее существенных
переменных в случае множественной линейной регрессии.
1. Составьте корреляционную матрицу Q — сделайте
предположения о мультиколлинеарности переменных, предложите
список существенных переменных.
2. Постройте регрессии показателя на каждый фактор по
отдельности — в каждом случае вычислите скорректированный
коэффициент детерминации, проверьте значимость уравнения. На
основании этого выберите наиболее существенный фактор.
3. Исследуйте целесообразность включения следующего
фактора — определите фактор, который в паре с фактором, уже
включенным на предыдущем шаге, дает наибольшее значение
скорректированного
коэффициента
детерминации.
Проверьте
оправданность включения этого фактора по частному F -критерию.
Проверьте статистическую значимость нового уравнения регрессии в
целом каждого коэффициента по отдельности.
4. Исследуйте по F -критерию целесообразность включения в
регрессию еще одного фактора из списка факторов, еще на
включенных в уравнение. Проверьте значимость получаемого
уравнения в целом и каждого коэффициента по отдельности.
5. Повторите эту процедуру до тех пор, пока не будет исчерпан
список
всех
факторов.
Запишите
полученное
уравнение
множественной регрессии.
Практикум по теме 3
Методические указания по выполнению практикума
Целью практикума является более глубокое усвоение темы, а
также развитие следующих навыков:
 Практическая проверка предположения регрессионного
анализа о гомоскедастичности наблюдений.
 Практическая проверка предположения регрессионного
анализа об отсутствии автокорреляции возмущений.
Решение типовых задач
21
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
ТЗ 2.1. Проверьте гипотезу гомоскедастичности. Выборка объемом
n  30 упорядочена по возрастанию значений объясняющей
переменной и разбита на три части, результаты расчетов с помощью
функции ЛИНЕЙН для первой и третьей частей приведены в
таблицах.
Первая часть:
3,05
2,12
0,12
1,63
0,99
2,52
642,28
9,00
4093,83
57,37
Третья часть:
2,37
30,48
0,64
32,44
0,60
13,50
13,61
9,00
2480,93 1640,24
Решение.
Для проверки
Голдфельда-Квандта
квадратов:
гипотезы гомоскедастичности по методу
вычислим отношение остаточных сумм
11
F
( y  y )
2
(y  y )
2
i 1
30
i  20
i
i
i
2
Sост
1640,24
 2 1
 28,59 .
Sост 2
57,37
i
По таблице распределения Фишера определяем критическое
значение, соответствующее доверительной вероятности 5%, число
степеней свободы числителя и знаменателя равно 9 — Fтабл  3,18 . Так
как F  Fтабл , то гипотеза об отсутствии гетероскедастичности
отклоняется.
Задания практикума
3.1. Проверьте гипотезу гомоскедастичности. Выборка объемом
n  30 упорядочена по возрастанию значений объясняющей
переменной и разбита на три части, результаты расчетов с помощью
функции ЛИНЕЙН для первой и третьей частей приведены в
таблицах.
Первая часть:
3,09 1,44
0,04 0,55
22
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
1,00
5721,0
7
4205,0
0
0,86
9,00
6,62
Третья часть:
2,47 26,57
0,70 35,36
0,58 14,72
12,42
9,00
2690,72 1949,22
3.2. Проверьте гипотезу гомоскедастичности. Выборка объемом
n  30 упорядочена по возрастанию значений объясняющей
переменной и разбита на три части, результаты расчетов с помощью
функции ЛИНЕЙН для первой и третьей частей приведены в
таблицах.
Первая часть:
2,16
3,66
0,28
1,53
0,88
1,91
61,48
8,00
223,72
29,11
Третья часть:
2,47
0,70
0,58
12,42
2690,72
26,57
35,36
14,72
9,00
1949,22
Лабораторная работа 3.1. «Метод Гольдфельда-Квандта проверки
гипотезы гомоскедастичности»
Задание
1. Постройте диаграмму корреляционного поля. Постройте
выборочную линейную регрессию и диаграмму остатков (квадратов
остатков) для исходной выборки — сделайте предположения о
наличии гетероскедастичности.
2. Упорядочьте выборку по возрастанию значений объясняющей
переменной.
23
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
3. Полученная упорядоченная выборка разбивается на три части:
первая и последняя содержат по l наблюдений, средняя — m  n  2l
наблюдений. Далее рассматриваются только две части: l первых
наблюдений (с небольшими значениями объясняющей переменной,
i  1,2, , l ) и l последних наблюдений (с большими значениями
объясняющей переменной, i  n  l  1, , n ) наблюдений, а m
центральных наблюдений исключаются из рассмотрения.
При этом должно быть выполнено условие (n  m) / 2  2 ,
например, если m  8 , то в этом случае можно взять l  11 , при этом из
рассмотрения исключаются наблюдения ( x12 , y12 ), ,( x19 , y19 ) . Таким
образом, наблюдения ( x1 , y1 ), ,( x11 , y11 ) составляют первую часть, а
( x20 , y20 ), ,( x30 , y30 ) — вторую часть.
4. По каждой части постройте свое уравнение выборочной
парной регрессии. Для построения парных регрессий можно
использовать функцию ЛИНЕЙН.
5*. Вычислите остаточные суммы квадратов для каждой части:
l
S
2
ост1
  ( yi  yi )2 — для первой части,
2
Sост
2 
i 1
n

i  n l 1
( yi  yi )2 — для второй части.
n
6. Вычислите отношение F 

i  n l 1
l
( yi  yi ) 2
( y  y )
i 1
i
2
2
Sост
 2 2 и сравните с
Sост1
i
табличным значением Fтабл. . Значение Fтабл. определяется по таблице
nm
nm
2
 2, 2 
2
2
Значение Fтабл можно
распределения Фишера со степенями свободы  1 
на 5% уровне значимости ( 1   2  l  2 ).
получить с помощью функции FРАСПОБР. Аргументы этой функции:
Вероятность — уровень значимости  , можно принять равным
0,05 (т.е. 5%);
Степени_свободы1 — число степеней свободы числителя  2 ;
Степени_свободы2 — число степеней свободы знаменателя  1 .
7.Сделайте вывод о принятии или отклонении гипотезы
гомоскедастичности наблюдений.
Лабораторная работа 3.2. «Критерий Дарбина-Уотсона»
Задание
24
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Проверить отсутствие автокорелляции первого порядка.
1. Постройте поле корреляции.
2. Используя функцию ЛИНЕЙН, найдите коэффициенты
выборочной парной линейной регрессии. Проверьте статистическую
значимость построенной регрессии.
3. Вычислите остатки и постройте график остатков в зависимости
от значений фактора (тип диаграммы — Точечная, для наглядности
можно выбрать вид с отрезками, соединяющими точки).
4. Вычислите статистику Дарбина–Уотсона по формуле
n
d
 (e  e
i 1
i
i 2
)2
.
n
e
i 1
2
i
5. Используя таблицу критических значений критерия Дарбина–
Уотсона, сделайте вывод о наличии или отсутствии значимой
автокорреляции в остатках. Наличие автокорреляции означает
неадекватность построенной парной регрессии истинной зависимости
и
недостаточность
построенной
парной
регрессии
для
прогнозирования.
6. Вычислите коэффициент автокорреляции первого порядка
n
r1 
e e
i 2
n
i i 1
e
i 1
,
2
i
сравните его со значением критерия Дарбина–Уотсона: должно быть
выполнено соотношение d  2(1  r1 ) .
Практикум по теме 4
Методические указания по выполнению практикума
Целью практикума является более глубокое усвоение темы, а
также развитие следующих навыков:
 Оценка параметров нелинейных регрессий;
 Оценка качества построенной модели, выбор наиболее
адекватной модели.
Решение типовых задач
ТЗ 4.1. По имеющимся данным оцените параметры следующей
регрессионной зависимости y   t  
25
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
t
1
4
16
y
3,5
11
29
ln y
1,25
2,4
3,37
0
0,69
1,1
ln t
Проверьте статистическую значимость линеаризованной формы.
Вычислите индекс детерминации непосредственно по формуле.
Вычислите среднюю абсолютную ошибку аппроксимации и среднее
абсолютное отклонение.
Решение.
Прологарифмировав уравнение регрессионной зависимости,
получаем:
ln y  ln    ln t  ln  .
Обозначив через y  ln y, x  ln x,  ln  ,   ln  , получаем модель
линейной регрессии y     x   . Оценки параметров этой модели с
помощью МНК:
a  1,21 , b  1,9 .
С помощью обратного преобразования получаем, что оценка
параметра  : a  ea  e1,21  3,35 . Оценка параметра  : b  b  1,9 . Таким
образом, оценкой нелинейной регрессионной модели является
выборочная нелинейная регрессия y  3,35  t1,9 .
Коэффициент
детерминации
линеаризованной
формы
2
R  0,9896 , а значение F -статистики равно 95,26. Сравнивая это
значение с критическим значением, полученным по таблице
распределения Фишера для уровня значимости 5% и степеней
свободы
числителя
и
знаменателя
равными
1,
имеем:
F  Fтабл  161,45 . Таким образом, найденная регрессия (линейная
форма) должна быть признана статистически незначимой.
Вычислим значения согласно уравнению выборочной регрессии:
y1  3,35 , y2  12,5 , y2  27,01 . Выборочная средняя значений y равна
14,5. Теперь можно вычислить индекс детерминации непосредственно
по формуле
3
R2  1 
( y  y )
i 1
3
i
( y  y)
i 1
2
i
 0,9819 .
2
i
Средняя абсолютная ошибка аппроксимации составляет
1 3 yi  yi
A 
100%  8,3% .
3 i 1 yi
Среднее абсолютное отклонение
26
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
MAD 
1 3
 yi  yi  1,21.
3 i 1
Задания практикума
4.1. По имеющимся данным оцените параметры следующей
регрессионной зависимости y   e  t
t
1
2
3
y
0,85
0,45
0,4
ln y
-0,16
-0,8
-0,92
0
1,39
2,77
ln t
Проверьте статистическую значимость линеаризованной формы.
Вычислите индекс детерминации непосредственно по формуле.
Вычислите среднюю абсолютную ошибку аппроксимации и среднее
абсолютное отклонение.
4.2. По имеющимся данным оцените параметры следующей
регрессионной зависимости y    t
27
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
t
1
4
16
y
2
6
10
ln y
0,69
1,79
2,3
0
1,39
2,77
ln t
Проверьте статистическую значимость линеаризованной формы.
Вычислите индекс детерминации непосредственно по формуле.
Вычислите среднюю абсолютную ошибку аппроксимации и среднее
абсолютное отклонение.
4.3. По имеющимся данным оцените параметры следующей
1
регрессионной зависимости yi       i
x
2
3
4
x
y
3,6
2,8
2,5
Проверьте статистическую значимость линеаризованной формы.
Вычислите индекс детерминации непосредственно по формуле.
Вычислите среднюю абсолютную ошибку аппроксимации и среднее
абсолютное отклонение.
Лабораторная работа «Нелинейная регрессия»
Задание
В этой работе для одних и тех же исходных данных, представляющих
собой парную выборку, необходимо построить различные регрессии. В
каждом случае необходимо вычислить коэффициенты выборочной
регрессии,
построить
линию
выборочной
регрессии
на
корреляционном поле (на одном и том же!), проверить статистическую
значимость линеаризованной формы и показатели, позволяющие
сделать вывод об адекватности модели — среднюю абсолютную
1 n yi  yi
100% , среднее абсолютное
ошибку аппроксимации A  
n i 1 yi
отклонение
MAD 
1 n
 yi  yi ,
n i 1
стандартную
Sост 
i 1
n  k 1
регрессии
n
n
 ( yi  yi )2
ошибку
, индекс детерминации R 2  1 
(y  y )
i 1
n
i
2
i
( y  y)
i 1
28
i
.
2
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
1. Постройте поле корреляции. Сделайте предположения о
форме зависимости показателя от фактора.
2. Найдите оценки коэффициентов парной линейной регрессии y
на x . Вычислите значения yi , постройте на корреляционном поле
прямую парной линейной регрессии.
Проверьте статистическую значимость регрессии. Вычислите
среднюю ошибку аппроксимации A , среднее абсолютное отклонение
Sост ,
стандартную
ошибку
регрессии
коэффициент
MAD ,
детерминации.
3. Найдите оценки коэффициентов квадратичной регрессии
yi    1 xi   2 xi2   i .
Оценки коэффициентов a, b1 , b2 найдите с помощью МНК для
множественной линейной регрессии yi    1 xi   2 zi   i , которая
получается из исходной с помощью замены zi  xi 2 . Проверьте
статистическую значимость линеаризованной формы.
Вычислите значения yi  a  b1xi  b2 xi2 , по найденным значениям
постройте на поле корреляции параболу квадратичной регрессии.
Вычислите непосредственно по формулам среднюю ошибку
аппроксимации
MAD ,
A , среднее абсолютное отклонение
стандартную ошибку регрессии Sост , индекс детерминации. Сравните
значение индекса детерминации, вычисленного непосредственно по
формуле, с коэффициентом детерминации для линеаризованной
формы и квадратом коэффициента парной корреляции rxy2 .
4. Найдите оценки гиперболической (обратной) регрессии
1
yi       i . Оценки найдите с помощью МНК для парной линейной
x
регрессии yi     zi   i , которая получается из исходной заменой
1
zi  . Проверьте статистическую значимость линеаризованной
xi
формы.
1
Вычислите значения yi  a  b , по найденным значениям
xi
постройте на поле корреляции линию регрессии.
Вычислите непосредственно по формулам среднюю ошибку
аппроксимации
MAD ,
A , среднее абсолютное отклонение
стандартную ошибку регрессии Sост , индекс детерминации. Сравните
значение индекса детерминации, вычисленного непосредственно по
29
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
формуле, с коэффициентом детерминации для линеаризованной
формы и квадратом коэффициента парной корреляции rxy2 .
5. Найдите оценки степенной регрессии yi   xi  i . Оценки
найдите с помощью обратного преобразования оценок a, b МНК для
парной линейной регрессии yi     zi   i , которая получается из
исходной
логарифмированием
и
заменой
yi  ln yi , zi  ln xi ,  ln  ,  i  ln  i . Проверьте статистическую значимость
линеаризованной формы.
Вычислите значения yi  AxiB , где A  ea , B  b . По найденным
значениям постройте на поле корреляции линию регрессии.
Вычислите непосредственно по формулам среднюю ошибку
аппроксимации
MAD ,
A , среднее абсолютное отклонение
стандартную ошибку регрессии Sост , индекс детерминации. Сравните
значение индекса детерминации, вычисленного непосредственно по
формуле, с коэффициентом детерминации для линеаризованной
формы и квадратом коэффициента парной корреляции rxy2 .
6. Найдите оценки показательной регрессии yi   i  i . Оценки
найдите с помощью обратного преобразования оценок a, b МНК для
парной линейной регрессии yi     xi   i , которая получается из
исходной
регрессии
логарифмированием
и
заменой
yi  ln yi ,   ln  ,  ln  ,  i  ln  i . Проверьте статистическую значимость
линеаризованной формы.
x
Вычислите значения yi  AB i , где A  ea , B  eb . По найденным
значениям постройте на поле корреляции линию регрессии.
Вычислите непосредственно по формулам среднюю ошибку
аппроксимации
MAD ,
A , среднее абсолютное отклонение
стандартную ошибку регрессии Sост , индекс детерминации. Сравните
значение индекса детерминации, вычисленного непосредственно по
формуле, с коэффициентом детерминации для линеаризованной
формы и квадратом коэффициента парной корреляции rxy2 .
x
7. Найдите оценки экспоненциальной регрессии yi   e xi  i .
Оценки найдите с помощью обратного преобразования оценок a, b
МНК для парной линейной регрессии yi     xi   i , которая
получается
из
исходной
логарифмированием
и
заменой
yi  ln yi ,  ln  ,  i  ln  i .
Проверьте
статистическую
значимость
линеаризованной формы.
30
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Вычислите значения yi  Ae Bxi , где A  ea , B  b . По найденным
значениям постройте на поле корреляции линию регрессии.
Вычислите непосредственно по формулам среднюю ошибку
аппроксимации
MAD ,
A , среднее абсолютное отклонение
стандартную ошибку регрессии Sост , индекс детерминации. Сравните
значение индекса детерминации, вычисленного непосредственно по
формуле, с коэффициентом детерминации для линеаризованной
формы и квадратом коэффициента парной корреляции rxy2 .
8. Найдите оценки логарифмической регрессии yi     ln xi   i .
Оценки найдите с помощью МНК для парной линейной регрессии
yi     zi   i , которая получается из исходной заменой zi  ln xi .
Проверьте статистическую значимость линеаризованной формы.
Вычислите значения yi  a  b ln xi . По найденным значениям
постройте на поле корреляции линию регрессии.
Вычислите непосредственно по формулам среднюю ошибку
аппроксимации
MAD ,
A , среднее абсолютное отклонение
стандартную ошибку регрессии Sост , индекс детерминации. Сравните
значение индекса детерминации, вычисленного непосредственно по
формуле, с коэффициентом детерминации для линеаризованной
формы и квадратом коэффициента парной корреляции rxy2 .
9. Сравните построенные регрессии — какая кажется Вам
наиболее подходящей (наилучшей)?
10. Использование стандартных средств Excel.
Для подбора и оценки адекватности регрессии (в особенности
нелинейной) в Excel имеется встроенное средство построения
основных видов регрессий, использование которого основано на
графическом представлении выборки.
Для того чтобы воспользоваться этим средством постройте еще
раз (лучше на отдельном листе) поле корреляции.
Для того чтобы добавить в построенную диаграмму линию
регрессии, выберите в главном меню Диаграмма пункт Добавить
линию тренда (или, выделив ряд данных щелкните правой кнопкой и
в контекстном меню выберите Добавить линию тренда).
В появившемся диалоговом окне Линия тренда, прежде всего,
необходимо на вкладке Тип указать тип тренда. На вкладке
Параметры этого окна необходимо указать дополнительные
параметры: необходимость вывод уравнения регрессии и значения
индекса детерминации R 2 на диаграмме.
31
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Постройте с помощью этого средства на одной диаграмме линии
линейной,
квадратичной,
степенной,
экспоненциальной
и
логарифмической регрессий.
Практикум по теме 5
Методические указания по выполнению практикума
Целью практикума является более глубокое усвоение темы, а
также развитие следующих навыков:
 Использование косвенного метода наименьших квадратов
для решения системы одновременных уравнений;
 Проверка идентифицируемости системы.
Задания практикума
Лабораторная работа 5.1. «Макроэкономическая модель Кейнса»
Задание.
Рассматривается классическая макроэкономическая модель
Кейнса для экономики страны, которая имеет следующий вид:
C    Y   ,
(1)
Y C  X,
где C — личное потребление в постоянных ценах; Y — национальный
доход в постоянных ценах; X — инвестиции в основной капитал и в
запасы экспорта и импорта;  — случайная составляющая
(   N (0, 2 ) );  ,  — параметры (неизвестные) линейной зависимости
потребления C от Y . В этой модели C и Y — эндогенные
переменные, X — экзогенная переменная. Система уравнений (1)
задает структурную форму модели.
Для построения оценок a и b параметров  ,  используется
косвенный метод наименьших квадратов (КМНК). Для его применения
строится система приведенных уравнений, в которой эндогенные
переменные C и Y выражаются через экзогенную переменную X :
C  A1  B1 X  u,
(2)
Y  A2  B2 X  u.
Здесь A1 , A2 , B1 , B2 ( A1  A2 ) — параметры, определяемые через
структурные коэффициенты  и  ; случайная составляющая u
определяется через случайную составляющую  и структурный
коэффициент  .
32
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Далее по известным данным xi , yi , ci , i  1, n , строятся оценки
A1 , A2 , B1 , B2 коэффициентов выборочных парных линейных регрессий
C  A1  B1 X ,
(3)
Y  A2  B2 X ,
после чего необходимо выразить из второго уравнения X через Y и
подставить в первое уравнение. В результате получаем эмпирическую
оценку функции
(4)
C  a  bY ,
где a и b — оценки структурных параметров  и  соответственно.
Задание
1*. Постройте приведенную форму (2) модели Кейнса. Для этого
получите аналитические выражение коэффициентов A1 , A2 , B1 , B2 через
коэффициенты  и  структурной формы модели (1), а также
выражение случайной составляющей u через  .
2. Исходная выборка представляет собой n наблюдений
( X i , Yi , Ci ) . Для того, чтобы оценить преимущества косвенного методы
наименьших квадратов смоделируйте выборку из n наблюдений
( X i , Yi , Ci ) . Для этого:
а) задайте произвольно n значений экзогенной переменной X i ;
б) значения случайной составляющей  i , возьмите из
нормального распределения N (0, 2 ) ; при построении значений  i
можно воспользоваться функциями СЛЧИС и НОРМОБР или
возможностями пакета Анализ данных;
в) значения  и  задайте произвольно;
г) по полученным ранее значениям X i ,  i , с помощью системы
приведенных уравнений (2) и выражения коэффициентов A1 , A2 , B1 , B2
через коэффициенты  и  найдите соответствующие значения
Yi , Ci , i  1, n .
3. По выборке найдите коэффициенты A1 , A2 , B1 , B2 двух парных
линейных регрессий (3). Для нахождения коэффициентов выборочных
регрессий
воспользуйтесь
функцией
ЛИНЕЙН.
Проверьте
статистическую значимость построенных регрессий.
4. Используя полученные в п. 3 оценки коэффициентов парных
регрессий (3), найдите зависимость (4) значений C от Y , т.е. получите
явное аналитическое выражение коэффициентов a и b , которые, в
свою очередь, являются, оценками структурных коэффициентов  и
 (сравните эти значения). Вычислите непосредственно по формуле
33
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
значение коэффициента детерминации для полученной регрессии.
Проверьте ее статистическую значимость.
5. Для того чтобы убедиться в преимуществе подобного метода
построения
оценок
структурных
коэффициентов,
сравните
полученные оценки с оценками, определяемыми при построении
«прямых» регрессий. Для этого, с помощью значений Yi , Ci , i  1, n
постройте парную регрессию C на Y обычным методом наименьших
квадратов с помощью функции ЛИНЕЙН: C  a1  b1Y . Проверьте ее
статистическую значимость.
6. Сравните оценку b , найденную в п. 4, и оценку b1 , полученную
в п. 5 со значением  .
Практикум по теме 6
Методические указания по выполнению практикума
Целью практикума является более глубокое усвоение темы, а
также развитие следующих навыков:
 Оценка тренда и сезонной компоненты временного ряда;
 Сглаживание временных рядов;
 Оценка адекватности построенной модели.
Решение типовых задач
ТЗ 6.1. Рассматривается аддитивная модель временного ряда,
содержащая тренд и сезонную компоненту. По 20 квартальным
наблюдениям, образующим временной ряд, был оценен линейный
тренд:
1,48 40,40
0,02 0,29
1,00 0,54
5066,53 18,00
1466,26 5,21
В таблице приведены остатки тренда — разности между
уровнями временного ряда и значениями тренда
ettr
11,48
-4,46
-8,45
2,71
6,90
0,87
34
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
-10,16
1,43
8,56
-5,22
-5,77
0,13
9,25
-0,17
-10,20
3,63
8,39
-5,65
-8,70
5,28
Оцените сезонную компоненту с периодом 4, постройте прогноз на
следующие четыре квартала.
Решение. Воспользуемся формулой для вычисления сезонных
компонент
1 m1
St   ( yt  jT  ut  jT ), t  1,2, , T ,
m j 0
в которой число периодов m  5 , длина периода T  4 . Для того, чтобы
вычислить оценку первой сезонной компоненты необходимо найти
среднее значение остатков e1tr , e5tr , e9tr , e13tr и e17tr :
1
S1  (11,48  6,9  8,56  9,25  8,39)  8,92 .
5
Вычисляя аналогично, получаем
1
S2  (4,46  0,87  5,22  0,17  5,65)  2,93 ,
5
1
S3  (8,45  10,16  5,77  10,20  8,7)  8,66 ,
5
1
S4  (2,71  1,43  0,13  3,63  5,28)  2,64 .
5
Прогноз на следующие четыре квартала представляет собой
сумму значений тренда и соответствующих сезонных компонент:
y21  40,4  1,48  21  8,92  80,5 ,
y22  40,4  1,48  22  2,93  70,14 ,
y23  40,4  1,48  23  8,66  69,9 ,
y24  40,4  1,48  24  2,64  78,68 .
35
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
Задания практикума.
6.1. Рассматривается аддитивная модель временного ряда,
содержащая тренд и сезонную компоненту. По 20 квартальным
наблюдениям, образующим временной ряд, был оценен линейный
тренд:
1,58
39,50
0,21
3,04
0,71
7,21
55,18
22,00
2867,40
1143,19
В таблице приведены остатки тренда — разности между
уровнями временного ряда и значениями тренда
ettr
12,1
1
3,94
8,02
3,05
7,15
1,03
10,11
1,39
8,43
5,45
6,09
0,29
8,74
0,77
10,89
2,84
7,50
6,63
36
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
9,77
4,12
Оцените сезонную компоненту с периодом 4, постройте прогноз на
следующие четыре квартала.
6.2. Рассматривается аддитивная модель временного ряда,
содержащая тренд и сезонную компоненту. По 20 квартальным
наблюдениям, образующим временной ряд, был оценен линейный
тренд:
1,58
66,57
0,02
0,25
1,00
0,54
5771,91
18,00
1670,40
5,21
В таблице приведены остатки тренда — разности между
уровнями временного ряда и значениями тренда
ettr
8,31
7,63
11,62
0,46
3,73
2,30
13,33
1,74
5,39
8,39
8,94
3,04
6,08
37
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
3,34
13,37
0,46
5,22
8,82
11,87
2,11
Оцените сезонную компоненту с периодом 4, постройте прогноз на
следующие четыре квартала.
Лабораторная работа 6.1. «Проверка случайности ряда
наблюдений»
Задание
Проверить независимость и стационарность ряда наблюдений по
двум критериям. Гипотеза проверяется с целью обнаружения
детерминированной составляющей во временном ряду.
Для того чтобы правильно проанализировать серии, можно
воспользоваться условным форматированием Формат\Условное
форматирование. Задав условия на значения исходного ряда на
сравнение с медианой или с предыдущим значением, необходимо
определить формат ячейки, например, цвет шрифта или заливку
ячейки, что облегчит подсчет и анализ серий.
Можно воспользоваться функцией ЕСЛИ, которая позволяет
сформировать дополнительный ряд значений в зависимости от
значения текущих ячеек. Например, в этом ряду будет стоять 1, если
значение текущей ячейки меньше медианы, 0 — если равно медиане,
и –1 — если больше медианы.
1. Постройте диаграмму временного ряда.
А). Критерий серий, основанный на медиане выборки.
1. Определите медиану временного ряда. Для этого можно
воспользоваться функцией МЕДИАНА, аргументом которой является
диапазон ячеек, содержащий ряд данных. При использовании этой
функции нет необходимости предварительно ранжировать исходный
ряд.
Если для исходного ряда предварительно построить
ранжированный ряд (т. е. ряд, элементы которого располагаются в
38
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
порядке возрастания, т. н. вариационный ряд y(1)  y(2)   y( n) ), то
медиана определяется по формуле
y( m1) , если n  2m  1


med   y( m )  y( m1)
.
, если n  2m


2
2. Сравнивая значения исходного ряда yi , i  1, , n с медианой,
составьте последовательность d1 , d 2 , , d n по формуле
, если yi  med

di   0, если yi  med .
 , если y  med
i

В дальнейшем рассматриваются только плюсы и минусы, нули
не участвуют в анализе.
3. Определите число серий  (n) в последовательности
di , i  1, , n . Под серией понимается последовательность подряд
идущих плюсов или минусов. Один отдельно стоящий плюс или минус
тоже считается серией.
4) Найдите  max (n) — протяженность самой длинной серии.
5) Сделайте вывод об отсутствии или наличии тенденции:
При условии случайности ряда y1 , y2 , yn (т.е. при отсутствии
тенденции) протяженность самой длинной серии не должна быть
слишком большой, а общее число серий — слишком маленьким.
Поэтому, если нарушается хотя бы одно из следующих неравенств, то
гипотеза о случайности отвергается для приблизительно 5% уровня
значимости:
  (n)  [ 12 (n  1  1,96 n  1]
,

 max (n)  [3,3lg(n  1)]
здесь с помощью квадратных скобок A обозначена целая часть числа
A . Для нахождения целой части используется функция ЦЕЛОЕ.
Если оба неравенства выполнены, то гипотеза случайности
принимается.
Б) Критерий «восходящих и нисходящих» серий.
1) Для исходного ряда y1 , y2 , yn составьте последовательность
знаков d1 , d 2 , , d n1 по следующему правилу:
, если yi 1  yi  0

di   0, если yi 1  yi  0 ,
 , если y  y  0
i 1
i

39
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
В дальнейшем рассматриваются только плюсы и минусы, нули
не участвуют в анализе.
2. Определите  (n) — число серий в последовательности
di , i  1, , n  1 . Под серией понимается последовательность подряд
идущих плюсов или минусов. Один отдельно стоящий плюс или минус
тоже считается серией.
3. Найдите  max (n) — протяженность самой длинной серии.
4. Сделайте вывод об отсутствии или наличии тенденции:
В условиях случайности число серий не должно быть слишком
маленьким, а протяженность самой длинной серии — слишком
большой. Если нарушается хотя бы одно из следующих двух
неравенств,
то
гипотеза
случайности
отвергается
для
приблизительно 5% уровня значимости:

16n  29
],
  (n)  [ 13 (2n  1)  1,96
90

 (n)   (n)
0
 max
где
 5, n  26

 0 (n)  6, 26  n  153 .
7, 153  n  1170

Если оба неравенства выполнены, то гипотеза случайности
принимается.
Лабораторная работа 6.2. «Сглаживание временного ряда»
Задание
Провести сглаживание временного ряда с помощью простой
скользящей средней и взвешенной скользящей средней.
1. Постройте диаграмму временного ряда.
2. Проведите сглаживание временного ряда с помощью простой
скользящей средней, используя три интервала сглаживания:
y  yt  yt 1
g  3 , yt  t 1
, t  2, , n  1 ,
3
y  yt 1  yt  yt 1  yt 2
g  5 , yt  t 2
, t  3, , n  2 ,
5
1y y y y 1y
t 2
t 1
t
t 1
2 t  2 , t  3, , n  2 .
g  4 , yt  2
4
40
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
3. Проведите сглаживание временного ряда с помощью
взвешенной скользящей средней:
1
g  5 , yt  (3 yt 2  12 yt 1  17 yt  12 yt 1  3 yt  2 ), t  3, , n  2 .
35
4. Постройте на одной диаграмме графики исходных и
сглаженных временных рядов.
5. Для каждого сглаженного ряда вычислите остатки, проверьте
отсутствие тенденции и авокорреляции, постройте диаграмму
остатков.
Лабораторная работа 6.3. «Оценка тренда и периодической
составляющей»
Задание
Исследуется аддитивная модель временного ряда, включающая
тренд и сезонную компоненту. Необходимо оценить тренд и сезонную
составляющую, построить модель временного ряда, проверить ее
адекватность, построить прогноз.
1. Постройте диаграмму временного ряда.
2. Оценить тренд и периодическую составляющую ряда можно с
помощью
следующего
метода.
По
двумерной
выборке
(1, y1 ),(2, y2 ), ,(n, yn ) постройте с помощью функции ЛИНЕЙН парную
регрессию показателя y на фактор t :
yˆttr  trt  a  bt ,
которая и будет рассматриваться как оценка тренда.
Перед построением регрессии можно провести сглаживание
временного ряда с помощью простой скользящей средней — интервал
сглаживания обычно выбирают равным периоду сезонных колебаний.
В этом случае тренд строится по сглаженным данным.
3. Устраните этот тренд из исходного временного ряда, для этого
вычислите остатки тренда (разности между исходным значением
временного ряда и трендом)
ettr  yt  trt , t  1, , n .
Постройте диаграмму остатков тренда.
4. Оцените по диаграмме остатков тренда число периодов и
длину периода временного ряда — убедитесь, что в n наблюдениях
n
содержится целое число периодов m  , где T — длина периода.
T
41
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
5. По остаткам тренда найдите оценку периодической
составляющей: для каждого из моментов времени, входящего в
период вычислите
1 m1
1 m1
St   ettr jT   ( yt  jT  trt  jT ), t  1,2, , T
m j 0
m j 0
Постройте график периодической составляющей на диаграмме
остатков тренда (где St  St T  St 2T   St ( m1)T для t  1, ,T ).
6. Вычислите значения, представляющие собой эмпирическую
модель временного ряда
yˆt  trt  St , t  1, , n .
Постройте график эмпирической модели ряда на диаграмме
временного ряда.
7. Вычислите остатки модели:
et  yt  yˆt  yt  (trt  St ), t  1, , n ,
где St  St T  St 2T   St ( m1)T для t  1, ,T .
8. Постройте график остатков модели.
9. Рассчитайте прогнозные значения показателя на два периода
вперед по формуле из п. 6.
Прогноз представляет собой сумму значения тренда trt (который
вычисляется с помощью прямой подстановки значений t в уравнение
тренда) и значения сезонной компоненты St , соответствующей
рассматриваемому моменту времени (при вычислении сезонной
составляющей необходимо определить соответствующее значение
номера сезона внутри периода).
10. Исследуйте остатки et : проверьте гипотезу случайности
остатков (например, по критерию серий, основанному на медиане
выборки) и наличие автокорреляции по критерию Дарбина-Уотсона.
11. Вычислите среднюю абсолютную ошибку аппроксимации.
Сделайте вывод об адекватности построенной модели.
Лабораторная работа 6.4. «Экспоненциальное сглаживание»
Задание
Провести экспоненциальное сглаживание временного ряда,
изучить влияние значения константы сглаживания.
1. Постройте диаграмму временного ряда.
2. Постройте сглаживающую кривую методом экспоненциального
сглаживания при значении константы сглаживания   0,3 :
42
МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ
INTERNATIONAL BANKING INSTITUTE
St  St 1   ( yt  St 1 ) , t  1,2, .n
В качестве начального значения возьмите среднее значение
y  y2  y3
первых трех уровней ряда: S0  1
.
3
3. Изучите, как влияет на кривую экспоненциального
сглаживание значение константы сглаживания  — постройте
сглаживающие кривые для   0,1,   0,01,   0,9 .
4. Для каждого сглаженного ряда вычислите остатки и постройте
графики остатков. Проверьте автокоррелированность и наличие
тенденции в остатках.
43
Download