Эконометрика Методические указания по выполнению

advertisement
РОСТОВСКИЙ ГОСУДАРСТВЕННЫЙ ЭКОНОМИЧЕСКИЙ
УНИВЕРСИТЕТ (РИНХ)
ЭКОНОМЕТРИКА
Методические указания по выполнению контрольной работы
Ростов-на-Дону
Печатается по решению кафедры математической статистики, эконометри-
ки и актуарных расчетов РГЭУ.
Авторы: Ниворожкина Л.И., Житников И.В., Федосова О.Н.
Рецензенты: заслуженный деятель науки РФ, д.э.н., проф. Князевский В.С.
к.э.н., доцент Алексейчик Т.В.
Методические указания составлены на основе Государственного стандарта высшего профессионального образования: включают программу курса, список рекомендуемой учебной и научной литературы, задания для самостоятельной работы и текущего
контроля знаний студентов, методические указания к решению типовых задач.
Эконометрика как метод исследования экономических явлений с использованием аппарата математической статистики и ЭВМ; основные приемы спецификации переменных в уравнениях регрессии; проверка адекватности эконометрической модели;
проверка гипотез в эконометрических моделях; прогнозирование на основе эконометрических моделей.
Предназначено для студентов и аспирантов всех форм обучения.
Контрольные задания составлены по материалам учебников, представленных в списке рекомендуемой литературы.
Ниворожкина Л.И, Житников И.В.,
Федосова О.Н.,
© Ростовский государственный
экономический университет,
©
2
РАБОЧАЯ ПРОГРАММА ПО КУРСУ «ЭКОНОМЕТРИКА»
Тема 1. Предмет и задачи курса.
Определение эконометрики. Эконометрика и экономическая теория. Эконометрика и статистика. Эконометрика и экономико-математические методы. Области применения эконометрических моделей. Методологические вопросы построения эконометрических моделей: обзор используемых методов.
Литература:
1. Магнус Я.Р, Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.:
Дело, 1997. - с.12-15.
2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.
Учебник для вузов. - М.: ЮНИТИ, 1998. - с. 23-48, 597-618.
3. Джонстон Дж. Эконометрические методы. - М.: Статистика, 1980. - с. 11-15.
4. Эконометрика Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и
др. – М.: Финансы и статистика, 2001.- с.7-32.
Тема 2. Парная регрессия и корреляция.
Понятие о функциональной, статистической и корреляционной связях. Основные задачи прикладного корреляционно-регрессионного анализа.
Уравнение регрессии, его смысл и назначение. Выбор типа математической
функции при построении уравнения регрессии. Парная регрессия. Метод наименьших
квадратов и условия его применения для определения параметров уравнения парной
регрессии.
Нелинейные модели регрессии и их линеаризация.
Оценка степени тесноты связи между количественными переменными. Коэффициент ковариации. Показатели корреляции: линейный коэффициент корреляции, индекс корреляции, теоретическое корреляционное отношение. Коэффициент детерминации.
Стандартная ошибка уравнения регрессии.
Оценка статистической значимости показателей корреляции, параметров уравнения регрессии, уравнения регрессии в целом: t - критерий Стьюдента, F - критерий
Фишера.
3
1.
2.
3.
4.
5.
Литература:
Магнус Я.Р, Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.:
Дело, 1997. - с.17-37.
Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.
Учебник для вузов. - М.: ЮНИТИ, 1998. - с. 621-627.
Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997. - с. 53-69.
Джонстон Дж. Эконометрические методы. - М.: Статистика, 1980. - с. 17-70.
Эконометрика Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и
др. – М.: Финансы и статистика, 2001. – с.34-88.
Тема 3. Множественная регрессия и корреляция.
Понятие о множественной регрессии. Классическая линейная модель множественной регрессии (КЛММР). Определение параметров уравнения множественной регрессии методом наименьших квадратов.
Стандартизованные коэффициенты регрессии, их интерпретация. Парные
и частные коэффициенты корреляции. Множественный коэффициент корреляции и
множественный коэффициент детерминации. Оценка надежности показателей корреляции.
Оценка качества модели множественной регрессии: F – критерий Фишера, t критерий Стьюдента.
Мультиколлинеарность. Методы устранения мультиколлинеарности.
Литература:
1. Магнус Я.Р, Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.:
Дело, 1997. - с. 43-79.
2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.
Учебник для вузов. - М.: ЮНИТИ, 1998. - с. 628-772.
3. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997. - с. 134-196.
4. Джонстон Дж. Эконометрические методы. - М.: Статистика, 1980. - с. 123-237.
5. Эконометрика Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и
др. – М.: Финансы и статистика, 2001. – с.90-175.
Тема 4. Спецификация переменных в уравнениях регрессии.
Эконометрические модели: общая характеристика, различия статистического и
эконометрического подхода к моделированию.
Спецификация переменных в уравнениях регрессии. Ошибки спецификации.
Обобщенная линейная модель множественной регрессии. Обобщенный метод
наименьших квадратов.
Проблема гетероскедастичности. Автокорреляция. Анализ линейной модели
множественной регрессии при гетероскедастичности и автокорреляции.
4
Фиктивные переменные: общий случай. Множественные совокупности фиктивных переменных. Фиктивные переменные для коэффициентов наклона. Тест Чоу.
Моделирование: влияние отсутствия переменной, которая должна быть включена; влияние включения в модель переменной, которая не должна быть включена. Замещающие переменные.
Литература:
1. Магнус Я.Р, Катышев П.К., Пересецкий А.А., Эконометрика. Начальный курс. - М.:
Дело, 1997. - с. 66-79.
2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. - М.: ЮНИТИ, 1998. - с. 653-668.
3. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997. - с. 262-285.
4. Джонстон Дж. Эконометрические методы. - М.: Статистика, 1980. - с. 123-237.
5. Эконометрика Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и
др. – М.: Финансы и статистика, 2001.
Тема 5. Временные ряды в эконометрических исследованиях.
Специфика временных рядов как источника данных в эконометрическом моделировании.
Аналитическое выравнивание временных рядов. Оценка параметров уравнения
тренда.
Автокорреляция в остатках, ее измерение и интерпретация. Критерий ДарбинаУотсона в оценке качества трендового уравнения регрессии.
Анализ временных рядов при наличии периодических колебаний: аддитивная и
мультипликативная модели.
Особенности изучения взаимосвязанных временных рядов. Автокорреляция рядов динамики и методы ее устранения. Метод последовательных разностей. Интерпретация параметров уравнения регрессии, построенного по первым и вторым разностям.
Метод отклонения уровней ряда от основной тенденции. Метод включения фактора
времени.
Литература:
1. Магнус Я.Р, Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.:
Дело, 1997. - с. 102-136.
2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.
Учебник для вузов. - М.: ЮНИТИ, 1998. - с. 778-903.
3. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997. - с. 200-229.
4. Джонстон Дж. Эконометрические методы. - М.: Статистика, 1980. - с. 242-265.
5. Эконометрика Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и
др. – М.: Финансы и статистика, 2001. – с.225-289.
5
Тема 6. Системы эконометрических уравнений.
Виды систем эконометрических уравнений. Независимые системы. Рекурсивные
системы. Системы одновременных (совместных) уравнений. Структурная и приведенная формы эконометрической модели. Проблемы идентификации. Косвенный и двухшаговый метод наименьших квадратов, общая схема алгоритма расчетов. Применение
эконометрических моделей. Модель Кейнса (статистическая и динамическая формы).
Модель Клейна (1).
Литература:
1. Магнус Я.Р, Пересецкий А.А., Катышев П.К. Эконометрика. Начальный курс. - М.:
Дело, 1997. -С. 142-163.
2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. - М.: ЮНИТИ, 1998. - С. 907-956.
3. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997. - С. 322-347.
4. Джонстон Дж. Эконометрические методы. - М.: Статистика, 1980. - С. 375-408.
5. Эконометрика. Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и
др. – М.: Финансы и статистика, 2001. – с.177-225.
Домашнее задание по курсу “Эконометрика”
Общие указания по выполнению домашнего задания
Задания к контрольной работе составлены в 10 вариантах. Номер варианта соответствует последней цифре шифра зачетной книжки. Если последняя цифра зачетной книжки – 0, следует выполнить 10-й вариант.
Каждый вариант контрольной работы содержит 5 задач по основным разделам
курса. Порядковый номер задачи из каждой темы соответствует номеру варианта.
1. Работа должна быть заблаговременно представлена на кафедру СМиП, для
аспирантов - в отдел аспирантуры.
2. Результаты расчетов всех относительных величин необходимо проводить с
точностью до 0,0001, а процентов - до 0,01.
3. Все расчеты должны быть выполнены как вручную, так и с использованием
пакетов прикладных программ на персональном компьютере. В последнем случае следует обязательно указывать название и версию использованного программного обеспечения. Соответствующие распечатки необходимо привести в тексте работы или оформить в качестве приложения.
4. Все расчеты должны сопровождаться комментариями и интерпретацией полученных результатов.
Указания к выполнению контрольных работ содержат все необходимые формулы, а также содержат примеры расчетов типовых задач, которые по тексту указаний
выделены курсивом.
6
Указания к выполнению контрольных заданий
Задача 1 каждого варианта составлена по теме “Парная регрессия и корреляция”. Введем следующие обозначения:
X - факторный признак, независимая (объясняющая) переменная,
Y - результативный признак, зависимая переменная,
x – фактические значения факторного признака,
y – фактические значения результативного признака,
ŷ - расчетные (полученные по уравнению регрессии) значения результативного
признака,
a , b - параметры уравнения регрессии.
В контрольных заданиях используется уравнение парной линейной регрессии
вида:
Y  α  βX  ξ
Рассмотрим методику выполнения на условиях конкретной задачи:
American Express Company в течение долгого времени полагала, что владельцы
ее кредитных карт предпочитают оплачивать свои расходы во время путешествий
при помощи их карт. Для выяснения этого из компьютерной базы компании были случайно выбраны 25 владельцев карточек, которым были заданы вопросы о числе миль,
которые они провели в путешествиях. Данные опроса о расходах путешественников и
числе миль, проведенных ими в пути, составляют исходную информацию задачи.
N
п/п
1
2
3
4
5
6
7
8
9
10
11
12
13
Число миль, проведенных в пути,
X
1211
1345
1422
1687
1847
2026
2133
2253
2400
2468
2699
2806
3082
Расходы, у.е , Y
N
п/п
1802
2405
2005
2511
2332
2305
3016
3385
3090
3694
3371
3998
3555
14
15
16
17
18
19
20
21
22
23
24
25
Число
миль,
проведенных в
пути, X
3209
3466
3643
3852
4033
4267
4498
4533
4804
5090
5233
5439
Расходы, у.е , Y
4492
4244
5298
4801
5147
5738
6420
6059
6426
6321
7025
6964
Пункт 1. Построение поля корреляции результата и фактора производится по
исходным данным о парах значений факторного и результативного признаков с соблюдением масштаба. На основе поля корреляции делаются выводы о направлении и возможной функциональной форме связи между факторным и результативным признаками (прямая - обратная, линейная - нелинейная).
7
Для условий рассматриваемой задачи поле корреляции выглядит следующим образом:
расходы, у.е.
8000
6000
4000
2000
0
0
1000
2000
3000
4000
5000
6000
количество миль, проведенных в путешествии
Связь между факторным и результативным признаками прямая, линейная.
Пункт 2. Оценка параметров уравнения парной линейной регрессии производится обычным методом наименьших квадратов (МНК): yˆi  a  bxi , где
a и b –оценки параметров модели.
Величины, минимизирующие суммы квадратов отклонений y от ŷ для случая
парной линейной регрессии, находятся как:
n
b
 x  ~x  y
i 1
i
i
~
y 
n
2
 xi  ~x 
;
i 1
a  ~
y  b~
x .
Значения ошибок, называемые обычно остатками, рассчитываются как ei
Проведите интерпретацию полученных результатов.
  yi  yˆ i  .
Расчет необходимых данных лучше всего организовать в таблице. Для нашего примера
таблица будет выглядеть следующим образом:
Таблица 1
N/N
х
у
xi  ~
x
x )( y i  ~
y ) ( xi  ~
ei  yˆ i  y i
yi  ~
y ( xi  ~
ŷ i
x)2
1
2
3
4
5
6
7
8
9
10
11
12
13
1211
1345
1422
1687
1847
2026
2133
2253
2400
2468
2699
2806
3082
1802
2405
2005
2511
2332
2305
3016
3385
3090
3694
3371
3998
3555
-1966,84
-1832,84
-1755,84
-1490,84
-1330,84
-1151,84
-1044,84
-924,84
-777,84
-709,84
-478,84
-371,84
-95,84
-2454,16
-1851,16
-2251,16
-1745,16
-1924,16
-1951,16
-1240,16
-871,16
-1166,16
-562,16
-885,16
-258,16
-701,16
4826940
3392880
3952677
2601754
2560749
2247424
1295769
805683,6
907085,9
399043,7
423850
95994,21
67199,17
3868460
3359302
3082974
2222604
1771135
1326735
1091691
855329
605035,1
503872,8
229287,7
138265
9185,306
N/N
х
у
xi  ~
x
yi  ~
y
( xi  ~
x )( y i  ~
y)
( xi  ~
x)2
8
1787,652
14,34756
1955,831
449,1692
2052,471
-47,4707
2385,062
125,9377
2585,872
-253,872
2810,529
-505,529
2944,82
71,17973
3095,428
289,5722
3279,922
-189,922
3365,266
328,7337
3655,186
-284,186
3789,477
208,5225
4135,875
-580,875
Продолжение таблицы 1
ŷ i
ei  yˆ i  y i
14
3209
4492
15
3466
4244
16
3643
5298
17
3852
4801
18
4033
5147
19
4267
5738
20
4498
6420
21
4533
6059
22
4804
6426
23
5090
6321
24
5233
7025
25
5439
6964
сумма 79446 106404
Средн. 3177,8 4256,1
4
6
31,16
288,16
465,16
674,16
855,16
1089,16
1320,16
1355,16
1626,16
1912,16
2055,16
2261,16
235,84
-12,16
1041,84
544,84
890,84
1481,84
2163,84
1802,84
2169,84
2064,84
2768,84
2707,84
7348,774
-3504,03
484622,3
367309,3
761810,7
1613961
2856615
2443137
3528507
3948304
5690409
6122859
51398430
970,9456
83036,19
216373,8
454491,7
731298,6
1186270
1742822
1836459
2644396
3656356
4223683
5112845
40952877
4295,268
4617,819
4839,965
5102,273
5329,439
5623,124
5913,044
5956,971
6297,093
6656,041
6835,515
7094,058
106404
196,7322
-373,819
458,035
-301,273
-182,439
114,8759
506,9564
102,0292
128,9072
-335,041
189,4853
-130,058
0
В соответствии с расчетами, представленными в таблице 1, а= 267,7715; b=1,2551
Соответственно уравнение регрессии может быть записано как:
yˆ  267,7715  1,2551x
Коэффициент регрессии линейной функции (b) есть абсолютный показатель силы связи, характеризующий среднее абсолютное изменение результата при изменении
факторного признака на единицу своего измерения.
Полученное уравнение может быть объяснено следующим образом: с увеличением расстояния на 1 милю расходы путешественника в среднем увеличиваются на
1,2551 условных денежных единиц. Свободный член уравнения равен 267,7715, что
может трактоваться как влияние на величину расходов других, неучтенных в модели
факторов.
Пункт 3. Линейный коэффициент корреляции характеризует тесноту линейной
связи между изучаемыми признаками. Его можно определить по следующей формуле:
x  ~x  y  ~y 

r
.
n x y
Значения линейного коэффициента корреляции принадлежит промежутку [-1;1].
Чем ближе его абсолютное значение к 1, тем теснее связь между признаками.
Положительная величина свидетельствует о прямой связи между изучаемыми признаками, отрицательная - о наличии обратной связи между признаками.
Для нашей задачи r=0,98329, что подтверждает вывод, сделанный в пункте 1,
что связь между признаками прямая, а также указывает на очень сильную взаимосвязь между количеством миль, проведенных в пути и расходами.
Квадрат коэффициента (индекса) корреляции называется коэффициентом детерминации и показывает долю вариации результативного признака, объясненную вариацией факторного признака.
Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в
процентах. Например: R 2 =0,8 означает, что доля колеблемости результативного признака, объясненная вариацией фактора X , включенного в уравнение регрессии, равна
80%. Остальные 20% приходятся на долю прочих факторов, не учтенных в уравнении
регрессии.
9
Для нашей задачи коэффициент детерминации равен 0,9669, то есть 96,69%
вариации результативного признака (расходов путешественников) объясняется вариацией факторного признака (количеством миль, проведенных в пути)
Пункт 4 связан с темой “Проверка статистических гипотез”. Рекомендуется использовать следующую общую процедуру проверки гипотез:
1. Сформулируйте нулевую гипотезу о том, что коэффициент регрессии статистически незначим: H 0 :   0 (линейной зависимости нет)
при конкурирующей: H1 :   0 (линейная зависимость есть)
или о том, что уравнение в целом статистически незначимо: H 0 : R 2  0 .
2. Определите фактическое значение соответствующего критерия.
3. Сравните полученное фактическое значение с табличным.
4. Если фактическое значение используемого критерия превышает табличное,
нулевая гипотеза отклоняется, и с вероятностью (1-  ) принимается альтернативная гипотеза о статистической значимости коэффициента регрессии. Если фактическое значение t - критерия меньше табличного, оснований отклонять нулевую гипотезу - нет.
Статистическая значимость коэффициента регрессии  проверяется с помощью
t - критерия Стьюдента:
b β
,
Sb
t n 2 
где
Sb 
S yx
n
2
  xi  ~x 
,
S yx

n
n
(  x )2
i 1
n
 xi2 
i 1
i 1
S yx - стандартная ошибка оценки, рассчитываемая по формуле
n
S yx 

 y  y 
i
i 1
n2
2
i
.
Так как нулевая гипотеза предполагает, что  =0, то tнабл. рассчитывается как:
b0
tнабл. 
.
Sb
Для определения табличного значения воспользуйтесь таблицами распределения
Стьюдента для заданного уровня значимости α, принимая во внимание, что число степеней свободы для распределения Стьюдента равно (k = n - 2).
Для нашего примера t набл  25,906 , а
t табл( 0, 05, k  23) =2,07, следовательно ну-
левая гипотеза отвергается в пользу альтернативной и коэффициент регрессии 
статистически значим, то есть наличие существенной линейной зависимости между
количеством миль, проведенных в путешествии и величиной расходов статистически
подтверждается.
10
Оценка статистической значимости построенной модели регрессии в целом производится с помощью F- критерия Фишера. Фактическое значение F-критерия качества
оценивания регрессии, который представляет собой отношение объясненной суммы
квадратов SSR (в расчете на одну независимую переменную) к остаточной сумме квадратов SSE (в расчете на одну степень свободы), определяется как:
SSR
Fнабл. 
k
,
SSE
n  k 1
n
где SSR =  ( ŷi  ~
y )2 - факторная, или объясненная моделью регрессии, сумма
i 1
квадратов,
n
SSE   ( y i  yˆ i ) 2 - остаточная, или необъясненная моделью сумма квадраi 1
тов
k - число независимых переменных.
F - критерий можно выразить через коэффициент детерминации:
R2
.
Fнабл. 
(1  R 2 ) /( n  2)
Для определения табличного значения воспользуйтесь таблицами распределения
Фишера-Снедекора для заданного уровня значимости α, принимая во внимание, что в
случае парной регрессии число степеней свободы большей дисперсии равно 1, а число
степеней свободы меньшей дисперсии равно n - 2.
Для нашего примера
Fнабл. =671,
137, а
Fтабл.( 0,05, k11, k 2  23) =4,45. Так как
Fнабл.  Fтабл. построенная модель регрессии в целом значима и может в дальнейшем
использоваться нами для прогнозов.
Для выполнения пункта 5 необходимо изучить вопрос об интервальном оценивании в регрессионном анализе, уяснить смысл понятий “точечный прогноз” и “интер подставьте в уравнение регресвальный прогноз”. Для расчета точечного прогноза Y
k
сии заданное значение факторного признака X  .
Так, например, если необходимо оценить расходы путешественника, преодолевшего (собирающегося преодолеть) 4500 миль, следует использовать уравнение регрессии записанное нами в пункте 2:
yˆ  267,7715  1,2551  4500  5915,7215 , то есть в среднем путешественник,
преодолевший 4500 миль израсходует 5915,7215 условных денежных единиц.

Доверительный интервал для значений y i , лежащих на линии регрессии, имеет
вид:

y i  t n 2 S yx 1  hi ,
где
11
1
hi  
n
x

~
x

2
n
2
  xi  ~x 

( x  ~
x )2
1

n
n
n
(  xi ) 2
i 1
n
 xi2 
i 1

y i - прогнозное значение зависимой переменной;
S yx - стандартная ошибка оценки;
i 1
n - объем выборки;
x  - заданное значение X .
Полученный интервал будет характеризовать значения результативного призна
ка при заданном значении факторного признака x для отдельной наблюдаемой единицы.
Так, для нашего примера этот доверительный интервал будет выглядеть как
5247,8367  ŷ i  6582,9665, то есть с вероятностью 0,95 можно утверждать, что
расходы одного путешественника, преодолевшего 4500 миль составят от 5247,8367
до 6582,9665 условных денежных единиц.
Если же необходимо сделать вывод об интервале значений результативного при
знака для всех наблюдаемых единиц при среднем значении факторного признака x ,
расчет будет производиться по формуле доверительного интервала генерального значения yˆ ãåí. :

yi  t n2S yx hi .
В соответствии с условиями рассматриваемого примера доверительный интервал, характеризующий расходы всех путешественников, преодолевших 4500 миль
будет выглядеть как 5730,918  yˆ ãåí.  6099,885, то есть расходы всех путешественников, преодолевших расстояние в 4500 миль составят от 5730,918 до 6099,885 условных денежных единиц.
Сделайте выводы по задаче в целом.
12
Задача 2 составлена по теме “Множественная регрессия и корреляция” и предполагает построение и анализ двухфакторного уравнения линейной регрессии вида:
Y    1 X 1   2 X 2   .
Рассмотрим методику решения задачи такого типа на примере:
Компания, производящая моющие средства, предприняла рекламную акцию в
магазинах с демонстрацией антисептических свойств нового моющего средства. В
этот же период компания использовала обычную теле- и радиорекламу. Через 20
недель компания решила проанализировать сравнительную эффективность различных
видов рекламных расходов. Аналитик компании, исходя из гипотезы о линейной регрессионной взаимосвязи, оценил параметры модели следующего вида:
y  а  b1 x1  b2 x 2 ,
где
y – объем продаж моющего средства,
x1 – расходы на теле и радио рекламу,
x 2 – расходы на демонстрацию товара в магазинах.
Расходы приведены в условных денежных единицах.
Таблица 1. Исходные данные
y
Номера наблюдений
x2
x1
1
72
12
5
2
76
11
7
3
78
15
6
4
70
10
5
5
68
11
3
6
80
16
7
7
82
14
3
8
65
8
4
9
62
8
3
10
90
18
5
Пункт 1 посвящен анализу показателей тесноты связи в уравнении множественной регрессии.
Но прежде чем приступить к анализу показателей тесноты связи необходимо
рассмотреть дискриптивные (описательные статистики), которые подробно изучались в
курсах математической статистики с элементами теории вероятностей и общей теории
статистики
Таблица 2. Дискриптивные статистики
y
x1
x2
Размер выборки, n
10
10
10
Средняя арифметическая
74,3
12,3
4,8
Среднее квадратическое (стандартное) отклонение, S
8,54
3,37
1,55
Коэффициент вариации, V
0,12
0,27
0,32
Коэффициент асимметрии, As
0,35
0,31
0,19
Коэффициент эксцесса, Ex
-0,32
-0,91
-1,28
Сравнивая значения средних величин и стандартных отклонений, находим коэффициент вариации, значения которого свидетельствуют о том, что уровень варьи13
рования признаков находится в допустимых пределах (< 0,35). Значения коэффициентов асимметрии и эксцесса указывают на отсутствие значимой скошенности и остро-(плоско-) вершинности фактического распределения признаков по сравнению с их
нормальным распределением.1 По результатам анализа дискриптивных статистик
можно сделать вывод, что совокупность признаков – однородна и для её изучения
можно использовать метод наименьших квадратов (МНК) и вероятностные методы
оценки статистических гипотез.
Парный коэффициент корреляции - это линейный коэффициент корреляции, характеризующий степень тесноты линейной связи между результативным и факторным
признаками. Методика его расчета и интерпретация была изложена в пункте 3 задачи 1.
При выполнении задания необходимо выписать матрицу парных коэффициентов корреляции и сделать выводы о наличии (отсутствии) в построенной модели мультиколлинеарности факторов.
Значения линейных коэффициентов парной корреляции представлены в матрице
парных коэффициентов (таблица 3). Они определяют тесноту парных зависимостей
между анализируемыми переменными.
Таблица 3.Парные коэффициенты линейной корреляции Пирсона
y
x2
x1
y
1,0000
0,9393
0,4167
(0,0)
(0,0001)
(0,2310)
0,9393
1,0000
0,4174
x1
(0,0001)
(0,0)
(0,2301)
0,4167
0,4174
1,0000
x2
(0,2310)
(0,2301)
(0,0)
В скобках: P ( Н о : R  0)
Коэффициент корреляции между x1 и y свидетельствует о значительной и
статистически существенной линейной связи между объемом продаж моющего средства и расходами на радио и теле рекламу. Увеличение расходов на рекламу поднимает
объем продаж. Связь между x 2 и y не является статистически значимой. Кроме того, степень тесноты связи между x1 и x 2 выше, чем между x 2 и y . Таким образом,
можно сделать предварительное заключение, что расходы на демонстрацию моющего
средства в магазинах, существенно не влияют на рост объема продаж нового моющего средства.
Частные коэффициенты корреляции характеризуют тесноту связи между результативным и факторным признаками при фиксированном воздействии других факторов,
включенных в уравнение регрессии. Их можно определить, используя парные коэффициенты корреляции по следующим рабочим формулам:
Обычно статистические ППП имеют набор процедур, оценивающих числовые характеристики распределения признаков, включенных в модель. В контрольной работе необходимо привести формулы расчета
этих характеристик и их интерпретацию.
14
1
ryx1x2 
ryx2 x1 
ryx1  ryx2 rx1x2
1  r 1  r 
2
yx2
2
x1 x2
ryx2  ryx1 rx1x2
,
1  r 1  r 
2
yx1
2
x1 x2
где
ryx1x2 - частный коэффициент корреляции между результативным и первым факторным признаками при фиксированном воздействии второго факторного признака,
ryx2 x1 - частный коэффициент корреляции между результативным и вторым
факторным признаками при фиксированном воздействии первого факторного признака,
ryx1 , ryx 2 , rx1 x 2 - парные коэффициенты корреляции.
Интерпретируйте полученные значения частных коэффициентов корреляции и
поясните причины различий между значениями частных и парных коэффициентов корреляции.
Приведенные в таблице 4 линейные коэффициенты частной корреляции оценивают тесноту связи значений двух переменных, исключая влияние всех других переменных, представленных в уравнении множественной регрессии.
Таблица 4. Коэффициенты частной корреляции
y
x2
x1
y
1,0000
0,9265
0,0790
(0,0)
(0,0003)
(0,8399)
0,9265
1,0000
0,0834
x1
(0,0003)
(0,0)
(0,8311)
0,0790
0,0834
1,0000
x2
(0,8399)
(0,8311)
(0,0)
В скобках: P ( Н о : R  0)
Коэффициенты частной корреляции дают более точную характеристику тесноты зависимости двух признаков, чем коэффициенты парной корреляции, так как
«очищают» парную зависимость от взаимодействия данной пары переменных с другими переменными, представленными в модели. Наиболее тесно связаны x1 и y ,
ryx1.x2  0,9265 . Другие взаимосвязи существенно слабее. При сравнении коэффициентов парной и частной корреляции видно, что из-за влияния межфакторной зависимости между x1 и x 2 происходит некоторое завышение оценки тесноты связи между
переменными.
По этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной
зависимости меньше, чем теснота межфакторной связи.
Пункт 2. Расчет параметров линейного уравнения множественной регрессии
осуществляется обычным МНК путем решения системы нормальных уравнений. Для
уравнения с двумя объясняющими переменными система примет вид:
15
na  b1  x 1  b2  x 2   y

2
a  x1  b1  x1  b2  x1 x2   yx1

2
a  x2  b1  x1 x2  b2  x2   yx2
Поясните экономический смысл коэффициентов регрессии b1 и b2 : это показатели, характеризующие абсолютное (в натуральных единицах измерения) изменение
результативного признака при изменении факторного признака на единицу своего измерения при фиксированном влиянии второго фактора.
Результаты построения уравнения множественной регрессии представлены в
таблице 5.
Таблица 5. Результаты построения модели множественной регрессии
Независимые
КоэффициенСтандартные t - статистики Вероятность
переменные
ты
ошибки коэфслучайного
фициентов
значения
Константа
44,61
4,58
9,73
0,0001
x1
2,35
0,36
6,51
0,0003
x2
0,16
0,78
0,21
0,8399
2
R = 0,88
R2adj=0,85
F = 26,402
Prob > F = 0,0005
Уравнение имеет вид:
y = 44,61 + 2,35x1 + 0,16x2
Значения стандартной ошибки параметров представлены в графе 3 таблицы 5:
S a  4,58; S b1  0,36; S b2  0,78. Они показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Их значения используются
для расчета t-критерия Стьюдента (графа 4)
b0
b1
b
=6,51; t b2  2 =0,21.
tа 
 9,73; t b1 
S b0
S b1
S b2
В нашем примере параметр x1 является статистически значимым, а x 2 - нет.2
На это же указывает значение вероятности случайных значений параметров регрессии (графа 5), если вероятность меньше принятого за стандарт уровня  = 0,05, то
делается вывод о неслучайной природе данного значения параметра, то есть о том,
что он статистически значим и надежен. В противном случае принимается нулевая
гипотеза (H0) о случайной природе значения коэффициентов уравнения. В нашем примере для переменной х2  > 0,05 (х2=0,84), что свидетельствует о малой информативности (значимости) этой переменной.
Интерпретация коэффициентов регрессии следующая:
а - оценивает агрегированное влияние прочих (кроме учтенных в модели х1 и х2) факторов на результат y;
b1 и b2 указывают, что с увеличением х1 и х2 на единицу их значений объем продаж нового моющего средства увеличивается, соответственно, на 2,35 и 0,16 условных денежных единиц.
Пункт 3 связан с расчетом и анализом относительных показателей силы связи в
уравнении множественной регрессии - частных коэффициентов эластичности. Частные
2
Определение значимости параметров уравнения регрессии подробно рассмотрены в пункте 4 задачи1.
16
коэффициенты эластичности рассчитывают, как правило, для средних значений факторного и результативного признака:
~
xj
Эj  bj  ~ , j  i , m
y
где b j - коэффициент условно-чистой регрессии при j-м факторе,
~
x j - среднее значение j-го факторного признака;
~
y - среднее значение результативного признака,
m - число факторных признаков в уравнении множественной регрессии.
Зачастую интерпретация результатов регрессии более наглядна, если произведен расчет частных коэффициентов эластичности. Частные коэффициенты эластичности
Э yx показывают, на сколько процентов от значения своей средней ( ~y ) изменяется
x ) и при фиксированрезультат при изменении фактора xj на 1% от своей средней ( ~
j
ном воздействии на y прочих факторов, включенных в уравнение регрессии. Здесь
2,34944  12,3
Э yx1 
 0,3889%
74,3
0,164397  4,8
Э yx2 
 0,0106%
74,3
По значениям частных коэффициентов эластичности можно сделать вывод о более
сильном влиянии на результат у (объем продаж моющего средства) рекламной компании по радио и телевидению, нежели демонстрации товара в магазинах.
Пункт 4 предполагает оценку совокупного влияния факторных переменных на
результативный признак.
Оцените долю вариации результативного признака, объясненную совокупным
влиянием факторных признаков, рассчитав совокупный (нескорректированный) множественный коэффициент детерминации:
SSR
SSE
R2 
 1
,
SST
SST
n
где SSR=  ( ŷi  ~
y )2 - факторная, или объясненная моделью регрессии, сумма
i 1
квадратов,
n
y )2 - общая сумма квадратов,
SST =  ( yi  ~
i 1
n
2
SSE    yi  yˆ i 
- остаточная, или не объясненная моделью регрессии
i 1
сумма квадратов.
В нашем примере эта доля составляет 88,29% и указывает на весьма высокую
степень обусловленности вариации результата вариацией факторов. Иными словами,
на весьма тесную связь факторов с результатом.
Скорректированный множественный коэффициент детерминации
17
n 1
1 2
1 2 n  m 1
(где n – число наблюдений, m – число объясняющих переменных) определяет
тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов в модели и поэтому
может сравниваться по разным моделям с разным числом факторов. Оба коэффициента
указывают на весьма высокую детерминированность результата y в модели факторами
x 1 и x 2.
2
2
R yx
 1  (1  R yx
)
x
x
Охарактеризуйте степень тесноты связи между результативным признаком и
всеми факторными, включенными в уравнение регрессии, определив множественный
коэффициент корреляции:
R  R2 .
Пункт 5 предполагает ознакомление с методикой дисперсионного анализа по
модели множественной регрессии.
Проверьте статистическую значимость модели регрессии в целом с помощью Fкритерия Фишера. Для этого воспользуйтесь алгоритмом проверки гипотез, изложенном в указаниях к пункту 4 задачи 1, учитывая, что фактическое значение F – критерия
для уравнения множественной регрессии определяется по формуле:
SSR n  k
R2 n  k
,
Fфакт . 



SSE k  1 1  R 2 k  1
где k - общее число параметров в уравнении множественной регрессии (в случае
двухфакторной линейной регрессии k = 3).
Для проведения дисперсионного анализа и расчета фактического значения F критерия рекомендуется также заполнить таблицу результатов дисперсионного анализа:
Колеблемость результативного признака
Сумма
квадратов
За счет регрессии
Сфакт.
(SSR)
Число степеней свободы
k
Остаточная
Сост.
(SSE)
n-(k+1)
Общая
Собщ.
(SST)
n-1
Дисперсия
Dфакт. 
F-критерий
C факт. Fфакт. 
k
(MSR)
C ост.
Dост. 
n  (k  1)
(MSE)
Для нашего примера:
Таблица 6. Дисперсионный анализ модели множественной регрессии
18
Dфакт.
Dост.
Колеблемость результативного признака
Сумма
квадратов
Число степеней свободы
Дисперсия
F-критерий
За счет регрессии
579,303
2
289,651
26,402
Остаточная
76,797
7
10,971
Общая
656,100
9
Оценку надежности уравнения регрессии в целом, его параметров и показателя
тесноты связи Ryx1x2 дает F-критерий Фишера :
Fфакт .
SSR
DF(k
- 1)

SSE
DF (n  k )

579,3029
2
76,7971
7
 26,402
Вероятность случайного значения F - критерия = 24,402 составляет 0,0005,
что значительно меньше 0,05. Следовательно, полученное значение неслучайно, оно
сформировалось под влиянием существенных факторов. То есть подтверждается
статистическая значимость всего уравнения, его параметров и показателя тесноты
связи – коэффициента множественной корреляции.
Общий вывод по построенной регрессионной модели состоит в том, что на увеличение объёма продаж нового моющего средства значимо повлияла реклама на радио
и телевидении: при увеличении расходов на рекламу – возрастал объем продаж. Затраты же на демонстрацию моющего средства в магазинах не оказали существенного влияния на рост объёма продаж.
Прогноз по модели множественной регрессии осуществляется по тому же
принципу, что и для парной регрессии. Для получения прогнозных значений мы подставляем значения хi в уравнение для получения значения ŷ . Предположим, что мы хотим
узнать ожидаемый объем продаж моющего средства, при условии, что затраты на
теле и радио рекламу составят 10 условных денежных единиц, а на демонстрацию в
магазинах – 5 денежных единиц.
yˆ  44,61  2,349  10  0,164  5  68,6 (денежных единиц).
Качество прогноза – неплохое, поскольку в исходных данных таким значениям независимых переменных соответствует значение y равное 70 денежных единиц.
Мы так же можем вычислить интервал прогноза как 1   100% - доверительный интервал для ожидаемого значения y при заданных значениях независимых переменных:
yˆ  t  / 2,n( k 1)  S yx2  MSE ,
где MSE – остаточная дисперсия, а стандартная ошибка S yx2 для случая нескольких независимых переменных имеет достаточно сложное выражение, которое мы здесь не
приводим. 1   100% доверительный интервал для значения y при средних значениS (Yˆ ). Большинство пакетов
ях независимых переменных имеет вид: yˆ  t
 / 2,n(k 1)
программ рассчитывают доверительные интервалы автоматически.
19
Задачи 3, 4 и 5 посвящены теме “Временные ряды в эконометрических исследованиях”,
и, прежде всего проблеме автокорреляции уровней временного ряда и ее последствиям,
а также наличию во временном ряде тенденции.
Задача 3.
Рассмотрим методику решения задачи на практическом примере:
Имеются следующие данные о расходах семьи на товар "А" в 1994-1999 гг.:
Годы
1994
1995
1996
1997
1998
1999
Расходы на товар "А", руб.
30
35
39
44
50
53
Приступая к выполнению пункта 1, изучите вопрос об измерении автокорреляции уровней временного ряда.
Коэффициент автокорреляции первого порядка есть линейный коэффициент
корреляции между уровнями исходного временного ряда и уровнями того же ряда
сдвинутыми на один момент времени.
Его расчет производится по стандартным формулам для расчета линейного коэффициента корреляции:
ryt yt 1 
 yt yt 1 

  yt2   yt 

n

2
 yt  yt 1
n

  yt21   yt 1 

n

2




,
где yt - 1 - уровни, сдвинутые по отношению к уровням исходного ряда на 1 год.
Заметим, что расчет должен быть осуществлен для пар наблюдений ( yt , y t 1 ) ,
причем общее число пар наблюдений, по которым производится расчет, равно (n - 1).
Близкое по абсолютной величине к единице значение коэффициента автокорреляции
первого порядка свидетельствует о высокой тесноте связи между текущими и непосредственно предшествующими уровнями временного ряда или, иными словами, о
наличии во временном ряде тенденции.
В соответствии с условиями нашей задачи проведем расчеты
1994
1995
1996
1997
1998
Суммы
ry (t ) y (t 1) 
yt
yt+1
ytyt+1
yt2
yt+12
30
35
39
44
50
198
35
39
44
50
53
221
1050
1365
1716
2200
2650
8981
900
1225
1521
1936
2500
8082
1225
1521
1936
2500
2809
9991
8981 
198  221
5
2
2



  8082  198  9991  221  



5 
5  


8981  8751,6
(8082  7840,8)(9991  9768,2)
20

229,4
 0,9896.
231,8175
Коэффициент автокорреляции первого порядка равен 0,9896, что свидетельствует о тесной прямой связи между текущими и непосредственно предшествующими уровнями временного ряда.
В пункте 2 требуется определить функциональную форму и найти параметры
уравнения, наилучшим образом описывающего тенденцию (тренд). Для определения
вида тренда рассчитайте следующие показатели динамики:
а) цепные абсолютные приросты:  t  уt  уt 1 ;
б) абсолютные ускорения уровней ряда, или вторые разности:     t   t 1 ;
уt
.
у t 1
Проанализируйте полученные результаты.
Если приблизительно одинаковы цепные абсолютные приросты, то для описания тенденции временного ряда следует выбрать линейный тренд: уˆ t  a  bt .
Если примерно постоянны абсолютные ускорения уровней ряда, следует выбрать параболу второго порядка: уˆ t  a  b1t  b2 t 2 .
Если примерно одинаковы цепные коэффициенты роста, моделирование тенденции следует проводить с использованием экспоненциальной кривой: уˆ t  e a bt .
Для расчета параметров уравнения тренда примените обычный МНК. В случае
нелинейных зависимостей проведите линеаризацию исходной функции.
Дайте интерпретацию параметров тренда.
Коэффициент регрессии b в линейном тренде есть средний за период цепной
абсолютный прирост уровней ряда.
в) цепные коэффициенты роста: K t 
b
В экспоненциальной функции величина e представляет собой средний за период цепной темп роста уровней ряда.
Начальный уровень ряда в момент (период времени) t = 0 в линейном тренде
a
выражается параметром а, в экспоненциальном тренде - величиной e .
Для нашей задачи проведем следующие расчеты:.
1994
1995
1996
1997
1998
1999
yt
 t  yt  yt 1
30
35
39
44
50
53
5
4
5
6
3
    t   t 1
-1
1
1
-3
Kt 
yt
yt 1
1,1667
1,1143
1,1282
1,1364
1,0600
Очевидно, в данном случае для описания тренда можно выбрать линейную модель: yˆ t  a  bt .
Для расчета параметров уравнения тренда применим обычный МНК.
yt
n ;
(t) 2

n
yt b=
t 2
21
~
a=~
y - bt.
Если периоды или моменты времени пронумеровать так, чтобы получилось t
=0, то вышеприведенные алгоритмы существенно упростятся и превратятся в
b=
yt
;
t 2
a = ~y .
Расчеты проведем в следующей рабочей таблице.
1994
1995
1996
1997
1998
1999
Суммы
t
yt
t2
ytt
-2,5
-1,5
-0,5
0,5
1,5
2,5
0,00
30
35
39
44
50
53
251
6,25
2,25
0,25
0,25
2,25
6,25
17,5
-75
-52,5
-19,5
22
75
132,5
82,5
b=
82,5
 4,7143;
17,5
a=
251
 41,8333 .
6
Таким образом, трендовое линейное уравнение регрессии имеет вид:
yˆ t  41,8333  4,7143t .
Дадим интерпретацию параметров тренда.
Коэффициент регрессии (b) в линейном тренде показывает средний за период
цепной абсолютный прирост уровней ряда. В нашем примере b = 4,7143, следовательно расходы на товар "А" в среднем за год увеличиваются на 4,7143 руб. Свободный
член (а) в линейном тренде выражает начальный уровень ряда в момент (период времени) t = 0. В нашей нумерации t = 0 приходится на период времени между 1996 и 1997
гг., что несколько затрудняет его интерпретацию. В нашем случае а = 41,8333 руб. –
это расходы семьи на товар "А" за вторую половину 1996 и первую половину 1997 гг.
В случае нелинейных зависимостей необходимо провести линеаризацию исходной функции.
Пункт 3. Точечный прогноз по уравнению тренда - это расчетное значение переменной уt , полученное путем подстановки в уравнение тренда соответствующих
значений t. Интервальный прогноз рассчитывается в соответствии с методикой, изложенной для уравнения парной линейной регрессии (см. указания к пункту 5 задачи 1).
Дадим прогноз расходов на товар "А" на 2000 год.
В нашей нумерации 2000 год соответствует моменту времени t = 3,5. Отсюда,
yˆ t 3,5  41,8333  4,7143  3,5  58,3333 .
Следовательно, точечная оценка расходов семьи на товар "А" на 2000 год составляет 58,3333 руб.
Определим границы доверительного интервала, в котором с заданной надежностью γ будут находится расходы семьи на товар "А" в 2000 году. Общепринятый в
экономике уровень надежности γ = 1 - α = 1 - 0,05 = 0,95.
yˆ t    yt  yˆ t   ,
22
где y t -прогноз значения переменной y на момент (период) времени t;
ŷ t - точечная оценка значения переменной y на момент (период) времени t;
 - предельная ошибка прогноза.
Для того, чтобы получить интервальную оценку, определим величину предельной ошибки прогноза.
Она рассчитывается по формуле:
  t / 2  se( yˆ t ) ,
где t / 2 - табличное значение t - критерия Стьюдента для уровня значимости
α и числа степеней свободы (k = n - 2);
se ( yˆ t ) - стандартная ошибка точечного прогноза, которая, в свою очередь,
рассчитывается по формуле:
se( yˆ t ) 
 ( yt  yˆ t ) 2 1  1  3(n  2l  1) 2  ,
n2


n3  n
n


где l - длина периода упреждения (срок прогноза).
Расчеты проведем в рабочей таблице.
1994
1995
1996
1997
1998
1999
Суммы
t
yt
ŷ t
y t  yˆ t
( yt  yˆ t ) 2
-2,5
-1,5
-0,5
0,5
1,5
2,5
0,00
30
35
39
44
50
53
251
30,0476
34,7619
39,4762
44,1905
48,9048
53,6190
197,3810
-0,0476
0,2381
-0,4762
-0,1905
1,0952
-0,6190
0,0000
0,0023
0,0567
0,2268
0,0363
1,1995
0,3832
1,9048
1,9048  1 3(6  2  2  1) 2 
1  
  1,0519 .
se( yˆ t ) 
6  2  6
63  6

Табличное значение t - критерия Стьюдента для уровня значимости α = 0,05 и числа
степеней свободы k = 6 – 2 = 4 составляет 2,78, т.е. t / 2 =2,78.
Отсюда,
  2,78  1,0519  2,9244.
Таким образом,
58,3333  2,9244  yt  58,3333  2,9244 ;
55,4089  yt  61,2577 .
С вероятностью 0,95 можно ожидать, что в 2000 году расходы семьи на товар "А"
будут находиться в пределах от 55,4089 до 61,2577 руб.
Обратите внимание на то, что приведенные формулы верны только для уравнения
парной регрессии, линейной по параметрам.
23
Задача 4.
Рассмотрим методику решения задачи на примере:
Имеются следующие данные о величине дохода в расчете на одного члена семьи
в процентах к 1994 году и о расходах семьи на товар "А" в 1994-1999 гг.:
Годы
1994
1995
1996
1997
1998
1999
Расходы на товар "А", руб.
30
35
39
44
50
53
Доход на одного члена семьи в про100
103
105
109
115
118
центах к 1994 году, %
Пункт 1. Определение функциональной формы трендового уравнения регрессии описано в пункте 2 к задаче 3.
Пункты 2-3. При измерении корреляции между двумя временными рядами следует учитывать возможность наличия ложной корреляции, обусловленной простым сопутствием временных рядов. Для того чтобы устранить ложную корреляцию, следует
определять степень тесноты связи не самих уровней временных рядов, а их последовательных (первых или вторых) разностей или отклонений от трендов (если последние не
содержат тенденции).
Сделайте вывод о наличии или отсутствии ложной корреляции при разных способах измерения связи между исследуемыми временными рядами, поясните причины
существования ложной корреляции.
По данным примера рассчитаем коэффициент корреляции между расходами на
товар "А" и доходом на одного члена семьи по исходным уровням ряда:
xy
n
rxy 
2
  2 x   2 y 2  
  x 
 y 




n
n



Заметим, что расчет может быть осуществлен и по другим формулам.
Промежуточные расчеты проведем в рабочей таблице.
Годы
y
x
xy
y2
x2
1994
30
100
3000
900
10000
1995
35
103
3605
1225
10609
1996
39
105
4095
1521
11025
1997
44
109
4796
1936
11881
1998
50
115
5750
2500
13225
1999
53
118
6254
2809
13924
Суммы
251
650
27500
10891
70664
xy 
27500 
rxy 
2

 10891  251

6

251  650
6

6502
 70664 

6






27500  27191,6667
(10891  10500,1667)(70664  70416,6667)
 0,9917.
Близкое к единице значение коэффициента корреляции свидетельствует о тесной прямой связи между расходами на товар "А" и доходом на одного члена семьи.
24
Однако, учитывая, что расчет был произведен по уровням временного ряда,
корреляция между изучаемыми признаками может быть вызвана простым сопутствием явлений во времени.
Для того, чтобы исключить тенденцию, рассчитаем коэффициент корреляции
по первым разностям.
Промежуточные расчеты проведем в рабочей таблице.
Годы
1994
1995
1996
1997
1998
1999
Суммы
y
30
35
39
44
50
53
251
x
100
103
105
109
115
118
650
Δy
Δx
ΔxΔy
Δy2
Δx2
5
4
5
6
3
23
3
2
4
6
3
18
15
8
20
36
9
88
25
16
25
36
9
111
9
4
16
36
9
74
xy
.
n

2
2 



  x 2  x   y 2  y   

n 
n  

xy 
rxy
23  18
5


2
2 




 111  23  74  18   

5 
5  

88 
rxy
.
88  82,8
 0,7518
111  105,874  64,2
Коэффициент корреляции между расходами на товар "А" и доходом на одного
члена семьи, рассчитанный по первым разностям, показывает не столь тесную связь,
как коэффициент, рассчитанный по уровням ряда динамики.
Расчет коэффициента корреляции по первым разностям позволяет устранить
тенденцию, зависимость между x и y, обусловленную сопутствием рядов во времени.
Рассчитаем коэффициент корреляции между расходами на товар "А" и доходом на одного члена семьи по отклонениям от тренда.
Прежде, чем рассчитывать отклонения от тренда, определим функциональную
форму трендовых уравнений регрессии расходов на товар "А" и дохода на одного члена
семьи.
Слабая колеблемость первых разностей (цепных абсолютных приростов) позволяет говорить о линейной форме обеих моделей.
Трендовое линейное уравнение регрессии расходов на товар "А" имеет вид (расчеты см. в методических указаниях к решению задачи 3):
yˆ t  41,8333  4,7143t .
Аналогично рассчитаем параметры трендового линейного уравнения регрессии
доходов в расчете на одного члена семьи:
Годы
1994
1995
1996
t
-2,50
-1,5
-0,5
x
100
103
105
25
xt
-250
-154,5
-52,5
t2
6,25
2,25
0,25
1997
1998
1999
Суммы
0,5
1,5
2,5
0
109
115
118
650
54,5
172,5
295
65
0,25
2,25
6,25
17,5
65
650
 3,7143; a =
 108,3333 .
17,5
6
Таким образом, трендовое линейное уравнение регрессии имеет вид:
yˆ t  108,3333  3,7143t .
Перейдем к расчету коэффициента корреляции по отклонению от тренда согласно формуле:
 ( yt  yˆ t )( xt  xˆt )
rex e y 
 ( yt  yˆ t ) 2  ( xt  xˆt ) 2
b=
1994
1995
1996
1997
1998
1999
Суммы
yt
ŷ t
30
35
39
44
50
53
251
30,0476
34,7619
39,4762
44,1905
48,9048
53,6190
197,3810
y t  yˆ t ( yt  yˆ t ) 2
-0,0476
0,2381
-0,4762
-0,1905
1,0952
-0,6190
0,0000
re y ex 
t
t
0,0023
0,0567
0,2268
0,0363
1,1995
0,3832
1,9048
xt
x̂ t
xt  xˆ t ( xt  xˆ t ) 2
( y t  yˆ t ) 
( xt  xˆ t )
100
103
105
109
115
118
650
99,0476
102,7619
106,4762
110,1905
113,9048
117,6190
532,3810
0,9524 0,9070
0,2381 0,0567
-1,4762 2,1791
-1,1905 1,4172
1,0952 1,1995
0,3810 0,1451
0,0000 5,90476
-0,04535
0,056689
0,702948
0,226757
1,199546
-0,23583
1,90476
1,90476
5,904761,9048
 0,568 .
Величина этого коэффициента корреляции еще более убедительно свидетельствует о сопутствии рядов во времени.
Пункт 4. По аналогии с коэффициентами корреляции параметры уравнения регрессии по временным рядам определяют также не по исходным их уровням, а по последовательным разностям, либо отклонениям от тренда.
Обратите внимание на интерпретацию параметров, полученных уравнений регрессии:
- если уравнение регрессии построено по первым разностям, то коэффициент регрессии b характеризует изменение прироста результативного признака при изменении
прироста факторного признака на единицу.
Сделайте общий вывод о наличии и тесноте причинно-следственной связи между изучаемыми временными рядами, укажите ее направление.
Определим параметры уравнения парной линейной регрессии по первым разностям.
Расчет осуществляется обычным методом наименьших квадратов:
Годы
y
x
Δy
Δx
ΔxΔy
Δy2
1994
30
100
1995
35
103
5
3
15
25
26
Δx2
9
1996
1997
1998
1999
Суммы
39
44
50
53
251
105
109
115
118
650
4
5
6
3
23
2
4
6
3
18
18  23
5  88  82,8  0,5652;
b=
(18) 2 74  64,8
74 
5
Отсюда, модель имеет вид:
88 -
a=
8
20
36
9
88
16
25
36
9
111
4
16
36
9
74
23
18
- 0,5652   2,5652.
5
5
y  2,5652  0,5652 x.
Коэффициент регрессии b = 0,5652 означает, что с изменением прироста душевого дохода на 1 процентный пункт расходы на товар "А" изменяются с ускорением, равным 0,5652 руб.
27
Задача 5 посвящена методике выявления сезонной компоненты в рядах динамики, построению моделей с аддитивной и мультипликативной сезонными компонентами
и прогнозированию по этим моделям.
Для выявления тренда и наличия сезонной компоненты постройте график ряда
динамики (пункт 1). При построении графика ряда динамики по оси абсцисс откладываются временные промежутки, а по оси ординат – уровни ряда.
Приступая к выполнению пункта 2, изучите вопрос об особенностях анализа сезонных колебаний.
Сезонная колеблемость в рядах динамики может иметь аддитивный и мультипликативный характер.
Если сезонная вариация постоянна в различных временных периодах, то для
анализа временного ряда подходит модель с аддитивной компонентой.
Если сезонная вариация не является константой, например, увеличивается с возрастанием значений тренда, то для анализа лучше подходит модель с мультипликативной компонентой, в которой значения сезонной компоненты представляют собой определенную долю трендового значения.
В зависимости от особенностей сезонной вариации сделайте выбор между моделями с аддитивной и мультипликативной компонентами.
Каждой из этих моделей соответствуют различные методы расчета сезонной
компоненты тренда, использующие сочетание методов скользящего среднего и линейной регрессии.
Следует помнить, что поскольку сезонные колебания характеризуются относительно небольшими временными интервалами, то прогнозирование по моделям с сезонной компонентой – также краткосрочное.
Модель с аддитивной компонентой. Если сезонная компонента переменной А
– постоянна, модель фактических значений переменной А можно представить следующим образом:
Фактическое значение =
= Трендовое значение + Сезонная вариация + Ошибка,
то есть:
A = T + S + E.
Модель с мультипликативной компонентой. Если значение сезонной компоненты переменной А, не является константой, а представляет собой определенную долю трендового значения, т.е. значения сезонной компоненты увеличиваются с возрастанием значений тренда, модель фактических значений переменной А можно представить следующим образом:
Фактическое значение =
= Трендовое значение  Сезонная вариация  Ошибка,
т.е.
А = T  S  E.
В моделях, как с аддитивной, так и с мультипликативной компонентой общая
процедура анализа примерно одинакова:
Шаг 1. Расчет значений сезонной компоненты.
Шаг 2. Десезонализация данных. Для модели с аддитивной компонентой он состоит в вычитании сезонной компоненты из фактических значений. Для модели с мультипликативной компонентой – в расчете отношений между фактическими значениями
и сезонной составляющей. Расчет тренда на основе полученных десезонализированных
данных.
Шаг 3. Расчет ошибок как разности между фактическими и трендовыми значениями. В мультипликативной модели можно рассчитать ошибки еще и как отношение
между фактическими и трендовыми значениями.
28
Шаг 4. Расчет среднего линейного отклонения или среднеквадратической ошибки для обоснования соответствия модели исходным данным или для выбора из множества моделей наилучшей.
Для того чтобы элиминировать влияние сезонной компоненты (пункт 3) воспользуйтесь методом скользящей средней. Если сезон состоит из 4-х кварталов (год),
следует провести сглаживание по 4-м точкам, если сезон состоит из 7-и дней (неделя)
следует провести сглаживание по 7-и точкам и т.д.
Значения уровней ряда, сглаженные по четному числу точек необходимо центрировать.
Множество скользящих средних представляет наилучшую оценку искомого
тренда.
Процедуры сглаживания и центрирования одинаковы при построении моделей с
аддитивной и мультипликативной компонентами.
Полученные значения тренда используйте для нахождения оценок сезонной
компоненты.
Для модели с аддитивной компонентой:
A – T = S + E.
Для модели с мультипликативной компонентой:
А/Т= S  E.
Найдите средние значения сезонных оценок для каждого года (недели и т.п.).
Эта процедура позволяет уменьшить некоторые значения ошибок.
Скорректируйте средние значения.
Для модели с аддитивной компонентой корректировка состоит в увеличении
или уменьшении средних значений на одно и то же число таким образом, чтобы их общая сумма была равна нулю. Это необходимо для того, чтобы усреднить значения сезонной компоненты в целом за период. Обычно корректирующий фактор рассчитывается путем деления суммы оценок сезонных компонент на число сезонов.
В мультипликативной модели значения сезонной компоненты - это относительные величины. Поэтому необходимо, чтобы их сумма была равна числу сезонов, а не
нулю, как в случае с аддитивной моделью. Если это не так, произведите корректировку
значений сезонной компоненты.
Шаг 2 состоит в десезонализации исходных данных (пункт 4).
В модели с аддитивной компонентой она заключается в вычитании соответствующих значений сезонной компоненты из фактических значений данных за каждый
квартал (день и т.п.), то есть:
A – S = T + E.
В модели с мультипликативной компонентой процедура десезонализации осуществляется по формуле:
А/S= T  E.
Новые оценки тренда, которые все еще содержат ошибку, используйте для построения модели основного тренда. Нанесите эти значения на исходную диаграмму,
сделайте вывод о наличии тренда.
Пункт 5 посвящен подбору уравнения тренда с аддитивной или мультипликативной компонентой. При этом выбор функциональной формы тренда осуществляется,
исходя из общих принципов, изложенных в пункте 2 к задаче 3.
Предположим, например, что тренд – линейный.
Уравнение линейного тренда имеет вид:
T  a  bx ,
где х – порядковый номер квартала,
а и b – параметры уравнения парной регрессии.
29
Поскольку предполагается, что тренд имеет линейный характер, то значения параметров линии, аппроксимирующей тренд, найдите методом наименьших квадратов:
где
y = T + E,
n
b
 x  ~x  y
i 1
i
i
~
y 
n
2
 xi  ~x 
,
i 1
a  ~y  b~
x .
Пункт 6 заключается в расчете ошибки (Е), среднего абсолютного отклонения
(MAD) и среднеквадратической ошибки (MSE) модели.
Расчет этих показателей соответствует шагу 3 алгоритма и предшествует составлению прогноза.
Осуществите расчет ошибок или остатка.
В аддитивной модели он осуществляется по формуле:
Е = А - S - Т.
В мультипликативной:
Е = А/(Т  S)
или
Е = А - (Т  S).
Найдите меру соответствия модели исходным данным, т.е. определите ту часть
колеблемости уровней ряда, которую невозможно объяснить с помощью построенной
модели.
Для этого используйте среднее абсолютное отклонение (mean absolute deviation MAD) и среднеквадратическую ошибку (mean square error - MCE):
MAD 
 Фактические значения - Прогнозные значения
n
 E 
MSE 

 Et
n
;
2
t
.
n
Целесообразно использовать обе меры, так как последняя из них резко возрастает при наличии высоких ошибок.
Пункт 7 состоит в прогнозировании на основании полученных моделей.
Прогнозные значения по модели с аддитивной компонентой рассчитайте по
формуле:
F = T + S.
В модели с мультипликативной компонентой используйте следующий алгоритм:
F= Т  S.
Не следует забывать: чем более отдаленным является период упреждения, тем
меньшей оказывается обоснованность прогноза.
Рассмотрим практическую реализацию методики решения задачи для модели с
аддитивной компонентой.
В таблице 1 представлено количество продукции, проданной компанией FORA
LTD в течение последних 13 кварталов.
Таблица 1. Количество продукции, проданной в течение последних 13 кварталов
ДАТА
Количество
30
проданной продукции, тыс. шт.
239
201
182
297
Январь - март 1996
Апрель – июнь
Июль – сентябрь
Октябрь – декабрь
Январь - март 1997
Апрель – июнь
Июль – сентябрь
Октябрь – декабрь
324
278
257
384
Январь - март 1998
Апрель – июнь
Июль – сентябрь
Октябрь – декабрь
401
360
335
462
Январь - март 1999
481
9
19
9
т
ма
р
-
рь
Ян
ва
Ок
тя
бр
ь
–
–
се
де
ка
бр
ь
бр
ь
ь
нт
я
ию
н
8
–
19
9
ль
Ию
ль
-
Ап
ре
ма
р
т
де
–
рь
Ян
ва
бр
ь
–
Ок
тя
Ию
ль
ка
бр
ь
бр
ь
ь
нт
я
ию
н
се
–
19
9
ль
т
Ап
ре
ма
р
рь
-
–
Ян
ва
бр
ь
7
ка
бр
ь
бр
ь
де
нт
я
се
Ок
тя
Ию
ль
–
ль
Ап
ре
рь
-
ма
р
т
–
19
9
ию
н
6
ь
600
500
400
300
200
100
0
Ян
ва
количество проданной продукции, тыс. шт.
Построим график, позволяющий сделать выводы о типе модели:
Стабильность сезонной компоненты указывает на то, что модель с аддитивной компонентой подходит для анализа этого временного ряда. То есть фактические
объемы продаж можно выразить следующим образом:
A=T+S+E
Для того чтобы элиминировать влияние сезонной компоненты воспользуемся
методом скользящей средней, которую рассчитаем с интервалом в три месяца. Этот
расчет и все последующие проведем в таблице 2.
Таблица 2 . Расчет по 4 точкам центрированных скользящих средних значений
тренда для модели A – T = S + E
ДАТА
Объем
Итого за
Скользящая Центриро- Оценка
продаж,
4 кварта- средняя за
ванная
сезонной
тыс.шт.
ла
4 квартала скользящая компосредняя
ненты
A-T=S+E
31
Январь - март 239
1996
Апрель – июнь
201
919
Июль – сентябрь
Октябрь – декабрь
Январь
1997
-
229,75
182
1004
251
1081
270,25
297
март 324
1156
Апрель – июнь
278
Июль – сентябрь
257
384
1480
Июль – сентябрь
Октябрь – декабрь
Январь
1999
-
279,6
+44,4
299,9
-21,9
320,4
-63,4
340,3
+43,8
360,2
+40,8
379,8
-19,8
399,5
-64,5
350,5
март 401
Апрель – июнь
+36,4
330
1402
-
260,6
310,75
1320
Январь
1998
-58,4
289
1243
Октябрь – декабрь
240,4
370
360
1558
389,5
1638
409,5
335
462
март 481
Просуммировав первые 4 значения, получим общий объем продаж в 1996 году.
Разделив эту сумму на 4, найдем средний объем продаж в каждом квартале 1996 года:
(239 + 201 + 182 + 297)/4 = 299,75.
Полученное значение уже не содержит сезонной компоненты, так как представляет собой среднюю величину за год. У нас появилась оценка значения тренда для
середины года, то есть для точки, лежащей в середине между кварталами II и III. Последовательно продвигаясь вперед с шагом в один квартал, рассчитаем средние квартальные значения для промежутков: апрель 1996 – март 1997 (251), июль 1996 – июнь
1997 (270,25) и т.д. Данная процедура позволяет генерировать скользящие средние по 4
точкам исходного множества данных. Получаемое таким образом множество скользящих средних представляет собой наилучшую оценку искомого тренда.
Теперь полученные значения тренда можно использовать для нахождения оценок сезонной компоненты. Мы рассчитываем:
A – T = S + E.
К сожалению, оценки значений тренда, получаемые в результате расчета
скользящих средних по 4 точкам, относятся к несколько иным моментам времени, чем
фактические данные. Первая оценка, равная 229,75, представляет собой точку, совпадающую с серединой 1996 года, то есть лежит в центре промежутка фактических
объемов продаж во II и III кварталах. Вторая оценка, равная 251, лежит между фактическими значениями в III и IV кварталах. Нам же необходимы десезонализированные
32
средние значения, соответствующие тем же интервалам времени, что и фактические
значения за квартал. Положение десезонализированных средних во времени сдвигается
путем дальнейшего расчета средних для каждой пары значений. Найдем среднюю из
первой и второй оценок, центрируя их июнь-сентябрь 1996 года, т.е.
(229,75 + 251)/2 = 240,4.
Это и есть десезонализированная средняя за июль-сентябрь 1996 г. Эту десезонализированную величину, которая называется центрированной скользящей средней,
можно непосредственно сравнивать с фактическим значением за июль-сентябрь 1996
года, равным 182. Отметим, что сглаживание по 4-м точкам приводит к потере оценок тренда за первые два или последние два квартала временного ряда.
После расчетов в таблице 2. мы имеем оценки сезонной компоненты, которые
включают в себя ошибку или остаток. Прежде чем мы сможем использовать сезонную компоненту, нужно пройти два следующих этапа. Найдем средние значения сезонных оценок для каждого сезона года. Расчеты приведены в таблице 3.
Таблица 3. Расчет средних значений сезонной компоненты
Номер квартала
ГОД
1
2
3
4
1996
1997
1998
Итого
Среднее значение
Оценка сезонной
компоненты
Скорректированная
сезонная компонента
+44,4
+40,8
+85,2
85,2  2
-21,9
-19,8
-41,7
-41,7  2
-58,4
-63,4
-64,5
-186,3
-186,3  3
+36,4
43,8
+80,2
80,2  2
+42,6
-20,8
-62,1
+40,1
+42,6
-20,7
-62,0
+40,1
Сумма=- 0,2
Сумма =
0
Эта процедура позволяет уменьшить некоторые значения ошибок. Наконец,
скорректируем средние значения, увеличивая или уменьшая их на одно и то же число
таким образом, чтобы их общая сумма была равна нулю. Это необходимо, чтобы
усреднить значения сезонной компоненты в целом за год. Обычно корректирующий
фактор рассчитывается путем деления суммы оценок сезонных компонент на число
сезонов. В нашем же примере оценки второго и третьего кварталов мы округлили до
ближайшего большего числа.
Значения скорректированной сезонной компоненты подтверждают наши выводы, сделанные на основе диаграммы. Объемы продаж за два зимних месяца превышают среднее трендовое значение приблизительно на 40 тыс. шт., а объемы продаж за
два летних месяца ниже средних на 21 и 62 тыс. шт. соответственно.
Аналогичная процедура применима при определении сезонной вариации за любой
промежуток времени. Если, например, в качестве сезона выступают дни недели, для
элиминирования влияния ежедневной “сезонной компоненты” также рассчитывают
скользящую среднюю, но уже не по четырем, а по семи точкам. Эта скользящая средняя представляет собой значение тренда в середине недели, то есть в четверг, таким
образом, необходимость в центрировании отпадает.
Шаг 2 состоит в десезонализации исходных данных. Она заключается в вычитании соответствующих значений сезонной компоненты из фактических значений
данных за каждый квартал, то есть A – S = T + E, что показано в таблице 4.
33
Таблица 4 . Расчет десезонализированных данных
Номер
Объем
Сезонная
ДАТА
квартала продаж,
компонента
тыс.шт.
Январь - март
1996
Апрель – июнь
Июль – сентябрь
Октябрь – декабрь
Январь - март
1997
Апрель – июнь
Июль – сентябрь
Октябрь – декабрь
Январь - март
1998
Апрель – июнь
Июль – сентябрь
Октябрь – декабрь
Январь - март
1999
1
239
+42,6
Десезонализированный объем продаж, Тыс. шт.
A–S=T+E
196,4
2
3
4
5
201
182
297
324
-20,7
-62,0
+40,1
+42,6
221,7
244,0
256,9
281,4
6
7
8
9
278
257
384
401
-20,7
-62,0
+40,1
+42,6
298,7
319,0
343,9
358,6
10
11
12
13
360
335
462
481
-20,7
-62,0
+40,1
+42,6
380,7
397,1
421,9
438,4
Новые оценки тренда, которые все еще содержат ошибку, можно использовать для построения модели основного тренда. Если нанести эти значения на исходную диаграмму, то можно сделать вывод о существовании явного линейного тренда
Уравнение линии тренда имеет вид:
T  a  bx ,
где х – порядковый номер квартала,
а и b – параметры уравнения парной регрессии. Поскольку мы нашли, что тренд
имеет линейный характер, то значения параметров линии, аппроксимирующей тренд,
найдем методом наименьших квадратов.
где y = T + E,
n
x  ~x  y  ~y 
b

i
i 1
i
n
 x
i 1
i
~
x
,
a  ~y  b~
x .
2
Подставив значения из последних колонок таблицы 4 в соответствующие формулы, получим: b  19 ,978 , a  180 ,046 .
Следовательно, уравнение модели тренда имеет следующий вид (с округлением
значений коэффициентов регрессии до ближайших целых значений):
Трендовое значение объема продаж, тыс. шт. = 180,0 + 20,0 * номер квартала.
Шаг 3 нашего алгоритма, предшествующий составлению прогноза состоит в
расчете ошибок или остатка. Наша модель имеет следующий вид:
A = T + S + E.
Значение S было найдено в таблице 2, а значение T в таблице 3. Вычитая каждое значение из фактических объемов продаж, получим значения ошибок.
34
Таблица 5. Расчет ошибок для модели с аддитивной компонентой
Дата
Номер
Объем
Сезонная
Трендовое
кварта- продаж,
компонента значение,
ла
Тыс. шт.
тыс, шт
Январь - март
1
239
+42,6
200
1996
Апрель – июнь
2
201
-20,7
220
Июль – сентябрь
3
182
-62,0
240
Октябрь – декабрь
4
297
+40,1
260
Январь - март
5
324
+42,6
280
1997
Апрель – июнь
6
278
-20,7
300
Июль – сентябрь
7
257
-62,0
320
Октябрь – декабрь
8
384
+40,1
340
Январь - март
9
401
+42,6
360
1998
Апрель – июнь
10
360
-20,7
380
Июль – сентябрь
11
335
-62,0
400
Октябрь – декабрь 12
462
+40,1
420
Январь - март 13
481
+42,6
440
1999
Ошибка,
тыс. шт.
-3,6
+1,7
+4,0
-3,1
+1,4
-1,3
-1,0
+3,9
-1,6
+0,7
-3,0
+1,9
-1,6
Как и в случае линейной регрессии для того, чтобы найти меру соответствия
модели исходным данным, необходимо вычислить значения ошибок (остатков) модели,
то есть той части значения наблюдения, которую невозможно объяснить с помощью
построенной модели. Для этого применяют среднее абсолютное отклонение (mean
absolute deviation - MAD) и среднеквадратическую ошибку (mean square error - MCE).
Целесообразно использовать обе меры, так как последняя их этих мер резко
возрастает при наличии высоких ошибок.
Мы можем использовать в шаге 4 последний столбец таблицы 5 для расчета
MAD и MSE.
E t 2 78 ,85
E i  28 ,6



MSE 

 6 ,1
MAD 

 2 ,2
n
13
n
13
;
В нашем случае ошибки достаточно малы и составляют от 1 до 3% от уровней
ряда. Тенденция, выявленная по фактическим данным, достаточно устойчива и позволяет получить хорошие краткосрочные прогнозы.
Прогнозные значения по модели с аддитивной компонентой рассчитывают как:
F=T+S (тыс. шт. за квартал),
где трендовое значение Т=180+20номер квартала, а сезонная компонента S
составляет +42,6 в январе-марте, -20,7 в апреле-июне, 62,0 в июле-сентябре и +40,1 в
октябре-декабре.
Порядковый номер квартала, охватывающего ближайшие три месяца с апреля
по июль 1999 г., равен 14, таким образом, прогнозное трендовое значение составит:
Т14=180+2014=460 (тыс. шт. за квартал).
Соответствующая сезонная компонента равна –20,7 тыс. шт. Следовательно,
прогноз на этот квартал определяется как:
F (апрель-июнь 1999г.)=460-20,7=439,3 тыс. шт.
35
Не следует забывать: чем более отдаленным является период упреждения, тем
меньшей оказывается обоснованность прогноза. В данном случае мы предполагаем, что
тенденция, обнаруженная по ретроспективным данным, распространяется и на будущий
период. Для сравнительно небольших периодов упреждения такая предпосылка может
действительно иметь место, однако ее выполнение становится менее вероятным по мере сопоставления прогнозов на более отдаленную перспективу.
Рассмотрим практическую реализацию методики решения задачи для модели с
мультипликативной компонентной.
В некоторых временных рядах значение сезонной компоненты не является константой, а
представляет собой определенную долю трендового значения. Таким образом, значения сезонной компоненты увеличиваются с возрастанием значений тренда.
Пример 2. Компания LORA Ltd осуществляет реализацию нескольких видов продукции. Объемы продаж одного из продуктов за последние 13 кварталов представлены
в таблице 6.
Таблица 6. Квартальные объемы продаж компании LORA Ltd
Дата
Номер квартала
Количество проданной продукции, тыс. шт.
Январь-март 1996
1
70
Апрель-июнь
2
66
Июль-сентябрь
3
65
Октябрь-декабрь
4
71
Январь-март 1997
5
79
Апрель-июнь
6
66
Июль-сентябрь
7
67
Октябрь-декабрь
8
82
Январь-март 1998
9
84
Апрель-июнь
10
69
Июль-сентябрь
11
72
Октябрь-декабрь
12
87
Январь-март 1999
13
94
нв
ар
ьм
ар
т
19
Ап
96
ре
ль
И
-и
ю
ю
ль
нь
-с
О
е
кт
нт
яб
яб
рь
рь
Я
д
нв
ек
ар
аб
ьрь
м
ар
т
19
Ап
97
ре
ль
И
-и
ю
ю
ль
нь
-с
О
е
кт
нт
яб
яб
рь
рь
Я
де
нв
к
ар
аб
ьрь
м
ар
т
19
Ап
98
ре
ль
И
-и
ю
ю
ль
нь
се
О
кт
нт
яб
яб
рь
рь
Я
де
нв
ка
ар
бр
ьм
ь
ар
т
19
99
100
90
80
70
60
50
40
30
20
10
0
Я
количество проданной продукции,
тыс. шт
Построим график, позволяющий сделать выводы о типе модели:
36
Объем продаж этого продукта так же, как и в предыдущем примере, подвержен
сезонным колебаниям, и значения его в зимний период выше, чем в летний. Однако размах вариации фактических значений относительно линии тренда постоянно возрастает. К таким данным следует применять модель с мультипликативной компонентной:
Фактическое значение = Трендовое значение  Сезонная вариация  Ошибка,
т.е.
А=T  S  E
В нашем примере есть все основания предположить существование линейного
тренда, но чтобы полностью в этом убедиться, проведем процедуру сглаживания
временного ряда.
В сущности эта процедура ничем не отличается от той, которая применялась для
аддитивной модели. Так же вычисляются центрированные скользящие средние для
трендовых значений, однако оценки сезонной компоненты представляют собой коэффициенты, полученные по формуле А/Т= S  E. Результаты расчетов приведены в
табл. 7.
Таблица 7. Расчет значений сезонной компоненты для LORA Ltd
Дата
Номер квар- Объем про- Скользящая Центриро- Коэффициент
тала
даж, тыс.
средняя за
ванная
сезонности
шт. А
четыре
скользящая А/Т= S  E.
квартала
средняя
1
2
3
4
5
6
Январь-март
1
70
1996
Апрель-июнь
2
66
68
Июль3
65
70,25
69,13
0,940
сентябрь
Октябрь4
71
70.25
70,25
1,011
декабрь
Январь-март
5
79
70,75
70,50
1,121
1997
Апрель-июнь
6
66
73,50
72,13
0,915
Июль7
67
74,75
74,13
0,904
сентябрь
Октябрь8
82
75,50
75,13
1,092
декабрь
Январь-март
9
84
76,75
76,13
1,103
1998
Апрель-июнь
10
69
78
77,38
0,892
Июль11
72
80,50
79,25
0,909
сентябрь
Октябрь12
87
декабрь
Январь-март
13
94
1999
Значения сезонных коэффициентов получены на основе квартальных оценок по
аналогии с алгоритмом, который применялся для аддитивной модели. Так как значения
сезонной компоненты - это коэффициенты, а число сезонов равно четырем, необходи37
мо, чтобы их сумма была равна четырем, а не нулю, как в предыдущем случае. (Если
бы в исходных данных предполагалось семь сезонов в течение недели по одному дню
каждый, то общая сумма значений сезонной компоненты должна была бы равняться
семи). Если эта сумма не равна четырем, производится корректировка значений сезонной компоненты точно таким же образом, как это уже делалось ранее. В таблице
оценки, рассчитанные в последнем столбце предшествующей табл. 8, расположены
под соответствующим номером квартала.
Таблица 8.Расчет значений сезонной компоненты для LORA Ltd
Год
Номер квартала
1
2
3
4
1996
0,940
1,011
1997
1,121
0,915
0,904
1,092
1998
1,103
0,892
0,909
Итого
2,224
1,807
2,77753
2,103
Среднее значение
2,224  2 1,807  2 2,753  2 2,103  2
Оценка сезонной компо1,112
0,903
0,918
1,051
Сумма
ненты
=3,984
Скорректированная
се1,116
0,907
0,922
1,055
Сумма
зонная компонента
=0
Как показывают оценки, в результате сезонных воздействий объемы продаж в январе-марте увеличиваются на 11,6 % соответствующего значения тренда (1,116).
Аналогично сезонные воздействия в октябре-декабре приводят к увеличению объема
продаж на 5,5 % от соответствующего значения тренда. В двух других кварталах
сезонные воздействия состоят в снижении объемов продаж, которое составляет 90,7
и 92,2 % от соответствующих трендовых значений.
После того, как оценки сезонной компоненты определены, можем приступить к
процедуре десезонализации по формуле А/S= T  E. Результаты расчетов этих оценок
значений тренда приведены в табл. 9.
Таблица 9. Расчет уравнения тренда для компании LORA Ltd
Дата
Номер
Объем проКоэффициент
Десезонализированный
квартала даж, тыс.
сезонности, S
объем продаж, тыс.
шт., А
шт. А/T= S  E
Январь-март
1
70
1,116
62,7
1996
Апрель-июнь
2
66
0,907
72,8
Июль-сентябрь
3
65
0,922
70,6
Октябрь4
71
1,055
67,3
декабрь
Январь-март
5
79
1,116
70,8
1997
Апрель-июнь
6
66
0,907
72,8
Июль-сентябрь
7
67
0,922
72,7
Октябрь8
82
1,055
77,7
декабрь
Январь-март
9
84
1,116
75,2
1998
38
Апрель-июнь
10
69
0,907
76,1
Июль-сентябрь
11
72
0,922
78,2
Октябрь12
87
1,055
82,4
декабрь
Январь-март
13
94
1,116
84,2
1999
Теперь нужно принять решение о том, какой вид будет иметь уравнение тренда.
Очевидно, что линия тренда - не кривая, наоборот, она несколько больше напоминает
прямую, хотя отдельные точки, особенно значения за 1996 г, расположены хаотически. Предположим для простоты, что тренд линейный, и для расчета параметров
прямой, наилучшим образом его аппроксимирующей, будем применять метод
наименьших квадратов, который дает следующий результат:
Т = 64,6 + 1,36  номер квартала (тыс. шт. в квартал).
Это уравнение будем использовать в дальнейшем для расчета оценок трендовых
объемов продаж на каждый момент времени.
Итак, мы нашли значения тренда и сезонной компоненты. Теперь мы можем использовать их для того, чтобы рассчитать ошибки в прогнозируемых по модели объемах продаж Т  S по сравнению с фактическими значениями А. В табл.10 эти ошибки
рассчитаны как отношение Е = А/(Т  S).
Для каждого года ошибки достаточно велики, что видно из графика десезонализированных значений. Однако, начиная и первого квартала 1997 г., величина ошибки составляет в среднем 2-3 % от фактического значения, и можно сделать вывод о соответствии построенной модели фактическим данным.
Дата
Январьмарт
1996
Апрельиюнь
Июльсентябрь
Октябрьдекабрь
Январьмарт
1997
Апрельиюнь
Июльсентябрь
Октябрьдекабрь
Таблица 10.Расчет ошибок для компоненты LORA Ltd.
Номер Объем Сезонная Трендовое
Ошибка
квар- продаж, композначение,
тала
тыс.
нента, тыс. шт., Т
шт. А
S
Т S
А/(Т  S).
1
70
1,116
66,0
73,7
0,95
А-(Т  S).
-3,7
2
66
0,907
67,3
61,0
1,08
+5,0
3
65
0,922
68,7
63,3
1,03
+1,7
4
71
1,055
70,0
73,9
0,96
-2,9
5
79
1,116
71,4
79,7
0,99
-0,7
6
66
0,907
72,8
66,0
1,00
0
7
67
0,922
74,1
68,3
0,98
-1,3
8
82
1,055
755,5
79,7
1,03
+2,3
39
Январьмарт
1998
Апрельиюнь
Июльсентябрь
Октябрьдекабрь
Январьмарт
1999
9
84
1,116
76,8
85,7
0,98
-1,7
10
69
0,907
78,8
70,9
0,97
-1,9
11
72
0,922
79,6
73,3
0,98
-1,3
12
87
1,055
80,9
85,4
1,02
+1,6
13
94
1,116
82,3
91,9
1,02
+2,1
При составлении прогнозов по любой модели предполагается, что можно найти
уравнение, удовлетворительно описывающее значение тренда. В обоих изложенных
выше примерах эти предпосылка была успешно выполнена. Тренд, который нами рассматривался, был очевидно линейный. Если бы исследуемый тренд представлял собой
кривую, мы были бы вынуждены моделировать эту связь с помощью одного из методов формализации нелинейных взаимосвязей, рассмотренных в предыдущей главе. После того, как параметры уравнения тренда определены, процедура составления прогнозов становится совершенно очевидной. Прогнозные значения определяются по
формуле:
F= Т  S,
где
Т=64,6+1,36  номер квартала (тыс. шт. за квартал),
а сезонные компоненты составляют 1,116 в первом квартале, 1,097 - во втором, 0,922
- в третьем и 1,055 в четвертом квартале. Ближайший следующий квартал - это
второй квартал 1999г., охватывающий период с апреля по июнь и имеющий во временном ряду порядковый номер 14. Прогноз объема продаж в этом квартале составляет:
F= Т  S = (64 + 1,36  14)  0,907 = 83,64  0,907 = 75,9 (тыс. шт. за квартал).
С учетом величины ошибки прогноза мы можем сделать вывод, что данная оценка
будет отклоняться от фактического значения не более, чем на 2 - 3 %. Аналогично,
прогноз на октябрь-декабрь 1999 г., рассчитывается для квартала с порядковым номером 16 с использованием значения сезонной компоненты для IV квартала года:
F = Т  S = (64 + 1,36  16)  1,055 = 83,36  1,055 = 91,1(тыс. шт. за квартал).
Разумно предположить, что величина ошибки данного прогноза будет несколько
выше, чем предыдущего, поскольку этот прогноз рассчитан на более длительную перспективу.
40
Контрольные задания
Задача 1
Задания:
1) Постройте поле корреляции результативного и факторного признаков.
2) Определите параметры уравнения парной линейной регрессии. Дайте интер
претацию найденных параметров и всего уравнения в целом.
3) Постройте теоретическую линию регрессии, совместив ее с полем корреляции. Сделайте выводы.
4) Рассчитайте линейный коэффициент корреляции и поясните его смысл. Определите коэффициент детерминации и дайте его интерпретацию.
5) С вероятностью 0,95 оцените статистическую значимость коэффициента регрессии и уравнения регрессии в целом. Сделайте выводы.
6) С вероятностью 0,95 постройте доверительный интервал для прогноза оценки

y i и доверительный интервал генерального значения ŷ г ен. ( x  -задается отдель-
но в условии каждой задачи).
7) Определите значение коэффициента эластичности и объясните его.
1. Туристическая компания предлагает места в гостиницах приморского курорта.
Менеджера компании интересует, насколько возрастает привлекательность гостиницы
в зависимости от ее удаленности от пляжа. С этой целью по 14 гостиницам города была
выяснена среднегодовая наполняемость номеров и расстояние от пляжа:
Расстояние, км 0,1 0,1 0,2 0,3 0,4 0,4 0,5 0,6 0,7 0,7 0,8 0,8 0,9 0,9
Наполняе92 95 96 90 89 86 90 83 85 80 78 76 72 75
мость, %

К пункту 6. Значение x =0,65.
2. Компанию по прокату автомобилей интересует зависимость между пробегом
автомобилей и стоимостью ежемесячного обслуживания. Для выяснения характера
этой связи было отобрано 15 автомобилей. Результаты исследования представлены в
таблице:
1 1 1 1 1 1 1 1 1 1 2
Пробег, тыс. км
6 7 8 9
0 1 2 3 4 5 6 7 8 9 0
Стоимость
1 1 1 2 1 2 2 2 3 3 3 3 3 4 3
обслуживания, у.е.
3 6 5 0 9 1 6 4 0 2 0 5 4 0 9

К пункту 6. Значение x =18,5.
3. Торговцу нужно выяснить, как изменяется количество пучков салата, продаваемых ежедневно в розницу. Имеются следующие сведения о количестве и цене:
Количество, тыс./день
28
29
34
35
37
37
41
46
Цена, у.е. за единицу
30
31
25
26
22
24
16
12

К пункту 6. Значение x =20.
4. Компания, занимающаяся продажей радиоаппаратуры, установила на видеомагнитофон определенной модели цену, дифференцированную по регионам. Следую41
щие данные показывают цены на видеомагнитофон в 8 различных регионах и соответствующее им число продаж:
Число продаж, шт.
420
380
350
400
440
380
450
420
Цена, у.е.
5,5
6,0
6,5
6,0
5,0
5,6
4,5
5,0

К пункту 6. Значение x =5,75.
5. Некоторая компания недавно провела рекламную кампанию в магазинах с демонстрацией антисептических качеств своего нового моющего средства. Через 10
недель компания решила проанализировать эффективность этого вида рекламы, сопоставив еженедельные объемы продаж с расходами на рекламу (тыс. руб.):
Объем продаж, у.е.
72 76 78 70 68 80 82 65 62 90
Расходы на рекламу, у.е.
5
8
6
5
3
9
12
4
3
10

К пункту 6. Значение x =7,5.
6. По 10 однородным предприятиям имеются данные о количестве рабочих с
профессиональной подготовкой и количестве бракованной продукции:
№ предприятия
1
2
3
4
5
6
7
8
9 10
Количество рабочих с профессио10 12 14 17 24 28 30 35 40 50
нальной подготовкой, %
Количество бракованной
18 17 14 12 10 10 8
9
6
6
продукции, %

К пункту 6. Значение x =27.
7. При исследовании годового дохода и сбережений населения в случайном порядке отобрано 9 человек. Получены следующие данные:
Доход, тыс. у.е.
15
6
9
3
20
11
14
10
12
Сбережения, у.е..
2000 200
500
500 2500 1800 1500 1500 1600

К пункту 6. Значение x =17.
8. Проведен опрос случайно выбранных 10 студентов, проживающих в общежитии университета, для выявления зависимости между средним баллом по результатам
предыдущей сессии и числом часов в неделю, затраченных студентом на самостоятельную подготовку:
Средний балл
4,6
4,3
3,8
3,8
4,2
4,3
3,8
4,0
3,1
3,9
Число часов
25
22
19
15
15
30
20
30
10
17

К пункту 6. Значение x =27.
9. Имеются данные по 14 предприятиям о производительности труда и коэффициенте механизации работ:
Коэффициент меха32 30 36 40 41 47 56 54 60 55 61 67 69 76
низации работ, %
Производительность
20 24 28 30 31 33 34 37 38 40 41 43 45 48
труда, шт.

К пункту 6. Значение x =65.
10. Представлены данные, характеризующие зависимость между количеством
внесенных удобрений и урожайностью картофеля:
42
Удобрения, кг/га.
140
148
150
150
185
190
202
220
220
240
К пункту 6.
Картофель, ц/га.
135
135
182
175
200
200
200
210
265
250

Значение x =160.
43
Задача 2
Задания:
1) Определите парные и частные коэффициенты корреляции, корреляции, проверьте их значимость для α = 0,05, сделайте выводы.
2) Постройте линейное уравнение множественной регрессии, поясните экономический смысл его параметров и всего уравнения в целом. Проверьте значимость
параметров уравнения регрессии на уровне значимости α = 0,05.
3) Рассчитайте коэффициенты эластичности. Дайте их интерпретацию.
4) Найдите множественный коэффициент корреляции и детерминации, объясните их смысл.
5) Проверьте наличие мультиколлинеарности в модели, вычислив значение показателя VIF.
6) Проверьте значимость полученного уравнения регрессии в целом на уровне
значимости α = 0,05.Сделайте выводы.
1. В конце семестра студенты сдают экзамены. Перед сдачей экзаменов в 20
группах был проведен опрос о том, какую оценку по сдаваемым в сессию курсам они
ожидают получить. После сессии полученные оценки были сопоставлены с ожидаемыми оценками и числом студентов в группах.
Средняя оценка по предмету в iОжидаемая
Число студентов в группе
той группе студентов
оценка
4,1
3,4
45
3,4
3,1
52
3,3
3,0
47
3,0
2,8
63
4,7
3,7
20
4,6
3,5
32
3,0
2,9
51
4,6
3,7
32
4,6
3,5
21
3,6
3,2
33
3,5
3,0
40
4,0
3,5
29
3,6
3,3
38
3,1
3,1
67
3,3
3,3
61
4,5
3,9
50
2,8
2,9
63
3,7
3,2
47
3,8
3,4
51
3,9
3,4
31
2. Имеются следующие данные о результатах аукционных торгов старинными
часами:
44
№
п/п
Цена
продажи,
тыс. у.е.
1
2
3
4
5
6
7
8
9
10
1,2
1,1
0,8
1,5
1,0
2,0
1,8
1,2
1,3
0,9
Возраст
часов,
лет
127
115
127
150
156
182
156
132
137
113
Число
участников
аукционных
торгов, чел.
13
12
7
9
6
11
12
10
9
9
№
п/п
Цена
продажи,
тыс. у.е.
11
12
13
14
15
16
17
18
19
20
1,7
1,0
1,1
1,1
1,2
1,3
1,5
0,9
1,1
1,2
Возраст
часов,
лет
137
117
137
153
117
126
150
127
115
127
Число
участников
аукционных
торгов, чел.
15
11
8
6
13
10
9
7
12
13
3. Имеются следующие данные по 20 предприятиям отрасли промышленности:
ЭнерговооруженДоля рабочих, занятых руч№
Производительность
ность, квт.-ч на 1 ра- ным трудом в общей численп/п труда, у.е. на 1 рабочего
бочего
ности рабочих, %
1
9,8
4,8
40
2
6,7
2,8
59
3
12,4
7,0
38
4
6,9
3,8
57
5
11,8
5,5
31
6
7,3
3,0
56
7
8,4
3,4
45
8
10,7
5,2
35
9
11,1
5,4
32
10
7,3
2,9
54
11
8,8
3,9
43
12
10,0
5,0
36
13
12,1
6,2
29
14
11,9
5,1
32
15
6,8
2,7
55
16
7,0
2,9
50
17
12,0
6,1
30
18
7,5
3,3
48
19
8,0
3,4
45
20
9,2
3,8
49
4. По выборке из 20 почтовых отправлений изучается зависимость стоимости
отправки корреспонденции экспресс - почтой от веса конверта и дальности перевозки:
Стоимость
Вес
Дальность
Стоимость
Вес
Дальность
№
№
доставки,
конперевозки,
доставки,
конперевозки,
п/п
п/п
у.е.
верта, г
тыс. км.
у.е.
верта, г
тыс. км.
1
26
590
0,5
11
110
510
2,4
2
39
320
1,5
12
50
240
2,1
3
80
44
2,0
13
20
30
1,6
4
92
66
1,6
14
60
620
1,2
45
5
6
7
8
9
10
44
15
145
19
10
140
75
70
650
450
60
750
2,8
0,8
2,4
0,5
1,0
1,9
15
16
17
18
19
20
11
80
33
121
155
17
270
350
410
810
700
110
0,4
2,5
1,0
1,6
2,6
0,9
5. Имеются следующие данные о ценах и дивидендах по обыкновенным акциям,
а также о доходности капитала инвестиционной компании :
ДоходУровень
ДоходУровень
№
Цена ак№
Цена акность кадивиденность ка- дивиденп/п
ции, у.е.
п/п
ции, у.е.
питала, %
дов, %
питала, %
дов, %
1
25
15,2
2,6
11
25
15,3
2,6
2
20
13,9
2,1
12
26
15,2
2,8
3
15
15,8
1,5
13
26
12,0
2,7
4
34
12,8
3,1
14
20
15,3
1,9
5
20
6,9
2,5
15
20
13,7
1,9
6
33
14,6
3,1
16
13
13,3
1,6
7
28
15,4
2,9
17
21
15,1
2,4
8
30
17,3
2,8
18
31
15,0
3,0
9
23
13,7
2,4
19
26
11,2
3,1
10
24
12,7
2,4
20
11
12,1
2,0
6. Для анализа эффективности работы предприятий машиностроения были исследованы следующие данные:
Рентабельность, прибыль в
Производительность
Средний возраст про№
% к стоимости основных и
труда, у.е. на 1 работизводственного оборуп/п
оборотных фондов
ника
дования, лет.
1
7
7
20
2
8
10
19
3
7
9
21
4
9
11
17
5
9
11
16
6
8
11
18
7
11
13
15
8
11
14
14
9
16
17
10
10
15
18
11
11
19
21
9
12
16
18
11
13
18
20
10
14
17
20
10
15
19
22
9
16
20
23
8
17
11
12
15
18
11
11
14
19
10
12
13
20
15
17
12
46
7. Изучается влияние изменения объема промышленного производства и
среднедушевого дохода на товарооборот. Для этого по 20 регионам РФ были получены
следующие данные:
Розничный товарооборот
Объем промышленного
Среднедушевой денеж№
(в % к предыдущему гопроизводства (в % к
ный доход (в % к
п/п
ду)
предыдущему году)
предыдущему году)
1
89
85
88
2
75
70
85
3
82
86
81
4
84
80
87
5
91
97
87
6
92
79
110
7
89
92
102
8
107
99
105
9
89
83
94
10
87
77
92
11
96
88
82
12
75
89
85
13
74
72
84
14
86
80
105
15
73
81
94
16
100
97
98
17
87
73
92
18
87
75
95
19
98
84
101
20
81
75
88
8. По 25 предприятиям отрасли имеются данные об объеме производства, потреблении сырья и электроэнергии:
Производство
Потребление
Потребление
№ предприятия
продукции, тыс. шт.
сырья, тыс. т.
электроэнергии, кВт.ч.
1
24,6
3,2
2,3
2
37,4
4,1
1,7
3
45,4
2,2
0,9
4
46,7
1,6
2,0
5
50,1
4,4
2,7
6
51,3
10,5
3,7
7
55,0
2,6
1,0
8
66,0
5,7
2,0
9
68,3
9,5
2,1
10
70,8
5,0
1,6
11
86,1
2,8
2,0
12
96,9
8,1
2,3
13
99,1
6,0
1,5
47
14
15
16
17
18
19
20
21
22
23
24
25
111,9
122,6
166,9
171,6
173,8
177,5
177,6
171,2
213,0
257,1
269,3
359,2
6,2
10,6
8,3
6,1
9,8
9,6
13,3
12,3
7,7
13,1
19,5
21,5
2,8
4,2
2,6
2,2
3,5
8,5
4,2
4,6
3,9
6,5
5,3
7,8
9. Имеются следующие данные о посевной площади зерновых культур, валовом
сборе и внесении минеральных удобрений на 1 га посевной площади:
Посевная площадь
Внесено минеральных
№ фермерского
Валовой
зерновых культур,
удобрений на 1 га посевной
хозяйства
сбор, тыс. т.
тыс. га
площади, кг.
1
4,0
6,0
30
2
2,0
4,6
33
3
3,1
4,4
20
4
3,2
4,5
25
5
3,4
5,5
29
6
3,5
4,8
20
7
3,7
5,1
21
8
3,2
5,2
20
9
3,9
7,0
35
10
3,5
5,3
30
11
5,0
7,5
35
12
3,7
7,7
30
13
5,0
7,3
40
14
3,8
7,0
42
15
5,0
6,7
39
10. Имеются данные о бюджетах домохозяйств США, долл. в месяц:
Семья
Доход семьи
Расходы на питание Расходы на одежду
1
3000
850
250
2
2500
700
150
3
4000
950
250
4
6000
1150
450
5
3300
800
200
6
5300
1000
700
7
4200
900
400
8
6500
1550
1000
9
2800
800
400
10
3650
1200
600
11
5850
1400
950
12
4500
950
350
48
Задача 3
Задания:
1) Обоснуйте выбор вида уравнения тренда и определите его параметры, объясните полученное уравнение.
2) Дайте прогноз уровня ряда на следующий календарный период времени (дату).
3) Определите коэффициент автокорреляции первого порядка и дайте его интерпретацию
4) Сделайте выводы.
1. Имеются следующие данные о квартальных объемах реализации нового продукта предприятием оптовой торговли:
Период времени
1
2
3
4
5
6
7
8
9
Объем реализации,
14
135
297
498
737
1016 1336 1700 2101
тыс. шт.
2. Имеются следующие данные о количестве зарегистрированных малых предприятий города:
Месяц
Число зарегистрированных малых предприятий, ед.
Январь
222
Февраль
322
Март
427
Апрель
530
Май
631
Июнь
731
Июль
832
Август
927
Сентябрь
1010
3. Имеются следующие данные о средней урожайности зерновых в области:
Годы
1
2
3
4
5
6
7
8
9
Урожайность зерно8,8
9,0
9,7
10,7 12,2 14,2 16,6 19,6 22,9
вых (ц/га)
4. Имеются поквартальные данные о численности занятых на предприятиях машиностроения в некотором городе:
№ квартала
1
2
3
4
5
6
7
8
9
Численность заня232
220
209
197
187
175
164
155
146
тых (тыс. чел.)
5. Имеются следующие данные о базисных темпах роста среднедушевого дохода
населения области за 10 месяцев ( в % к январю):
49
Месяц
Февраль
Март
Апрель
Май
Июнь
Июль
Август
Сентябрь
Октябрь
Ноябрь
Темпы роста среднедушевого дохода (%)
102
103
107
114
118
126
134
146
156
166
6. Имеются следующие данные об уровне безработицы в регионе:
Месяц
Уровень безработицы, %
Январь
8,9
Февраль
8,6
Март
8,4
Апрель
8,1
Май
7,9
Июнь
7,6
Июль
7,3
Август
7,2
Сентябрь
7,0
7. Имеются данные о поголовье крупного рогатого скота в районе:
Год
1991
1992
1993
1994
1995
1996
Поголовье крупного рога63,0
67,2
70,0
71,3
73,2
74,1
того скота, тыс. голов
1997
75,0
8. Имеются следующие данные о производстве продукции предприятия за 19921997 гг. (в сопоставимых ценах),млн.у.е.:
Год
1992
1993
1994
1995
1996
1997
Объем производства, у.е.
80
84
89
95
101
108
9. Добыча угля в Восточно-Сибирском районе характеризуется следующими
данными, млн т:
Год
1991
1992
1993
1994
1995
Добыча угля, млн. т
103
97
85
76
72
10. Имеются следующие данные о динамике числа профессиональных театров в
РФ:
Год
Число профессиональных
театров на конец года
1990
1991
1992
1993
1994
1995
1996
382
393
421
439
460
470
489
Задача 4
Задания:
50
1) Определите функциональную форму трендовых уравнений регрессии для изучаемых признаков и рассчитайте их параметры.
2) Найдите линейный коэффициент корреляции между изучаемыми признаками:
а) по исходным уровням ряда;
б) по первым разностям уровней рядов;
в) по отклонениям от тренда.
3) Сделайте вывод о степени тесноты связи между изучаемыми признаками.
4) Определите параметры уравнения парной линейной регрессии по первым разностям и поясните их смысл.
1. Имеются следующие данные о динамике среднегодовой численности промышленно-производственного персонала и индекса физического объема продукции в
промышленности Ростовской области в 1990-1995 гг.
1990
1991
1992
1993
1994
1995
Среднегодовая численность
519,3 500,4 472,6 446,9 412,4 369,3
ППП, тыс. чел.
Индекс физического объема про100
99,0
87,8
68,5
45,1
38,7
дукции, в % к 1990 г.
2. Имеются следующие данные о динамике числа браков и родившихся в Ростовской области в 1990-1998 гг.
Год
Количество браков, тыс.
Количество родившихся, тыс.
1990
39,6
54,0
1991
39,7
51,0
1992
31,5
47,0
1993
34,9
41,6
1994
34,5
42,5
1995
35,5
40,7
1996
25,6
38,8
1997
27,8
36,7
1998
24,5
36,2
3. Изучается взаимосвязь между уровнем инфляции и вкладами населения в
коммерческие банки. Ниже приводятся данные по одному из иностранных коммерческих банков за 9 лет:
Время, лет
1
2
3
4
5
6
7
8
9
Индекс цен (в % к преды128 110 109 115 100
90
95
87
80
дущему году)
Депозиты физических лиц
(млн. дол., в сопостави4,2
4,6
4,7
4,1
5,0
5,5
5,3
6,0
6,5
мых ценах)
4. Для анализа зависимости между изменением цен на молоко и молокопродукты и потреблением белка населением города было проведено выборочное обследование
и получены следующие данные за 10 месяцев:
Потребление белка в среднем за месяц в Индекс цен на молоко и молоМесяц
расчете на душу населения (г)
копродукты (в % к январю)
Январь
2000
100
Февраль
2010
108
Март
2022
115
51
Апрель
Май
Июнь
Июль
Август
Сентябрь
Октябрь
2040
2057
2075
2092
2108
2128
2150
118
122
126
132
139
143
145
5. Администрация компании XYZ проводит анализ кадровой политики. В частности, требуется определить, зависит ли общий объем продаж от удельного веса женщин среди работников компании. Были получены следующие данные за последние 9
кварталов:
Номер квартала
1
2
3
4
5
6
7
8
9
Объем продаж компании, тыс. у.е. 378 385 393 403 414 428 444 462 481
Удельный вес женщин в общем
25
24
27
30
31
29
31
33
34
числе работников компании, %
6. Исследуется зависимость объема продаж бензина от динамики потребительских цен. Были получены следующие данные за последние 9 кварталов:
Квартал
1
2
3
4
5
6
7
8
9
Индекс потребительских
139 132 126 121 117 112 106 100 100
цен (в % к кварталу 9)
Средний за день объем
продаж бензина в течение
65
68
72
75
77
80
83
85
89
квартала (тыс. л.)
7. Имеются следующие данные о динамике средней ожидаемой продолжительности предстоящей жизни при рождении и национального дохода на душу населения в
США в 1971 – 1985 гг.:
Средняя ожидаемая продолжительность
Национальный доход на
Годы
предстоящей жизни при рождении, лет
душу населения, долл.
1971
71,1
4304,4
1972
71,2
4841,2
1973
71,4
5362,9
1974
72,0
5669,0
1975
72,6
5968,8
1976
72,9
6617,9
1977
73,3
7329,1
1978
73,5
8233,1
1979
73,9
9097,5
1980
73,7
9674,7
1981
74,2
10617,5
1982
74,5
10830,9
1983
74,6
11582,2
1984
74,7
12778,8
1985
74,7
13498,2
8. Имеются следующие данные о динамике располагаемого личного дохода и
расходов на питание на душу населения в США в 1971 – 1985 гг.:
52
Годы
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
Располагаемый личный доход, долл.
779,2
810,3
865,3
858,4
875,8
906,8
942,9
988,8
1015,5
1021,6
1049,3
1058,3
1095,4
Расходы на питание, долл.
130,0
132,4
129,4
128,1
132,3
139,7
145,2
146,1
149,3
153,2
153,0
154,6
161,2
9. Ниже приводятся данные об уровне дивидендов, выплачиваемых по обыкновенным акциям, и среднегодовой стоимости основных фондов (ОФ) компании Х в сопоставимых ценах:
Период времени
1
2
3
4
5
6
7
8
9
Среднегодовая стои72
75
77
77
79
80
78
79
80
мость ОФ (тыс.у.е.)
Дивиденд по обыкно4,2
3,0
2,4
2,0
1,9
1,7
1,8
1,6
1,7
венным акциям, %
10. Изучается зависимость между объемом инвестиций в основные производственные фонды (ОПФ) и валовой добавленной стоимостью (ВДС). Ниже представлены данные по некоторой отрасли промышленности за последние 10 лет:
(в сопоставимых ценах, млн. у.е.)
Время, лет
1
2
3
4
5
6
7
8
9
10
Объем инвестиций в ОПФ 140 160 190 210 220 240 260 290 310 320
ВДС
300 345 405 445 480 535 595 639 677 704
Задача 5
Задания:
1) Постройте график ряда динамики.
2) Оцените характер сезонных колебаний и сделать выбор между моделью с сезонной и мультипликативной компонентой.
3) Проведите сглаживание ряда динамики с помощью скользящей средней.
4) Найдите значения десезонализированных данных и нанесите их на график.
5) В предположении существования линейного тренда постройте модель с аддитивной или мультипликативной компонентой.
6) Рассчитайте ошибку, среднее абсолютное отклонение (MAD) и среднеквадратическую ошибку (MSE) модели.
7) Сделайте прогноз на ближайшие три календарных периода времени. Прокомментируйте вопрос о вероятной точности ваших прогнозов.
53
1. В таблице представлены данные по двухмесячному объему производства
среднего предприятия обрабатывающей отрасли промышленности, расположенного в
Дублине:
Объем производства, тонн
Период
1995
1996
1997
1998
Январь-февраль
120
119
110
107
Март-апрель
132
125
119
114
Май-июнь
106
99
102
92
Июль-август
98
98
89
88
Сентябрь-октябрь
88
86
79
75
Ноябрь-декабрь
94
90
88
80
2. В таблице приведены данные по средней заявленной годовой арендной плате
за съем деловых помещений в центральной части Лондона в период 1993 - 1997 гг.:
Годовая плата за аренду помещения, у.е. за кв. м.
Год
Январь-апрель
Май-август
Сентябрь-декабрь
1993
120
100
121
1994
138
120
142
1995
160
138
163
1996
184
162
182
1997
208
175
206
3. Ниже приведены квартальные объемы продукции компании «Cobournes plc»:
Год
1
2
3
Квартал
1
2
3
4
1
2
3
4
1
2
3
Объем выпуска,
24
50
56
63
79
89
79
80
93
100
88
тыс. у.е.
4. Ниже приводятся скорректированные на инфляцию данные о прибыли компании «Doble-Flood» за последние 10 кварталов:
Год
1
2
3
Квартал
1
2
3
4
1
2
3
4
1
2
Прибыль,
146
106
123
89
97
74
80
53
56
35
тыс. у.е.
5. Объемы выпуска продукции компании «Banham and Barsey» приведены в таблице:
Год
Квартал
Объем выпуска,
тыс. у.е.
2
1
3
4
1
2
2
3
4
1
3
2
3
400
715
600
585
560
975
800
765
720
1235
6. В таблице приведены данные по объему продаж компании АПИ в странах Восточной Европы в период 1994 - 1997 гг.:
Объем продаж мазута, тыс. баррелей
Год
Январь-апрель
Май-август
Сентябрь-декабрь
1994
35
15
42
1995
36
19
44
54
1996
1997
41
45
22
26
47
52
7. Динамика товарооборота компании «Amada plc» за последние 11 кварталов,
скорректированного на инфляцию, представлена в таблице:
Год
1
2
3
Квартал
1
2
3
4
1
2
3
4
1
2
3
Товарооборот
22
28
34
27
31
43
43
41
46 53 56
, тыс. у.е.
8. Динамика квартального спроса на стулья компании «Peace Retailers» представлена в таблице:
Год
1
2
3
Квартал
3
4
1
2
3
4
1
2
3
4
Спрос, тыс. штук 157 137 156
151
153
141 154 152 154 142
9. В таблице приведены данные по общей стоимости экспортных заказов некой
компании в период 1993 - 1996 гг.:
Общий объем экспорта, млн. у.е.
Год
Январь-апрель
Май-август
Сентябрь-декабрь
1994
4,5
5,6
4,9
1995
5,1
5,9
5,2
1996
5,4
6,8
5,8
1997
6,0
6,8
6,1
10. В таблице приведены данные по общему объему продаж газеты одного из
канадских издательств в период 1994 - 1997 гг.:
Дневной объем продаж газеты, тыс. экз.
Период
1994 г.
1995 г.
1996 г.
1997 г.
I квартал
2,2
2,6
2,9
3,2
П квартал
2,9
3,2
3,4
3,6
Ш квартал
3,3
3,6
3,9
4,2
IY квартал
2,4
2,7
2,8
3,1
55
Рекомендуемая литература
1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.
Учебник для вузов. - М.: ЮНИТИ, 1998.
2. Айвазян С.А., Мхитарян В.С. Практикум по прикладной статистике и эконометрике( учебное пособие) / МЭСИ, 1998.
3. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997.
4. Эконометрика Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и
др. – М.: Финансы и статистика, 2001.
5. Практикум по эконометрике: Учебное пособие/ И.И. Елисеева, С.В. Курышева,
Н.М. Гордиенко и др.; под ред. И.И, Елисеевой – М.: Финансы и статистика, 2001.
6. Кейн Э. Экономическая статистика и эконометрика. Введение в количественный
анализ. Пер. с англ. - М.: Статистика, 1977.
7. Джонстон Дж. Эконометрические методы. Пер. с англ. - М.: Статистика, 1980.
8. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.:
Дело, 1997.
9. Катышев П.К., Пересецкий А.А. Сборник задач к начальному курсу эконометрики. –
М.: Дело, 1999.
10. Айвазян С.А., Евнюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. - М.: Финансы и статистика, 1983.
11. Айвазян С.А., Евнюков И.С., Мешалкин Л.Д. Прикладная статистика. Исследование
взаимосвязей. - М.: Финансы и статистика, 1985.
12. Айвазян С.А., Бухштабер В.М., Евнюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. - М.: Финансы и статистика, 1989.
13. Green W.H. (1996) Econometrics Analysis, third edition. Macmillan Publishing
Company.
14. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник. - М.: Финансы
и статистика, 1995.
15. Ефимова М.Р., Петрова Е.В., Румянцева В.Н. Общая теория статистики: Учебник. М.: ИНФРА - М., 1996.
16. Колемаев В.А., Калинина В.Н. Теория вероятностей и математическая статистика:
Учебник. - М.: ИНФРА - М., 1996.
17. Гмурман В.Е. Теория вероятностей и математическая статистика: Учебник. - М.:
“Высшая школа”, 1997.
18. Фестер Э., Ренц Б. Методы корреляционного и регрессионного анализа: руководство для экономистов. - М.: Финансы и статистика, 1983.
19. Методические материалы по экономическим дисциплинам для преподавателей
средних школ и вузов / Под. общ. ред. Л.С. Гребнева. Экономичсекая статистика.
Эконометрика. (Программы, тесты, задачи, решения). – М.:ГУ-ВШЭ,2000.
20. Эконометрика: Решение типовых задач. / Под.ред. С.В. Курышевой – СПб: Союз
студентов СПбГУЭФ,1999.
21. Кулинич Е.И. Эконометрия. – М.:Финансы и статистика, 1999.
22. Эддоус М., Стенфилд Р. Методы принятия решений / пер. с англ. под ред. чл.-корр.
РАН И.И. ЕЛисеевой. – М.:Аудит, ЮНИТИ, 1997.
23. Громыко Г.Л. Общая теория статистики: Практикум. – М.: ИНФРА-М,1999.
24. Вайнберг Дж., Шумекер Дж. Статистика / пер. с англ. – М.:Статистика, 1979.
25. Практикум по теории статистики: Учебное пособие / под ред. проф.
Р.А.Шмойловой. – М.: Финансы и статистика,1999.
26. Ниворожкина Л.И., Морозова З.А., Житников И.В., Герасимова И.А. Основы статистики с элементами теории вероятностей./ Учебник. - Ростов-на-Дону: Феникс,
1999.
56
Эконометрика
Методические указания по выполнению контрольной работы
Ниворожкина Людмила Ивановна
Житников Игорь Васильевич
Федосова Оксана Николаевна
Ответственная за выпуск
Начальник РИО РГЭУ
Изд.№103/5347
Печать офсетная
Заказ №
В.Е. Смейле
Подписано к печати
Формат 60*84/16
Тираж 100 экз.
Бумага офсетная
Объем 4,0 уч.- изд.л.
“С”103
344007, г. Ростов-на-Дону, ул. Б. Садовая, 69. РГЭУ.
Издательство.
Отпечатано в
КМЦ “Колибри”
Ростов-на-Дону, ул. Б. Садовая, 9.
57
Download