РОСТОВСКИЙ ГОСУДАРСТВЕННЫЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ (РИНХ) ЭКОНОМЕТРИКА Методические указания по выполнению контрольной работы Ростов-на-Дону Печатается по решению кафедры математической статистики, эконометри- ки и актуарных расчетов РГЭУ. Авторы: Ниворожкина Л.И., Житников И.В., Федосова О.Н. Рецензенты: заслуженный деятель науки РФ, д.э.н., проф. Князевский В.С. к.э.н., доцент Алексейчик Т.В. Методические указания составлены на основе Государственного стандарта высшего профессионального образования: включают программу курса, список рекомендуемой учебной и научной литературы, задания для самостоятельной работы и текущего контроля знаний студентов, методические указания к решению типовых задач. Эконометрика как метод исследования экономических явлений с использованием аппарата математической статистики и ЭВМ; основные приемы спецификации переменных в уравнениях регрессии; проверка адекватности эконометрической модели; проверка гипотез в эконометрических моделях; прогнозирование на основе эконометрических моделей. Предназначено для студентов и аспирантов всех форм обучения. Контрольные задания составлены по материалам учебников, представленных в списке рекомендуемой литературы. Ниворожкина Л.И, Житников И.В., Федосова О.Н., © Ростовский государственный экономический университет, © 2 РАБОЧАЯ ПРОГРАММА ПО КУРСУ «ЭКОНОМЕТРИКА» Тема 1. Предмет и задачи курса. Определение эконометрики. Эконометрика и экономическая теория. Эконометрика и статистика. Эконометрика и экономико-математические методы. Области применения эконометрических моделей. Методологические вопросы построения эконометрических моделей: обзор используемых методов. Литература: 1. Магнус Я.Р, Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.: Дело, 1997. - с.12-15. 2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. - М.: ЮНИТИ, 1998. - с. 23-48, 597-618. 3. Джонстон Дж. Эконометрические методы. - М.: Статистика, 1980. - с. 11-15. 4. Эконометрика Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и др. – М.: Финансы и статистика, 2001.- с.7-32. Тема 2. Парная регрессия и корреляция. Понятие о функциональной, статистической и корреляционной связях. Основные задачи прикладного корреляционно-регрессионного анализа. Уравнение регрессии, его смысл и назначение. Выбор типа математической функции при построении уравнения регрессии. Парная регрессия. Метод наименьших квадратов и условия его применения для определения параметров уравнения парной регрессии. Нелинейные модели регрессии и их линеаризация. Оценка степени тесноты связи между количественными переменными. Коэффициент ковариации. Показатели корреляции: линейный коэффициент корреляции, индекс корреляции, теоретическое корреляционное отношение. Коэффициент детерминации. Стандартная ошибка уравнения регрессии. Оценка статистической значимости показателей корреляции, параметров уравнения регрессии, уравнения регрессии в целом: t - критерий Стьюдента, F - критерий Фишера. 3 1. 2. 3. 4. 5. Литература: Магнус Я.Р, Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.: Дело, 1997. - с.17-37. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. - М.: ЮНИТИ, 1998. - с. 621-627. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997. - с. 53-69. Джонстон Дж. Эконометрические методы. - М.: Статистика, 1980. - с. 17-70. Эконометрика Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и др. – М.: Финансы и статистика, 2001. – с.34-88. Тема 3. Множественная регрессия и корреляция. Понятие о множественной регрессии. Классическая линейная модель множественной регрессии (КЛММР). Определение параметров уравнения множественной регрессии методом наименьших квадратов. Стандартизованные коэффициенты регрессии, их интерпретация. Парные и частные коэффициенты корреляции. Множественный коэффициент корреляции и множественный коэффициент детерминации. Оценка надежности показателей корреляции. Оценка качества модели множественной регрессии: F – критерий Фишера, t критерий Стьюдента. Мультиколлинеарность. Методы устранения мультиколлинеарности. Литература: 1. Магнус Я.Р, Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.: Дело, 1997. - с. 43-79. 2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. - М.: ЮНИТИ, 1998. - с. 628-772. 3. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997. - с. 134-196. 4. Джонстон Дж. Эконометрические методы. - М.: Статистика, 1980. - с. 123-237. 5. Эконометрика Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и др. – М.: Финансы и статистика, 2001. – с.90-175. Тема 4. Спецификация переменных в уравнениях регрессии. Эконометрические модели: общая характеристика, различия статистического и эконометрического подхода к моделированию. Спецификация переменных в уравнениях регрессии. Ошибки спецификации. Обобщенная линейная модель множественной регрессии. Обобщенный метод наименьших квадратов. Проблема гетероскедастичности. Автокорреляция. Анализ линейной модели множественной регрессии при гетероскедастичности и автокорреляции. 4 Фиктивные переменные: общий случай. Множественные совокупности фиктивных переменных. Фиктивные переменные для коэффициентов наклона. Тест Чоу. Моделирование: влияние отсутствия переменной, которая должна быть включена; влияние включения в модель переменной, которая не должна быть включена. Замещающие переменные. Литература: 1. Магнус Я.Р, Катышев П.К., Пересецкий А.А., Эконометрика. Начальный курс. - М.: Дело, 1997. - с. 66-79. 2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. - М.: ЮНИТИ, 1998. - с. 653-668. 3. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997. - с. 262-285. 4. Джонстон Дж. Эконометрические методы. - М.: Статистика, 1980. - с. 123-237. 5. Эконометрика Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и др. – М.: Финансы и статистика, 2001. Тема 5. Временные ряды в эконометрических исследованиях. Специфика временных рядов как источника данных в эконометрическом моделировании. Аналитическое выравнивание временных рядов. Оценка параметров уравнения тренда. Автокорреляция в остатках, ее измерение и интерпретация. Критерий ДарбинаУотсона в оценке качества трендового уравнения регрессии. Анализ временных рядов при наличии периодических колебаний: аддитивная и мультипликативная модели. Особенности изучения взаимосвязанных временных рядов. Автокорреляция рядов динамики и методы ее устранения. Метод последовательных разностей. Интерпретация параметров уравнения регрессии, построенного по первым и вторым разностям. Метод отклонения уровней ряда от основной тенденции. Метод включения фактора времени. Литература: 1. Магнус Я.Р, Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.: Дело, 1997. - с. 102-136. 2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. - М.: ЮНИТИ, 1998. - с. 778-903. 3. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997. - с. 200-229. 4. Джонстон Дж. Эконометрические методы. - М.: Статистика, 1980. - с. 242-265. 5. Эконометрика Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и др. – М.: Финансы и статистика, 2001. – с.225-289. 5 Тема 6. Системы эконометрических уравнений. Виды систем эконометрических уравнений. Независимые системы. Рекурсивные системы. Системы одновременных (совместных) уравнений. Структурная и приведенная формы эконометрической модели. Проблемы идентификации. Косвенный и двухшаговый метод наименьших квадратов, общая схема алгоритма расчетов. Применение эконометрических моделей. Модель Кейнса (статистическая и динамическая формы). Модель Клейна (1). Литература: 1. Магнус Я.Р, Пересецкий А.А., Катышев П.К. Эконометрика. Начальный курс. - М.: Дело, 1997. -С. 142-163. 2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. - М.: ЮНИТИ, 1998. - С. 907-956. 3. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997. - С. 322-347. 4. Джонстон Дж. Эконометрические методы. - М.: Статистика, 1980. - С. 375-408. 5. Эконометрика. Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и др. – М.: Финансы и статистика, 2001. – с.177-225. Домашнее задание по курсу “Эконометрика” Общие указания по выполнению домашнего задания Задания к контрольной работе составлены в 10 вариантах. Номер варианта соответствует последней цифре шифра зачетной книжки. Если последняя цифра зачетной книжки – 0, следует выполнить 10-й вариант. Каждый вариант контрольной работы содержит 5 задач по основным разделам курса. Порядковый номер задачи из каждой темы соответствует номеру варианта. 1. Работа должна быть заблаговременно представлена на кафедру СМиП, для аспирантов - в отдел аспирантуры. 2. Результаты расчетов всех относительных величин необходимо проводить с точностью до 0,0001, а процентов - до 0,01. 3. Все расчеты должны быть выполнены как вручную, так и с использованием пакетов прикладных программ на персональном компьютере. В последнем случае следует обязательно указывать название и версию использованного программного обеспечения. Соответствующие распечатки необходимо привести в тексте работы или оформить в качестве приложения. 4. Все расчеты должны сопровождаться комментариями и интерпретацией полученных результатов. Указания к выполнению контрольных работ содержат все необходимые формулы, а также содержат примеры расчетов типовых задач, которые по тексту указаний выделены курсивом. 6 Указания к выполнению контрольных заданий Задача 1 каждого варианта составлена по теме “Парная регрессия и корреляция”. Введем следующие обозначения: X - факторный признак, независимая (объясняющая) переменная, Y - результативный признак, зависимая переменная, x – фактические значения факторного признака, y – фактические значения результативного признака, ŷ - расчетные (полученные по уравнению регрессии) значения результативного признака, a , b - параметры уравнения регрессии. В контрольных заданиях используется уравнение парной линейной регрессии вида: Y α βX ξ Рассмотрим методику выполнения на условиях конкретной задачи: American Express Company в течение долгого времени полагала, что владельцы ее кредитных карт предпочитают оплачивать свои расходы во время путешествий при помощи их карт. Для выяснения этого из компьютерной базы компании были случайно выбраны 25 владельцев карточек, которым были заданы вопросы о числе миль, которые они провели в путешествиях. Данные опроса о расходах путешественников и числе миль, проведенных ими в пути, составляют исходную информацию задачи. N п/п 1 2 3 4 5 6 7 8 9 10 11 12 13 Число миль, проведенных в пути, X 1211 1345 1422 1687 1847 2026 2133 2253 2400 2468 2699 2806 3082 Расходы, у.е , Y N п/п 1802 2405 2005 2511 2332 2305 3016 3385 3090 3694 3371 3998 3555 14 15 16 17 18 19 20 21 22 23 24 25 Число миль, проведенных в пути, X 3209 3466 3643 3852 4033 4267 4498 4533 4804 5090 5233 5439 Расходы, у.е , Y 4492 4244 5298 4801 5147 5738 6420 6059 6426 6321 7025 6964 Пункт 1. Построение поля корреляции результата и фактора производится по исходным данным о парах значений факторного и результативного признаков с соблюдением масштаба. На основе поля корреляции делаются выводы о направлении и возможной функциональной форме связи между факторным и результативным признаками (прямая - обратная, линейная - нелинейная). 7 Для условий рассматриваемой задачи поле корреляции выглядит следующим образом: расходы, у.е. 8000 6000 4000 2000 0 0 1000 2000 3000 4000 5000 6000 количество миль, проведенных в путешествии Связь между факторным и результативным признаками прямая, линейная. Пункт 2. Оценка параметров уравнения парной линейной регрессии производится обычным методом наименьших квадратов (МНК): yˆi a bxi , где a и b –оценки параметров модели. Величины, минимизирующие суммы квадратов отклонений y от ŷ для случая парной линейной регрессии, находятся как: n b x ~x y i 1 i i ~ y n 2 xi ~x ; i 1 a ~ y b~ x . Значения ошибок, называемые обычно остатками, рассчитываются как ei Проведите интерпретацию полученных результатов. yi yˆ i . Расчет необходимых данных лучше всего организовать в таблице. Для нашего примера таблица будет выглядеть следующим образом: Таблица 1 N/N х у xi ~ x x )( y i ~ y ) ( xi ~ ei yˆ i y i yi ~ y ( xi ~ ŷ i x)2 1 2 3 4 5 6 7 8 9 10 11 12 13 1211 1345 1422 1687 1847 2026 2133 2253 2400 2468 2699 2806 3082 1802 2405 2005 2511 2332 2305 3016 3385 3090 3694 3371 3998 3555 -1966,84 -1832,84 -1755,84 -1490,84 -1330,84 -1151,84 -1044,84 -924,84 -777,84 -709,84 -478,84 -371,84 -95,84 -2454,16 -1851,16 -2251,16 -1745,16 -1924,16 -1951,16 -1240,16 -871,16 -1166,16 -562,16 -885,16 -258,16 -701,16 4826940 3392880 3952677 2601754 2560749 2247424 1295769 805683,6 907085,9 399043,7 423850 95994,21 67199,17 3868460 3359302 3082974 2222604 1771135 1326735 1091691 855329 605035,1 503872,8 229287,7 138265 9185,306 N/N х у xi ~ x yi ~ y ( xi ~ x )( y i ~ y) ( xi ~ x)2 8 1787,652 14,34756 1955,831 449,1692 2052,471 -47,4707 2385,062 125,9377 2585,872 -253,872 2810,529 -505,529 2944,82 71,17973 3095,428 289,5722 3279,922 -189,922 3365,266 328,7337 3655,186 -284,186 3789,477 208,5225 4135,875 -580,875 Продолжение таблицы 1 ŷ i ei yˆ i y i 14 3209 4492 15 3466 4244 16 3643 5298 17 3852 4801 18 4033 5147 19 4267 5738 20 4498 6420 21 4533 6059 22 4804 6426 23 5090 6321 24 5233 7025 25 5439 6964 сумма 79446 106404 Средн. 3177,8 4256,1 4 6 31,16 288,16 465,16 674,16 855,16 1089,16 1320,16 1355,16 1626,16 1912,16 2055,16 2261,16 235,84 -12,16 1041,84 544,84 890,84 1481,84 2163,84 1802,84 2169,84 2064,84 2768,84 2707,84 7348,774 -3504,03 484622,3 367309,3 761810,7 1613961 2856615 2443137 3528507 3948304 5690409 6122859 51398430 970,9456 83036,19 216373,8 454491,7 731298,6 1186270 1742822 1836459 2644396 3656356 4223683 5112845 40952877 4295,268 4617,819 4839,965 5102,273 5329,439 5623,124 5913,044 5956,971 6297,093 6656,041 6835,515 7094,058 106404 196,7322 -373,819 458,035 -301,273 -182,439 114,8759 506,9564 102,0292 128,9072 -335,041 189,4853 -130,058 0 В соответствии с расчетами, представленными в таблице 1, а= 267,7715; b=1,2551 Соответственно уравнение регрессии может быть записано как: yˆ 267,7715 1,2551x Коэффициент регрессии линейной функции (b) есть абсолютный показатель силы связи, характеризующий среднее абсолютное изменение результата при изменении факторного признака на единицу своего измерения. Полученное уравнение может быть объяснено следующим образом: с увеличением расстояния на 1 милю расходы путешественника в среднем увеличиваются на 1,2551 условных денежных единиц. Свободный член уравнения равен 267,7715, что может трактоваться как влияние на величину расходов других, неучтенных в модели факторов. Пункт 3. Линейный коэффициент корреляции характеризует тесноту линейной связи между изучаемыми признаками. Его можно определить по следующей формуле: x ~x y ~y r . n x y Значения линейного коэффициента корреляции принадлежит промежутку [-1;1]. Чем ближе его абсолютное значение к 1, тем теснее связь между признаками. Положительная величина свидетельствует о прямой связи между изучаемыми признаками, отрицательная - о наличии обратной связи между признаками. Для нашей задачи r=0,98329, что подтверждает вывод, сделанный в пункте 1, что связь между признаками прямая, а также указывает на очень сильную взаимосвязь между количеством миль, проведенных в пути и расходами. Квадрат коэффициента (индекса) корреляции называется коэффициентом детерминации и показывает долю вариации результативного признака, объясненную вариацией факторного признака. Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах. Например: R 2 =0,8 означает, что доля колеблемости результативного признака, объясненная вариацией фактора X , включенного в уравнение регрессии, равна 80%. Остальные 20% приходятся на долю прочих факторов, не учтенных в уравнении регрессии. 9 Для нашей задачи коэффициент детерминации равен 0,9669, то есть 96,69% вариации результативного признака (расходов путешественников) объясняется вариацией факторного признака (количеством миль, проведенных в пути) Пункт 4 связан с темой “Проверка статистических гипотез”. Рекомендуется использовать следующую общую процедуру проверки гипотез: 1. Сформулируйте нулевую гипотезу о том, что коэффициент регрессии статистически незначим: H 0 : 0 (линейной зависимости нет) при конкурирующей: H1 : 0 (линейная зависимость есть) или о том, что уравнение в целом статистически незначимо: H 0 : R 2 0 . 2. Определите фактическое значение соответствующего критерия. 3. Сравните полученное фактическое значение с табличным. 4. Если фактическое значение используемого критерия превышает табличное, нулевая гипотеза отклоняется, и с вероятностью (1- ) принимается альтернативная гипотеза о статистической значимости коэффициента регрессии. Если фактическое значение t - критерия меньше табличного, оснований отклонять нулевую гипотезу - нет. Статистическая значимость коэффициента регрессии проверяется с помощью t - критерия Стьюдента: b β , Sb t n 2 где Sb S yx n 2 xi ~x , S yx n n ( x )2 i 1 n xi2 i 1 i 1 S yx - стандартная ошибка оценки, рассчитываемая по формуле n S yx y y i i 1 n2 2 i . Так как нулевая гипотеза предполагает, что =0, то tнабл. рассчитывается как: b0 tнабл. . Sb Для определения табличного значения воспользуйтесь таблицами распределения Стьюдента для заданного уровня значимости α, принимая во внимание, что число степеней свободы для распределения Стьюдента равно (k = n - 2). Для нашего примера t набл 25,906 , а t табл( 0, 05, k 23) =2,07, следовательно ну- левая гипотеза отвергается в пользу альтернативной и коэффициент регрессии статистически значим, то есть наличие существенной линейной зависимости между количеством миль, проведенных в путешествии и величиной расходов статистически подтверждается. 10 Оценка статистической значимости построенной модели регрессии в целом производится с помощью F- критерия Фишера. Фактическое значение F-критерия качества оценивания регрессии, который представляет собой отношение объясненной суммы квадратов SSR (в расчете на одну независимую переменную) к остаточной сумме квадратов SSE (в расчете на одну степень свободы), определяется как: SSR Fнабл. k , SSE n k 1 n где SSR = ( ŷi ~ y )2 - факторная, или объясненная моделью регрессии, сумма i 1 квадратов, n SSE ( y i yˆ i ) 2 - остаточная, или необъясненная моделью сумма квадраi 1 тов k - число независимых переменных. F - критерий можно выразить через коэффициент детерминации: R2 . Fнабл. (1 R 2 ) /( n 2) Для определения табличного значения воспользуйтесь таблицами распределения Фишера-Снедекора для заданного уровня значимости α, принимая во внимание, что в случае парной регрессии число степеней свободы большей дисперсии равно 1, а число степеней свободы меньшей дисперсии равно n - 2. Для нашего примера Fнабл. =671, 137, а Fтабл.( 0,05, k11, k 2 23) =4,45. Так как Fнабл. Fтабл. построенная модель регрессии в целом значима и может в дальнейшем использоваться нами для прогнозов. Для выполнения пункта 5 необходимо изучить вопрос об интервальном оценивании в регрессионном анализе, уяснить смысл понятий “точечный прогноз” и “интер подставьте в уравнение регресвальный прогноз”. Для расчета точечного прогноза Y k сии заданное значение факторного признака X . Так, например, если необходимо оценить расходы путешественника, преодолевшего (собирающегося преодолеть) 4500 миль, следует использовать уравнение регрессии записанное нами в пункте 2: yˆ 267,7715 1,2551 4500 5915,7215 , то есть в среднем путешественник, преодолевший 4500 миль израсходует 5915,7215 условных денежных единиц. Доверительный интервал для значений y i , лежащих на линии регрессии, имеет вид: y i t n 2 S yx 1 hi , где 11 1 hi n x ~ x 2 n 2 xi ~x ( x ~ x )2 1 n n n ( xi ) 2 i 1 n xi2 i 1 y i - прогнозное значение зависимой переменной; S yx - стандартная ошибка оценки; i 1 n - объем выборки; x - заданное значение X . Полученный интервал будет характеризовать значения результативного призна ка при заданном значении факторного признака x для отдельной наблюдаемой единицы. Так, для нашего примера этот доверительный интервал будет выглядеть как 5247,8367 ŷ i 6582,9665, то есть с вероятностью 0,95 можно утверждать, что расходы одного путешественника, преодолевшего 4500 миль составят от 5247,8367 до 6582,9665 условных денежных единиц. Если же необходимо сделать вывод об интервале значений результативного при знака для всех наблюдаемых единиц при среднем значении факторного признака x , расчет будет производиться по формуле доверительного интервала генерального значения yˆ ãåí. : yi t n2S yx hi . В соответствии с условиями рассматриваемого примера доверительный интервал, характеризующий расходы всех путешественников, преодолевших 4500 миль будет выглядеть как 5730,918 yˆ ãåí. 6099,885, то есть расходы всех путешественников, преодолевших расстояние в 4500 миль составят от 5730,918 до 6099,885 условных денежных единиц. Сделайте выводы по задаче в целом. 12 Задача 2 составлена по теме “Множественная регрессия и корреляция” и предполагает построение и анализ двухфакторного уравнения линейной регрессии вида: Y 1 X 1 2 X 2 . Рассмотрим методику решения задачи такого типа на примере: Компания, производящая моющие средства, предприняла рекламную акцию в магазинах с демонстрацией антисептических свойств нового моющего средства. В этот же период компания использовала обычную теле- и радиорекламу. Через 20 недель компания решила проанализировать сравнительную эффективность различных видов рекламных расходов. Аналитик компании, исходя из гипотезы о линейной регрессионной взаимосвязи, оценил параметры модели следующего вида: y а b1 x1 b2 x 2 , где y – объем продаж моющего средства, x1 – расходы на теле и радио рекламу, x 2 – расходы на демонстрацию товара в магазинах. Расходы приведены в условных денежных единицах. Таблица 1. Исходные данные y Номера наблюдений x2 x1 1 72 12 5 2 76 11 7 3 78 15 6 4 70 10 5 5 68 11 3 6 80 16 7 7 82 14 3 8 65 8 4 9 62 8 3 10 90 18 5 Пункт 1 посвящен анализу показателей тесноты связи в уравнении множественной регрессии. Но прежде чем приступить к анализу показателей тесноты связи необходимо рассмотреть дискриптивные (описательные статистики), которые подробно изучались в курсах математической статистики с элементами теории вероятностей и общей теории статистики Таблица 2. Дискриптивные статистики y x1 x2 Размер выборки, n 10 10 10 Средняя арифметическая 74,3 12,3 4,8 Среднее квадратическое (стандартное) отклонение, S 8,54 3,37 1,55 Коэффициент вариации, V 0,12 0,27 0,32 Коэффициент асимметрии, As 0,35 0,31 0,19 Коэффициент эксцесса, Ex -0,32 -0,91 -1,28 Сравнивая значения средних величин и стандартных отклонений, находим коэффициент вариации, значения которого свидетельствуют о том, что уровень варьи13 рования признаков находится в допустимых пределах (< 0,35). Значения коэффициентов асимметрии и эксцесса указывают на отсутствие значимой скошенности и остро-(плоско-) вершинности фактического распределения признаков по сравнению с их нормальным распределением.1 По результатам анализа дискриптивных статистик можно сделать вывод, что совокупность признаков – однородна и для её изучения можно использовать метод наименьших квадратов (МНК) и вероятностные методы оценки статистических гипотез. Парный коэффициент корреляции - это линейный коэффициент корреляции, характеризующий степень тесноты линейной связи между результативным и факторным признаками. Методика его расчета и интерпретация была изложена в пункте 3 задачи 1. При выполнении задания необходимо выписать матрицу парных коэффициентов корреляции и сделать выводы о наличии (отсутствии) в построенной модели мультиколлинеарности факторов. Значения линейных коэффициентов парной корреляции представлены в матрице парных коэффициентов (таблица 3). Они определяют тесноту парных зависимостей между анализируемыми переменными. Таблица 3.Парные коэффициенты линейной корреляции Пирсона y x2 x1 y 1,0000 0,9393 0,4167 (0,0) (0,0001) (0,2310) 0,9393 1,0000 0,4174 x1 (0,0001) (0,0) (0,2301) 0,4167 0,4174 1,0000 x2 (0,2310) (0,2301) (0,0) В скобках: P ( Н о : R 0) Коэффициент корреляции между x1 и y свидетельствует о значительной и статистически существенной линейной связи между объемом продаж моющего средства и расходами на радио и теле рекламу. Увеличение расходов на рекламу поднимает объем продаж. Связь между x 2 и y не является статистически значимой. Кроме того, степень тесноты связи между x1 и x 2 выше, чем между x 2 и y . Таким образом, можно сделать предварительное заключение, что расходы на демонстрацию моющего средства в магазинах, существенно не влияют на рост объема продаж нового моющего средства. Частные коэффициенты корреляции характеризуют тесноту связи между результативным и факторным признаками при фиксированном воздействии других факторов, включенных в уравнение регрессии. Их можно определить, используя парные коэффициенты корреляции по следующим рабочим формулам: Обычно статистические ППП имеют набор процедур, оценивающих числовые характеристики распределения признаков, включенных в модель. В контрольной работе необходимо привести формулы расчета этих характеристик и их интерпретацию. 14 1 ryx1x2 ryx2 x1 ryx1 ryx2 rx1x2 1 r 1 r 2 yx2 2 x1 x2 ryx2 ryx1 rx1x2 , 1 r 1 r 2 yx1 2 x1 x2 где ryx1x2 - частный коэффициент корреляции между результативным и первым факторным признаками при фиксированном воздействии второго факторного признака, ryx2 x1 - частный коэффициент корреляции между результативным и вторым факторным признаками при фиксированном воздействии первого факторного признака, ryx1 , ryx 2 , rx1 x 2 - парные коэффициенты корреляции. Интерпретируйте полученные значения частных коэффициентов корреляции и поясните причины различий между значениями частных и парных коэффициентов корреляции. Приведенные в таблице 4 линейные коэффициенты частной корреляции оценивают тесноту связи значений двух переменных, исключая влияние всех других переменных, представленных в уравнении множественной регрессии. Таблица 4. Коэффициенты частной корреляции y x2 x1 y 1,0000 0,9265 0,0790 (0,0) (0,0003) (0,8399) 0,9265 1,0000 0,0834 x1 (0,0003) (0,0) (0,8311) 0,0790 0,0834 1,0000 x2 (0,8399) (0,8311) (0,0) В скобках: P ( Н о : R 0) Коэффициенты частной корреляции дают более точную характеристику тесноты зависимости двух признаков, чем коэффициенты парной корреляции, так как «очищают» парную зависимость от взаимодействия данной пары переменных с другими переменными, представленными в модели. Наиболее тесно связаны x1 и y , ryx1.x2 0,9265 . Другие взаимосвязи существенно слабее. При сравнении коэффициентов парной и частной корреляции видно, что из-за влияния межфакторной зависимости между x1 и x 2 происходит некоторое завышение оценки тесноты связи между переменными. По этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи. Пункт 2. Расчет параметров линейного уравнения множественной регрессии осуществляется обычным МНК путем решения системы нормальных уравнений. Для уравнения с двумя объясняющими переменными система примет вид: 15 na b1 x 1 b2 x 2 y 2 a x1 b1 x1 b2 x1 x2 yx1 2 a x2 b1 x1 x2 b2 x2 yx2 Поясните экономический смысл коэффициентов регрессии b1 и b2 : это показатели, характеризующие абсолютное (в натуральных единицах измерения) изменение результативного признака при изменении факторного признака на единицу своего измерения при фиксированном влиянии второго фактора. Результаты построения уравнения множественной регрессии представлены в таблице 5. Таблица 5. Результаты построения модели множественной регрессии Независимые КоэффициенСтандартные t - статистики Вероятность переменные ты ошибки коэфслучайного фициентов значения Константа 44,61 4,58 9,73 0,0001 x1 2,35 0,36 6,51 0,0003 x2 0,16 0,78 0,21 0,8399 2 R = 0,88 R2adj=0,85 F = 26,402 Prob > F = 0,0005 Уравнение имеет вид: y = 44,61 + 2,35x1 + 0,16x2 Значения стандартной ошибки параметров представлены в графе 3 таблицы 5: S a 4,58; S b1 0,36; S b2 0,78. Они показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Их значения используются для расчета t-критерия Стьюдента (графа 4) b0 b1 b =6,51; t b2 2 =0,21. tа 9,73; t b1 S b0 S b1 S b2 В нашем примере параметр x1 является статистически значимым, а x 2 - нет.2 На это же указывает значение вероятности случайных значений параметров регрессии (графа 5), если вероятность меньше принятого за стандарт уровня = 0,05, то делается вывод о неслучайной природе данного значения параметра, то есть о том, что он статистически значим и надежен. В противном случае принимается нулевая гипотеза (H0) о случайной природе значения коэффициентов уравнения. В нашем примере для переменной х2 > 0,05 (х2=0,84), что свидетельствует о малой информативности (значимости) этой переменной. Интерпретация коэффициентов регрессии следующая: а - оценивает агрегированное влияние прочих (кроме учтенных в модели х1 и х2) факторов на результат y; b1 и b2 указывают, что с увеличением х1 и х2 на единицу их значений объем продаж нового моющего средства увеличивается, соответственно, на 2,35 и 0,16 условных денежных единиц. Пункт 3 связан с расчетом и анализом относительных показателей силы связи в уравнении множественной регрессии - частных коэффициентов эластичности. Частные 2 Определение значимости параметров уравнения регрессии подробно рассмотрены в пункте 4 задачи1. 16 коэффициенты эластичности рассчитывают, как правило, для средних значений факторного и результативного признака: ~ xj Эj bj ~ , j i , m y где b j - коэффициент условно-чистой регрессии при j-м факторе, ~ x j - среднее значение j-го факторного признака; ~ y - среднее значение результативного признака, m - число факторных признаков в уравнении множественной регрессии. Зачастую интерпретация результатов регрессии более наглядна, если произведен расчет частных коэффициентов эластичности. Частные коэффициенты эластичности Э yx показывают, на сколько процентов от значения своей средней ( ~y ) изменяется x ) и при фиксированрезультат при изменении фактора xj на 1% от своей средней ( ~ j ном воздействии на y прочих факторов, включенных в уравнение регрессии. Здесь 2,34944 12,3 Э yx1 0,3889% 74,3 0,164397 4,8 Э yx2 0,0106% 74,3 По значениям частных коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат у (объем продаж моющего средства) рекламной компании по радио и телевидению, нежели демонстрации товара в магазинах. Пункт 4 предполагает оценку совокупного влияния факторных переменных на результативный признак. Оцените долю вариации результативного признака, объясненную совокупным влиянием факторных признаков, рассчитав совокупный (нескорректированный) множественный коэффициент детерминации: SSR SSE R2 1 , SST SST n где SSR= ( ŷi ~ y )2 - факторная, или объясненная моделью регрессии, сумма i 1 квадратов, n y )2 - общая сумма квадратов, SST = ( yi ~ i 1 n 2 SSE yi yˆ i - остаточная, или не объясненная моделью регрессии i 1 сумма квадратов. В нашем примере эта доля составляет 88,29% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов. Иными словами, на весьма тесную связь факторов с результатом. Скорректированный множественный коэффициент детерминации 17 n 1 1 2 1 2 n m 1 (где n – число наблюдений, m – число объясняющих переменных) определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов в модели и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую детерминированность результата y в модели факторами x 1 и x 2. 2 2 R yx 1 (1 R yx ) x x Охарактеризуйте степень тесноты связи между результативным признаком и всеми факторными, включенными в уравнение регрессии, определив множественный коэффициент корреляции: R R2 . Пункт 5 предполагает ознакомление с методикой дисперсионного анализа по модели множественной регрессии. Проверьте статистическую значимость модели регрессии в целом с помощью Fкритерия Фишера. Для этого воспользуйтесь алгоритмом проверки гипотез, изложенном в указаниях к пункту 4 задачи 1, учитывая, что фактическое значение F – критерия для уравнения множественной регрессии определяется по формуле: SSR n k R2 n k , Fфакт . SSE k 1 1 R 2 k 1 где k - общее число параметров в уравнении множественной регрессии (в случае двухфакторной линейной регрессии k = 3). Для проведения дисперсионного анализа и расчета фактического значения F критерия рекомендуется также заполнить таблицу результатов дисперсионного анализа: Колеблемость результативного признака Сумма квадратов За счет регрессии Сфакт. (SSR) Число степеней свободы k Остаточная Сост. (SSE) n-(k+1) Общая Собщ. (SST) n-1 Дисперсия Dфакт. F-критерий C факт. Fфакт. k (MSR) C ост. Dост. n (k 1) (MSE) Для нашего примера: Таблица 6. Дисперсионный анализ модели множественной регрессии 18 Dфакт. Dост. Колеблемость результативного признака Сумма квадратов Число степеней свободы Дисперсия F-критерий За счет регрессии 579,303 2 289,651 26,402 Остаточная 76,797 7 10,971 Общая 656,100 9 Оценку надежности уравнения регрессии в целом, его параметров и показателя тесноты связи Ryx1x2 дает F-критерий Фишера : Fфакт . SSR DF(k - 1) SSE DF (n k ) 579,3029 2 76,7971 7 26,402 Вероятность случайного значения F - критерия = 24,402 составляет 0,0005, что значительно меньше 0,05. Следовательно, полученное значение неслучайно, оно сформировалось под влиянием существенных факторов. То есть подтверждается статистическая значимость всего уравнения, его параметров и показателя тесноты связи – коэффициента множественной корреляции. Общий вывод по построенной регрессионной модели состоит в том, что на увеличение объёма продаж нового моющего средства значимо повлияла реклама на радио и телевидении: при увеличении расходов на рекламу – возрастал объем продаж. Затраты же на демонстрацию моющего средства в магазинах не оказали существенного влияния на рост объёма продаж. Прогноз по модели множественной регрессии осуществляется по тому же принципу, что и для парной регрессии. Для получения прогнозных значений мы подставляем значения хi в уравнение для получения значения ŷ . Предположим, что мы хотим узнать ожидаемый объем продаж моющего средства, при условии, что затраты на теле и радио рекламу составят 10 условных денежных единиц, а на демонстрацию в магазинах – 5 денежных единиц. yˆ 44,61 2,349 10 0,164 5 68,6 (денежных единиц). Качество прогноза – неплохое, поскольку в исходных данных таким значениям независимых переменных соответствует значение y равное 70 денежных единиц. Мы так же можем вычислить интервал прогноза как 1 100% - доверительный интервал для ожидаемого значения y при заданных значениях независимых переменных: yˆ t / 2,n( k 1) S yx2 MSE , где MSE – остаточная дисперсия, а стандартная ошибка S yx2 для случая нескольких независимых переменных имеет достаточно сложное выражение, которое мы здесь не приводим. 1 100% доверительный интервал для значения y при средних значениS (Yˆ ). Большинство пакетов ях независимых переменных имеет вид: yˆ t / 2,n(k 1) программ рассчитывают доверительные интервалы автоматически. 19 Задачи 3, 4 и 5 посвящены теме “Временные ряды в эконометрических исследованиях”, и, прежде всего проблеме автокорреляции уровней временного ряда и ее последствиям, а также наличию во временном ряде тенденции. Задача 3. Рассмотрим методику решения задачи на практическом примере: Имеются следующие данные о расходах семьи на товар "А" в 1994-1999 гг.: Годы 1994 1995 1996 1997 1998 1999 Расходы на товар "А", руб. 30 35 39 44 50 53 Приступая к выполнению пункта 1, изучите вопрос об измерении автокорреляции уровней временного ряда. Коэффициент автокорреляции первого порядка есть линейный коэффициент корреляции между уровнями исходного временного ряда и уровнями того же ряда сдвинутыми на один момент времени. Его расчет производится по стандартным формулам для расчета линейного коэффициента корреляции: ryt yt 1 yt yt 1 yt2 yt n 2 yt yt 1 n yt21 yt 1 n 2 , где yt - 1 - уровни, сдвинутые по отношению к уровням исходного ряда на 1 год. Заметим, что расчет должен быть осуществлен для пар наблюдений ( yt , y t 1 ) , причем общее число пар наблюдений, по которым производится расчет, равно (n - 1). Близкое по абсолютной величине к единице значение коэффициента автокорреляции первого порядка свидетельствует о высокой тесноте связи между текущими и непосредственно предшествующими уровнями временного ряда или, иными словами, о наличии во временном ряде тенденции. В соответствии с условиями нашей задачи проведем расчеты 1994 1995 1996 1997 1998 Суммы ry (t ) y (t 1) yt yt+1 ytyt+1 yt2 yt+12 30 35 39 44 50 198 35 39 44 50 53 221 1050 1365 1716 2200 2650 8981 900 1225 1521 1936 2500 8082 1225 1521 1936 2500 2809 9991 8981 198 221 5 2 2 8082 198 9991 221 5 5 8981 8751,6 (8082 7840,8)(9991 9768,2) 20 229,4 0,9896. 231,8175 Коэффициент автокорреляции первого порядка равен 0,9896, что свидетельствует о тесной прямой связи между текущими и непосредственно предшествующими уровнями временного ряда. В пункте 2 требуется определить функциональную форму и найти параметры уравнения, наилучшим образом описывающего тенденцию (тренд). Для определения вида тренда рассчитайте следующие показатели динамики: а) цепные абсолютные приросты: t уt уt 1 ; б) абсолютные ускорения уровней ряда, или вторые разности: t t 1 ; уt . у t 1 Проанализируйте полученные результаты. Если приблизительно одинаковы цепные абсолютные приросты, то для описания тенденции временного ряда следует выбрать линейный тренд: уˆ t a bt . Если примерно постоянны абсолютные ускорения уровней ряда, следует выбрать параболу второго порядка: уˆ t a b1t b2 t 2 . Если примерно одинаковы цепные коэффициенты роста, моделирование тенденции следует проводить с использованием экспоненциальной кривой: уˆ t e a bt . Для расчета параметров уравнения тренда примените обычный МНК. В случае нелинейных зависимостей проведите линеаризацию исходной функции. Дайте интерпретацию параметров тренда. Коэффициент регрессии b в линейном тренде есть средний за период цепной абсолютный прирост уровней ряда. в) цепные коэффициенты роста: K t b В экспоненциальной функции величина e представляет собой средний за период цепной темп роста уровней ряда. Начальный уровень ряда в момент (период времени) t = 0 в линейном тренде a выражается параметром а, в экспоненциальном тренде - величиной e . Для нашей задачи проведем следующие расчеты:. 1994 1995 1996 1997 1998 1999 yt t yt yt 1 30 35 39 44 50 53 5 4 5 6 3 t t 1 -1 1 1 -3 Kt yt yt 1 1,1667 1,1143 1,1282 1,1364 1,0600 Очевидно, в данном случае для описания тренда можно выбрать линейную модель: yˆ t a bt . Для расчета параметров уравнения тренда применим обычный МНК. yt n ; (t) 2 n yt b= t 2 21 ~ a=~ y - bt. Если периоды или моменты времени пронумеровать так, чтобы получилось t =0, то вышеприведенные алгоритмы существенно упростятся и превратятся в b= yt ; t 2 a = ~y . Расчеты проведем в следующей рабочей таблице. 1994 1995 1996 1997 1998 1999 Суммы t yt t2 ytt -2,5 -1,5 -0,5 0,5 1,5 2,5 0,00 30 35 39 44 50 53 251 6,25 2,25 0,25 0,25 2,25 6,25 17,5 -75 -52,5 -19,5 22 75 132,5 82,5 b= 82,5 4,7143; 17,5 a= 251 41,8333 . 6 Таким образом, трендовое линейное уравнение регрессии имеет вид: yˆ t 41,8333 4,7143t . Дадим интерпретацию параметров тренда. Коэффициент регрессии (b) в линейном тренде показывает средний за период цепной абсолютный прирост уровней ряда. В нашем примере b = 4,7143, следовательно расходы на товар "А" в среднем за год увеличиваются на 4,7143 руб. Свободный член (а) в линейном тренде выражает начальный уровень ряда в момент (период времени) t = 0. В нашей нумерации t = 0 приходится на период времени между 1996 и 1997 гг., что несколько затрудняет его интерпретацию. В нашем случае а = 41,8333 руб. – это расходы семьи на товар "А" за вторую половину 1996 и первую половину 1997 гг. В случае нелинейных зависимостей необходимо провести линеаризацию исходной функции. Пункт 3. Точечный прогноз по уравнению тренда - это расчетное значение переменной уt , полученное путем подстановки в уравнение тренда соответствующих значений t. Интервальный прогноз рассчитывается в соответствии с методикой, изложенной для уравнения парной линейной регрессии (см. указания к пункту 5 задачи 1). Дадим прогноз расходов на товар "А" на 2000 год. В нашей нумерации 2000 год соответствует моменту времени t = 3,5. Отсюда, yˆ t 3,5 41,8333 4,7143 3,5 58,3333 . Следовательно, точечная оценка расходов семьи на товар "А" на 2000 год составляет 58,3333 руб. Определим границы доверительного интервала, в котором с заданной надежностью γ будут находится расходы семьи на товар "А" в 2000 году. Общепринятый в экономике уровень надежности γ = 1 - α = 1 - 0,05 = 0,95. yˆ t yt yˆ t , 22 где y t -прогноз значения переменной y на момент (период) времени t; ŷ t - точечная оценка значения переменной y на момент (период) времени t; - предельная ошибка прогноза. Для того, чтобы получить интервальную оценку, определим величину предельной ошибки прогноза. Она рассчитывается по формуле: t / 2 se( yˆ t ) , где t / 2 - табличное значение t - критерия Стьюдента для уровня значимости α и числа степеней свободы (k = n - 2); se ( yˆ t ) - стандартная ошибка точечного прогноза, которая, в свою очередь, рассчитывается по формуле: se( yˆ t ) ( yt yˆ t ) 2 1 1 3(n 2l 1) 2 , n2 n3 n n где l - длина периода упреждения (срок прогноза). Расчеты проведем в рабочей таблице. 1994 1995 1996 1997 1998 1999 Суммы t yt ŷ t y t yˆ t ( yt yˆ t ) 2 -2,5 -1,5 -0,5 0,5 1,5 2,5 0,00 30 35 39 44 50 53 251 30,0476 34,7619 39,4762 44,1905 48,9048 53,6190 197,3810 -0,0476 0,2381 -0,4762 -0,1905 1,0952 -0,6190 0,0000 0,0023 0,0567 0,2268 0,0363 1,1995 0,3832 1,9048 1,9048 1 3(6 2 2 1) 2 1 1,0519 . se( yˆ t ) 6 2 6 63 6 Табличное значение t - критерия Стьюдента для уровня значимости α = 0,05 и числа степеней свободы k = 6 – 2 = 4 составляет 2,78, т.е. t / 2 =2,78. Отсюда, 2,78 1,0519 2,9244. Таким образом, 58,3333 2,9244 yt 58,3333 2,9244 ; 55,4089 yt 61,2577 . С вероятностью 0,95 можно ожидать, что в 2000 году расходы семьи на товар "А" будут находиться в пределах от 55,4089 до 61,2577 руб. Обратите внимание на то, что приведенные формулы верны только для уравнения парной регрессии, линейной по параметрам. 23 Задача 4. Рассмотрим методику решения задачи на примере: Имеются следующие данные о величине дохода в расчете на одного члена семьи в процентах к 1994 году и о расходах семьи на товар "А" в 1994-1999 гг.: Годы 1994 1995 1996 1997 1998 1999 Расходы на товар "А", руб. 30 35 39 44 50 53 Доход на одного члена семьи в про100 103 105 109 115 118 центах к 1994 году, % Пункт 1. Определение функциональной формы трендового уравнения регрессии описано в пункте 2 к задаче 3. Пункты 2-3. При измерении корреляции между двумя временными рядами следует учитывать возможность наличия ложной корреляции, обусловленной простым сопутствием временных рядов. Для того чтобы устранить ложную корреляцию, следует определять степень тесноты связи не самих уровней временных рядов, а их последовательных (первых или вторых) разностей или отклонений от трендов (если последние не содержат тенденции). Сделайте вывод о наличии или отсутствии ложной корреляции при разных способах измерения связи между исследуемыми временными рядами, поясните причины существования ложной корреляции. По данным примера рассчитаем коэффициент корреляции между расходами на товар "А" и доходом на одного члена семьи по исходным уровням ряда: xy n rxy 2 2 x 2 y 2 x y n n Заметим, что расчет может быть осуществлен и по другим формулам. Промежуточные расчеты проведем в рабочей таблице. Годы y x xy y2 x2 1994 30 100 3000 900 10000 1995 35 103 3605 1225 10609 1996 39 105 4095 1521 11025 1997 44 109 4796 1936 11881 1998 50 115 5750 2500 13225 1999 53 118 6254 2809 13924 Суммы 251 650 27500 10891 70664 xy 27500 rxy 2 10891 251 6 251 650 6 6502 70664 6 27500 27191,6667 (10891 10500,1667)(70664 70416,6667) 0,9917. Близкое к единице значение коэффициента корреляции свидетельствует о тесной прямой связи между расходами на товар "А" и доходом на одного члена семьи. 24 Однако, учитывая, что расчет был произведен по уровням временного ряда, корреляция между изучаемыми признаками может быть вызвана простым сопутствием явлений во времени. Для того, чтобы исключить тенденцию, рассчитаем коэффициент корреляции по первым разностям. Промежуточные расчеты проведем в рабочей таблице. Годы 1994 1995 1996 1997 1998 1999 Суммы y 30 35 39 44 50 53 251 x 100 103 105 109 115 118 650 Δy Δx ΔxΔy Δy2 Δx2 5 4 5 6 3 23 3 2 4 6 3 18 15 8 20 36 9 88 25 16 25 36 9 111 9 4 16 36 9 74 xy . n 2 2 x 2 x y 2 y n n xy rxy 23 18 5 2 2 111 23 74 18 5 5 88 rxy . 88 82,8 0,7518 111 105,874 64,2 Коэффициент корреляции между расходами на товар "А" и доходом на одного члена семьи, рассчитанный по первым разностям, показывает не столь тесную связь, как коэффициент, рассчитанный по уровням ряда динамики. Расчет коэффициента корреляции по первым разностям позволяет устранить тенденцию, зависимость между x и y, обусловленную сопутствием рядов во времени. Рассчитаем коэффициент корреляции между расходами на товар "А" и доходом на одного члена семьи по отклонениям от тренда. Прежде, чем рассчитывать отклонения от тренда, определим функциональную форму трендовых уравнений регрессии расходов на товар "А" и дохода на одного члена семьи. Слабая колеблемость первых разностей (цепных абсолютных приростов) позволяет говорить о линейной форме обеих моделей. Трендовое линейное уравнение регрессии расходов на товар "А" имеет вид (расчеты см. в методических указаниях к решению задачи 3): yˆ t 41,8333 4,7143t . Аналогично рассчитаем параметры трендового линейного уравнения регрессии доходов в расчете на одного члена семьи: Годы 1994 1995 1996 t -2,50 -1,5 -0,5 x 100 103 105 25 xt -250 -154,5 -52,5 t2 6,25 2,25 0,25 1997 1998 1999 Суммы 0,5 1,5 2,5 0 109 115 118 650 54,5 172,5 295 65 0,25 2,25 6,25 17,5 65 650 3,7143; a = 108,3333 . 17,5 6 Таким образом, трендовое линейное уравнение регрессии имеет вид: yˆ t 108,3333 3,7143t . Перейдем к расчету коэффициента корреляции по отклонению от тренда согласно формуле: ( yt yˆ t )( xt xˆt ) rex e y ( yt yˆ t ) 2 ( xt xˆt ) 2 b= 1994 1995 1996 1997 1998 1999 Суммы yt ŷ t 30 35 39 44 50 53 251 30,0476 34,7619 39,4762 44,1905 48,9048 53,6190 197,3810 y t yˆ t ( yt yˆ t ) 2 -0,0476 0,2381 -0,4762 -0,1905 1,0952 -0,6190 0,0000 re y ex t t 0,0023 0,0567 0,2268 0,0363 1,1995 0,3832 1,9048 xt x̂ t xt xˆ t ( xt xˆ t ) 2 ( y t yˆ t ) ( xt xˆ t ) 100 103 105 109 115 118 650 99,0476 102,7619 106,4762 110,1905 113,9048 117,6190 532,3810 0,9524 0,9070 0,2381 0,0567 -1,4762 2,1791 -1,1905 1,4172 1,0952 1,1995 0,3810 0,1451 0,0000 5,90476 -0,04535 0,056689 0,702948 0,226757 1,199546 -0,23583 1,90476 1,90476 5,904761,9048 0,568 . Величина этого коэффициента корреляции еще более убедительно свидетельствует о сопутствии рядов во времени. Пункт 4. По аналогии с коэффициентами корреляции параметры уравнения регрессии по временным рядам определяют также не по исходным их уровням, а по последовательным разностям, либо отклонениям от тренда. Обратите внимание на интерпретацию параметров, полученных уравнений регрессии: - если уравнение регрессии построено по первым разностям, то коэффициент регрессии b характеризует изменение прироста результативного признака при изменении прироста факторного признака на единицу. Сделайте общий вывод о наличии и тесноте причинно-следственной связи между изучаемыми временными рядами, укажите ее направление. Определим параметры уравнения парной линейной регрессии по первым разностям. Расчет осуществляется обычным методом наименьших квадратов: Годы y x Δy Δx ΔxΔy Δy2 1994 30 100 1995 35 103 5 3 15 25 26 Δx2 9 1996 1997 1998 1999 Суммы 39 44 50 53 251 105 109 115 118 650 4 5 6 3 23 2 4 6 3 18 18 23 5 88 82,8 0,5652; b= (18) 2 74 64,8 74 5 Отсюда, модель имеет вид: 88 - a= 8 20 36 9 88 16 25 36 9 111 4 16 36 9 74 23 18 - 0,5652 2,5652. 5 5 y 2,5652 0,5652 x. Коэффициент регрессии b = 0,5652 означает, что с изменением прироста душевого дохода на 1 процентный пункт расходы на товар "А" изменяются с ускорением, равным 0,5652 руб. 27 Задача 5 посвящена методике выявления сезонной компоненты в рядах динамики, построению моделей с аддитивной и мультипликативной сезонными компонентами и прогнозированию по этим моделям. Для выявления тренда и наличия сезонной компоненты постройте график ряда динамики (пункт 1). При построении графика ряда динамики по оси абсцисс откладываются временные промежутки, а по оси ординат – уровни ряда. Приступая к выполнению пункта 2, изучите вопрос об особенностях анализа сезонных колебаний. Сезонная колеблемость в рядах динамики может иметь аддитивный и мультипликативный характер. Если сезонная вариация постоянна в различных временных периодах, то для анализа временного ряда подходит модель с аддитивной компонентой. Если сезонная вариация не является константой, например, увеличивается с возрастанием значений тренда, то для анализа лучше подходит модель с мультипликативной компонентой, в которой значения сезонной компоненты представляют собой определенную долю трендового значения. В зависимости от особенностей сезонной вариации сделайте выбор между моделями с аддитивной и мультипликативной компонентами. Каждой из этих моделей соответствуют различные методы расчета сезонной компоненты тренда, использующие сочетание методов скользящего среднего и линейной регрессии. Следует помнить, что поскольку сезонные колебания характеризуются относительно небольшими временными интервалами, то прогнозирование по моделям с сезонной компонентой – также краткосрочное. Модель с аддитивной компонентой. Если сезонная компонента переменной А – постоянна, модель фактических значений переменной А можно представить следующим образом: Фактическое значение = = Трендовое значение + Сезонная вариация + Ошибка, то есть: A = T + S + E. Модель с мультипликативной компонентой. Если значение сезонной компоненты переменной А, не является константой, а представляет собой определенную долю трендового значения, т.е. значения сезонной компоненты увеличиваются с возрастанием значений тренда, модель фактических значений переменной А можно представить следующим образом: Фактическое значение = = Трендовое значение Сезонная вариация Ошибка, т.е. А = T S E. В моделях, как с аддитивной, так и с мультипликативной компонентой общая процедура анализа примерно одинакова: Шаг 1. Расчет значений сезонной компоненты. Шаг 2. Десезонализация данных. Для модели с аддитивной компонентой он состоит в вычитании сезонной компоненты из фактических значений. Для модели с мультипликативной компонентой – в расчете отношений между фактическими значениями и сезонной составляющей. Расчет тренда на основе полученных десезонализированных данных. Шаг 3. Расчет ошибок как разности между фактическими и трендовыми значениями. В мультипликативной модели можно рассчитать ошибки еще и как отношение между фактическими и трендовыми значениями. 28 Шаг 4. Расчет среднего линейного отклонения или среднеквадратической ошибки для обоснования соответствия модели исходным данным или для выбора из множества моделей наилучшей. Для того чтобы элиминировать влияние сезонной компоненты (пункт 3) воспользуйтесь методом скользящей средней. Если сезон состоит из 4-х кварталов (год), следует провести сглаживание по 4-м точкам, если сезон состоит из 7-и дней (неделя) следует провести сглаживание по 7-и точкам и т.д. Значения уровней ряда, сглаженные по четному числу точек необходимо центрировать. Множество скользящих средних представляет наилучшую оценку искомого тренда. Процедуры сглаживания и центрирования одинаковы при построении моделей с аддитивной и мультипликативной компонентами. Полученные значения тренда используйте для нахождения оценок сезонной компоненты. Для модели с аддитивной компонентой: A – T = S + E. Для модели с мультипликативной компонентой: А/Т= S E. Найдите средние значения сезонных оценок для каждого года (недели и т.п.). Эта процедура позволяет уменьшить некоторые значения ошибок. Скорректируйте средние значения. Для модели с аддитивной компонентой корректировка состоит в увеличении или уменьшении средних значений на одно и то же число таким образом, чтобы их общая сумма была равна нулю. Это необходимо для того, чтобы усреднить значения сезонной компоненты в целом за период. Обычно корректирующий фактор рассчитывается путем деления суммы оценок сезонных компонент на число сезонов. В мультипликативной модели значения сезонной компоненты - это относительные величины. Поэтому необходимо, чтобы их сумма была равна числу сезонов, а не нулю, как в случае с аддитивной моделью. Если это не так, произведите корректировку значений сезонной компоненты. Шаг 2 состоит в десезонализации исходных данных (пункт 4). В модели с аддитивной компонентой она заключается в вычитании соответствующих значений сезонной компоненты из фактических значений данных за каждый квартал (день и т.п.), то есть: A – S = T + E. В модели с мультипликативной компонентой процедура десезонализации осуществляется по формуле: А/S= T E. Новые оценки тренда, которые все еще содержат ошибку, используйте для построения модели основного тренда. Нанесите эти значения на исходную диаграмму, сделайте вывод о наличии тренда. Пункт 5 посвящен подбору уравнения тренда с аддитивной или мультипликативной компонентой. При этом выбор функциональной формы тренда осуществляется, исходя из общих принципов, изложенных в пункте 2 к задаче 3. Предположим, например, что тренд – линейный. Уравнение линейного тренда имеет вид: T a bx , где х – порядковый номер квартала, а и b – параметры уравнения парной регрессии. 29 Поскольку предполагается, что тренд имеет линейный характер, то значения параметров линии, аппроксимирующей тренд, найдите методом наименьших квадратов: где y = T + E, n b x ~x y i 1 i i ~ y n 2 xi ~x , i 1 a ~y b~ x . Пункт 6 заключается в расчете ошибки (Е), среднего абсолютного отклонения (MAD) и среднеквадратической ошибки (MSE) модели. Расчет этих показателей соответствует шагу 3 алгоритма и предшествует составлению прогноза. Осуществите расчет ошибок или остатка. В аддитивной модели он осуществляется по формуле: Е = А - S - Т. В мультипликативной: Е = А/(Т S) или Е = А - (Т S). Найдите меру соответствия модели исходным данным, т.е. определите ту часть колеблемости уровней ряда, которую невозможно объяснить с помощью построенной модели. Для этого используйте среднее абсолютное отклонение (mean absolute deviation MAD) и среднеквадратическую ошибку (mean square error - MCE): MAD Фактические значения - Прогнозные значения n E MSE Et n ; 2 t . n Целесообразно использовать обе меры, так как последняя из них резко возрастает при наличии высоких ошибок. Пункт 7 состоит в прогнозировании на основании полученных моделей. Прогнозные значения по модели с аддитивной компонентой рассчитайте по формуле: F = T + S. В модели с мультипликативной компонентой используйте следующий алгоритм: F= Т S. Не следует забывать: чем более отдаленным является период упреждения, тем меньшей оказывается обоснованность прогноза. Рассмотрим практическую реализацию методики решения задачи для модели с аддитивной компонентой. В таблице 1 представлено количество продукции, проданной компанией FORA LTD в течение последних 13 кварталов. Таблица 1. Количество продукции, проданной в течение последних 13 кварталов ДАТА Количество 30 проданной продукции, тыс. шт. 239 201 182 297 Январь - март 1996 Апрель – июнь Июль – сентябрь Октябрь – декабрь Январь - март 1997 Апрель – июнь Июль – сентябрь Октябрь – декабрь 324 278 257 384 Январь - март 1998 Апрель – июнь Июль – сентябрь Октябрь – декабрь 401 360 335 462 Январь - март 1999 481 9 19 9 т ма р - рь Ян ва Ок тя бр ь – – се де ка бр ь бр ь ь нт я ию н 8 – 19 9 ль Ию ль - Ап ре ма р т де – рь Ян ва бр ь – Ок тя Ию ль ка бр ь бр ь ь нт я ию н се – 19 9 ль т Ап ре ма р рь - – Ян ва бр ь 7 ка бр ь бр ь де нт я се Ок тя Ию ль – ль Ап ре рь - ма р т – 19 9 ию н 6 ь 600 500 400 300 200 100 0 Ян ва количество проданной продукции, тыс. шт. Построим график, позволяющий сделать выводы о типе модели: Стабильность сезонной компоненты указывает на то, что модель с аддитивной компонентой подходит для анализа этого временного ряда. То есть фактические объемы продаж можно выразить следующим образом: A=T+S+E Для того чтобы элиминировать влияние сезонной компоненты воспользуемся методом скользящей средней, которую рассчитаем с интервалом в три месяца. Этот расчет и все последующие проведем в таблице 2. Таблица 2 . Расчет по 4 точкам центрированных скользящих средних значений тренда для модели A – T = S + E ДАТА Объем Итого за Скользящая Центриро- Оценка продаж, 4 кварта- средняя за ванная сезонной тыс.шт. ла 4 квартала скользящая компосредняя ненты A-T=S+E 31 Январь - март 239 1996 Апрель – июнь 201 919 Июль – сентябрь Октябрь – декабрь Январь 1997 - 229,75 182 1004 251 1081 270,25 297 март 324 1156 Апрель – июнь 278 Июль – сентябрь 257 384 1480 Июль – сентябрь Октябрь – декабрь Январь 1999 - 279,6 +44,4 299,9 -21,9 320,4 -63,4 340,3 +43,8 360,2 +40,8 379,8 -19,8 399,5 -64,5 350,5 март 401 Апрель – июнь +36,4 330 1402 - 260,6 310,75 1320 Январь 1998 -58,4 289 1243 Октябрь – декабрь 240,4 370 360 1558 389,5 1638 409,5 335 462 март 481 Просуммировав первые 4 значения, получим общий объем продаж в 1996 году. Разделив эту сумму на 4, найдем средний объем продаж в каждом квартале 1996 года: (239 + 201 + 182 + 297)/4 = 299,75. Полученное значение уже не содержит сезонной компоненты, так как представляет собой среднюю величину за год. У нас появилась оценка значения тренда для середины года, то есть для точки, лежащей в середине между кварталами II и III. Последовательно продвигаясь вперед с шагом в один квартал, рассчитаем средние квартальные значения для промежутков: апрель 1996 – март 1997 (251), июль 1996 – июнь 1997 (270,25) и т.д. Данная процедура позволяет генерировать скользящие средние по 4 точкам исходного множества данных. Получаемое таким образом множество скользящих средних представляет собой наилучшую оценку искомого тренда. Теперь полученные значения тренда можно использовать для нахождения оценок сезонной компоненты. Мы рассчитываем: A – T = S + E. К сожалению, оценки значений тренда, получаемые в результате расчета скользящих средних по 4 точкам, относятся к несколько иным моментам времени, чем фактические данные. Первая оценка, равная 229,75, представляет собой точку, совпадающую с серединой 1996 года, то есть лежит в центре промежутка фактических объемов продаж во II и III кварталах. Вторая оценка, равная 251, лежит между фактическими значениями в III и IV кварталах. Нам же необходимы десезонализированные 32 средние значения, соответствующие тем же интервалам времени, что и фактические значения за квартал. Положение десезонализированных средних во времени сдвигается путем дальнейшего расчета средних для каждой пары значений. Найдем среднюю из первой и второй оценок, центрируя их июнь-сентябрь 1996 года, т.е. (229,75 + 251)/2 = 240,4. Это и есть десезонализированная средняя за июль-сентябрь 1996 г. Эту десезонализированную величину, которая называется центрированной скользящей средней, можно непосредственно сравнивать с фактическим значением за июль-сентябрь 1996 года, равным 182. Отметим, что сглаживание по 4-м точкам приводит к потере оценок тренда за первые два или последние два квартала временного ряда. После расчетов в таблице 2. мы имеем оценки сезонной компоненты, которые включают в себя ошибку или остаток. Прежде чем мы сможем использовать сезонную компоненту, нужно пройти два следующих этапа. Найдем средние значения сезонных оценок для каждого сезона года. Расчеты приведены в таблице 3. Таблица 3. Расчет средних значений сезонной компоненты Номер квартала ГОД 1 2 3 4 1996 1997 1998 Итого Среднее значение Оценка сезонной компоненты Скорректированная сезонная компонента +44,4 +40,8 +85,2 85,2 2 -21,9 -19,8 -41,7 -41,7 2 -58,4 -63,4 -64,5 -186,3 -186,3 3 +36,4 43,8 +80,2 80,2 2 +42,6 -20,8 -62,1 +40,1 +42,6 -20,7 -62,0 +40,1 Сумма=- 0,2 Сумма = 0 Эта процедура позволяет уменьшить некоторые значения ошибок. Наконец, скорректируем средние значения, увеличивая или уменьшая их на одно и то же число таким образом, чтобы их общая сумма была равна нулю. Это необходимо, чтобы усреднить значения сезонной компоненты в целом за год. Обычно корректирующий фактор рассчитывается путем деления суммы оценок сезонных компонент на число сезонов. В нашем же примере оценки второго и третьего кварталов мы округлили до ближайшего большего числа. Значения скорректированной сезонной компоненты подтверждают наши выводы, сделанные на основе диаграммы. Объемы продаж за два зимних месяца превышают среднее трендовое значение приблизительно на 40 тыс. шт., а объемы продаж за два летних месяца ниже средних на 21 и 62 тыс. шт. соответственно. Аналогичная процедура применима при определении сезонной вариации за любой промежуток времени. Если, например, в качестве сезона выступают дни недели, для элиминирования влияния ежедневной “сезонной компоненты” также рассчитывают скользящую среднюю, но уже не по четырем, а по семи точкам. Эта скользящая средняя представляет собой значение тренда в середине недели, то есть в четверг, таким образом, необходимость в центрировании отпадает. Шаг 2 состоит в десезонализации исходных данных. Она заключается в вычитании соответствующих значений сезонной компоненты из фактических значений данных за каждый квартал, то есть A – S = T + E, что показано в таблице 4. 33 Таблица 4 . Расчет десезонализированных данных Номер Объем Сезонная ДАТА квартала продаж, компонента тыс.шт. Январь - март 1996 Апрель – июнь Июль – сентябрь Октябрь – декабрь Январь - март 1997 Апрель – июнь Июль – сентябрь Октябрь – декабрь Январь - март 1998 Апрель – июнь Июль – сентябрь Октябрь – декабрь Январь - март 1999 1 239 +42,6 Десезонализированный объем продаж, Тыс. шт. A–S=T+E 196,4 2 3 4 5 201 182 297 324 -20,7 -62,0 +40,1 +42,6 221,7 244,0 256,9 281,4 6 7 8 9 278 257 384 401 -20,7 -62,0 +40,1 +42,6 298,7 319,0 343,9 358,6 10 11 12 13 360 335 462 481 -20,7 -62,0 +40,1 +42,6 380,7 397,1 421,9 438,4 Новые оценки тренда, которые все еще содержат ошибку, можно использовать для построения модели основного тренда. Если нанести эти значения на исходную диаграмму, то можно сделать вывод о существовании явного линейного тренда Уравнение линии тренда имеет вид: T a bx , где х – порядковый номер квартала, а и b – параметры уравнения парной регрессии. Поскольку мы нашли, что тренд имеет линейный характер, то значения параметров линии, аппроксимирующей тренд, найдем методом наименьших квадратов. где y = T + E, n x ~x y ~y b i i 1 i n x i 1 i ~ x , a ~y b~ x . 2 Подставив значения из последних колонок таблицы 4 в соответствующие формулы, получим: b 19 ,978 , a 180 ,046 . Следовательно, уравнение модели тренда имеет следующий вид (с округлением значений коэффициентов регрессии до ближайших целых значений): Трендовое значение объема продаж, тыс. шт. = 180,0 + 20,0 * номер квартала. Шаг 3 нашего алгоритма, предшествующий составлению прогноза состоит в расчете ошибок или остатка. Наша модель имеет следующий вид: A = T + S + E. Значение S было найдено в таблице 2, а значение T в таблице 3. Вычитая каждое значение из фактических объемов продаж, получим значения ошибок. 34 Таблица 5. Расчет ошибок для модели с аддитивной компонентой Дата Номер Объем Сезонная Трендовое кварта- продаж, компонента значение, ла Тыс. шт. тыс, шт Январь - март 1 239 +42,6 200 1996 Апрель – июнь 2 201 -20,7 220 Июль – сентябрь 3 182 -62,0 240 Октябрь – декабрь 4 297 +40,1 260 Январь - март 5 324 +42,6 280 1997 Апрель – июнь 6 278 -20,7 300 Июль – сентябрь 7 257 -62,0 320 Октябрь – декабрь 8 384 +40,1 340 Январь - март 9 401 +42,6 360 1998 Апрель – июнь 10 360 -20,7 380 Июль – сентябрь 11 335 -62,0 400 Октябрь – декабрь 12 462 +40,1 420 Январь - март 13 481 +42,6 440 1999 Ошибка, тыс. шт. -3,6 +1,7 +4,0 -3,1 +1,4 -1,3 -1,0 +3,9 -1,6 +0,7 -3,0 +1,9 -1,6 Как и в случае линейной регрессии для того, чтобы найти меру соответствия модели исходным данным, необходимо вычислить значения ошибок (остатков) модели, то есть той части значения наблюдения, которую невозможно объяснить с помощью построенной модели. Для этого применяют среднее абсолютное отклонение (mean absolute deviation - MAD) и среднеквадратическую ошибку (mean square error - MCE). Целесообразно использовать обе меры, так как последняя их этих мер резко возрастает при наличии высоких ошибок. Мы можем использовать в шаге 4 последний столбец таблицы 5 для расчета MAD и MSE. E t 2 78 ,85 E i 28 ,6 MSE 6 ,1 MAD 2 ,2 n 13 n 13 ; В нашем случае ошибки достаточно малы и составляют от 1 до 3% от уровней ряда. Тенденция, выявленная по фактическим данным, достаточно устойчива и позволяет получить хорошие краткосрочные прогнозы. Прогнозные значения по модели с аддитивной компонентой рассчитывают как: F=T+S (тыс. шт. за квартал), где трендовое значение Т=180+20номер квартала, а сезонная компонента S составляет +42,6 в январе-марте, -20,7 в апреле-июне, 62,0 в июле-сентябре и +40,1 в октябре-декабре. Порядковый номер квартала, охватывающего ближайшие три месяца с апреля по июль 1999 г., равен 14, таким образом, прогнозное трендовое значение составит: Т14=180+2014=460 (тыс. шт. за квартал). Соответствующая сезонная компонента равна –20,7 тыс. шт. Следовательно, прогноз на этот квартал определяется как: F (апрель-июнь 1999г.)=460-20,7=439,3 тыс. шт. 35 Не следует забывать: чем более отдаленным является период упреждения, тем меньшей оказывается обоснованность прогноза. В данном случае мы предполагаем, что тенденция, обнаруженная по ретроспективным данным, распространяется и на будущий период. Для сравнительно небольших периодов упреждения такая предпосылка может действительно иметь место, однако ее выполнение становится менее вероятным по мере сопоставления прогнозов на более отдаленную перспективу. Рассмотрим практическую реализацию методики решения задачи для модели с мультипликативной компонентной. В некоторых временных рядах значение сезонной компоненты не является константой, а представляет собой определенную долю трендового значения. Таким образом, значения сезонной компоненты увеличиваются с возрастанием значений тренда. Пример 2. Компания LORA Ltd осуществляет реализацию нескольких видов продукции. Объемы продаж одного из продуктов за последние 13 кварталов представлены в таблице 6. Таблица 6. Квартальные объемы продаж компании LORA Ltd Дата Номер квартала Количество проданной продукции, тыс. шт. Январь-март 1996 1 70 Апрель-июнь 2 66 Июль-сентябрь 3 65 Октябрь-декабрь 4 71 Январь-март 1997 5 79 Апрель-июнь 6 66 Июль-сентябрь 7 67 Октябрь-декабрь 8 82 Январь-март 1998 9 84 Апрель-июнь 10 69 Июль-сентябрь 11 72 Октябрь-декабрь 12 87 Январь-март 1999 13 94 нв ар ьм ар т 19 Ап 96 ре ль И -и ю ю ль нь -с О е кт нт яб яб рь рь Я д нв ек ар аб ьрь м ар т 19 Ап 97 ре ль И -и ю ю ль нь -с О е кт нт яб яб рь рь Я де нв к ар аб ьрь м ар т 19 Ап 98 ре ль И -и ю ю ль нь се О кт нт яб яб рь рь Я де нв ка ар бр ьм ь ар т 19 99 100 90 80 70 60 50 40 30 20 10 0 Я количество проданной продукции, тыс. шт Построим график, позволяющий сделать выводы о типе модели: 36 Объем продаж этого продукта так же, как и в предыдущем примере, подвержен сезонным колебаниям, и значения его в зимний период выше, чем в летний. Однако размах вариации фактических значений относительно линии тренда постоянно возрастает. К таким данным следует применять модель с мультипликативной компонентной: Фактическое значение = Трендовое значение Сезонная вариация Ошибка, т.е. А=T S E В нашем примере есть все основания предположить существование линейного тренда, но чтобы полностью в этом убедиться, проведем процедуру сглаживания временного ряда. В сущности эта процедура ничем не отличается от той, которая применялась для аддитивной модели. Так же вычисляются центрированные скользящие средние для трендовых значений, однако оценки сезонной компоненты представляют собой коэффициенты, полученные по формуле А/Т= S E. Результаты расчетов приведены в табл. 7. Таблица 7. Расчет значений сезонной компоненты для LORA Ltd Дата Номер квар- Объем про- Скользящая Центриро- Коэффициент тала даж, тыс. средняя за ванная сезонности шт. А четыре скользящая А/Т= S E. квартала средняя 1 2 3 4 5 6 Январь-март 1 70 1996 Апрель-июнь 2 66 68 Июль3 65 70,25 69,13 0,940 сентябрь Октябрь4 71 70.25 70,25 1,011 декабрь Январь-март 5 79 70,75 70,50 1,121 1997 Апрель-июнь 6 66 73,50 72,13 0,915 Июль7 67 74,75 74,13 0,904 сентябрь Октябрь8 82 75,50 75,13 1,092 декабрь Январь-март 9 84 76,75 76,13 1,103 1998 Апрель-июнь 10 69 78 77,38 0,892 Июль11 72 80,50 79,25 0,909 сентябрь Октябрь12 87 декабрь Январь-март 13 94 1999 Значения сезонных коэффициентов получены на основе квартальных оценок по аналогии с алгоритмом, который применялся для аддитивной модели. Так как значения сезонной компоненты - это коэффициенты, а число сезонов равно четырем, необходи37 мо, чтобы их сумма была равна четырем, а не нулю, как в предыдущем случае. (Если бы в исходных данных предполагалось семь сезонов в течение недели по одному дню каждый, то общая сумма значений сезонной компоненты должна была бы равняться семи). Если эта сумма не равна четырем, производится корректировка значений сезонной компоненты точно таким же образом, как это уже делалось ранее. В таблице оценки, рассчитанные в последнем столбце предшествующей табл. 8, расположены под соответствующим номером квартала. Таблица 8.Расчет значений сезонной компоненты для LORA Ltd Год Номер квартала 1 2 3 4 1996 0,940 1,011 1997 1,121 0,915 0,904 1,092 1998 1,103 0,892 0,909 Итого 2,224 1,807 2,77753 2,103 Среднее значение 2,224 2 1,807 2 2,753 2 2,103 2 Оценка сезонной компо1,112 0,903 0,918 1,051 Сумма ненты =3,984 Скорректированная се1,116 0,907 0,922 1,055 Сумма зонная компонента =0 Как показывают оценки, в результате сезонных воздействий объемы продаж в январе-марте увеличиваются на 11,6 % соответствующего значения тренда (1,116). Аналогично сезонные воздействия в октябре-декабре приводят к увеличению объема продаж на 5,5 % от соответствующего значения тренда. В двух других кварталах сезонные воздействия состоят в снижении объемов продаж, которое составляет 90,7 и 92,2 % от соответствующих трендовых значений. После того, как оценки сезонной компоненты определены, можем приступить к процедуре десезонализации по формуле А/S= T E. Результаты расчетов этих оценок значений тренда приведены в табл. 9. Таблица 9. Расчет уравнения тренда для компании LORA Ltd Дата Номер Объем проКоэффициент Десезонализированный квартала даж, тыс. сезонности, S объем продаж, тыс. шт., А шт. А/T= S E Январь-март 1 70 1,116 62,7 1996 Апрель-июнь 2 66 0,907 72,8 Июль-сентябрь 3 65 0,922 70,6 Октябрь4 71 1,055 67,3 декабрь Январь-март 5 79 1,116 70,8 1997 Апрель-июнь 6 66 0,907 72,8 Июль-сентябрь 7 67 0,922 72,7 Октябрь8 82 1,055 77,7 декабрь Январь-март 9 84 1,116 75,2 1998 38 Апрель-июнь 10 69 0,907 76,1 Июль-сентябрь 11 72 0,922 78,2 Октябрь12 87 1,055 82,4 декабрь Январь-март 13 94 1,116 84,2 1999 Теперь нужно принять решение о том, какой вид будет иметь уравнение тренда. Очевидно, что линия тренда - не кривая, наоборот, она несколько больше напоминает прямую, хотя отдельные точки, особенно значения за 1996 г, расположены хаотически. Предположим для простоты, что тренд линейный, и для расчета параметров прямой, наилучшим образом его аппроксимирующей, будем применять метод наименьших квадратов, который дает следующий результат: Т = 64,6 + 1,36 номер квартала (тыс. шт. в квартал). Это уравнение будем использовать в дальнейшем для расчета оценок трендовых объемов продаж на каждый момент времени. Итак, мы нашли значения тренда и сезонной компоненты. Теперь мы можем использовать их для того, чтобы рассчитать ошибки в прогнозируемых по модели объемах продаж Т S по сравнению с фактическими значениями А. В табл.10 эти ошибки рассчитаны как отношение Е = А/(Т S). Для каждого года ошибки достаточно велики, что видно из графика десезонализированных значений. Однако, начиная и первого квартала 1997 г., величина ошибки составляет в среднем 2-3 % от фактического значения, и можно сделать вывод о соответствии построенной модели фактическим данным. Дата Январьмарт 1996 Апрельиюнь Июльсентябрь Октябрьдекабрь Январьмарт 1997 Апрельиюнь Июльсентябрь Октябрьдекабрь Таблица 10.Расчет ошибок для компоненты LORA Ltd. Номер Объем Сезонная Трендовое Ошибка квар- продаж, композначение, тала тыс. нента, тыс. шт., Т шт. А S Т S А/(Т S). 1 70 1,116 66,0 73,7 0,95 А-(Т S). -3,7 2 66 0,907 67,3 61,0 1,08 +5,0 3 65 0,922 68,7 63,3 1,03 +1,7 4 71 1,055 70,0 73,9 0,96 -2,9 5 79 1,116 71,4 79,7 0,99 -0,7 6 66 0,907 72,8 66,0 1,00 0 7 67 0,922 74,1 68,3 0,98 -1,3 8 82 1,055 755,5 79,7 1,03 +2,3 39 Январьмарт 1998 Апрельиюнь Июльсентябрь Октябрьдекабрь Январьмарт 1999 9 84 1,116 76,8 85,7 0,98 -1,7 10 69 0,907 78,8 70,9 0,97 -1,9 11 72 0,922 79,6 73,3 0,98 -1,3 12 87 1,055 80,9 85,4 1,02 +1,6 13 94 1,116 82,3 91,9 1,02 +2,1 При составлении прогнозов по любой модели предполагается, что можно найти уравнение, удовлетворительно описывающее значение тренда. В обоих изложенных выше примерах эти предпосылка была успешно выполнена. Тренд, который нами рассматривался, был очевидно линейный. Если бы исследуемый тренд представлял собой кривую, мы были бы вынуждены моделировать эту связь с помощью одного из методов формализации нелинейных взаимосвязей, рассмотренных в предыдущей главе. После того, как параметры уравнения тренда определены, процедура составления прогнозов становится совершенно очевидной. Прогнозные значения определяются по формуле: F= Т S, где Т=64,6+1,36 номер квартала (тыс. шт. за квартал), а сезонные компоненты составляют 1,116 в первом квартале, 1,097 - во втором, 0,922 - в третьем и 1,055 в четвертом квартале. Ближайший следующий квартал - это второй квартал 1999г., охватывающий период с апреля по июнь и имеющий во временном ряду порядковый номер 14. Прогноз объема продаж в этом квартале составляет: F= Т S = (64 + 1,36 14) 0,907 = 83,64 0,907 = 75,9 (тыс. шт. за квартал). С учетом величины ошибки прогноза мы можем сделать вывод, что данная оценка будет отклоняться от фактического значения не более, чем на 2 - 3 %. Аналогично, прогноз на октябрь-декабрь 1999 г., рассчитывается для квартала с порядковым номером 16 с использованием значения сезонной компоненты для IV квартала года: F = Т S = (64 + 1,36 16) 1,055 = 83,36 1,055 = 91,1(тыс. шт. за квартал). Разумно предположить, что величина ошибки данного прогноза будет несколько выше, чем предыдущего, поскольку этот прогноз рассчитан на более длительную перспективу. 40 Контрольные задания Задача 1 Задания: 1) Постройте поле корреляции результативного и факторного признаков. 2) Определите параметры уравнения парной линейной регрессии. Дайте интер претацию найденных параметров и всего уравнения в целом. 3) Постройте теоретическую линию регрессии, совместив ее с полем корреляции. Сделайте выводы. 4) Рассчитайте линейный коэффициент корреляции и поясните его смысл. Определите коэффициент детерминации и дайте его интерпретацию. 5) С вероятностью 0,95 оцените статистическую значимость коэффициента регрессии и уравнения регрессии в целом. Сделайте выводы. 6) С вероятностью 0,95 постройте доверительный интервал для прогноза оценки y i и доверительный интервал генерального значения ŷ г ен. ( x -задается отдель- но в условии каждой задачи). 7) Определите значение коэффициента эластичности и объясните его. 1. Туристическая компания предлагает места в гостиницах приморского курорта. Менеджера компании интересует, насколько возрастает привлекательность гостиницы в зависимости от ее удаленности от пляжа. С этой целью по 14 гостиницам города была выяснена среднегодовая наполняемость номеров и расстояние от пляжа: Расстояние, км 0,1 0,1 0,2 0,3 0,4 0,4 0,5 0,6 0,7 0,7 0,8 0,8 0,9 0,9 Наполняе92 95 96 90 89 86 90 83 85 80 78 76 72 75 мость, % К пункту 6. Значение x =0,65. 2. Компанию по прокату автомобилей интересует зависимость между пробегом автомобилей и стоимостью ежемесячного обслуживания. Для выяснения характера этой связи было отобрано 15 автомобилей. Результаты исследования представлены в таблице: 1 1 1 1 1 1 1 1 1 1 2 Пробег, тыс. км 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 Стоимость 1 1 1 2 1 2 2 2 3 3 3 3 3 4 3 обслуживания, у.е. 3 6 5 0 9 1 6 4 0 2 0 5 4 0 9 К пункту 6. Значение x =18,5. 3. Торговцу нужно выяснить, как изменяется количество пучков салата, продаваемых ежедневно в розницу. Имеются следующие сведения о количестве и цене: Количество, тыс./день 28 29 34 35 37 37 41 46 Цена, у.е. за единицу 30 31 25 26 22 24 16 12 К пункту 6. Значение x =20. 4. Компания, занимающаяся продажей радиоаппаратуры, установила на видеомагнитофон определенной модели цену, дифференцированную по регионам. Следую41 щие данные показывают цены на видеомагнитофон в 8 различных регионах и соответствующее им число продаж: Число продаж, шт. 420 380 350 400 440 380 450 420 Цена, у.е. 5,5 6,0 6,5 6,0 5,0 5,6 4,5 5,0 К пункту 6. Значение x =5,75. 5. Некоторая компания недавно провела рекламную кампанию в магазинах с демонстрацией антисептических качеств своего нового моющего средства. Через 10 недель компания решила проанализировать эффективность этого вида рекламы, сопоставив еженедельные объемы продаж с расходами на рекламу (тыс. руб.): Объем продаж, у.е. 72 76 78 70 68 80 82 65 62 90 Расходы на рекламу, у.е. 5 8 6 5 3 9 12 4 3 10 К пункту 6. Значение x =7,5. 6. По 10 однородным предприятиям имеются данные о количестве рабочих с профессиональной подготовкой и количестве бракованной продукции: № предприятия 1 2 3 4 5 6 7 8 9 10 Количество рабочих с профессио10 12 14 17 24 28 30 35 40 50 нальной подготовкой, % Количество бракованной 18 17 14 12 10 10 8 9 6 6 продукции, % К пункту 6. Значение x =27. 7. При исследовании годового дохода и сбережений населения в случайном порядке отобрано 9 человек. Получены следующие данные: Доход, тыс. у.е. 15 6 9 3 20 11 14 10 12 Сбережения, у.е.. 2000 200 500 500 2500 1800 1500 1500 1600 К пункту 6. Значение x =17. 8. Проведен опрос случайно выбранных 10 студентов, проживающих в общежитии университета, для выявления зависимости между средним баллом по результатам предыдущей сессии и числом часов в неделю, затраченных студентом на самостоятельную подготовку: Средний балл 4,6 4,3 3,8 3,8 4,2 4,3 3,8 4,0 3,1 3,9 Число часов 25 22 19 15 15 30 20 30 10 17 К пункту 6. Значение x =27. 9. Имеются данные по 14 предприятиям о производительности труда и коэффициенте механизации работ: Коэффициент меха32 30 36 40 41 47 56 54 60 55 61 67 69 76 низации работ, % Производительность 20 24 28 30 31 33 34 37 38 40 41 43 45 48 труда, шт. К пункту 6. Значение x =65. 10. Представлены данные, характеризующие зависимость между количеством внесенных удобрений и урожайностью картофеля: 42 Удобрения, кг/га. 140 148 150 150 185 190 202 220 220 240 К пункту 6. Картофель, ц/га. 135 135 182 175 200 200 200 210 265 250 Значение x =160. 43 Задача 2 Задания: 1) Определите парные и частные коэффициенты корреляции, корреляции, проверьте их значимость для α = 0,05, сделайте выводы. 2) Постройте линейное уравнение множественной регрессии, поясните экономический смысл его параметров и всего уравнения в целом. Проверьте значимость параметров уравнения регрессии на уровне значимости α = 0,05. 3) Рассчитайте коэффициенты эластичности. Дайте их интерпретацию. 4) Найдите множественный коэффициент корреляции и детерминации, объясните их смысл. 5) Проверьте наличие мультиколлинеарности в модели, вычислив значение показателя VIF. 6) Проверьте значимость полученного уравнения регрессии в целом на уровне значимости α = 0,05.Сделайте выводы. 1. В конце семестра студенты сдают экзамены. Перед сдачей экзаменов в 20 группах был проведен опрос о том, какую оценку по сдаваемым в сессию курсам они ожидают получить. После сессии полученные оценки были сопоставлены с ожидаемыми оценками и числом студентов в группах. Средняя оценка по предмету в iОжидаемая Число студентов в группе той группе студентов оценка 4,1 3,4 45 3,4 3,1 52 3,3 3,0 47 3,0 2,8 63 4,7 3,7 20 4,6 3,5 32 3,0 2,9 51 4,6 3,7 32 4,6 3,5 21 3,6 3,2 33 3,5 3,0 40 4,0 3,5 29 3,6 3,3 38 3,1 3,1 67 3,3 3,3 61 4,5 3,9 50 2,8 2,9 63 3,7 3,2 47 3,8 3,4 51 3,9 3,4 31 2. Имеются следующие данные о результатах аукционных торгов старинными часами: 44 № п/п Цена продажи, тыс. у.е. 1 2 3 4 5 6 7 8 9 10 1,2 1,1 0,8 1,5 1,0 2,0 1,8 1,2 1,3 0,9 Возраст часов, лет 127 115 127 150 156 182 156 132 137 113 Число участников аукционных торгов, чел. 13 12 7 9 6 11 12 10 9 9 № п/п Цена продажи, тыс. у.е. 11 12 13 14 15 16 17 18 19 20 1,7 1,0 1,1 1,1 1,2 1,3 1,5 0,9 1,1 1,2 Возраст часов, лет 137 117 137 153 117 126 150 127 115 127 Число участников аукционных торгов, чел. 15 11 8 6 13 10 9 7 12 13 3. Имеются следующие данные по 20 предприятиям отрасли промышленности: ЭнерговооруженДоля рабочих, занятых руч№ Производительность ность, квт.-ч на 1 ра- ным трудом в общей численп/п труда, у.е. на 1 рабочего бочего ности рабочих, % 1 9,8 4,8 40 2 6,7 2,8 59 3 12,4 7,0 38 4 6,9 3,8 57 5 11,8 5,5 31 6 7,3 3,0 56 7 8,4 3,4 45 8 10,7 5,2 35 9 11,1 5,4 32 10 7,3 2,9 54 11 8,8 3,9 43 12 10,0 5,0 36 13 12,1 6,2 29 14 11,9 5,1 32 15 6,8 2,7 55 16 7,0 2,9 50 17 12,0 6,1 30 18 7,5 3,3 48 19 8,0 3,4 45 20 9,2 3,8 49 4. По выборке из 20 почтовых отправлений изучается зависимость стоимости отправки корреспонденции экспресс - почтой от веса конверта и дальности перевозки: Стоимость Вес Дальность Стоимость Вес Дальность № № доставки, конперевозки, доставки, конперевозки, п/п п/п у.е. верта, г тыс. км. у.е. верта, г тыс. км. 1 26 590 0,5 11 110 510 2,4 2 39 320 1,5 12 50 240 2,1 3 80 44 2,0 13 20 30 1,6 4 92 66 1,6 14 60 620 1,2 45 5 6 7 8 9 10 44 15 145 19 10 140 75 70 650 450 60 750 2,8 0,8 2,4 0,5 1,0 1,9 15 16 17 18 19 20 11 80 33 121 155 17 270 350 410 810 700 110 0,4 2,5 1,0 1,6 2,6 0,9 5. Имеются следующие данные о ценах и дивидендах по обыкновенным акциям, а также о доходности капитала инвестиционной компании : ДоходУровень ДоходУровень № Цена ак№ Цена акность кадивиденность ка- дивиденп/п ции, у.е. п/п ции, у.е. питала, % дов, % питала, % дов, % 1 25 15,2 2,6 11 25 15,3 2,6 2 20 13,9 2,1 12 26 15,2 2,8 3 15 15,8 1,5 13 26 12,0 2,7 4 34 12,8 3,1 14 20 15,3 1,9 5 20 6,9 2,5 15 20 13,7 1,9 6 33 14,6 3,1 16 13 13,3 1,6 7 28 15,4 2,9 17 21 15,1 2,4 8 30 17,3 2,8 18 31 15,0 3,0 9 23 13,7 2,4 19 26 11,2 3,1 10 24 12,7 2,4 20 11 12,1 2,0 6. Для анализа эффективности работы предприятий машиностроения были исследованы следующие данные: Рентабельность, прибыль в Производительность Средний возраст про№ % к стоимости основных и труда, у.е. на 1 работизводственного оборуп/п оборотных фондов ника дования, лет. 1 7 7 20 2 8 10 19 3 7 9 21 4 9 11 17 5 9 11 16 6 8 11 18 7 11 13 15 8 11 14 14 9 16 17 10 10 15 18 11 11 19 21 9 12 16 18 11 13 18 20 10 14 17 20 10 15 19 22 9 16 20 23 8 17 11 12 15 18 11 11 14 19 10 12 13 20 15 17 12 46 7. Изучается влияние изменения объема промышленного производства и среднедушевого дохода на товарооборот. Для этого по 20 регионам РФ были получены следующие данные: Розничный товарооборот Объем промышленного Среднедушевой денеж№ (в % к предыдущему гопроизводства (в % к ный доход (в % к п/п ду) предыдущему году) предыдущему году) 1 89 85 88 2 75 70 85 3 82 86 81 4 84 80 87 5 91 97 87 6 92 79 110 7 89 92 102 8 107 99 105 9 89 83 94 10 87 77 92 11 96 88 82 12 75 89 85 13 74 72 84 14 86 80 105 15 73 81 94 16 100 97 98 17 87 73 92 18 87 75 95 19 98 84 101 20 81 75 88 8. По 25 предприятиям отрасли имеются данные об объеме производства, потреблении сырья и электроэнергии: Производство Потребление Потребление № предприятия продукции, тыс. шт. сырья, тыс. т. электроэнергии, кВт.ч. 1 24,6 3,2 2,3 2 37,4 4,1 1,7 3 45,4 2,2 0,9 4 46,7 1,6 2,0 5 50,1 4,4 2,7 6 51,3 10,5 3,7 7 55,0 2,6 1,0 8 66,0 5,7 2,0 9 68,3 9,5 2,1 10 70,8 5,0 1,6 11 86,1 2,8 2,0 12 96,9 8,1 2,3 13 99,1 6,0 1,5 47 14 15 16 17 18 19 20 21 22 23 24 25 111,9 122,6 166,9 171,6 173,8 177,5 177,6 171,2 213,0 257,1 269,3 359,2 6,2 10,6 8,3 6,1 9,8 9,6 13,3 12,3 7,7 13,1 19,5 21,5 2,8 4,2 2,6 2,2 3,5 8,5 4,2 4,6 3,9 6,5 5,3 7,8 9. Имеются следующие данные о посевной площади зерновых культур, валовом сборе и внесении минеральных удобрений на 1 га посевной площади: Посевная площадь Внесено минеральных № фермерского Валовой зерновых культур, удобрений на 1 га посевной хозяйства сбор, тыс. т. тыс. га площади, кг. 1 4,0 6,0 30 2 2,0 4,6 33 3 3,1 4,4 20 4 3,2 4,5 25 5 3,4 5,5 29 6 3,5 4,8 20 7 3,7 5,1 21 8 3,2 5,2 20 9 3,9 7,0 35 10 3,5 5,3 30 11 5,0 7,5 35 12 3,7 7,7 30 13 5,0 7,3 40 14 3,8 7,0 42 15 5,0 6,7 39 10. Имеются данные о бюджетах домохозяйств США, долл. в месяц: Семья Доход семьи Расходы на питание Расходы на одежду 1 3000 850 250 2 2500 700 150 3 4000 950 250 4 6000 1150 450 5 3300 800 200 6 5300 1000 700 7 4200 900 400 8 6500 1550 1000 9 2800 800 400 10 3650 1200 600 11 5850 1400 950 12 4500 950 350 48 Задача 3 Задания: 1) Обоснуйте выбор вида уравнения тренда и определите его параметры, объясните полученное уравнение. 2) Дайте прогноз уровня ряда на следующий календарный период времени (дату). 3) Определите коэффициент автокорреляции первого порядка и дайте его интерпретацию 4) Сделайте выводы. 1. Имеются следующие данные о квартальных объемах реализации нового продукта предприятием оптовой торговли: Период времени 1 2 3 4 5 6 7 8 9 Объем реализации, 14 135 297 498 737 1016 1336 1700 2101 тыс. шт. 2. Имеются следующие данные о количестве зарегистрированных малых предприятий города: Месяц Число зарегистрированных малых предприятий, ед. Январь 222 Февраль 322 Март 427 Апрель 530 Май 631 Июнь 731 Июль 832 Август 927 Сентябрь 1010 3. Имеются следующие данные о средней урожайности зерновых в области: Годы 1 2 3 4 5 6 7 8 9 Урожайность зерно8,8 9,0 9,7 10,7 12,2 14,2 16,6 19,6 22,9 вых (ц/га) 4. Имеются поквартальные данные о численности занятых на предприятиях машиностроения в некотором городе: № квартала 1 2 3 4 5 6 7 8 9 Численность заня232 220 209 197 187 175 164 155 146 тых (тыс. чел.) 5. Имеются следующие данные о базисных темпах роста среднедушевого дохода населения области за 10 месяцев ( в % к январю): 49 Месяц Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Темпы роста среднедушевого дохода (%) 102 103 107 114 118 126 134 146 156 166 6. Имеются следующие данные об уровне безработицы в регионе: Месяц Уровень безработицы, % Январь 8,9 Февраль 8,6 Март 8,4 Апрель 8,1 Май 7,9 Июнь 7,6 Июль 7,3 Август 7,2 Сентябрь 7,0 7. Имеются данные о поголовье крупного рогатого скота в районе: Год 1991 1992 1993 1994 1995 1996 Поголовье крупного рога63,0 67,2 70,0 71,3 73,2 74,1 того скота, тыс. голов 1997 75,0 8. Имеются следующие данные о производстве продукции предприятия за 19921997 гг. (в сопоставимых ценах),млн.у.е.: Год 1992 1993 1994 1995 1996 1997 Объем производства, у.е. 80 84 89 95 101 108 9. Добыча угля в Восточно-Сибирском районе характеризуется следующими данными, млн т: Год 1991 1992 1993 1994 1995 Добыча угля, млн. т 103 97 85 76 72 10. Имеются следующие данные о динамике числа профессиональных театров в РФ: Год Число профессиональных театров на конец года 1990 1991 1992 1993 1994 1995 1996 382 393 421 439 460 470 489 Задача 4 Задания: 50 1) Определите функциональную форму трендовых уравнений регрессии для изучаемых признаков и рассчитайте их параметры. 2) Найдите линейный коэффициент корреляции между изучаемыми признаками: а) по исходным уровням ряда; б) по первым разностям уровней рядов; в) по отклонениям от тренда. 3) Сделайте вывод о степени тесноты связи между изучаемыми признаками. 4) Определите параметры уравнения парной линейной регрессии по первым разностям и поясните их смысл. 1. Имеются следующие данные о динамике среднегодовой численности промышленно-производственного персонала и индекса физического объема продукции в промышленности Ростовской области в 1990-1995 гг. 1990 1991 1992 1993 1994 1995 Среднегодовая численность 519,3 500,4 472,6 446,9 412,4 369,3 ППП, тыс. чел. Индекс физического объема про100 99,0 87,8 68,5 45,1 38,7 дукции, в % к 1990 г. 2. Имеются следующие данные о динамике числа браков и родившихся в Ростовской области в 1990-1998 гг. Год Количество браков, тыс. Количество родившихся, тыс. 1990 39,6 54,0 1991 39,7 51,0 1992 31,5 47,0 1993 34,9 41,6 1994 34,5 42,5 1995 35,5 40,7 1996 25,6 38,8 1997 27,8 36,7 1998 24,5 36,2 3. Изучается взаимосвязь между уровнем инфляции и вкладами населения в коммерческие банки. Ниже приводятся данные по одному из иностранных коммерческих банков за 9 лет: Время, лет 1 2 3 4 5 6 7 8 9 Индекс цен (в % к преды128 110 109 115 100 90 95 87 80 дущему году) Депозиты физических лиц (млн. дол., в сопостави4,2 4,6 4,7 4,1 5,0 5,5 5,3 6,0 6,5 мых ценах) 4. Для анализа зависимости между изменением цен на молоко и молокопродукты и потреблением белка населением города было проведено выборочное обследование и получены следующие данные за 10 месяцев: Потребление белка в среднем за месяц в Индекс цен на молоко и молоМесяц расчете на душу населения (г) копродукты (в % к январю) Январь 2000 100 Февраль 2010 108 Март 2022 115 51 Апрель Май Июнь Июль Август Сентябрь Октябрь 2040 2057 2075 2092 2108 2128 2150 118 122 126 132 139 143 145 5. Администрация компании XYZ проводит анализ кадровой политики. В частности, требуется определить, зависит ли общий объем продаж от удельного веса женщин среди работников компании. Были получены следующие данные за последние 9 кварталов: Номер квартала 1 2 3 4 5 6 7 8 9 Объем продаж компании, тыс. у.е. 378 385 393 403 414 428 444 462 481 Удельный вес женщин в общем 25 24 27 30 31 29 31 33 34 числе работников компании, % 6. Исследуется зависимость объема продаж бензина от динамики потребительских цен. Были получены следующие данные за последние 9 кварталов: Квартал 1 2 3 4 5 6 7 8 9 Индекс потребительских 139 132 126 121 117 112 106 100 100 цен (в % к кварталу 9) Средний за день объем продаж бензина в течение 65 68 72 75 77 80 83 85 89 квартала (тыс. л.) 7. Имеются следующие данные о динамике средней ожидаемой продолжительности предстоящей жизни при рождении и национального дохода на душу населения в США в 1971 – 1985 гг.: Средняя ожидаемая продолжительность Национальный доход на Годы предстоящей жизни при рождении, лет душу населения, долл. 1971 71,1 4304,4 1972 71,2 4841,2 1973 71,4 5362,9 1974 72,0 5669,0 1975 72,6 5968,8 1976 72,9 6617,9 1977 73,3 7329,1 1978 73,5 8233,1 1979 73,9 9097,5 1980 73,7 9674,7 1981 74,2 10617,5 1982 74,5 10830,9 1983 74,6 11582,2 1984 74,7 12778,8 1985 74,7 13498,2 8. Имеются следующие данные о динамике располагаемого личного дохода и расходов на питание на душу населения в США в 1971 – 1985 гг.: 52 Годы 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 Располагаемый личный доход, долл. 779,2 810,3 865,3 858,4 875,8 906,8 942,9 988,8 1015,5 1021,6 1049,3 1058,3 1095,4 Расходы на питание, долл. 130,0 132,4 129,4 128,1 132,3 139,7 145,2 146,1 149,3 153,2 153,0 154,6 161,2 9. Ниже приводятся данные об уровне дивидендов, выплачиваемых по обыкновенным акциям, и среднегодовой стоимости основных фондов (ОФ) компании Х в сопоставимых ценах: Период времени 1 2 3 4 5 6 7 8 9 Среднегодовая стои72 75 77 77 79 80 78 79 80 мость ОФ (тыс.у.е.) Дивиденд по обыкно4,2 3,0 2,4 2,0 1,9 1,7 1,8 1,6 1,7 венным акциям, % 10. Изучается зависимость между объемом инвестиций в основные производственные фонды (ОПФ) и валовой добавленной стоимостью (ВДС). Ниже представлены данные по некоторой отрасли промышленности за последние 10 лет: (в сопоставимых ценах, млн. у.е.) Время, лет 1 2 3 4 5 6 7 8 9 10 Объем инвестиций в ОПФ 140 160 190 210 220 240 260 290 310 320 ВДС 300 345 405 445 480 535 595 639 677 704 Задача 5 Задания: 1) Постройте график ряда динамики. 2) Оцените характер сезонных колебаний и сделать выбор между моделью с сезонной и мультипликативной компонентой. 3) Проведите сглаживание ряда динамики с помощью скользящей средней. 4) Найдите значения десезонализированных данных и нанесите их на график. 5) В предположении существования линейного тренда постройте модель с аддитивной или мультипликативной компонентой. 6) Рассчитайте ошибку, среднее абсолютное отклонение (MAD) и среднеквадратическую ошибку (MSE) модели. 7) Сделайте прогноз на ближайшие три календарных периода времени. Прокомментируйте вопрос о вероятной точности ваших прогнозов. 53 1. В таблице представлены данные по двухмесячному объему производства среднего предприятия обрабатывающей отрасли промышленности, расположенного в Дублине: Объем производства, тонн Период 1995 1996 1997 1998 Январь-февраль 120 119 110 107 Март-апрель 132 125 119 114 Май-июнь 106 99 102 92 Июль-август 98 98 89 88 Сентябрь-октябрь 88 86 79 75 Ноябрь-декабрь 94 90 88 80 2. В таблице приведены данные по средней заявленной годовой арендной плате за съем деловых помещений в центральной части Лондона в период 1993 - 1997 гг.: Годовая плата за аренду помещения, у.е. за кв. м. Год Январь-апрель Май-август Сентябрь-декабрь 1993 120 100 121 1994 138 120 142 1995 160 138 163 1996 184 162 182 1997 208 175 206 3. Ниже приведены квартальные объемы продукции компании «Cobournes plc»: Год 1 2 3 Квартал 1 2 3 4 1 2 3 4 1 2 3 Объем выпуска, 24 50 56 63 79 89 79 80 93 100 88 тыс. у.е. 4. Ниже приводятся скорректированные на инфляцию данные о прибыли компании «Doble-Flood» за последние 10 кварталов: Год 1 2 3 Квартал 1 2 3 4 1 2 3 4 1 2 Прибыль, 146 106 123 89 97 74 80 53 56 35 тыс. у.е. 5. Объемы выпуска продукции компании «Banham and Barsey» приведены в таблице: Год Квартал Объем выпуска, тыс. у.е. 2 1 3 4 1 2 2 3 4 1 3 2 3 400 715 600 585 560 975 800 765 720 1235 6. В таблице приведены данные по объему продаж компании АПИ в странах Восточной Европы в период 1994 - 1997 гг.: Объем продаж мазута, тыс. баррелей Год Январь-апрель Май-август Сентябрь-декабрь 1994 35 15 42 1995 36 19 44 54 1996 1997 41 45 22 26 47 52 7. Динамика товарооборота компании «Amada plc» за последние 11 кварталов, скорректированного на инфляцию, представлена в таблице: Год 1 2 3 Квартал 1 2 3 4 1 2 3 4 1 2 3 Товарооборот 22 28 34 27 31 43 43 41 46 53 56 , тыс. у.е. 8. Динамика квартального спроса на стулья компании «Peace Retailers» представлена в таблице: Год 1 2 3 Квартал 3 4 1 2 3 4 1 2 3 4 Спрос, тыс. штук 157 137 156 151 153 141 154 152 154 142 9. В таблице приведены данные по общей стоимости экспортных заказов некой компании в период 1993 - 1996 гг.: Общий объем экспорта, млн. у.е. Год Январь-апрель Май-август Сентябрь-декабрь 1994 4,5 5,6 4,9 1995 5,1 5,9 5,2 1996 5,4 6,8 5,8 1997 6,0 6,8 6,1 10. В таблице приведены данные по общему объему продаж газеты одного из канадских издательств в период 1994 - 1997 гг.: Дневной объем продаж газеты, тыс. экз. Период 1994 г. 1995 г. 1996 г. 1997 г. I квартал 2,2 2,6 2,9 3,2 П квартал 2,9 3,2 3,4 3,6 Ш квартал 3,3 3,6 3,9 4,2 IY квартал 2,4 2,7 2,8 3,1 55 Рекомендуемая литература 1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. - М.: ЮНИТИ, 1998. 2. Айвазян С.А., Мхитарян В.С. Практикум по прикладной статистике и эконометрике( учебное пособие) / МЭСИ, 1998. 3. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997. 4. Эконометрика Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и др. – М.: Финансы и статистика, 2001. 5. Практикум по эконометрике: Учебное пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и др.; под ред. И.И, Елисеевой – М.: Финансы и статистика, 2001. 6. Кейн Э. Экономическая статистика и эконометрика. Введение в количественный анализ. Пер. с англ. - М.: Статистика, 1977. 7. Джонстон Дж. Эконометрические методы. Пер. с англ. - М.: Статистика, 1980. 8. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.: Дело, 1997. 9. Катышев П.К., Пересецкий А.А. Сборник задач к начальному курсу эконометрики. – М.: Дело, 1999. 10. Айвазян С.А., Евнюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. - М.: Финансы и статистика, 1983. 11. Айвазян С.А., Евнюков И.С., Мешалкин Л.Д. Прикладная статистика. Исследование взаимосвязей. - М.: Финансы и статистика, 1985. 12. Айвазян С.А., Бухштабер В.М., Евнюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. - М.: Финансы и статистика, 1989. 13. Green W.H. (1996) Econometrics Analysis, third edition. Macmillan Publishing Company. 14. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник. - М.: Финансы и статистика, 1995. 15. Ефимова М.Р., Петрова Е.В., Румянцева В.Н. Общая теория статистики: Учебник. М.: ИНФРА - М., 1996. 16. Колемаев В.А., Калинина В.Н. Теория вероятностей и математическая статистика: Учебник. - М.: ИНФРА - М., 1996. 17. Гмурман В.Е. Теория вероятностей и математическая статистика: Учебник. - М.: “Высшая школа”, 1997. 18. Фестер Э., Ренц Б. Методы корреляционного и регрессионного анализа: руководство для экономистов. - М.: Финансы и статистика, 1983. 19. Методические материалы по экономическим дисциплинам для преподавателей средних школ и вузов / Под. общ. ред. Л.С. Гребнева. Экономичсекая статистика. Эконометрика. (Программы, тесты, задачи, решения). – М.:ГУ-ВШЭ,2000. 20. Эконометрика: Решение типовых задач. / Под.ред. С.В. Курышевой – СПб: Союз студентов СПбГУЭФ,1999. 21. Кулинич Е.И. Эконометрия. – М.:Финансы и статистика, 1999. 22. Эддоус М., Стенфилд Р. Методы принятия решений / пер. с англ. под ред. чл.-корр. РАН И.И. ЕЛисеевой. – М.:Аудит, ЮНИТИ, 1997. 23. Громыко Г.Л. Общая теория статистики: Практикум. – М.: ИНФРА-М,1999. 24. Вайнберг Дж., Шумекер Дж. Статистика / пер. с англ. – М.:Статистика, 1979. 25. Практикум по теории статистики: Учебное пособие / под ред. проф. Р.А.Шмойловой. – М.: Финансы и статистика,1999. 26. Ниворожкина Л.И., Морозова З.А., Житников И.В., Герасимова И.А. Основы статистики с элементами теории вероятностей./ Учебник. - Ростов-на-Дону: Феникс, 1999. 56 Эконометрика Методические указания по выполнению контрольной работы Ниворожкина Людмила Ивановна Житников Игорь Васильевич Федосова Оксана Николаевна Ответственная за выпуск Начальник РИО РГЭУ Изд.№103/5347 Печать офсетная Заказ № В.Е. Смейле Подписано к печати Формат 60*84/16 Тираж 100 экз. Бумага офсетная Объем 4,0 уч.- изд.л. “С”103 344007, г. Ростов-на-Дону, ул. Б. Садовая, 69. РГЭУ. Издательство. Отпечатано в КМЦ “Колибри” Ростов-на-Дону, ул. Б. Садовая, 9. 57