МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение высшего профессионального образования «ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ СИСТЕМ УПРАВЛЕНИЯ И РАДИОЭЛЕКТРОНИКИ» (ТУСУР)) Методические указания к контрольным работам по дисциплине Эконометрика Направления подготовки: 080100.62 «Экономика» 080200.62 «Менеджмент» Экономический факультет Кафедра экономики Разработчик Старший преподаватель кафедры АОИ И.В. Потахова 2011 2 СОДЕРЖАНИЕ Методические указания Линейная парная регрессия Нелинейная парная регрессия Множественная линейная регрессия Системы эконометрических уравнений Список литературы 3 4 9 12 19 23 3 Методические указания Контрольные работы выполняются в рамках курса «Эконометрика», предусматривающего изучение методов проверки, обоснования, оценивания количественных закономерностей и качественных утверждений на основе анализа статистических данных. Кроме этого рассматриваются возможности применения Excel для решения означенных задач. В работах предусмотрено выполнение ряда практических заданий. Работы рекомендуется выполнять в порядке их следования. По выполненным контрольным работам студент отчитывается перед преподавателем. Отчет студента должен быть представлен выполненными заданиями и пояснениями по ходу их выполнения. Тема 1. ЛИНЕЙНАЯ ПАРНАЯ РЕГРЕССИЯ Цель: построение и исследование уравнения линейной регрессии. Простая (парная) регрессия представляет собой регрессию между двумя переменными — y и вида: где y f (x) , x (1.1) — зависимая переменная (результативный признак); x — независимая, или объясняющая, переменная (признак-фактор); — случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии yˆ f ( x) . (1.2) Различают линейные и нелинейные регрессии. Линейная регрессия описывается уравнением: y a b x . (1.3) На практике построение линейной регрессии сводится к оценке параметров уравнения yˆ x a b x . (1.4) Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК). y Расчетные соотношения. 1. ВЫЧИСЛЕНИЕ КОЭФФИЦИЕНТОВ УРАВНЕНИЯ ЛИНЕЙНОЙ РЕГРЕССИИ Коэффициенты, определяемые на основе метода наименьших квадратов, являются решением системы уравнений: a b x y a x b x 2 x y (1.5) где 1 n 1 n x xi ; y yi ; n i 1 n i 1 1 n x y xi yi ; n i 1 xi2 1 n 2 xi . n i 1 (1.6) Коэффициенты уравнений (1.3), (1.4) получаем, решив систему (1.5). b x y x y cov(x, y ) x2 ); x ( x) где cov(x, y ) — выборочное значение формуле: cov(x, y ) x y x y , 2 2 a y b x (1.7), корреляционного момента (ковариация), определенного по (1.8) x2 – выборочное значение дисперсии величины x , определяемой по формуле: x2 x 2 (x ) 2 (1.9) 4 2. ИССЛЕДОВАНИЕ УРАВНЕНИЯ ЛИНЕЙНОЙ РЕГРЕССИИ 2.1. Оценка тесноты связи Линейный коэффициент корреляции. При линейной регрессии в качестве показателя тесноты связи выступает линейный коэффициент корреляции. Его значение находится в границах 1 rxy 1 . rxy 2 где x cov(x, y) , x y x x , 2 2 (1.10) y2 y y 2 2 , yi2 1 n 2 yi . n i 1 (1.11) Коэффициент детерминации. Он характеризует долю дисперсии результативного признака y, объясняемую регрессией, в общей дисперсии результативного признака. r 2 xy 2 2 объясн ост 1 2 y2 y (1.12) 1 n ( yi y ) 2 y 2 y 2 , n i 1 1 n 1 n 2 2 объясн ( yˆ i y ) 2 , ост ( yi yˆ i ) 2 , n i 1 n i 1 2 где y (1.13) Cредняя ошибка аппроксимации. Средняя ошибка аппроксимации – среднее относительное отклонение расчетных значений ŷ от фактических y . 1 n yi yˆ xi A 100% n i 1 yi (1.14) Построенное уравнение регрессии считается удовлетворительным, если значение A не превышает 8–10 %. Чем выше показатель детерминации или чем ниже средняя ошибка аппроксимации, тем лучше модель описывает исходные данные. Оценка значимости уравнения линейной регрессии и существенности параметров линейной регрессии. 2.2.1. Вычисление оценок дисперсий парной линейной регрессии 2.2. Оценки для дисперсий определяются формулами: n ( y y)2 2 S общ i 1 n 1 — общая дисперсия результативного признака. (1.15) n ( yˆ x y ) 2 2 S факт i 1 m — факторная (объясненная) дисперсия результативного признака. (1.16) n ( y yˆ x ) 2 2 S ост i 1 n m 1 остаточная (необъясненная) дисперсия результативного признака. (1.17) Здесь n — количество наблюдений, m = 1 для парной регрессии. 5 2.2.2. Оценка значимости уравнения регрессии в целом дается с помощью F- критерия Фишера 2 2 . Если нулевая гипотеза справедлива, то факторная и Выдвигается нулевая гипотеза H 0 : S факт S ост остаточная дисперсии не отличаются друг от друга. Следовательно, уравнение регрессии в целом незначимо. То есть для гипотезы H 0 необходимо опровержение: факторная дисперсия должна превышать остаточную дисперсию. Таким образом, уравнение парной регрессии значимо с уровнем значимости , если выполняется следующее неравенство: F 2 Sфакт F ;1; n 2 2 Sост где F ;1; n 2 – значения квантиля k1 1; k 2 n 2 . Для вычисления F ;1; n 2 = FРАСПОБР( ;1; n 2 ). (1.18) уровня F-распределения с числами степеней свободы квантиля можно использовать таблицу или функцию Excel: 2.2.3. Оценка существенности коэффициента линейной регрессии. Для проверки существенности коэффициента регрессии и для расчета его доверительных интервалов применяется величина стандартной ошибки совместно с t – распределением Стьюдента при n-2 степенях свободы. Фактическое значение t – критерия Стьюдента вычисляется по формуле: tb b mb . (1.19) Стандартная ошибка коэффициента mb (b) регрессии определяется по формуле: S ост , x n (1.20) где n где 2 S ост ( y yˆ x ) 2 i 1 n m 1 x2 x 2 x 2 — остаточная дисперсия на одну степень свободы, — дисперсия признака x. Вычисленное значение значимости , (t b ) сравнивается с табличным значением при определенном уровне и числе степеней свободы (n 2) . H0 : b 0 , x , учитывающая значение b . Здесь проверяется нулевая гипотеза предполагающая несущественность статистической связи между y и Если tb t табл ( , n 2) , то гипотеза H 0 : b 0 должна быть отклонена, а статистическая связь y и x считается установленной. В случае tb t табл ( , n 2) нулевая гипотеза не может быть отклонена, и влияние y на x признается несущественным. 2.2.4. Построение интервальных оценок для параметров регрессии, функции парной линейной регрессии Интервальная оценка (доверительный интервал) для коэффициента b с надежностью (доверительной вероятностью) равной определяется выражением: b t табл mb (1.30) Аналогично строится интервальная оценка параметра a . При этом используются следующая расчетная формула вычисления стандартной ошибки коэффициента a : 6 S ост ma n xi2 i 1 (1.31) x n Интервальная оценка (доверительный интервал) для вычисленного значения значении xi с надежностью (доверительной вероятностью) равной 1 (1.32) Стандартная ошибка вычисленного значения ŷi определяется по формуле: 1 ( xi x ) 2 Sост 1 n n x2 Таким образом, в (1.30) входят две величины помощью функции Excel: при заданном определяется выражением yˆ i t табл m yˆ i m yˆ i ŷ i (1.33) m yˆ i (зависит от xi ) и t ( , n 2) , вычисляемая с t ( , n 2) СТЬЮДРАСПОБР(1 , n 2) . 3. Варианты контрольной работы №1 (1 – 9 варианты). В таблице приведены данные о среднедушевом прожиточном минимуме в день на одного работающего x (в рублях) и данные о средней заработной плате за один рабочий день y (в рублях) в 15-ти регионах. 1. Постройте уравнение парной регрессии y от x . 2. Рассчитайте коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации. 3. Оцените статистическую значимость параметров регрессии и уравнения регрессии с помощью F -критерия Фишера и t -критерия Стьюдента. 4. Найдите доверительные интервалы для коэффициентов регрессии и уравнения регрессии на уровне значимости 0,05 . 5. Найдите и удалите из выборки две точки, наиболее удалённые от линии регрессии. Постройте линию регрессии для этой выборки. Сравните результаты. Вариант 1 Прожиточный Заработная минимум плата 234 445 246 484 261 518 237 457 267 524 318 623 201 396 264 517 219 434 261 517 228 449 345 685 207 419 252 526 276 553 Вариант 2 Прожиточный Заработная минимум плата 215 486 226 531 239 569 217 500 245 574 292 682 184 433 242 566 201 476 239 567 209 492 316 752 190 460 231 579 253 607 Вариант 3 Прожиточный Заработная минимум плата 206 369 216 410 229 441 208 383 235 443 279 526 177 335 232 436 192 369 229 439 200 380 303 583 182 360 221 459 242 472 7 Вариант 4 Прожиточный Заработная минимум плата 223 448 233 467 246 494 225 451 252 504 296 594 194 388 249 499 209 420 246 494 217 436 320 641 199 399 238 478 259 520 Вариант 5 Прожиточный Заработная минимум плата 312 628 342 685 367 735 322 644 371 742 443 887 277 555 365 732 306 612 366 733 316 633 489 979 295 591 374 749 393 786 Вариант 7 Прожиточный Заработная минимум плата 287 577 299 600 317 635 289 579 324 649 384 769 247 495 321 642 268 537 317 635 278 558 415 832 254 509 307 614 335 670 Вариант 8 Прожиточный Заработная минимум плата 406 816 445 890 478 957 417 836 483 967 579 1160 358 717 476 953 396 793 477 955 410 822 641 1283 382 764 488 976 512 1025 Вариант 6 Прожиточный Заработная минимум плата 234 472 261 524 282 565 243 487 283 567 338 678 211 423 279 558 234 469 281 563 242 484 377 754 228 457 294 589 303 607 Вариант 9 Прожиточный Заработная минимум плата 302 608 337 675 365 730 313 627 366 733 440 881 270 541 360 721 301 603 363 727 311 622 491 983 293 586 381 763 393 786 (10 – 15 варианты). В таблице приведены данные о весе грузов x (в килограммах) и количестве заказов соответствующего груза y (в тысячах). 1. Постройте уравнение парной регрессии y от x . 2. Рассчитайте коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации. 3. Оцените статистическую значимость параметров регрессии и уравнения регрессии с помощью F -критерия Фишера и t -критерия Стьюдента. 4. Найдите доверительные интервалы для коэффициентов регрессии и уравнения регрессии на уровне значимости 0,05 . Отразите на графике. 5. Найдите и удалите из выборки две точки, наиболее удалённые от линии регрессии. Постройте линию регрессии для этой выборки. Сравните результаты. Вариант 10 Вариант 11 Вариант 12 8 Вес 540 708 593 508 648 935 855 753 913 960 1010 1065 1205 1080 1023 1383 1430 1265 1320 1253 1570 1693 1505 1575 1630 Заказы 6.1 9.1 7.2 7.5 6.9 11.5 10.3 9.5 9.2 10.6 12.5 12.9 14.5 13.6 12.8 16.5 17.1 15.0 16.2 15.8 19.0 19.4 19.1 18.0 20.2 Вес 554 719 608 526 666 955 865 767 931 971 1022 1075 1215 1092 1035 1393 1443 1278 1336 1266 1584 1706 1524 1590 1644 Заказы 6.7 11.5 8.0 5.6 2.9 9.8 9.6 9.7 6.7 8.8 7.6 14.5 10.4 11.9 13.9 16.2 18.8 14.9 14.3 17.1 18.0 19.8 21.4 15.6 15.2 Вес 547 713 600 517 657 945 860 760 922 966 1016 1070 1210 1086 1029 1388 1436 1272 1328 1259 1577 1699 1515 1582 1637 Заказы 6.7 11.5 8.0 5.6 2.9 9.8 9.6 9.7 6.7 8.8 7.6 14.5 10.4 11.9 13.9 16.2 18.8 14.9 14.3 17.1 18.0 19.8 21.4 15.6 15.2 Вес 554 719 608 526 666 955 865 767 931 971 1022 1075 1215 1092 1035 1393 1443 1278 1336 1266 1584 1706 1524 1590 1644 Вариант 13 Заказы 6.1 9.1 7.2 7.5 6.9 11.5 10.3 9.5 9.2 10.6 12.5 12.9 14.5 13.6 12.8 16.5 17.1 15.0 16.2 15.8 19.0 19.4 19.1 18.0 20.2 Вес 561 724 616 536 676 964 870 774 940 977 1029 1081 1220 1097 1041 1398 1449 1285 1343 1273 1591 1713 1534 1597 1651 Вариант 14 Заказы 12.8 20.6 15.2 13.1 9.8 21.3 19.9 19.2 15.9 19.4 20.1 27.4 24.9 25.5 26.7 32.7 35.9 29.9 30.5 32.9 37.0 39.2 40.5 33.6 35.4 Вес 1108 1437 1217 1053 1333 1909 1730 1533 1862 1943 2045 2151 2431 2183 2069 2785 2886 2557 2671 2532 3167 3412 3048 3179 3289 Вариант 15 Заказы 6.1 9.1 7.2 7.5 6.9 11.5 10.3 9.5 9.2 10.6 12.5 12.9 14.5 13.6 12.8 16.5 17.1 15.0 16.2 15.8 19.0 19.4 19.1 18 20.2 9 Тема 2. НЕЛИНЕЙНАЯ ПАРНАЯ РЕГРЕССИЯ Цель: построение и исследование уравнения нелинейной регрессии. Простая (парная) регрессия представляет собой регрессию между двумя переменными — y и x вида: (2.1) y f (x) , y — зависимая переменная (результативный признак); где x — независимая, или объясняющая, переменная (признак-фактор); — случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии yˆ f ( x) . Построение и анализ нелинейных моделей имеют свою специфику. В рамках данной контрольной работы рассматриваются нелинейные модели, допускающие сведения их к линейному типу. Расчетные соотношения. 4. Оценка параметров нелинейной регрессии 4.1. Регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам. b . x y a b ln( x) . равносторонняя гипербола: полулогарифмическая: y a (2.2) (2.3) При оценке параметров регрессий (2.2), (2.3) используется метод замены переменных. Суть его состоит в замене нелинейных объясняющих переменных, в результате чего нелинейные функции регрессии сводятся к линейным. К новой, преобразованной функции регрессии может быть применен обычный метод наименьших квадратов (МНК), рассмотренный в контрольной работе №1. Линеаризующие преобразования Вид модели 1 2 yˆ x a b ln x 1 yˆ x a b x Таблица 1. Возможные замены переменных Обратная замена Ограничения переменных X ln x 1 X x x0 aa bb x0 aa bb 4.2. Регрессии, нелинейные относительно оцениваемых параметров, но линейных относительно включенных в анализ объясняющих переменных. логарифмическая модель (степенная): показательная: y a b ; экспоненциальная: y a xb (2.4) x ye a b x (2.5) (2.6). Оценка параметров регрессий (2.4), (2.5), (2,6) выполняется по следующему алгоритму: 1. уравнения приводятся к линейному виду с помощью логарифмирования и последующей замены переменных; 2. оцениваются параметры преобразованного уравнения с использованием метода наименьших квадратов; 3. выполняется обратная замена переменных и записывается исходное уравнение. 10 Линеаризующие преобразования Вид модели Y ln y, X ln x, yˆ x a x b 1 2 yˆ x a b x 3 yˆ x e a b x A ln a Y ln y, B ln b, A ln a Y ln y Таблица 2. Возможные замены переменных Обратная замена Ограничения переменных x 0, y 0, a0 b 0, y 0, a0 y0 a eA bb a eA b eB aa bb 5. ИССЛЕДОВАНИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ РЕГРЕССИИ 5.1. Оценка тесноты связи Индекс корреляции. При нелинейной регрессии в качестве показателя тесноты связи выступает индекс корреляции. Его значение находится в границах 0 xy 1 . xy где 2 ост 1 2 y y2 , 1 ( y y)2 , n (2.8) 2 ост 1 ( y yˆ x ) 2 n (2.9) Индекс детерминации. Он характеризует долю дисперсии результативного признака y, объясняемую регрессией, в общей дисперсии результативного признака. 2 2 2 объясн ост 1 2 y2 y xy 1 n ( yi y ) 2 y 2 y 2 , n i 1 1 n 1 n 2 2 объясн ( yˆ i y ) 2 , ост ( yi yˆ i ) 2 , n i 1 n i 1 (2.10) 2 где y (2.11) Следует обратить внимание на то, что разности в соответствующих суммах n ( yˆi y ) 2 i 1 и ( y yˆ x ) 2 ( y y)2 , берутся не в преобразованных, а в исходных значениях результативного признака. Иначе говоря, при вычислении этих сумм следует использовать не преобразованные (линеаризованные) зависимости, а исходные нелинейные уравнения регрессии. Оценка качества уравнения регрессии Cредняя ошибка аппроксимации. Средняя ошибка аппроксимации – среднее относительное отклонение расчетных значений ŷ от фактических y . 5.2. A 1 n yi yˆ xi 100% n i 1 yi (2.12) Построенное уравнение регрессии считается удовлетворительным, если значение A не превышает 8–10 %. Чем выше показатель детерминации или чем ниже средняя ошибка аппроксимации, тем лучше модель описывает исходные данные. 11 Коэффициент эластичности. Коэффициент эластичности. показывает, на сколько процентов измениться в среднем результат, если фактор изменится на 1%. Формула для расчета коэффициента эластичности имеет вид: Э f ( x) x . y Так как для большинства функций коэффициент эластичности не является постоянной величиной, а зависит от соответствующего значения фактора x , то обычно рассчитывается средний коэффициент эластичности: Э f ( x) Таблица3. Формулы для расчета Вид модели, y Первая производная, b x y a xb b x2 y a b xb1 y a bx y a b ln x a ln b b x b x y e a bx b e a bx y a 5.3. x . y Э средних коэффициентов эластичности. y Средний коэффициент эластичности, Э b ax b b x ln b b a b ln x bx Оценка значимости уравнения нелинейной регрессии. F где 2 xy 2 1 xy 2 xy n m 1 , m – индекс детерминации, n – число наблюдений, m – число параметров при переменной x . Фактическое значение F -критерия сравнивается с табличным при уровне значимости и числе степеней свободы k 2 n m 1 (для остаточной суммы квадратов) и k1 m (для факторной суммы квадратов). Вычисленное значение при заданном уровне значимости регрессии в целом. F -критерия . В этом признается достоверным, если оно больше табличного случае делается вывод о существенности уравнения 6. Задание и варианты контрольной работы №2 1. На основании таблиц 3,4 построить предложенные уравнения регрессий. 2. Вычислить индексы парной корреляции и индексы детерминации для каждого уравнения. Дать сравнительную оценку силы связи фактора с результатом. 3. Вычислить средний коэффициент эластичности. Дать смысловую интерпретацию. 4. Определить лучшее уравнение на основе средней ошибки аппроксимации. 5. Определить лучшее уравнение на основе совместного анализа значений индекса детерминации и средней ошибки аппроксимации. 6. Оценить с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. 7. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 15% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости α=0,05. 8. Сделать выводы по проделанной работе. 12 Вариан т 1 2 3 4 5 6 7 8 9 10 Граф ы табли цы 4 (x,y) 1, 2 1, 3 2, 3 2, 3 3, 2 1, 2 1, 3 2, 3 2, 3 3, 2 Порядковый номер года 1 1 2 3 4 5 6 7 8 9 10 11 Таблица 3. Варианты заданий Виды кривых аппроксимации Гиперболическая Полулогарифмическая * * * * Степенная Показательная * * * * * * Экспоненциальная * * * * * * * * * * Таблица 4 Данные для построения уравнений регрессий Фактическое конечное потребление Среднедушевые денежные доходы домашних хозяйств (в текущих ценах), млрд. населения (в месяц), руб. руб. 2 3 2722 1515,9 3813 2281,1 5014 3062,0 6400 3947,2 7708 5170,4 9848 6410,3 12455 8111,9 15284 10196,0 18928 12602,7 23695 14940,6 25151 16857,0 Тема 3. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ Цель y работы. Вычисление коэффициентов линейной множественной a b1 x1 b2 x 2 ... bm x m и проверка значимости в режиме Регрессия регрессии Режим Регрессия модуля Анализ данных. Табличный процессор Excel содержит модуль Анализ данных. Этот модуль позволяет выполнить статистический анализ выборочных данных (построение гистограмм, вычисление числовых характеристик и т.д.). Режим работы Регрессия этого модуля осуществляет вычисление коэффициентов линейной множественной регрессии с k переменными, построение доверительные интервалы и проверку значимости уравнения регрессии. Для вызова режима Регрессия модуля Анализ данных необходимо: обратиться к пункту меню Сервис (Excel 2000); Данные (Excel 2007) в появившемся меню выбрать команду Анализ данных; в списке режимов работы модуля Анализ данных выбрать режим Регрессия и щелкнуть на кнопке Ok. После вызова режима Регрессия на экране появляется диалоговое окно (см. рис. 3.1), в котором 13 задаются следующие параметры: 1. Входной интервал Y – вводится диапазон адресов ячеек, содержащих значения yi (ячейки должны составлять один столбец). Рис. 3.1. Диалоговое окно режима Регрессия 2. Входной интервал X – вводится диапазон адресов ячеек, содержащих значения независимых переменных. Значения каждой переменной представляются одним столбцом. Количество переменных не более 16 (т.е. k 16 ). 3. Метки – включается если первая строка во входном диапазоне содержит заголовок. В этом случае автоматически будут созданы стандартные названия. 4. Уровень надежности – при включении этого параметра задается надежность при построении доверительных интервалов. 5. Константа-ноль – при включении этого параметра коэффициент a 0 . 6. Выходной интервал – при включении активизируется поле, в которое необходимо ввести адрес левой верхней ячейки выходного диапазона, который содержит ячейки с результатами вычислений режима Регрессия. 7. Новый рабочий лист – при включении этого параметра открывается новый лист, в который начиная с ячейки А1 вставляются результаты работы режима Регрессия. 8. Новая рабочая книга - при включении этого параметра открывается новая книга на первом листе которой начиная с ячейки А1 вставляются результаты работы режима Регрессия. 9. Остатки – при включении вычисляется столбец, содержащий невязки yi yˆi , i 1,..., n . 10. Стандартизованные остатки – при включении вычисляется столбец, содержащий стандартизованные остатки. 11. График остатков – при включении выводятся точечные графики невязки yi yˆi , i 1,..., n , в зависимости от значений переменных x j , j 1,..., k . Количество графиков равно числу k переменных xj . 12. График подбора – при включении выводятся точечные графики предсказанных по построенной регрессии значений yˆ i от значений переменных x j , j 1,..., k . Количество графиков равно числу k переменных x j . Пример решения типовой задачи. По данным таблицы (см. рис. 3.2) построить и оценить модель множественной линейной регрессии. 14 A B Внешнеторговый оборот, в %( y ) 1 2 3 4 5 6 7 8 17,4 12,6 23,1 21,3 16,8 26,5 26,4 20,4 32,7 39,1 31,5 47,7 47,3 40,7 54,5 47 41 54,6 48,7 44 54,7 48,4 45,5 51,8 Рис. 3.2 Исходные данные для построения модели 1 2 3 4 5 6 7 8 9 C Экспорт, в % ( x1 ) D Импорт, в % ( x2 ) Первоначально заполним таблицу, как показано на рисунке 3.2. После этого вызовем режим Регрессия и в диалоговом окне зададим необходимые параметры (см. рис 3.1). Результаты работы приводятся на рис. 3.3 – 3.5. ВЫВОД ИТОГОВ Регрессионная статистика Множествен-ный R 0,99990 R-квадрат 0,99979 Нормирован-ный R-квадрат 0,99971 Стандартная ошибка 0,22622 Наблюдения 8 Дисперсионный анализ Значиdf SS Регрессия 2 Остаток Итого MS 1220,084 610,042 5 0,256 0,051 7 1220,340 F 11920,166 мость F 6,37E-10 Рис. 3.3. Результаты работы режима Регрессия Дадим краткую интерпретацию показателям, значения которых вычисляются в режиме Регрессия. Первоначально рассмотрим показатели, объединенные названием Регрессионная статистика (см. рис. 3.3). Множественный R - корень квадратный из коэффициента детерминации. R квадрат – коэффициент детерминации R 2 . Нормированный R квадрат – приведенный коэффициент детерминации R̂ 2 . Стандартная ошибка – оценка s для среднеквадратического отклонения . 15 Наблюдения – число наблюдений n . Перейдем к показателям, объединенным названием Дисперсионный анализ (см. рис. 3.3). Столбец df — число степеней свободы. Для строки Регрессия показатель равен количеству коэффициентов регрессии k r m ; для строки Остаток соответствующий показатель ke n m 1; для строки Итого число степеней свободы равно n 1. Столбец SS – сумма квадратов отклонений. Для строки Регрессия показатель равен величине факторной суммы квадратов n SS r ( yˆ i y ) 2 ; i 1 для строки Остаток - равен величине остаточной суммы квадратов n SS е ( yˆ i yi ) 2 ; i 1 для строки Итого – SS SS r SSe — общая сумма квадратов отклонений переменной y от среднего значения y . Столбец MS дисперсии, вычисленные по формуле SS MS , df т.е. дисперсия на одну степень свободы. Столбец F – значение Fc , равное F критерию Фишера, вычисленного по формуле: SS r kr Fc . SS e ke Столбец значимость F - значение уровня значимости, соответствующее вычисленной величине P( F ( kr , ke ) Fc ) , где F ( kr , ke ) - случайная величина, и равное вероятности F критерия подчиняющаяся распределению Фишера с k r , k e степенями свободы. Эту вероятность можно также определить с помощью функции FРАСП( Fc ; k r ; ke ). Если вероятность меньше уровня значимости (обычно 0.05 ), то построенная регрессия является значимой.. Перейдем к следующей группе показателей, объединенных в таблице, показанной на рис. 3.4. Коэффициенты Y-пересечение Стандартная t- P- Нижние Верхние ошибка статистика Значение 95% 95% 0,0092 0,3983 0,0232 0,9824 -1,0145 1,0330 0,5179 0,0289 17,9504 0,0000 0,4437 0,5921 0,4767 0,0282 16,8818 0,0000 0,4041 0,5493 Переменная X 1 Переменная X 2 Рис. 3.4. Продолжение результатов работы режима Регрессия Столбец Коэффициенты – вычисленные значения коэффициентов вниз. Столбец Стандартная ошибка – значения 2 mbi S ост ( X X ) 1 ii mbi , a, b1, b2 , расположенных сверху- (i 0,1,2,..., m) , вычисленные по формуле (i 0,1,2,..., m) , 16 где ( X X ) 1 элемента матрицы ii — элемент (ii) матрицы 1 (X X ) ( X X ) 1 . Значение i0 для вычисления стандартной ошибки параметра соответствует номеру a. n 2 S ост ( yi yˆ xi ) 2 i 1 n m 1 — несмещенная оценка остаточной дисперсии (столбец MS, рис 3.3). Столбец t статистика – значения статистик Tb j . Столбец Р – значение – содержит вероятности случайных событий P(t (n m) Tb j ) , где t (n m) случайная величина, подчиняющаяся распределению Стьюдента с n m степенями свободы. Если эта вероятность меньше уровня значимости , то принимается гипотеза о значимости соответствующего коэффициента регрессии. Столбцы Нижние 95% и Верхние 95% - соответственно нижние и верхние интервалы для оцениваемых коэффициентов a, b1, b2 . Перейдем к следующей группе показателей, объединенных в таблице, показанной на рис. 3.5. ВЫВОД ОСТАТКА Наблюдение Предсказанное Остатки Y Стандартные остатки 1 17,547 -0,147 -0,770 2 21,343 -0,043 -0,226 3 26,163 0,237 1,238 4 39,063 0,037 0,194 5 47,069 0,231 1,207 6 47,272 -0,272 -1,424 7 48,874 -0,174 -0,909 8 48,268 0,132 0,690 Рис. 3.5. Продолжение результатов работы режима Регрессия Столбец Наблюдение – содержит номера наблюдений. Столбец Предсказанное Y – значения yˆ i , вычисленные по построенному уравнению регрессии. Столбец Остатки – значения невязок yi yˆi 3.3 Задание и варианты контрольной работы №3 По 20 предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов x1 (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих x 2 (%) (смотри таблицу своего варианта). Требуется: 1. Построить линейную модель множественной регрессии и выполнить анализ результатов. 17 Вариант 1 Номер предприятия 1 2 3 4 5 6 7 8 9 10 y x1 x2 6 6 6 7 7 7 8 8 9 10 3,6 3,6 3,9 4,1 3,9 4,5 5,3 5,3 5,6 6,8 9 12 14 17 18 19 19 19 20 21 Номер предприятия 11 12 13 14 15 16 17 18 19 20 y x1 x2 9 11 11 12 12 13 13 13 14 14 6,3 6,4 7 7,5 7,9 8,2 8 8,6 9,5 9 21 22 24 25 28 30 30 31 33 36 y x1 x2 10 11 11 12 12 13 13 14 14 15 6,3 6,4 7 7,5 7,9 8,2 8,4 8,6 9,5 10 21 22 23 25 28 30 31 31 35 36 y x1 x2 11 11 11 12 12 13 13 13 14 15 6,3 6,4 7,2 7,5 7,9 8,1 8,4 8,6 9,5 9,5 22 22 23 25 27 30 31 32 35 36 y x1 x2 Вариант 2 Номер предприятия 1 2 3 4 5 6 7 8 9 10 y x1 x2 6 6 7 7 7 8 8 9 9 10 3,5 3,6 3,9 4,1 4,2 4,5 5,3 5,3 5,6 6 10 12 15 17 18 19 19 20 20 21 Номер предприятия 11 12 13 14 15 16 17 18 19 20 Вариант 3 Номер предприятия 1 2 3 4 5 6 7 8 9 10 y x1 x2 7 7 7 7 8 8 8 9 10 10 3,7 3,7 3,9 4,1 4,2 4,9 5,3 5,1 5,6 6,1 9 11 11 15 17 19 19 20 20 21 Номер предприятия 11 12 13 14 15 16 17 18 19 20 Вариант 4 Номер предприятия y x1 x2 Номер предприятия 18 1 2 3 4 5 6 7 8 9 10 7 7 7 7 8 8 9 9 10 10 3,5 3,6 3,9 4,1 4,2 4,5 5,3 5,5 5,6 6,1 9 10 12 17 18 19 19 20 21 21 11 12 13 14 15 16 17 18 19 20 10 10 11 12 12 13 13 14 14 15 6,3 6,5 7,2 7,5 7,9 8,2 8,4 8,6 9,5 9,6 22 22 24 25 27 30 31 33 35 36 y x1 x2 10 11 11 12 13 13 13 14 14 14 6,3 6,9 7,2 7,8 8,1 8,2 8,4 8,8 9,5 9,7 21 23 24 25 27 29 31 33 35 34 y x1 x2 10 10 11 12 12 13 13 13 14 14 6,3 6,8 7,2 7,9 8,1 8,3 8,4 8,8 9,6 9,7 21 22 24 25 26 29 31 32 35 36 y x1 x2 10 11 11 12 12 12 13 13 6,8 7,4 7,8 7,5 7,9 8,1 8,4 8,7 21 23 24 26 28 30 31 32 Вариант 5 Номер предприятия 1 2 3 4 5 6 7 8 9 10 y x1 x2 7 7 7 8 8 8 9 9 10 10 3,6 3,6 3,7 4,1 4,3 4,5 5,4 5,5 5,8 6,1 9 11 12 16 19 19 20 20 21 21 Номер предприятия 11 12 13 14 15 16 17 18 19 20 Вариант 6 Номер предприятия 1 2 3 4 5 6 7 8 9 10 y x1 x2 7 7 7 7 8 8 9 9 10 10 3,5 3,6 3,8 4,2 4,3 4,7 5,4 5,6 5,9 6,1 9 10 14 15 18 19 19 20 20 21 Номер предприятия 11 12 13 14 15 16 17 18 19 20 Вариант 7 Номер предприятия 1 2 3 4 5 6 7 8 y x1 x2 7 7 7 7 7 8 8 9 3,8 3,8 3,9 4,1 4,6 4,5 5,3 5,5 11 12 16 17 18 18 19 20 Номер предприятия 11 12 13 14 15 16 17 18 19 9 10 9 10 6,1 6,8 19 20 20 21 13 14 9,5 9,7 33 35 y x1 x2 11 11 12 12 12 13 13 14 14 15 7,1 7,5 7,8 7,6 7,9 8,1 8,5 8,7 9,6 9,8 22 23 25 27 29 30 32 32 33 36 Вариант 8 Номер предприятия 1 2 3 4 5 6 7 8 9 10 y x1 x2 7 7 7 7 8 8 9 9 11 10 3,8 4,1 4,3 4,1 4,6 4,7 5,3 5,5 6,9 6,8 9 14 16 17 17 18 20 20 21 21 Номер предприятия 11 12 13 14 15 16 17 18 19 20 Тема 4. СИСТЕМЫ ЭКОНОМЕТРИЧЕСКИХ УРАВНЕНИЙ Пример решения типовой задачи Рассмотрим пример. Изучается модель вида Ct a1 b11 Yt b12 Ct 1 1 , I a b r b I , t 2 21 t 22 t 1 2 rt a3 b31 Yt b32 M t 3 , Yt Ct I t Gt , где C t – расходы на потребление в период t , Yt – совокупный доход в период t , I t – инвестиции в период t , rt – процентная ставка в период t , M t – денежная масса в период t , Gt – государственные расходы в период t , Ct 1 – расходы на потребление в период t 1 , I t 1 инвестиции в период t 1 . Первое уравнение – функция потребления, второе уравнение – функция инвестиций, третье уравнение – функция денежного рынка, четвертое уравнение – тождество дохода. Модель представляет собой систему одновременных уравнений. Проверим каждое ее уравнение на идентификацию. Модель включает четыре эндогенные переменные Ct , I t , Yt , rt и четыре предопределенные переменные (две экзогенные переменные – M t и Gt и две лаговые переменные – Ct 1 и I t 1 ). 1. Проверим необходимое условие идентификации для каждого из уравнений модели. Первое уравнение: Ct a1 b11 Yt b12 Ct 1 1 . Это уравнение содержит две эндогенные переменные C t и Yt и одну предопределенную переменную Ct 1 . Таким образом, D 4 1 3 , т.е. выполняется условие D 1 H . Уравнение сверхидентифицируемо. H 2, а Второе уравнение: I t a2 b21 rt b22 I t 1 2 . Оно включает две эндогенные переменные и rt и одну экзогенную переменную I t 1 . Выполняется условие It D 1 3 1 H 2 . Уравнение сверхидентифицируемо. Третье уравнение: rt a3 b31 Yt b32 M t 3 . Оно включает две эндогенные переменные rt и одну экзогенную переменную Mt . Выполняется условие D 1 3 1 H 2 . Yt и Уравнение сверхидентифицируемо. Четвертое уравнение: Yt Ct I t Gt . Оно представляет собой тождество, параметры которого 20 известны. Необходимости в идентификации нет. 2. Проверим для каждого уравнения достаточное условие идентификации. Для этого составим матрицу коэффициентов при переменных модели. Ct It Ct 1 Yt rt I t 1 Gt Mt I –1 0 0 0 0 0 b11 b12 уравнение II 0 –1 0 0 0 0 b21 b22 уравнение III 0 0 –1 0 0 0 b31 b32 уравнение Тождество 1 1 0 –1 0 0 0 1 В соответствии с достаточным условием идентификации ранг матрицы коэффициентов при переменных, не входящих в исследуемое уравнение, должен быть равен числу эндогенных переменных модели без одного. Первое уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид It rt I t 1 Mt Gt II уравнение –1 b21 b22 0 0 III уравнение 0 –1 0 b32 0 Тождество 1 0 0 0 1 Ранг данной матрицы равен трем, так как определитель квадратной подматрицы 3 3 не равен нулю: b22 0 0 0 b32 0 0 0 b22b32 0 . 1 Достаточное условие идентификации для данного уравнения выполняется. Второе уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид Ct Yt Ct 1 Mt Gt I уравнение –1 b12 0 0 III уравнение 0 b11 b31 0 b32 0 Тождество 1 –1 0 0 1 Ранг данной матрицы равен трем, так как определитель квадратной подматрицы 3 3 не равен нулю: b12 0 0 0 b32 0 0 0 b12b32 0 . 1 Достаточное условие идентификации для данного уравнения выполняется. Третье уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид Ct It I t 1 Gt 0 Ct 1 b12 I уравнение –1 0 0 II уравнение 0 –1 0 b22 0 Тождество 1 1 0 0 1 21 Ранг данной матрицы равен трем, так как определитель квадратной подматрицы нулю: b12 0 0 0 b22 0 3 3 не равен 0 . 0 b12b22 0 1 Достаточное условие идентификации для данного уравнения выполняется. Таким образом, все уравнения модели сверхидентифицируемы. Приведенная форма модели в общем виде будет выглядеть следующим образом: Ct A1 11Ct 1 12 I t 1 13 M t 14Gt u1 , I A C I M G u , t 2 21 t 1 22 t 1 23 t 24 t 2 rt A3 31Ct 1 32 I t 1 33 M t 34Gt u3 , Yt A4 41Ct 1 42 I t 1 43 M t 44Gt u1. 3. Задание и варианты контрольной работы №4 Даны системы эконометрических уравнений. Требуется 1. Применив необходимое и достаточное условие идентифицируемо ли каждое из уравнений модели. 2. Запишите в общем виде приведенную форму модели. идентификации, определите, Вариант 1 Модель протекционизма Сальватора (упрощенная версия): M t a1 b12 N t b13 St b14 Et 1 b15 M t 1 1 , Nt a2 b21M t b23 St b26Yt 2 , S a b M b N b X . 3 31 t 32 t 36 t 3 t где M – доля импорта в ВВП; N – общее число прошений об освобождении от таможенных пошлин; S – число удовлетворенных прошений об освобождении от таможенных пошлин; E – фиктивная переменная, равная 1 для тех лет, в которые курс доллара на международных валютных рынках был искусственно завышен, и 0 – для всех остальных лет; Y – реальный ВВП; X – реальный объем чистого экспорта; t – текущий период; t 1 – предыдущий период. Вариант 2 Макроэкономическая модель (упрощенная версия модели Клейна): Ct a1 b12Yt b13Tt 1 , I t a2 b21Yt b24 K t 1 2 , Y C I , t t t где C – потребление; I – инвестиции; Y – доход; T – налоги; текущий период; t 1 – предыдущий период. Вариант 3 Макроэкономическая модель экономики США (одна из версий): K – запас капитала; t – Ct a1 b11Yt b12Ct 1 1 , I a b Y b r , t 2 21 t 23 t 2 rt a3 b31Yt b34 M t b35 rt 1 3 , Yt Ct I t Gt , G где C – потребление; Y – ВВП; I – инвестиции; r – процентная ставка; M – денежная масса; – государственные расходы; t – текущий период; t 1 – предыдущий период. Вариант 4 22 Модель Кейнса (одна из версий): Ct a1 b11Yt b12Yt 1 1 , I t a2 b21Yt 2 , Y C I G , t t t t где C – потребление; Y – ВВП; I – валовые инвестиции; текущий период; t 1 – предыдущий период. Вариант 5 Модель денежного и товарного рынков: G – государственные расходы; t – Rt a1 b12Yt b14 M t 1 , Yt a2 b21 Rt b23 I t b25Gt 2 , I a b R , 3 31 t 3 t где R – процентные ставки; Y – реальный ВВП; инвестиции; G – реальные государственные расходы. Вариант 6 Модифицированная модель Кейнса: M – денежная масса; I – внутренние Ct a1 b11Yt 1 , I t a2 b21Yt b22Yt 1 2 , Y C I G , t t t t где C – потребление; Y – доход; период; t 1 – предыдущий период. Вариант 7 Макроэкономическая модель: I – инвестиции; G – государственные расходы; t – текущий Ct a1 b11 Dt 1 , I a b Y b Y , t 2 22 t 23 t 1 2 Y D T , t t t Dt Ct I t Gt , где C – расходы на потребление; Y – чистый национальный продукт; D – чистый национальный доход; I – инвестиции; T – косвенные налоги; G – государственные расходы; t – текущий период; t 1 – предыдущий период. Вариант 8 Гипотетическая модель экономики: Ct a1 b11Yt b12 J t 1 , J a b Y , t 2 21 t 1 2 Tt a3 b31Yt 3 , Yt Ct J t Gt , где C – совокупное потребление в период t ; Y – совокупный доход в период t ; инвестиции в период t ; T – налоги в период t ; G – государственные доходы в период t . Вариант 9 Модель денежного рынка: Rt a1 b11M t b12Yt 1 , Yt a2 b21 Rt b22 I t 2 , I a b R , 3 33 t 3 t где R – процентные ставки; Y – ВВП; M – денежная масса; I – внутренние инвестиции. Вариант 10 Конъюнктурная модель имеет вид: J – 23 Ct a1 b11Yt b12Ct 1 1 , I a b r b I , t 2 21 t 22 t 1 2 rt a3 b31Yt b32 M t 3 , Yt Ct I t Gt , где C – расходы на потребление; Y – ВВП; I – инвестиции; r – процентная ставка; M – денежная масса; G – государственные расходы; t – текущий период; t 1 – предыдущий период. Список литературы 1. Тихомиров, Николай Петрович. Эконометрика : учебник для вузов / Н. П. Тихомиров, Е. Ю. Дорохина . — М. : ЭКЗАМЕН, 2007 – 510[2] с. : ил., табл. (в библиотеке 11 экз.) (Гриф) 2. Яновский, Леонид Петрович. Введение в эконометрику : учебное пособие для вузов / Л. П. Яновский, А. Г. Буховец ; ред. Л. П. Яновский. - 2-е изд., доп. — М. : КноРус, 2009. - 254[2] с. : ил., табл. (в библиотеке 10 экз.) 3. Эконометрика : учебник для вузов / И. И. Елисеева [и др.] ; ред. И. И. Елисеева. - 2-е изд., перераб. и доп. - М. : Финансы и статистика, 2008. - 574[2] с. : ил., табл. (в библиотеке 5 экз.) (Гриф) 3.2. Дополнительная литература 1. Орлов, Александр Иванович. Эконометрика: Учебник для вузов/ А. И. Орлов. — 3-е изд., перераб и доп.. — М.: Экзамен, 2004. - 573[3] с.. (в библиотеке 1 экз.) 2. Практикум по эконометрике: Учебное пособие для вузов / Ирина Ильинична Елисеева, Светлана Владимировна Курышева, Нелли Михайловна Гордеенко и др; Ред. И. И. Елисеева. - М.: Финансы и статистика, 2001. - 192 с. (в библиотеке 2 экз.) 3. Бородич, Сергей Аркадьевич. Эконометрика: Учебное пособие для вузов. — Минск: Новое знание, 2001. - 408[8] c. : ил. (в библиотеке 4 экз.) (Гриф) 4. Кремер, Наум Шевелевич. Эконометрика: Учебник для вузов. — М.: ЮНИТИ-ДАНА, 2003. 311 с. : ил. (в библиотеке 2 экз.) (Гриф)