Контрольная работа по дисциплине &quot

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Государственное образовательное учреждение высшего профессионального образования
«ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ СИСТЕМ УПРАВЛЕНИЯ
И РАДИОЭЛЕКТРОНИКИ» (ТУСУР))
Методические указания
к контрольным работам
по дисциплине
Эконометрика
Направления подготовки:
080100.62 «Экономика»
080200.62 «Менеджмент»
Экономический факультет
Кафедра экономики
Разработчик
Старший преподаватель кафедры АОИ
И.В. Потахова
2011
2
СОДЕРЖАНИЕ
Методические указания
Линейная парная регрессия
Нелинейная парная регрессия
Множественная линейная регрессия
Системы эконометрических уравнений
Список литературы
3
4
9
12
19
23
3
Методические указания
Контрольные работы выполняются в рамках курса «Эконометрика», предусматривающего изучение
методов проверки, обоснования, оценивания количественных закономерностей и качественных
утверждений на основе анализа статистических данных. Кроме этого рассматриваются возможности
применения Excel для решения означенных задач. В работах предусмотрено выполнение ряда
практических заданий.
Работы рекомендуется выполнять в порядке их следования.
По выполненным контрольным работам студент отчитывается перед преподавателем. Отчет студента
должен быть представлен выполненными заданиями и пояснениями по ходу их выполнения.
Тема 1. ЛИНЕЙНАЯ ПАРНАЯ РЕГРЕССИЯ
Цель: построение и исследование уравнения линейной регрессии.
Простая (парная) регрессия представляет собой регрессию между двумя переменными — y и
вида:
где
y  f (x)   ,
x
(1.1)
— зависимая переменная (результативный признак);
x — независимая, или объясняющая, переменная (признак-фактор);
 — случайная величина, характеризующая отклонения реального значения результативного
признака от теоретического, найденного по уравнению регрессии yˆ  f ( x)   .
(1.2)
Различают линейные и нелинейные регрессии.
Линейная регрессия описывается уравнением: y  a  b  x   .
(1.3)
На практике построение линейной регрессии сводится к оценке параметров уравнения
yˆ x  a  b  x .
(1.4)
Классический подход к оцениванию параметров линейной регрессии основан на методе
наименьших квадратов (МНК).
y
Расчетные соотношения.
1. ВЫЧИСЛЕНИЕ КОЭФФИЦИЕНТОВ УРАВНЕНИЯ ЛИНЕЙНОЙ РЕГРЕССИИ
Коэффициенты, определяемые на основе метода наименьших квадратов, являются решением
системы уравнений:
a  b  x  y

a  x  b  x 2  x  y
(1.5)
где
1 n
1 n
x    xi ; y    yi ;
n i 1
n i 1
1 n
x  y    xi  yi ;
n i 1
xi2
1 n 2
   xi .
n i 1
(1.6)
Коэффициенты уравнений (1.3), (1.4) получаем, решив систему (1.5).
b
x y  x y

cov(x, y )
 x2
);
x  ( x)
где cov(x, y ) — выборочное значение
формуле: cov(x, y )  x  y  x  y ,
2
2
a  y b x
(1.7),
корреляционного момента (ковариация), определенного по
(1.8)
 x2 – выборочное значение дисперсии величины x , определяемой по формуле:
 x2  x 2  (x ) 2
(1.9)
4
2. ИССЛЕДОВАНИЕ УРАВНЕНИЯ ЛИНЕЙНОЙ РЕГРЕССИИ
2.1. Оценка тесноты связи
Линейный коэффициент корреляции. При линейной регрессии в качестве показателя тесноты
связи выступает линейный коэффициент корреляции. Его значение находится в границах  1  rxy  1 .
rxy 
2
где  x
cov(x, y)
,
 x  y
x x ,
2
2
(1.10)
 y2
y y
2
2
,
yi2
1 n 2
   yi .
n i 1
(1.11)
Коэффициент детерминации. Он характеризует долю дисперсии результативного признака y,
объясняемую регрессией, в общей дисперсии результативного признака.
r
2
xy
2
2
 объясн
 ост

 1 2
 y2
y
(1.12)
1 n
   ( yi  y ) 2  y 2  y 2 ,
n i 1
1 n
1 n
2
2
 объясн
   ( yˆ i  y ) 2 ,  ост
   ( yi  yˆ i ) 2 ,
n i 1
n i 1
2
где  y
(1.13)
Cредняя ошибка аппроксимации. Средняя ошибка аппроксимации – среднее относительное
отклонение расчетных значений ŷ от фактических y .
1 n yi  yˆ xi
A  
 100%
n i 1 yi
(1.14)
Построенное уравнение регрессии считается удовлетворительным, если значение A не превышает
8–10 %.
Чем выше показатель детерминации или чем ниже средняя ошибка аппроксимации, тем лучше
модель описывает исходные данные.
Оценка значимости уравнения линейной регрессии и существенности параметров линейной
регрессии.
2.2.1. Вычисление оценок дисперсий парной линейной регрессии
2.2.
Оценки для дисперсий определяются формулами:
n
 ( y  y)2
2
S общ
 i 1
n 1
— общая дисперсия результативного признака.
(1.15)
n
 ( yˆ x  y ) 2
2
S факт
 i 1
m
— факторная (объясненная) дисперсия результативного признака. (1.16)
n
 ( y  yˆ x ) 2
2
S ост
 i 1
n  m 1
остаточная (необъясненная) дисперсия результативного признака.
(1.17)
Здесь
n
— количество наблюдений,
m
= 1 для парной регрессии.
5
2.2.2. Оценка значимости уравнения регрессии в целом дается с помощью F- критерия Фишера
2
2 . Если нулевая гипотеза справедлива, то факторная и
Выдвигается нулевая гипотеза H 0 : S факт
 S ост
остаточная дисперсии не отличаются друг от друга. Следовательно, уравнение регрессии в целом
незначимо. То есть для гипотезы H 0 необходимо опровержение: факторная дисперсия должна превышать
остаточную дисперсию. Таким образом, уравнение парной регрессии значимо с уровнем значимости ,
если выполняется следующее неравенство:
F
2
Sфакт
 F ;1; n  2
2
Sост
где
F ;1; n  2 – значения квантиля
k1  1; k 2  n  2 . Для вычисления
F ;1; n  2 = FРАСПОБР( ;1; n  2 ).
(1.18)
уровня

F-распределения с числами степеней свободы
квантиля можно использовать таблицу или функцию Excel:
2.2.3. Оценка существенности коэффициента линейной регрессии.
Для проверки существенности коэффициента регрессии и для расчета его доверительных интервалов
применяется величина стандартной ошибки совместно с t – распределением Стьюдента при n-2 степенях
свободы.
Фактическое значение t – критерия Стьюдента вычисляется по формуле:
tb 
b
mb
.
(1.19)
Стандартная ошибка коэффициента
mb 
(b)
регрессии определяется по формуле:
S ост
,
x  n
(1.20)
где
n
где
2
S ост

 ( y  yˆ x ) 2
i 1
n  m 1
 x2  x 2  x 2

— остаточная дисперсия на одну степень свободы,
— дисперсия признака x.
Вычисленное значение
значимости
,
(t b )
сравнивается с табличным значением при определенном уровне
и числе степеней свободы
(n  2) .
H0 : b  0 ,
x , учитывающая значение b .
Здесь проверяется нулевая гипотеза
предполагающая несущественность статистической связи между
y
и
Если tb  t табл ( , n  2) , то гипотеза H 0 : b  0 должна быть отклонена, а статистическая связь
y и x считается установленной. В случае tb  t табл ( , n  2) нулевая гипотеза не может быть
отклонена, и влияние y на x признается несущественным.
2.2.4. Построение интервальных оценок для параметров регрессии, функции парной линейной
регрессии
 Интервальная оценка (доверительный интервал) для коэффициента b с надежностью
(доверительной вероятностью) равной  определяется выражением:
b  t табл  mb
(1.30)
Аналогично строится интервальная оценка параметра a . При этом используются следующая
расчетная формула вычисления стандартной ошибки коэффициента a :
6
S ост 
ma 

n
 xi2
i 1
(1.31)
 x n
Интервальная оценка (доверительный интервал) для вычисленного значения
значении
xi
с надежностью (доверительной вероятностью) равной
 1  
(1.32)
Стандартная ошибка вычисленного значения
ŷi определяется по формуле:
1 ( xi  x ) 2
 Sост  1  
n
n   x2
Таким образом, в (1.30) входят две величины
помощью функции Excel:
при заданном
определяется выражением
yˆ i  t табл  m yˆ i
m yˆ i
ŷ i
(1.33)
m yˆ i
(зависит от
xi )
и
t ( , n  2) ,
вычисляемая с
t ( , n  2)  СТЬЮДРАСПОБР(1   , n  2) .
3. Варианты контрольной работы №1
(1 – 9 варианты). В таблице приведены данные о среднедушевом прожиточном минимуме в день на
одного работающего x (в рублях) и данные о средней заработной плате за один рабочий день y (в
рублях) в 15-ти регионах.
1.
Постройте уравнение парной регрессии y от x .
2.
Рассчитайте коэффициент парной корреляции, коэффициент детерминации и среднюю
ошибку аппроксимации.
3.
Оцените статистическую значимость параметров регрессии и уравнения регрессии с
помощью F -критерия Фишера и t -критерия Стьюдента.
4.
Найдите доверительные интервалы для коэффициентов регрессии и уравнения регрессии
на уровне значимости   0,05 .
5.
Найдите и удалите из выборки две точки, наиболее удалённые от линии регрессии.
Постройте линию регрессии для этой выборки. Сравните результаты.
Вариант 1
Прожиточный
Заработная
минимум
плата
234
445
246
484
261
518
237
457
267
524
318
623
201
396
264
517
219
434
261
517
228
449
345
685
207
419
252
526
276
553
Вариант 2
Прожиточный
Заработная
минимум
плата
215
486
226
531
239
569
217
500
245
574
292
682
184
433
242
566
201
476
239
567
209
492
316
752
190
460
231
579
253
607
Вариант 3
Прожиточный
Заработная
минимум
плата
206
369
216
410
229
441
208
383
235
443
279
526
177
335
232
436
192
369
229
439
200
380
303
583
182
360
221
459
242
472
7
Вариант 4
Прожиточный
Заработная
минимум
плата
223
448
233
467
246
494
225
451
252
504
296
594
194
388
249
499
209
420
246
494
217
436
320
641
199
399
238
478
259
520
Вариант 5
Прожиточный
Заработная
минимум
плата
312
628
342
685
367
735
322
644
371
742
443
887
277
555
365
732
306
612
366
733
316
633
489
979
295
591
374
749
393
786
Вариант 7
Прожиточный
Заработная
минимум
плата
287
577
299
600
317
635
289
579
324
649
384
769
247
495
321
642
268
537
317
635
278
558
415
832
254
509
307
614
335
670
Вариант 8
Прожиточный
Заработная
минимум
плата
406
816
445
890
478
957
417
836
483
967
579
1160
358
717
476
953
396
793
477
955
410
822
641
1283
382
764
488
976
512
1025
Вариант 6
Прожиточный
Заработная
минимум
плата
234
472
261
524
282
565
243
487
283
567
338
678
211
423
279
558
234
469
281
563
242
484
377
754
228
457
294
589
303
607
Вариант 9
Прожиточный
Заработная
минимум
плата
302
608
337
675
365
730
313
627
366
733
440
881
270
541
360
721
301
603
363
727
311
622
491
983
293
586
381
763
393
786
(10 – 15 варианты). В таблице приведены данные о весе грузов x (в килограммах) и количестве заказов
соответствующего груза y (в тысячах).
1.
Постройте уравнение парной регрессии y от x .
2.
Рассчитайте коэффициент парной корреляции, коэффициент детерминации и среднюю
ошибку аппроксимации.
3.
Оцените статистическую значимость параметров регрессии и уравнения регрессии с
помощью F -критерия Фишера и t -критерия Стьюдента.
4.
Найдите доверительные интервалы для коэффициентов регрессии и уравнения регрессии
на уровне значимости   0,05 . Отразите на графике.
5.
Найдите и удалите из выборки две точки, наиболее удалённые от линии регрессии.
Постройте линию регрессии для этой выборки. Сравните результаты.
Вариант 10
Вариант 11
Вариант 12
8
Вес
540
708
593
508
648
935
855
753
913
960
1010
1065
1205
1080
1023
1383
1430
1265
1320
1253
1570
1693
1505
1575
1630
Заказы
6.1
9.1
7.2
7.5
6.9
11.5
10.3
9.5
9.2
10.6
12.5
12.9
14.5
13.6
12.8
16.5
17.1
15.0
16.2
15.8
19.0
19.4
19.1
18.0
20.2
Вес
554
719
608
526
666
955
865
767
931
971
1022
1075
1215
1092
1035
1393
1443
1278
1336
1266
1584
1706
1524
1590
1644
Заказы
6.7
11.5
8.0
5.6
2.9
9.8
9.6
9.7
6.7
8.8
7.6
14.5
10.4
11.9
13.9
16.2
18.8
14.9
14.3
17.1
18.0
19.8
21.4
15.6
15.2
Вес
547
713
600
517
657
945
860
760
922
966
1016
1070
1210
1086
1029
1388
1436
1272
1328
1259
1577
1699
1515
1582
1637
Заказы
6.7
11.5
8.0
5.6
2.9
9.8
9.6
9.7
6.7
8.8
7.6
14.5
10.4
11.9
13.9
16.2
18.8
14.9
14.3
17.1
18.0
19.8
21.4
15.6
15.2
Вес
554
719
608
526
666
955
865
767
931
971
1022
1075
1215
1092
1035
1393
1443
1278
1336
1266
1584
1706
1524
1590
1644
Вариант 13
Заказы
6.1
9.1
7.2
7.5
6.9
11.5
10.3
9.5
9.2
10.6
12.5
12.9
14.5
13.6
12.8
16.5
17.1
15.0
16.2
15.8
19.0
19.4
19.1
18.0
20.2
Вес
561
724
616
536
676
964
870
774
940
977
1029
1081
1220
1097
1041
1398
1449
1285
1343
1273
1591
1713
1534
1597
1651
Вариант 14
Заказы
12.8
20.6
15.2
13.1
9.8
21.3
19.9
19.2
15.9
19.4
20.1
27.4
24.9
25.5
26.7
32.7
35.9
29.9
30.5
32.9
37.0
39.2
40.5
33.6
35.4
Вес
1108
1437
1217
1053
1333
1909
1730
1533
1862
1943
2045
2151
2431
2183
2069
2785
2886
2557
2671
2532
3167
3412
3048
3179
3289
Вариант 15
Заказы
6.1
9.1
7.2
7.5
6.9
11.5
10.3
9.5
9.2
10.6
12.5
12.9
14.5
13.6
12.8
16.5
17.1
15.0
16.2
15.8
19.0
19.4
19.1
18
20.2
9
Тема 2. НЕЛИНЕЙНАЯ ПАРНАЯ РЕГРЕССИЯ
Цель: построение и исследование уравнения нелинейной регрессии.
Простая (парная) регрессия представляет собой регрессию между двумя переменными — y и x
вида:
(2.1)
y  f (x)   ,
y — зависимая переменная (результативный признак);
где
x — независимая, или объясняющая, переменная (признак-фактор);
 — случайная величина, характеризующая отклонения реального значения результативного
признака от теоретического, найденного по уравнению регрессии yˆ  f ( x)   .
Построение и анализ нелинейных моделей имеют свою специфику. В рамках данной контрольной
работы рассматриваются нелинейные модели, допускающие сведения их к линейному типу.
Расчетные соотношения.
4. Оценка параметров нелинейной регрессии
4.1. Регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но
линейные по оцениваемым параметрам.
b
 .
x
y  a  b  ln( x)   .
 равносторонняя гипербола:
 полулогарифмическая:
y a
(2.2)
(2.3)
При оценке параметров регрессий (2.2), (2.3) используется метод замены переменных. Суть его
состоит в замене нелинейных объясняющих переменных, в результате чего нелинейные функции
регрессии сводятся к линейным. К новой, преобразованной функции регрессии может быть применен
обычный метод наименьших квадратов (МНК), рассмотренный в контрольной работе №1.
Линеаризующие
преобразования
Вид модели
1
2
yˆ x  a  b  ln x
1
yˆ x  a  b 
x
Таблица 1. Возможные замены переменных
Обратная замена
Ограничения
переменных
X  ln x
1
X 
x
x0
aa
bb
x0
aa
bb
4.2. Регрессии, нелинейные относительно оцениваемых параметров, но линейных относительно
включенных в анализ объясняющих переменных.
 логарифмическая модель (степенная):
 показательная:
y  a b   ;
 экспоненциальная:
y  a  xb  
(2.4)
x
ye
a b x
(2.5)

(2.6).
Оценка параметров регрессий (2.4), (2.5), (2,6) выполняется по следующему алгоритму:
1. уравнения приводятся к линейному виду с помощью логарифмирования и последующей замены
переменных;
2. оцениваются параметры преобразованного уравнения с использованием метода наименьших
квадратов;
3. выполняется обратная замена переменных и записывается исходное уравнение.
10
Линеаризующие
преобразования
Вид модели
Y  ln y, X  ln x,
yˆ x  a  x b
1
2
yˆ x  a  b x
3
yˆ x  e a  b  x
A  ln a
Y  ln y, B  ln b,
A  ln a
Y  ln y
Таблица 2. Возможные замены переменных
Обратная замена
Ограничения
переменных
x  0, y  0,
a0
b  0, y  0,
a0
y0
a  eA
bb
a  eA
b  eB
aa
bb
5. ИССЛЕДОВАНИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ РЕГРЕССИИ
5.1. Оценка тесноты связи
Индекс корреляции. При нелинейной регрессии в качестве показателя тесноты связи выступает
индекс корреляции. Его значение находится в границах 0   xy  1 .
 xy
где
2
 ост
 1 2
y
 y2 
,
1
( y  y)2 ,

n
(2.8)
2
 ост

1
( y  yˆ x ) 2

n
(2.9)
Индекс детерминации. Он характеризует долю дисперсии результативного признака y, объясняемую
регрессией, в общей дисперсии результативного признака.

2
2
2
 объясн
 ост

 1 2
 y2
y
xy
1 n
   ( yi  y ) 2  y 2  y 2 ,
n i 1
1 n
1 n
2
2
 объясн
   ( yˆ i  y ) 2 ,  ост
   ( yi  yˆ i ) 2 ,
n i 1
n i 1
(2.10)
2
где  y
(2.11)
Следует обратить внимание на то, что разности в соответствующих суммах
n
 ( yˆi  y ) 2
i 1
и
 ( y  yˆ x ) 2
 ( y  y)2 ,
берутся не в преобразованных, а в исходных значениях результативного
признака. Иначе говоря, при вычислении этих сумм следует использовать не преобразованные
(линеаризованные) зависимости, а исходные нелинейные уравнения регрессии.
Оценка качества уравнения регрессии
Cредняя ошибка аппроксимации. Средняя ошибка аппроксимации – среднее относительное
отклонение расчетных значений ŷ от фактических y .
5.2.
A
1 n yi  yˆ xi

 100%
n i 1 yi
(2.12)
Построенное уравнение регрессии считается удовлетворительным, если значение A не превышает
8–10 %.
Чем выше показатель детерминации или чем ниже средняя ошибка аппроксимации, тем лучше
модель описывает исходные данные.
11
Коэффициент эластичности. Коэффициент эластичности. показывает, на сколько процентов
измениться в среднем результат, если фактор изменится на 1%.
Формула для расчета коэффициента эластичности имеет вид:
Э  f ( x) 
x
.
y
Так как для большинства функций коэффициент эластичности не является постоянной величиной, а
зависит от соответствующего значения фактора x , то обычно рассчитывается средний коэффициент
эластичности:
Э  f ( x) 
Таблица3. Формулы для расчета
Вид модели,
y
Первая производная,
b

x
y  a  xb  
b
x2
y  a  b  xb1
y  a  bx 
y  a  b  ln x  
a  ln b  b x
b
x
y  e a bx  
b  e a bx

y a
5.3.
x
.
y
Э средних коэффициентов эластичности.
y
Средний коэффициент
эластичности,

Э
b
ax b
b
x  ln b
b
a  b  ln x
bx
Оценка значимости уравнения нелинейной регрессии.
F
где
2
 xy
2
1   xy
2
 xy

n  m 1
,
m
– индекс детерминации,
n
– число наблюдений,
m – число параметров при переменной x .
Фактическое значение F -критерия сравнивается с табличным при уровне значимости  и числе
степеней свободы k 2  n  m  1 (для остаточной суммы квадратов) и k1  m (для факторной суммы
квадратов). Вычисленное значение
при заданном уровне значимости
регрессии в целом.
F -критерия
 . В этом
признается достоверным, если оно больше табличного
случае делается вывод о существенности уравнения
6. Задание и варианты контрольной работы №2
1. На основании таблиц 3,4 построить предложенные уравнения регрессий.
2. Вычислить индексы парной корреляции и индексы детерминации для каждого уравнения. Дать
сравнительную оценку силы связи фактора с результатом.
3. Вычислить средний коэффициент эластичности. Дать смысловую интерпретацию.
4. Определить лучшее уравнение на основе средней ошибки аппроксимации.
5. Определить лучшее уравнение на основе совместного анализа значений индекса детерминации и
средней ошибки аппроксимации.
6. Оценить с помощью F-критерия Фишера статистическую надежность результатов регрессионного
моделирования.
7. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 15%
от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости α=0,05.
8. Сделать выводы по проделанной работе.
12
Вариан
т
1
2
3
4
5
6
7
8
9
10
Граф
ы
табли
цы 4
(x,y)
1, 2
1, 3
2, 3
2, 3
3, 2
1, 2
1, 3
2, 3
2, 3
3, 2
Порядковый
номер года
1
1
2
3
4
5
6
7
8
9
10
11
Таблица 3. Варианты заданий
Виды кривых аппроксимации
Гиперболическая
Полулогарифмическая
*
*
*
*
Степенная
Показательная
*
*
*
*
*
*
Экспоненциальная
*
*
*
*
*
*
*
*
*
*
Таблица 4 Данные для построения уравнений регрессий
Фактическое
конечное
потребление
Среднедушевые
денежные
доходы
домашних хозяйств (в текущих ценах), млрд.
населения (в месяц), руб.
руб.
2
3
2722
1515,9
3813
2281,1
5014
3062,0
6400
3947,2
7708
5170,4
9848
6410,3
12455
8111,9
15284
10196,0
18928
12602,7
23695
14940,6
25151
16857,0
Тема 3. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
Цель
y
работы.
Вычисление
коэффициентов
линейной
множественной
a  b1  x1  b2  x 2  ...  bm  x m   и проверка значимости в режиме Регрессия
регрессии
Режим Регрессия модуля Анализ данных. Табличный процессор Excel содержит модуль Анализ
данных. Этот модуль позволяет выполнить статистический анализ выборочных данных (построение
гистограмм, вычисление числовых характеристик и т.д.). Режим работы Регрессия этого модуля
осуществляет вычисление коэффициентов линейной множественной регрессии с k переменными,
построение доверительные интервалы и проверку значимости уравнения регрессии.
Для вызова режима Регрессия модуля Анализ данных необходимо:
 обратиться к пункту меню Сервис (Excel 2000); Данные (Excel 2007)
 в появившемся меню выбрать команду Анализ данных;
 в списке режимов работы модуля Анализ данных выбрать режим Регрессия и щелкнуть на кнопке
Ok.
После вызова режима Регрессия на экране появляется диалоговое окно (см. рис. 3.1), в котором
13
задаются следующие параметры:
1. Входной интервал Y – вводится диапазон адресов ячеек, содержащих значения yi (ячейки должны
составлять один столбец).
Рис. 3.1. Диалоговое окно режима Регрессия
2. Входной интервал X – вводится диапазон адресов ячеек, содержащих значения независимых
переменных. Значения каждой переменной представляются одним столбцом. Количество переменных не
более 16 (т.е. k  16 ).
3. Метки – включается если первая строка во входном диапазоне содержит заголовок. В этом случае
автоматически будут созданы стандартные названия.
4. Уровень надежности – при включении этого параметра задается надежность  при построении
доверительных интервалов.
5. Константа-ноль – при включении этого параметра коэффициент a  0 .
6. Выходной интервал – при включении активизируется поле, в которое необходимо ввести адрес
левой верхней ячейки выходного диапазона, который содержит ячейки с результатами вычислений
режима Регрессия.
7. Новый рабочий лист – при включении этого параметра открывается новый лист, в который
начиная с ячейки А1 вставляются результаты работы режима Регрессия.
8. Новая рабочая книга - при включении этого параметра открывается новая книга на первом листе
которой начиная с ячейки А1 вставляются результаты работы режима Регрессия.
9. Остатки – при включении вычисляется столбец, содержащий невязки yi  yˆi , i  1,..., n .
10. Стандартизованные остатки – при включении вычисляется столбец, содержащий
стандартизованные остатки.
11. График остатков – при включении выводятся точечные графики невязки yi  yˆi , i  1,..., n , в
зависимости от значений переменных x j , j  1,..., k . Количество графиков равно числу k переменных
xj .
12. График подбора – при включении выводятся точечные графики предсказанных по построенной
регрессии значений yˆ i от значений переменных x j , j  1,..., k . Количество графиков равно числу k
переменных x j .
Пример решения типовой задачи.
По данным таблицы (см. рис. 3.2) построить и оценить модель множественной линейной регрессии.
14
A
B
Внешнеторговый оборот,
в %( y )
1
2
3
4
5
6
7
8
17,4
12,6
23,1
21,3
16,8
26,5
26,4
20,4
32,7
39,1
31,5
47,7
47,3
40,7
54,5
47
41
54,6
48,7
44
54,7
48,4
45,5
51,8
Рис. 3.2 Исходные данные для построения модели
1
2
3
4
5
6
7
8
9
C
Экспорт, в %
( x1 )
D
Импорт,
в % ( x2 )
Первоначально заполним таблицу, как показано на рисунке 3.2.
После этого вызовем режим Регрессия и в диалоговом окне зададим необходимые параметры (см.
рис 3.1). Результаты работы приводятся на рис. 3.3 – 3.5.
ВЫВОД ИТОГОВ
Регрессионная статистика
Множествен-ный R
0,99990
R-квадрат
0,99979
Нормирован-ный R-квадрат
0,99971
Стандартная ошибка
0,22622
Наблюдения
8
Дисперсионный анализ
Значиdf
SS
Регрессия
2
Остаток
Итого
MS
1220,084
610,042
5
0,256
0,051
7
1220,340
F
11920,166
мость F
6,37E-10
Рис. 3.3. Результаты работы режима Регрессия
Дадим краткую интерпретацию показателям, значения которых вычисляются в режиме Регрессия.
Первоначально рассмотрим показатели, объединенные названием Регрессионная статистика (см. рис.
3.3).
Множественный R - корень квадратный из коэффициента детерминации.
R  квадрат – коэффициент детерминации R 2 .
Нормированный R  квадрат – приведенный коэффициент детерминации R̂ 2 .
Стандартная ошибка – оценка s для среднеквадратического отклонения  .
15
Наблюдения – число наблюдений n .
Перейдем к показателям, объединенным названием Дисперсионный анализ (см. рис. 3.3).
Столбец df — число степеней свободы. Для строки Регрессия показатель равен количеству
коэффициентов регрессии k r  m ; для строки Остаток соответствующий показатель ke  n  m  1;
для строки Итого число степеней свободы равно n  1.
Столбец SS – сумма квадратов отклонений. Для строки Регрессия показатель равен величине
факторной суммы квадратов
n
SS r   ( yˆ i  y ) 2 ;
i 1
для строки Остаток - равен величине остаточной суммы квадратов
n
SS е   ( yˆ i  yi ) 2 ;
i 1
для строки Итого – SS  SS r  SSe — общая сумма квадратов отклонений переменной y от
среднего значения y .
Столбец MS  дисперсии, вычисленные по формуле
SS
MS 
,
df
т.е. дисперсия на одну степень свободы.
Столбец F – значение Fc , равное F  критерию Фишера, вычисленного по формуле:
SS r
kr
Fc 
.
SS e
ke
Столбец значимость F - значение уровня значимости, соответствующее вычисленной величине
P( F ( kr , ke )  Fc ) , где F ( kr , ke ) - случайная величина,
и равное вероятности
F  критерия
подчиняющаяся распределению Фишера с k r , k e степенями свободы. Эту вероятность можно также
определить с помощью функции FРАСП( Fc ; k r ; ke ). Если вероятность меньше уровня значимости 
(обычно   0.05 ), то построенная регрессия является значимой..
Перейдем к следующей группе показателей, объединенных в таблице, показанной на рис. 3.4.
Коэффициенты
Y-пересечение
Стандартная
t-
P-
Нижние
Верхние
ошибка
статистика
Значение
95%
95%
0,0092
0,3983
0,0232
0,9824
-1,0145
1,0330
0,5179
0,0289
17,9504
0,0000
0,4437
0,5921
0,4767
0,0282
16,8818
0,0000
0,4041
0,5493
Переменная X
1
Переменная X
2
Рис. 3.4. Продолжение результатов работы режима Регрессия
Столбец Коэффициенты – вычисленные значения коэффициентов
вниз.
Столбец Стандартная ошибка – значения

2
mbi  S ост
 ( X   X ) 1

ii
mbi ,
a, b1, b2 , расположенных сверху-
(i  0,1,2,..., m) , вычисленные по формуле
(i  0,1,2,..., m) ,
16
где
( X   X ) 
1
элемента матрицы
ii — элемент (ii) матрицы
1
(X  X )
( X   X ) 1 .
Значение
i0
для вычисления стандартной ошибки параметра
соответствует номеру
a.
n
2
S ост

 ( yi  yˆ xi ) 2
i 1
n  m 1
— несмещенная оценка остаточной дисперсии (столбец MS, рис 3.3).
Столбец t  статистика – значения статистик Tb j .
Столбец
Р – значение
– содержит вероятности случайных событий
P(t (n  m)  Tb j ) , где
t (n  m)  случайная величина, подчиняющаяся распределению Стьюдента с n  m степенями свободы.
Если эта вероятность меньше уровня значимости  , то принимается гипотеза о значимости
соответствующего коэффициента регрессии.
Столбцы Нижние 95% и Верхние 95% - соответственно нижние и верхние интервалы для
оцениваемых коэффициентов a, b1, b2 .
Перейдем к следующей группе показателей, объединенных в таблице, показанной на рис. 3.5.
ВЫВОД ОСТАТКА
Наблюдение
Предсказанное
Остатки
Y
Стандартные
остатки
1
17,547
-0,147
-0,770
2
21,343
-0,043
-0,226
3
26,163
0,237
1,238
4
39,063
0,037
0,194
5
47,069
0,231
1,207
6
47,272
-0,272
-1,424
7
48,874
-0,174
-0,909
8
48,268
0,132
0,690
Рис. 3.5. Продолжение результатов работы режима Регрессия
Столбец Наблюдение – содержит номера наблюдений.
Столбец Предсказанное Y – значения yˆ i , вычисленные по построенному уравнению регрессии.
Столбец Остатки – значения невязок yi  yˆi
3.3 Задание и варианты контрольной работы №3
По 20 предприятиям региона изучается зависимость выработки продукции на одного работника y
(тыс. руб.) от ввода в действие новых основных фондов x1 (% от стоимости фондов на конец года) и от
удельного веса рабочих высокой квалификации в общей численности рабочих x 2 (%) (смотри таблицу
своего варианта).
Требуется:
1. Построить линейную модель множественной регрессии и выполнить анализ результатов.
17
Вариант 1
Номер
предприятия
1
2
3
4
5
6
7
8
9
10
y
x1
x2
6
6
6
7
7
7
8
8
9
10
3,6
3,6
3,9
4,1
3,9
4,5
5,3
5,3
5,6
6,8
9
12
14
17
18
19
19
19
20
21
Номер
предприятия
11
12
13
14
15
16
17
18
19
20
y
x1
x2
9
11
11
12
12
13
13
13
14
14
6,3
6,4
7
7,5
7,9
8,2
8
8,6
9,5
9
21
22
24
25
28
30
30
31
33
36
y
x1
x2
10
11
11
12
12
13
13
14
14
15
6,3
6,4
7
7,5
7,9
8,2
8,4
8,6
9,5
10
21
22
23
25
28
30
31
31
35
36
y
x1
x2
11
11
11
12
12
13
13
13
14
15
6,3
6,4
7,2
7,5
7,9
8,1
8,4
8,6
9,5
9,5
22
22
23
25
27
30
31
32
35
36
y
x1
x2
Вариант 2
Номер
предприятия
1
2
3
4
5
6
7
8
9
10
y
x1
x2
6
6
7
7
7
8
8
9
9
10
3,5
3,6
3,9
4,1
4,2
4,5
5,3
5,3
5,6
6
10
12
15
17
18
19
19
20
20
21
Номер
предприятия
11
12
13
14
15
16
17
18
19
20
Вариант 3
Номер
предприятия
1
2
3
4
5
6
7
8
9
10
y
x1
x2
7
7
7
7
8
8
8
9
10
10
3,7
3,7
3,9
4,1
4,2
4,9
5,3
5,1
5,6
6,1
9
11
11
15
17
19
19
20
20
21
Номер
предприятия
11
12
13
14
15
16
17
18
19
20
Вариант 4
Номер
предприятия
y
x1
x2
Номер
предприятия
18
1
2
3
4
5
6
7
8
9
10
7
7
7
7
8
8
9
9
10
10
3,5
3,6
3,9
4,1
4,2
4,5
5,3
5,5
5,6
6,1
9
10
12
17
18
19
19
20
21
21
11
12
13
14
15
16
17
18
19
20
10
10
11
12
12
13
13
14
14
15
6,3
6,5
7,2
7,5
7,9
8,2
8,4
8,6
9,5
9,6
22
22
24
25
27
30
31
33
35
36
y
x1
x2
10
11
11
12
13
13
13
14
14
14
6,3
6,9
7,2
7,8
8,1
8,2
8,4
8,8
9,5
9,7
21
23
24
25
27
29
31
33
35
34
y
x1
x2
10
10
11
12
12
13
13
13
14
14
6,3
6,8
7,2
7,9
8,1
8,3
8,4
8,8
9,6
9,7
21
22
24
25
26
29
31
32
35
36
y
x1
x2
10
11
11
12
12
12
13
13
6,8
7,4
7,8
7,5
7,9
8,1
8,4
8,7
21
23
24
26
28
30
31
32
Вариант 5
Номер
предприятия
1
2
3
4
5
6
7
8
9
10
y
x1
x2
7
7
7
8
8
8
9
9
10
10
3,6
3,6
3,7
4,1
4,3
4,5
5,4
5,5
5,8
6,1
9
11
12
16
19
19
20
20
21
21
Номер
предприятия
11
12
13
14
15
16
17
18
19
20
Вариант 6
Номер
предприятия
1
2
3
4
5
6
7
8
9
10
y
x1
x2
7
7
7
7
8
8
9
9
10
10
3,5
3,6
3,8
4,2
4,3
4,7
5,4
5,6
5,9
6,1
9
10
14
15
18
19
19
20
20
21
Номер
предприятия
11
12
13
14
15
16
17
18
19
20
Вариант 7
Номер
предприятия
1
2
3
4
5
6
7
8
y
x1
x2
7
7
7
7
7
8
8
9
3,8
3,8
3,9
4,1
4,6
4,5
5,3
5,5
11
12
16
17
18
18
19
20
Номер
предприятия
11
12
13
14
15
16
17
18
19
9
10
9
10
6,1
6,8
19
20
20
21
13
14
9,5
9,7
33
35
y
x1
x2
11
11
12
12
12
13
13
14
14
15
7,1
7,5
7,8
7,6
7,9
8,1
8,5
8,7
9,6
9,8
22
23
25
27
29
30
32
32
33
36
Вариант 8
Номер
предприятия
1
2
3
4
5
6
7
8
9
10
y
x1
x2
7
7
7
7
8
8
9
9
11
10
3,8
4,1
4,3
4,1
4,6
4,7
5,3
5,5
6,9
6,8
9
14
16
17
17
18
20
20
21
21
Номер
предприятия
11
12
13
14
15
16
17
18
19
20
Тема 4. СИСТЕМЫ ЭКОНОМЕТРИЧЕСКИХ УРАВНЕНИЙ
Пример решения типовой задачи
Рассмотрим пример. Изучается модель вида
Ct  a1  b11  Yt  b12  Ct 1  1 ,
I  a  b  r  b  I   ,
 t
2
21 t
22
t 1
2

rt  a3  b31  Yt  b32  M t   3 ,
Yt  Ct  I t  Gt ,
где C t – расходы на потребление в период t , Yt – совокупный доход в период t , I t – инвестиции в
период t , rt – процентная ставка в период t , M t – денежная масса в период t , Gt – государственные
расходы в период t , Ct 1 – расходы на потребление в период t  1 , I t 1 инвестиции в период t  1 .
Первое уравнение – функция потребления, второе уравнение – функция инвестиций, третье
уравнение – функция денежного рынка, четвертое уравнение – тождество дохода.
Модель представляет собой систему одновременных
уравнений. Проверим каждое ее уравнение на идентификацию.
Модель включает четыре эндогенные переменные  Ct , I t , Yt , rt  и четыре предопределенные
переменные (две экзогенные переменные – M t и Gt и две лаговые переменные – Ct 1 и I t 1 ).
1. Проверим необходимое условие идентификации для каждого из уравнений модели.
Первое уравнение: Ct  a1  b11  Yt  b12  Ct 1  1 . Это уравнение содержит две эндогенные
переменные C t и Yt и одну предопределенную переменную Ct 1 . Таким образом,
D  4  1  3 , т.е. выполняется условие D  1  H . Уравнение сверхидентифицируемо.
H  2, а
Второе уравнение: I t  a2  b21  rt  b22  I t 1   2 . Оно включает две эндогенные переменные
и
rt
и одну экзогенную переменную
I t 1 .
Выполняется условие
It
D  1  3  1  H  2 . Уравнение
сверхидентифицируемо.
Третье уравнение: rt  a3  b31  Yt  b32  M t   3 . Оно включает две эндогенные переменные
rt
и одну экзогенную переменную
Mt .
Выполняется условие
D 1  3 1  H  2 .
Yt
и
Уравнение
сверхидентифицируемо.
Четвертое уравнение: Yt  Ct  I t  Gt . Оно представляет собой тождество, параметры которого
20
известны. Необходимости в идентификации нет.
2. Проверим для каждого уравнения достаточное условие идентификации. Для этого
составим матрицу коэффициентов при переменных модели.
Ct
It
Ct 1
Yt
rt
I t 1
Gt
Mt
I
–1
0
0
0
0
0
b11
b12
уравнение
II
0
–1
0
0
0
0
b21
b22
уравнение
III
0
0
–1
0
0
0
b31
b32
уравнение
Тождество
1
1
0
–1
0
0
0
1
В соответствии с достаточным условием идентификации ранг матрицы коэффициентов при
переменных, не входящих в исследуемое уравнение, должен быть равен числу эндогенных переменных
модели без одного.
Первое уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид
It
rt
I t 1
Mt
Gt
II уравнение
–1
b21
b22
0
0
III уравнение
0
–1
0
b32
0
Тождество
1
0
0
0
1
Ранг данной матрицы равен трем, так как определитель квадратной подматрицы
3  3 не равен
нулю:
b22
0
0
0
b32
0
0
0  b22b32  0 .
1
Достаточное условие идентификации для данного уравнения выполняется.
Второе уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид
Ct
Yt
Ct 1
Mt
Gt
I уравнение
–1
b12
0
0
III уравнение
0
b11
b31
0
b32
0
Тождество
1
–1
0
0
1
Ранг данной матрицы равен трем, так как определитель квадратной подматрицы
3  3 не равен
нулю:
b12
0
0
0
b32
0
0
0  b12b32  0 .
1
Достаточное условие идентификации для данного уравнения выполняется.
Третье уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид
Ct
It
I t 1
Gt
0
Ct 1
b12
I уравнение
–1
0
0
II уравнение
0
–1
0
b22
0
Тождество
1
1
0
0
1
21
Ранг данной матрицы равен трем, так как определитель квадратной подматрицы
нулю:
b12
0
0
0
b22
0
3  3 не равен
0
.
0  b12b22  0
1
Достаточное условие идентификации для данного уравнения выполняется.
Таким образом, все уравнения модели сверхидентифицируемы. Приведенная форма модели в
общем виде будет выглядеть следующим образом:
Ct  A1  11Ct 1  12 I t 1  13 M t  14Gt  u1 ,
I  A   C   I   M   G  u ,
 t
2
21 t 1
22 t 1
23
t
24 t
2

rt  A3   31Ct 1   32 I t 1   33 M t   34Gt  u3 ,
Yt  A4   41Ct 1   42 I t 1   43 M t   44Gt  u1.
3. Задание и варианты контрольной работы №4
Даны системы эконометрических уравнений.
Требуется
1.
Применив необходимое и достаточное условие
идентифицируемо ли каждое из уравнений модели.
2.
Запишите в общем виде приведенную форму модели.
идентификации,
определите,
Вариант 1
Модель протекционизма Сальватора (упрощенная версия):
 M t  a1  b12 N t  b13 St  b14 Et 1  b15 M t 1  1 ,

 Nt  a2  b21M t  b23 St  b26Yt   2 ,
S  a  b M  b N  b X   .
3
31
t
32 t
36 t
3
 t
где M – доля импорта в ВВП; N – общее число прошений об освобождении от таможенных
пошлин; S – число удовлетворенных прошений об освобождении от таможенных пошлин; E –
фиктивная переменная, равная 1 для тех лет, в которые курс доллара на международных валютных
рынках был искусственно завышен, и 0 – для всех остальных лет; Y – реальный ВВП; X – реальный
объем чистого экспорта; t – текущий период; t  1 – предыдущий период.
Вариант 2
Макроэкономическая модель (упрощенная версия модели Клейна):
Ct  a1  b12Yt  b13Tt  1 ,

 I t  a2  b21Yt  b24 K t 1   2 ,
Y  C  I ,
t
t
 t
где C – потребление; I – инвестиции; Y – доход; T – налоги;
текущий период; t  1 – предыдущий период.
Вариант 3
Макроэкономическая модель экономики США (одна из версий):
K
– запас капитала;
t
–
Ct  a1  b11Yt  b12Ct 1  1 ,
I  a  b Y  b r   ,
 t
2
21 t
23 t
2

rt  a3  b31Yt  b34 M t  b35 rt 1   3 ,
Yt  Ct  I t  Gt ,
G
где C – потребление; Y – ВВП; I – инвестиции; r – процентная ставка; M – денежная масса;
– государственные расходы; t – текущий период; t  1 – предыдущий период.
Вариант 4
22
Модель Кейнса (одна из версий):
Ct  a1  b11Yt  b12Yt 1  1 ,

 I t  a2  b21Yt   2 ,
Y  C  I  G ,
t
t
t
 t
где C – потребление; Y – ВВП; I – валовые инвестиции;
текущий период; t  1 – предыдущий период.
Вариант 5
Модель денежного и товарного рынков:
G
– государственные расходы;
t
–
 Rt  a1  b12Yt  b14 M t  1 ,

Yt  a2  b21 Rt  b23 I t  b25Gt   2 ,
I  a  b R   ,
3
31 t
3
 t
где R – процентные ставки; Y – реальный ВВП;
инвестиции; G – реальные государственные расходы.
Вариант 6
Модифицированная модель Кейнса:
M
– денежная масса;
I
– внутренние
Ct  a1  b11Yt  1 ,

 I t  a2  b21Yt  b22Yt 1   2 ,
Y  C  I  G ,
t
t
t
 t
где C – потребление; Y – доход;
период; t  1 – предыдущий период.
Вариант 7
Макроэкономическая модель:
I
– инвестиции;
G
– государственные расходы;
t
– текущий
Ct  a1  b11 Dt  1 ,
I  a  b Y  b Y   ,
 t
2
22 t
23 t 1
2

Y

D

T
,
t
t
 t
 Dt  Ct  I t  Gt ,
где C – расходы на потребление; Y – чистый национальный продукт; D – чистый
национальный доход; I – инвестиции; T – косвенные налоги; G – государственные расходы; t –
текущий период; t  1 – предыдущий период.
Вариант 8
Гипотетическая модель экономики:
Ct  a1  b11Yt  b12 J t  1 ,
J  a  b Y   ,
 t
2
21 t 1
2

Tt  a3  b31Yt   3 ,
Yt  Ct  J t  Gt ,
где C – совокупное потребление в период t ; Y – совокупный доход в период t ;
инвестиции в период t ; T – налоги в период t ; G – государственные доходы в период t .
Вариант 9
Модель денежного рынка:
 Rt  a1  b11M t  b12Yt  1 ,

Yt  a2  b21 Rt  b22 I t   2 ,
I  a  b R   ,
3
33 t
3
 t
где R – процентные ставки; Y – ВВП; M – денежная масса; I – внутренние инвестиции.
Вариант 10
Конъюнктурная модель имеет вид:
J
–
23
Ct  a1  b11Yt  b12Ct 1  1 ,
I  a  b r  b I   ,
 t
2
21 t
22 t 1
2

rt  a3  b31Yt  b32 M t   3 ,
Yt  Ct  I t  Gt ,
где C – расходы на потребление; Y – ВВП; I – инвестиции; r – процентная ставка; M –
денежная масса; G – государственные расходы; t – текущий период; t  1 – предыдущий период.
Список литературы
1. Тихомиров, Николай Петрович. Эконометрика : учебник для вузов / Н. П. Тихомиров, Е. Ю.
Дорохина . — М. : ЭКЗАМЕН, 2007 – 510[2] с. : ил., табл. (в библиотеке 11 экз.) (Гриф)
2. Яновский, Леонид Петрович. Введение в эконометрику : учебное пособие для вузов / Л. П.
Яновский, А. Г. Буховец ; ред. Л. П. Яновский. - 2-е изд., доп. — М. : КноРус, 2009. - 254[2] с. : ил., табл.
(в библиотеке 10 экз.)
3. Эконометрика : учебник для вузов / И. И. Елисеева [и др.] ; ред. И. И. Елисеева. - 2-е изд.,
перераб. и доп. - М. : Финансы и статистика, 2008. - 574[2] с. : ил., табл. (в библиотеке 5 экз.) (Гриф)
3.2. Дополнительная литература
1. Орлов, Александр Иванович. Эконометрика: Учебник для вузов/ А. И. Орлов. — 3-е изд.,
перераб и доп.. — М.: Экзамен, 2004. - 573[3] с.. (в библиотеке 1 экз.)
2. Практикум по эконометрике: Учебное пособие для вузов / Ирина Ильинична Елисеева,
Светлана Владимировна Курышева, Нелли Михайловна Гордеенко и др; Ред. И. И. Елисеева. - М.:
Финансы и статистика, 2001. - 192 с. (в библиотеке 2 экз.)
3. Бородич, Сергей Аркадьевич. Эконометрика: Учебное пособие для вузов. — Минск: Новое
знание, 2001. - 408[8] c. : ил. (в библиотеке 4 экз.) (Гриф)
4. Кремер, Наум Шевелевич. Эконометрика: Учебник для вузов. — М.: ЮНИТИ-ДАНА, 2003. 311 с. : ил. (в библиотеке 2 экз.) (Гриф)
Download