Lecture 5.4

advertisement
Лекция 5.4
Классическая линейная регрессия.
Проверка гипотез о конкретном
значении коэффициентов регрессии.
1
Классическая линейная регрессия для случая
множественной регрессии
Пусть для регрессионной модели
Y = b1 + b2X2 +…+βkXk + u
выполнены условия теоремы Гаусса – Маркова и
ui , i = 1,…,n распределены нормально,
т.е. ui ~ N(0, σu2)
2
Проверка гипотез о конкретном значении
коэффициентов регрессии при двусторонней
альтернативной гипотезе
Y = b1 + b2X2 +…+βkXk + u
H 0 : b j  b , j {1,..., k}
0
j
H1 : b j  b
0
j
Проверка гипотез о конкретном значении коэффициентов
регрессии проводится аналогично случаю парной регрессии.
3
Проверка гипотез о конкретном значении
коэффициентов регрессии при двусторонней
альтернативной гипотезе
1) Оцениванием коэффициенты множественной регресс с
помощью МНК
Yˆ  b1  b2 X 2  ...  bk X k
2) Вычисляем значение тестовой статистики (имеющей
распределение t(n-k))
t
bj  b
0
j
s.e.(b j )
~ t (n  k )
4
Таблицы для t - распределения
t Distribution: Critical values of t
Degrees of Two-tailed test
freedom One-tailed test
1
2
3
4
5
…
…
18
19
20
…
…
120

10%
5%
5%
2.5%
2%
1%
1%
0.5%
0.2%
0.1%
0.1%
0.05%
6.314 12.706 31.821 63.657 318.31 636.62
2.920
4.303
6.965
9.925 22.327 31.598
2.353
3.182
4.541
5.841 10.214 12.924
2.132
2.776
3.747
4.604
7.173
8.610
2.015
2.571
3.365
4.032
5.893
6.869
…
…
…
…
…
…
…
…
…
…
…
…
1.734
2.101
2.552
2.878
3.610
3.922
1.729
2.093
2.539
2.861
3.579
3.883
1.725
2.086
2.528
2.845
3.552
3.850
…
…
…
…
…
…
…
…
…
…
…
…
1.658
1.980
2.358
2.617
3.160
3.373
1.645
1.960
2.326
2.576
3.090
3.291
5
Проверка гипотез о конкретном значении
коэффициентов регрессии при двусторонней
альтернативной гипотезе
H0 : b j  b
0
j
H1 : b j  b 0j
3) Правило принятия решения при выбранном уровне
значимости α: нулевая гипотеза отвергается, если
t t
cr
 /2
 /2
 /2
 tcr/ 2
tcr/ 2
6
Проверка гипотезы о значимости коэффициента
H0 : b j  0
H1 : b j  0
t
bj
s.e.(b j )
 /2
 /2
 tcr/ 2
tcr/ 2
Если нулевая гипотеза отвергается, то коэффициент b j называется
значимым (при выбранном уровне значимости). В противном случае
этот коэффициент называется незначимым.
7
P – VALUE для проверки гипотезы о значимости
коэффициента
Y  b1  b 2 X 2  ...  b k X k  u
H0 : b j  0
H1 : b j  0
t
bj
s.e.(b j )
p  value / 2
t
p  value / 2
t
P – value – минимальный уровень значимости, при котором основная
гипотеза не отвергается. Если P-value для коэффициента регрессии
меньше выбранного уровня значимости α, то нулевая гипотеза
отвергается и выбранный коэффициент является значимым (при
выбранном уровне значимости).
8
Связь доверительных интервалов с проверкой
гипотез
(1-α)100% доверительный интервал для
bj  t
cr
 /2
Если
b 0j
bj
:
s.e.(b j )  b j  b j  t
cr
 /2
s.e.(b j )
попадает в (1 – α)∙100% доверительный интервал
для коэффициента βj, то при уровне значимости α гипотеза
H 0 : b j  b 0j при альтернативной гипотезе
H1 : b j  b 0j
не отвергается.
9
Пример
. reg EARNINGS S EXP
Source |
SS
df
MS
-------------+-----------------------------Model | 22513.6473 2 11256.8237
Residual | 89496.5838 537 166.660305
-------------+-----------------------------Total | 112010.231 539 207.811189
Number of obs = 540
F( 2, 537) = 67.54
Prob > F
= 0.0000
R-squared = 0.2010
Adj R-squared = 0.1980
Root MSE
= 12.91
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t| [95% Conf. Interval]
-------------+---------------------------------------------------------------S
| 2.678125 .2336497 11.46 0.000 2.219146 3.137105
EXP
| .5624326 .1285136 4.38 0.000 .3099816 .8148837
_cons
| -26.48501 4.27251 -6.20 0.000 -34.87789 -18.09213
------------------------------------------------------------------------------
10
Download