Регрессионный анализ материалов наблюдений План Задание №3 x

advertisement
1
Пример регрессионного анализа (3 стр.)
Задание №3
Регрессионный анализ материалов наблюдений
Цель задания: освоение методики проведения регрессионного анализа.
Исходные данные: парные значения
состояние системы
xi
и
yi
(i
 1, 2 ,..., n) случайных величин X и Y , представляющие
( X , Y ) в разные моменты ее наблюдения.
План
1.
2.
Построить поле корреляции - точечную диаграмму (график).
На основании поля корреляции выдвинуть гипотезу о линейной корреляционной зависимости величин

X и Y с функцией регрессии M Y
  Ax  B .
3.
Вычислить оценки
4.
Оценить средние квадратические отклонения
5.
Вычислить выборочный коэффициент корреляции
ции
X
и
X x
Y
математических ожиданий случайных величин
X
X иY.
и  Y случайных величин X и Y .
rXY
- оценку действительного коэффициента корреля-
 XY .
6.
Проверить гипотезу о не значимости выборочного коэффициента корреляции.
7.
Получить оценку функции регрессии - уравнение регрессии Y на X . Записать уравнение регрессии в
числовом виде. Нанести прямую регрессии на график.
8.
Оценить точность регрессии (точность прогнозов).
9.
Выполнить точечную и интервальную оценку точности коэффициентов a и b уравнения регрессии.
10.
Оценить значимость коэффициента a уравнения регрессии.
11.
Оценить точность и надежность выборочного коэффициента корреляции согласно критерию Фишера.
12.
Сделать вывод о наличии, тесноте и форме корреляционной зависимости между случайными величинами X и Y .
Исходные данные получить у преподавателя.
Указания:
1. Проверку всех гипотез выполнить на 5%-м уровне значимости (т. е. q=0.05 и
2. Необходимые вычисления выполнить в рабочей таблице.
3. Указать свою группу и фамилию в области верхнего колонтитула!
Решение
1. Поле корреляции
2.
На основании графика выдвигаем гипотезу о линейной связи величин X и Y:
  0.95 ).
2
Пример регрессионного анализа (3 стр.)
H0  Y  AX  B
Рабочая таблица
i
xi
yi
xi  X
yi  Y
( xi  X )2
( yi  Y )2
( xi  X )( yi  Y )
yi
( yi  yi )2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
6,3
5,3
6,5
5,8
5,1
8,1
4,8
4,3
6,4
4,6
5,6
6,9
5,4
5,1
5,1
7,1
5
4,7
6,6
5,3
6,5
6,7
6,5
6,1
5,9
145,7
55,4
51,6
54,7
54,8
52,2
58,4
51,1
51,7
56,4
49,5
55,1
56,4
55,3
52,3
53,5
58,2
52,5
51,5
55,2
53,6
55,1
55
55
54
55,3
1353,8
0,472
-0,528
0,672
-0,028
-0,728
2,272
-1,028
-1,528
0,572
-1,228
-0,228
1,072
-0,428
-0,728
-0,728
1,272
-0,828
-1,128
0,772
-0,528
0,672
0,872
0,672
0,272
0,072
0,000
1,248
-2,552
0,548
0,648
-1,952
4,248
-3,052
-2,452
2,248
-4,652
0,948
2,248
1,148
-1,852
-0,652
4,048
-1,652
-2,652
1,048
-0,552
0,948
0,848
0,848
-0,152
1,148
0,000
0,223
0,279
0,452
0,001
0,530
5,162
1,057
2,335
0,327
1,508
0,052
1,149
0,183
0,530
0,530
1,618
0,686
1,272
0,596
0,279
0,452
0,760
0,452
0,074
0,005
20,510
1,558
6,513
0,300
0,420
3,810
18,046
9,315
6,012
5,054
21,641
0,899
5,054
1,318
3,430
0,425
16,386
2,729
7,033
1,098
0,305
0,899
0,719
0,719
0,023
1,318
115,022
0,589
1,347
0,368
-0,018
1,421
9,651
3,137
3,747
1,286
5,713
-0,216
2,410
-0,491
1,348
0,475
5,149
1,368
2,991
0,809
0,291
0,637
0,739
0,570
-0,041
0,083
43,364
55,150
53,036
55,573
54,093
52,613
58,956
51,979
50,921
55,361
51,556
53,670
56,418
53,247
52,613
52,613
56,841
52,401
51,767
55,784
53,036
55,573
55,996
55,573
54,727
54,304
1353,800
0,063
2,061
0,762
0,500
0,170
0,309
0,772
0,606
1,079
4,226
2,045
0,000
4,214
0,098
0,787
1,846
0,010
0,071
0,341
0,318
0,224
0,991
0,328
0,529
0,992
23,342
X=
Y=
~ X =
~Y =
rXY =
~ ост. =
5,828
54,152
0,906
2,14
0,86
1,01

n
3.
Оценка M(X):
X
xi

i 1
Y 
yi

i 1
n
 5.828 – среднее арифметическое;
n
Оценка M(Y):
n
 54.152 – среднее арифметическое;
n
4.
Оценка ср. кв. отклонения СВ. X:  X 
 xi  X 

i 1
 0.906 ;
n 1
n
Оценка ср. кв. отклонения СВ. Y:  Y 
2
 yi  Y 

i 1
2
 2.14 ;
n 1
n
5.
Выборочный коэффициент корреляции:
rXY 
x
i 1
i
 X  yi  Y 
n X Y
 0.86 .
3
Пример регрессионного анализа (3 стр.)
Нулевая гипотеза о не значимости коэффициента корреляции: H0   XY  0 . Эмпирическое значения
6.
n2
 7.98 . Критическое значение tT  2.07 - из таблиц распределения Стьюден2
1  rXY
критерия проверки tЭ =rXY
та для доверительной вероятности   0.95 и числа степеней свободы   n  2  23 . Так как tЭ  tT , то нулевая
гипотеза отклоняется, и коэффициент корреляции значим.
7.
Коэффициенты уравнения регрессии y  ax  b (формулы прогнозов):
ar
Y
 2.03,
X
b  Y  aX  42.3 .
Уравнение регрессии в числовом виде: y  2.03x  42.3 . Наносим прямую линию на график поля корреляции.
8.
Оценка точности регрессии (точность прогнозов по уравнению регрессии):
n
 yi  yi 

i 1
 ост. 
2
n2
 1.01 – остаточное ср.кв. отклонение.
9.
Оценка точности коэффициентов уравнения регрессии.
а) точечная:
a 
 ост.
n  2
X
 ост.
 0.23,  b 
n  2
 0.21 - средние квадратические отклонения коэффициентов
б) интервальная:
P a  t  a  A  a  t   a   - доверительный интервал для коэффициента

P  b  t 
b
 B  b  t  b


- доверительный интервал для коэффициента
a
и
b.
A функции регрессии;
B функции регрессии.
t  2.0 - аргумент функции Лапласа, соответствующий принятой доверительной вероятности   0.95 .
Тогда: P  2.03  2.0  0.23  A  2.03  2.0  0.23   , P  42.3  2.0  0.21  B  42.3  2.0  0.21   и окончательно:
P 1.77  A  2.49   0.95 ,
10.
P  41.88  B  42.72   0.95 .
Для проверки значимости коэффициента
a
уравнения регрессии проверим нулевую гипотезу
H0   A  0 о не значимости коэффициента A функции регрессии.
Эмпирическое значение критерия проверки гипотезы tЭ 
a
a
 8.9 . Критическое значение tT  2.07 - из таб-
лиц распределения Стьюдента для доверительной вероятности   0.95 и числа степеней свободы
  n  2  23 . Так как tЭ  tT , то нулевая гипотеза отклоняется и коэффициент А уравнения регрессии значим.
11.
Для оценки точности и надежности выборочного коэффициента корреляции построим доверительный
интервал для теоретического коэффициента корреляции
 XY
согласно критерию Фишера:
P thZ1   XY  thZ2    ,
где th - символ гиперболического тангенса;
1  1  rXY 
1
 0.213 ;, t β  2.07 - аргумент функции Лапласа Ф(t β )=β ;
rXY  0.86 , Z  ln 
  1.28,  Z 
2  1  rXY 
n3
t   Z  0.43 ; Z1  Z  t  Z  0.85, Z 2  Z  t  Z  1.71 ; thZ1  0.691; thZ2  0.937 .
Окончательно: P( 0.691   XY  0.937 )  0.95 - доверительный интервал для  XY .
thZ2  thZ1   0.246 ,
rmin 


n  36  n / 6  0.47 .
Так как длина доверительного интервала  thZ2  thZ1   rXY , равно как и
rmin  thZ1 , , то значение выборочно-
го коэффициента корреляции следует считать надежным, а линейную корреляционную зависимость – установленной.
Вывод: между случайными величинами X и Y существует линейная корреляционная зависимость с коэффициентом корреляции rXY  0.86 в форме уравнения регрессии y  ( 2.03x  42.3 )  1.01 . Точность прогнозов по уравнению регрессии  ост.  1.01 .
Download