1 Пример регрессионного анализа (3 стр.) Задание №3 Регрессионный анализ материалов наблюдений Цель задания: освоение методики проведения регрессионного анализа. Исходные данные: парные значения состояние системы xi и yi (i 1, 2 ,..., n) случайных величин X и Y , представляющие ( X , Y ) в разные моменты ее наблюдения. План 1. 2. Построить поле корреляции - точечную диаграмму (график). На основании поля корреляции выдвинуть гипотезу о линейной корреляционной зависимости величин X и Y с функцией регрессии M Y Ax B . 3. Вычислить оценки 4. Оценить средние квадратические отклонения 5. Вычислить выборочный коэффициент корреляции ции X и X x Y математических ожиданий случайных величин X X иY. и Y случайных величин X и Y . rXY - оценку действительного коэффициента корреля- XY . 6. Проверить гипотезу о не значимости выборочного коэффициента корреляции. 7. Получить оценку функции регрессии - уравнение регрессии Y на X . Записать уравнение регрессии в числовом виде. Нанести прямую регрессии на график. 8. Оценить точность регрессии (точность прогнозов). 9. Выполнить точечную и интервальную оценку точности коэффициентов a и b уравнения регрессии. 10. Оценить значимость коэффициента a уравнения регрессии. 11. Оценить точность и надежность выборочного коэффициента корреляции согласно критерию Фишера. 12. Сделать вывод о наличии, тесноте и форме корреляционной зависимости между случайными величинами X и Y . Исходные данные получить у преподавателя. Указания: 1. Проверку всех гипотез выполнить на 5%-м уровне значимости (т. е. q=0.05 и 2. Необходимые вычисления выполнить в рабочей таблице. 3. Указать свою группу и фамилию в области верхнего колонтитула! Решение 1. Поле корреляции 2. На основании графика выдвигаем гипотезу о линейной связи величин X и Y: 0.95 ). 2 Пример регрессионного анализа (3 стр.) H0 Y AX B Рабочая таблица i xi yi xi X yi Y ( xi X )2 ( yi Y )2 ( xi X )( yi Y ) yi ( yi yi )2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 6,3 5,3 6,5 5,8 5,1 8,1 4,8 4,3 6,4 4,6 5,6 6,9 5,4 5,1 5,1 7,1 5 4,7 6,6 5,3 6,5 6,7 6,5 6,1 5,9 145,7 55,4 51,6 54,7 54,8 52,2 58,4 51,1 51,7 56,4 49,5 55,1 56,4 55,3 52,3 53,5 58,2 52,5 51,5 55,2 53,6 55,1 55 55 54 55,3 1353,8 0,472 -0,528 0,672 -0,028 -0,728 2,272 -1,028 -1,528 0,572 -1,228 -0,228 1,072 -0,428 -0,728 -0,728 1,272 -0,828 -1,128 0,772 -0,528 0,672 0,872 0,672 0,272 0,072 0,000 1,248 -2,552 0,548 0,648 -1,952 4,248 -3,052 -2,452 2,248 -4,652 0,948 2,248 1,148 -1,852 -0,652 4,048 -1,652 -2,652 1,048 -0,552 0,948 0,848 0,848 -0,152 1,148 0,000 0,223 0,279 0,452 0,001 0,530 5,162 1,057 2,335 0,327 1,508 0,052 1,149 0,183 0,530 0,530 1,618 0,686 1,272 0,596 0,279 0,452 0,760 0,452 0,074 0,005 20,510 1,558 6,513 0,300 0,420 3,810 18,046 9,315 6,012 5,054 21,641 0,899 5,054 1,318 3,430 0,425 16,386 2,729 7,033 1,098 0,305 0,899 0,719 0,719 0,023 1,318 115,022 0,589 1,347 0,368 -0,018 1,421 9,651 3,137 3,747 1,286 5,713 -0,216 2,410 -0,491 1,348 0,475 5,149 1,368 2,991 0,809 0,291 0,637 0,739 0,570 -0,041 0,083 43,364 55,150 53,036 55,573 54,093 52,613 58,956 51,979 50,921 55,361 51,556 53,670 56,418 53,247 52,613 52,613 56,841 52,401 51,767 55,784 53,036 55,573 55,996 55,573 54,727 54,304 1353,800 0,063 2,061 0,762 0,500 0,170 0,309 0,772 0,606 1,079 4,226 2,045 0,000 4,214 0,098 0,787 1,846 0,010 0,071 0,341 0,318 0,224 0,991 0,328 0,529 0,992 23,342 X= Y= ~ X = ~Y = rXY = ~ ост. = 5,828 54,152 0,906 2,14 0,86 1,01 n 3. Оценка M(X): X xi i 1 Y yi i 1 n 5.828 – среднее арифметическое; n Оценка M(Y): n 54.152 – среднее арифметическое; n 4. Оценка ср. кв. отклонения СВ. X: X xi X i 1 0.906 ; n 1 n Оценка ср. кв. отклонения СВ. Y: Y 2 yi Y i 1 2 2.14 ; n 1 n 5. Выборочный коэффициент корреляции: rXY x i 1 i X yi Y n X Y 0.86 . 3 Пример регрессионного анализа (3 стр.) Нулевая гипотеза о не значимости коэффициента корреляции: H0 XY 0 . Эмпирическое значения 6. n2 7.98 . Критическое значение tT 2.07 - из таблиц распределения Стьюден2 1 rXY критерия проверки tЭ =rXY та для доверительной вероятности 0.95 и числа степеней свободы n 2 23 . Так как tЭ tT , то нулевая гипотеза отклоняется, и коэффициент корреляции значим. 7. Коэффициенты уравнения регрессии y ax b (формулы прогнозов): ar Y 2.03, X b Y aX 42.3 . Уравнение регрессии в числовом виде: y 2.03x 42.3 . Наносим прямую линию на график поля корреляции. 8. Оценка точности регрессии (точность прогнозов по уравнению регрессии): n yi yi i 1 ост. 2 n2 1.01 – остаточное ср.кв. отклонение. 9. Оценка точности коэффициентов уравнения регрессии. а) точечная: a ост. n 2 X ост. 0.23, b n 2 0.21 - средние квадратические отклонения коэффициентов б) интервальная: P a t a A a t a - доверительный интервал для коэффициента P b t b B b t b - доверительный интервал для коэффициента a и b. A функции регрессии; B функции регрессии. t 2.0 - аргумент функции Лапласа, соответствующий принятой доверительной вероятности 0.95 . Тогда: P 2.03 2.0 0.23 A 2.03 2.0 0.23 , P 42.3 2.0 0.21 B 42.3 2.0 0.21 и окончательно: P 1.77 A 2.49 0.95 , 10. P 41.88 B 42.72 0.95 . Для проверки значимости коэффициента a уравнения регрессии проверим нулевую гипотезу H0 A 0 о не значимости коэффициента A функции регрессии. Эмпирическое значение критерия проверки гипотезы tЭ a a 8.9 . Критическое значение tT 2.07 - из таб- лиц распределения Стьюдента для доверительной вероятности 0.95 и числа степеней свободы n 2 23 . Так как tЭ tT , то нулевая гипотеза отклоняется и коэффициент А уравнения регрессии значим. 11. Для оценки точности и надежности выборочного коэффициента корреляции построим доверительный интервал для теоретического коэффициента корреляции XY согласно критерию Фишера: P thZ1 XY thZ2 , где th - символ гиперболического тангенса; 1 1 rXY 1 0.213 ;, t β 2.07 - аргумент функции Лапласа Ф(t β )=β ; rXY 0.86 , Z ln 1.28, Z 2 1 rXY n3 t Z 0.43 ; Z1 Z t Z 0.85, Z 2 Z t Z 1.71 ; thZ1 0.691; thZ2 0.937 . Окончательно: P( 0.691 XY 0.937 ) 0.95 - доверительный интервал для XY . thZ2 thZ1 0.246 , rmin n 36 n / 6 0.47 . Так как длина доверительного интервала thZ2 thZ1 rXY , равно как и rmin thZ1 , , то значение выборочно- го коэффициента корреляции следует считать надежным, а линейную корреляционную зависимость – установленной. Вывод: между случайными величинами X и Y существует линейная корреляционная зависимость с коэффициентом корреляции rXY 0.86 в форме уравнения регрессии y ( 2.03x 42.3 ) 1.01 . Точность прогнозов по уравнению регрессии ост. 1.01 .