Lect11

advertisement
ЛЕКЦИЯ 11
y = ax+b
РЕГРЕССИОННЫЙ
АНАЛИЗ: ЧАСТЬ 2
11.1. Оценка значимости
регрессии с помощью
доверительных интервалов
Значимость линейной регрессии
оценивается путем проверки
гипотезы:
H0: β = 0
100(1 – α)-процентный
доверительный интервал для β:
b – tαsb < β < b + tαsb
Пример расчета 95%-ного
доверительного интервала для β:

Число степеней свободы df = n – 2 = 8
 t0.05,8

= 2.306
0.44 – 2.306х0.068 < β < 0.44 + 2.306х0.068
0.28 < β < 0.60
Интерпретация:
Рассчитанный доверительный
интервал не содержит 0.
Следовательно, нулевую
гипотезу об отсутствии связи
между признаками следует
отклонить.
Доверительный интервал для α:
а – tαsа < α < а + tαsа
-6.0 – 2.306х2.53 < α < -6.0 + 2.306х2.53
-11.8 < α < -0.17
11.2. Доверительная область
для линии регрессии
Стандартная ошибка регрессии:
s yˆ  s y|x
1 ( xi  x )

2
n (n  1) sx
2
100(1 – α)-процентный доверительный
интервал для каждого значения
уравнения регрессии в точке xi
yˆ  t s yˆ  y  yˆ  t s yˆ
Доверительная
область
регрессии
Гланц, 1999
11.3. Дисперсионный
анализ регрессии
Сравнение остаточной и
«естественной» дисперсий:
F
s
2
y| x
2
y
s
Таблица с результатами регрессионного
анализа в программе STATISTICA
содержит значение F-критерия:
11.4. Анализ остатков
Остатки – вертикальные
расстояния от
выборочных точек до
регрессионной прямой
1. Остатки должны распределяться
нормально:
2. Дисперсия остатков должна оставаться
неизменной во всем диапазоне значений
анализируемых переменных:
Выбросы (=аутсайдеры)
www.statsoft.ru
Наиболее обычные причины
появления выбросов:
инструментальные
ошибки измерений;
 ошибки, возникающие при
вводе данных в компьютер

11.5. Связь регрессии и
корреляции
Связь между коэффициентом корреляции
и коэффициентом регрессии:
sx
r b
sy
Коэффициент детерминации
(=аппроксимации):
s
n

2
2
r  1
n 1 s
2
y|x
2
y
0<
2
r
<1
11.6. Понятие о
множественной и нелинейной
регрессии
Пример линейной регрессии с двумя
независимыми переменными:
у = a + bх + cz
Свободный член
уравнения
Коэффициенты
регрессии
Основные виды нелинейных
зависимостей между биологическими
признаками:
y  a  bx  cx
y  ae xb
b
ya
x
2
y  ax
b
y  ae
N
y

c
a  bt
1  10
xb
Диаграмма рассеяния
(Scatterplot):
Логарифмирование степенной
зависимости позволяет ее
«выровнять»:
log y  a  b log x
Обратно пропорциональное
преобразование данных:
1
x 
x
b
y  a   y  a  bx
x
Download