Проверка гипотезы о значимости выборочного коэффициента

advertisement
Проверка гипотезы о значимости
выборочного коэффициента
коррелляции.
Коэффициент корреляции – это мера
интенсивности линейной связи между
признаками. Вычисляют по формуле:
S
r
S
x
yx
y
Свойства коэффициента корреляции:
1.
r 1
2. Если r = 1, то зависимость между
признаками Х и У является
функциональной
3. Если r = 0, то признаки Х и У не связаны
линейной корреляционной зависимостью,
но зависимость может иметь
криволинейный характер.
Пусть двумерная генеральная
совокупность (X;Y) распределена
нормально, из той совокупности
извлечена выборка объема n и по ней
найден выборочный коэффициент
корелляции rв, который оказался
отличным от нуля.
Т.к. выборка отобрана случайно, то еще
нельзя заключить, что коэффициент
генеральной совокупности rв также отличен
от нуля. В конечном счете нас интересует
именно этот коэффициент поэтому
возникает необходимость при заданном
уровне значимости α проверить нулевую
гипотезу: о равенстве генерального
коэффициента корелляции при
конкурирующей гипотезе.
Если нулевая гипотеза отвергается, то это
означает, что выборочный коэффициент
корелляции значимо отличается от нуля
(кратко говоря, значим), а X и Y
корелированы, т.е. связаны линейной
зависимостью.
Если нулевая гипотеза будет принята, то
выборочный коэффициент корелляции
незначим, а X и Y некорелированны, т.е. не
связаны линейной зависимостью.
В качестве критерия проверки нулевой
гипотезы примем случайную величину:
T
rв n  2
1  rв
2
Величина T при справедливости нулевой
гипотезы имеет распределение Стьюдента с
k = n – 2 степенями свободы.
Поскольку конкурирующая гипотеза имеет
вид , критическая область – двусторонняя.
Обозначим значение критерия, вычисленное
по данным наблюдений, через Tнабл. и
сформулируем правило проверки гипотезы.
Правило. Для того, чтобы при заданном
уровне значимости α проверить нулевую
гипотезу о равенстве нулю генерального
коэффициента корелляции нормальной
двумерной случайной величины при
конкурирующей гипотезе , надо вычислить
наблюдаемое значение критерия:
Т набл. 
rв n  2
1  rв
2
и по таблице критических точек
распределения Стьюдента, по заданному
уровню значимости и числу степеней
свободы k = n – 2 найти критическую
точку tкр. (α, k) для двусторонней
критической области.
• Если |Tнабл.| < tкр. – нет оснований
отвергнуть нулевую гипотезу.
• Если |Tнабл.| > tкр. – нулевую гипотезу
отвергают.
Принимается нулевая гипотеза
H 0 : r  0 при H 1 : r  0 .
Проверка нулевой гипотезы проводится
по t-критерию:
r
n2
t
r
2
 r 1 r ,
где t вычисляют по исходным данным.
Находят t кр из условия: задан
уровень значимости α и известно
число степеней свободы
k = n - 2.
По таблице распределения
Стьюдента определяют:
t
кр
 t ( ; n  2)
.
Если t  кр , то нулевая
гипотеза отвергается, поэтому
коэффициент корреляции
существенно отличен от нуля в
генеральной совокупности, а между
признаками Х и У существует
корреляционная связь.
t
Download