ïÔÞÅÔ 2 - Томский политехнический университет

advertisement
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение высшего профессионального образования
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ
УНИВЕРСИТЕТ
Институт Кибернетики
Кафедра Прикладной математики
Отчет по лабораторной работе 2
Критерий Стьюдента и критерий Манна-Уитни
По дисциплине «Прикладная математическая статистика»
Выполнила
студентка гр. 8БМ10
Рожновская А.И.
Проверил
профессор кафедры ПМ
Берестнева О.Г.
Томск 2013
Цель работы:
На основе независимых выборок (вьетнамцы и люди других национальностей) в пакете StatGraphics при помощи критерия Стьюдента и критерия МаннаУитни проверить гипотезы о равенстве средних в выборках и о статистической однородности двух выборок.
Теоретические положения
Критерий Стьюдента
Одним из наиболее распространенных параметрических критериев является
критерий Стьюдента, в основе которого лежит t-распределение. Английский математик В. Госсет (печатавшийся под псевдонимом Стьюдент) в 1908 г. нашел закон
распределения значений:
t
x
.
s/ n
Оказалось, что отношение разности между выборочной и генеральной средними к ошибке выборочной средней непрерывно распределяется согласно следующей формуле:
t2 

f (t )  C 1 

n  1


n 1
2
для – < t < +,
где C – константа, зависящая только от степеней свободы v=n –1.
Открытый Стьюдентом и теоретически обоснованный Р.Фишером закон tраспределения служит основой так называемой теории малой выборки, которая характеризует распределение выборочных средних в нормально распределяющейся
совокупности в зависимости от объема выборки. Данное распределение зависит
только от числа степеней свободы v=n –1, причем с увеличением объема выборки n
t-распределение быстро приближается к нормальному с параметрами  = 0 и  = 1
и уже при n > 30 не отличается от него.
Нулевая гипотеза сводится к предположению, что разность средних в выборке 1 и выборке 2 равна нулю. Эмпирическое значение t-критерия выражается в виде
отношения разности выборочных средних к своей ошибке:
t
x1  x 2
d
 .
sd
sd
H0-гипотезу отвергают, если фактически установленная величина t-критерия
(обозначаемая символом tэмп) превзойдет или окажется равной критическому (стандартному) значению tкр этой величины для принятого уровня значимости  и числа
степеней свободы v = n1+ n2 – 2, т. е. при условии
tэмп  tкр .
Ошибку разности средних sd определяют по следующим формулам:

для равночисленных выборок, т. е. при n1 = n2 ,
 xi  x1 
2
sd  s 2  s 2 
x1
x2

sd 
n(n  1)
 xi  x2 

2
n(n  1)
 xi  x1    xi  x2 
2

2
n(n  1)
;
для неравночисленных выборок, т. е. при n1  n2 ,
(n1  1) s12  (n1  1) s 22
n1  n2  2
 n1  n2 

 
n
n
 1 2 
 xi  x1 2  xi  x2 2  n1  n2  .
n1  n2  2
 nn 
 1 2 
Следует заметить, что вышеизложенное применение t-критерия предполагает, что дисперсии сравниваемых групп одинаковы:  12   22 . Если это не так, то величину критерия находят по другим формулам.
Неопровержение H0-гипотезы нельзя рассматривать как доказательство равенства между неизвестными параметрами совокупностей, из которых извлечены
сравниваемые выборки. В таких случаях вопрос о преимуществе одной статистической совокупности перед другой остается открытым. Ведь не исключено, что при
повторных испытаниях H0-гипотеза может оказаться несостоятельной. Более того,
и в тех случаях, когда H0-гипотеза опровергается, не следует спешить с окончательным выводом.
Правильное применение t-критерия предполагает нормальное распределение
совокупностей, из которых извлечены сравниваемые выборки и равенство генеральных дисперсий. Если эти условия не выполняются, то t-критерий применять не
следует. В таких случаях более эффективными будут непараметрические критерии.
U-критерий Уилкоксона (Манна-Уитни)
Область применения U-критерия Уилкоксона – анализ двух независимых
выборок. Размеры этих выборок могут различаться.
Назначение критерия – проверка гипотезы о статистической однородности
двух выборок. Иногда эту гипотезу называют гипотезой об отсутствии эффекта обработки (имея в виду, что одна из выборок держит характеристики объектов, подвергшихся некоему воздействию, а другая – характеристики контрольных объектов). Он основан на попарном сравнении результатов из первой и второй выборок.
Ограничения критерия
1. В каждой выборке должно быть не менее 3 наблюдений: т и n  3 допускается,
чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть
не менее 5.
2. В каждой выборке должно быть не более 60 наблюдений; т и n  60. Однако
уже при т, n > 20 ранжирование становиться достаточно трудоемким.
Порядок расчета
1. Расположить числовые значения сравниваемых выборок в возрастающем порядке в один общий ряд и пронумеровать члены общего ряда от 1 до N = m +
2.
n. Эти номера будут «рангами» членов ряда. Одинаковым значениям присваивается средний ранг.
Отдельно для каждой выборки найти суммы рангов R и определить величины:
U1  R1 
m(m  1)
n(n  1)
и U 2  R2 
,
2
2
которые отображают связь между суммами рангов первой и второй выборки.
3. В качестве U-критерия использовать меньшую величину Uэмп, которую нужно
сравнить с табличным значением Uкр . Условием для сохранения принятой Н0гипотезы служит неравенство Uэмп > Uкр . Критические точки U-критерия Uкр
для m и n и принимаемого уровня значимости  содержатся в статистических
таблицах.
Н-критерий Крускала-Уоллиса
Критерий предназначен для оценки различий одновременно между тремя, четырьмя и так далее выборками по уровню какого-либо признака.
Он позволяет установить, что уровень признака изменяется при переходе от
группы к группе, но не указывает на направление этих изменений.
Гипотезы для критерия Крускала-Уоллиса формулируются следующим
образом:
Н0: Между выборками 1, 2, 3 и так далее существуют лишь случайные различия по уровню исследуемого признака.
Н1: Между выборками 1, 2, 3 и так далее существуют неслучайные различия
по уровню исследуемого признака.
Н-критерий иногда рассматривается как непараметрический аналог метода
дисперсионного однофакторного анализа для несвязных выборок.
Данный критерий является продолжением критерия U для трех и более одновременно сопоставляемых выборок. Все индивидуальные значения ранжируются
так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно,
так как высокие и низкие ранги равномерно распределятся между выборками. Но
если в одной из выборок будут преобладать низкие значения рангов, в другой – высокие, а в третьей – средние, то критерий Н позволит установить эти различия.
Теперь познакомимся с алгоритмом подсчета Н-критерия Крускала-Уоллиса.
1.
Необходимо составить общий упорядоченный ряд. Результаты эксперимента
расположены в порядке их возрастания.
2.
Проранжировать значения, приписывая меньшему значению меньший ранг.
Общее количество рангов равно количеству испытуемых в выборке.
3.
Подсчитать сумму рангов отдельно по каждой группе. Проверить совпадение
общей суммы рангов с расчетной.
4.
Подсчитать значение Н-критерия по формуле
2
c T 
 12
j
H 

  3( N  1) ,
N
(
N

1
)
j 1 n


где N – общее количество испытуемых в объединенной выборке; с – количество
групп (выборок); n – количество испытуемых в каждой группе; Тj – суммы рангов
по каждой группе.
5.
При количестве групп с = 3 и n1, n2, n3  5 определить критическое значение
и соответствующий им уровень значимости. Если Нэмп равна или превышает
критическое значение при уровне значимости p = 0,05 (обозначается Н0,05),
Н0 отвергается.
При количестве групп с > 3 или количестве испытуемых n1, n2, n3 > 5 критические значения определятся как критические значения 2. Если Нэмп равен или превышает критическое значение 2, Н0 отвергается.
Ограничения критерия
1.
При сопоставлении трех выборок допускается, чтобы в одной из них n = 3, а
в других n = 2. Но при таких численных составах выборок мы сможем установить различия на низшем уровне значимости (р  0,05).
Для того чтобы оказалось возможным диагностировать различия на более
высоком уровне значимости (р  0,01), необходимо, чтобы в каждой выборке было
не менее 3 наблюдений, или чтобы по крайней мере в одной из них было 4 наблюдения, а в других – по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4 : 2 : 2.
2.
При большом количестве выборок и испытуемых в каждой выборке необходимо пользоваться таблицей критических значе-ний критерия 2, поскольку
критерий Крускала-Уоллиса асимп-тотически приближается к распределению 2 .
Количество степеней свободы при этом определяется по формуле  = с – 1,
где с – количество выборок.
Ход работы
Переменные
Кр.Стьюдента
Критерий Манна-Уитни
Различие
НЕ В
В
р
НЕ В
В
р
Отношение к работе
7
5,809
5,952
5,429
7,285
8,333
5,111
6,145
6,111
5,111
0,049
0,295
0,779
0,215
0,034
16,976
21,261
19,333
19,024
28,978
23,345
18,123
20,778
21,134
15,345
0,070
0,446
0,688
0,538
0,018
достоверно
не достоверно
не достоверно
не достоверно
достоверно
Отношения с начальством
6,333
5,611
0,375
22,214 17,417
0,183
не достоверно
Консерватизм
Самостоятельность
Самоконтроль
Внутр. напряж-ть
Выводы
В результате проведенных на независимых выборках («Вьетнам» и «Не
Вьетнам») исследованиях в пакете StatGraphics при помощи критерия Стьюдента и
критерия Манна-Уитни были отвергнуты гипотеза о равенстве средних в выборках
и гипотеза о статистической однородности двух выборок для всех переменных,
кроме «Консерватизма» и «Отношения к работе». Из этого можно заключить, что у
людей из Вьетнама отношение к работе лучше, чем у остальным и они более консервативны.
Download