Лекции №3

advertisement
Лекция 3
1.8. Алгоритмы параметрических критериев.
Параметрические критерии применяются для выборок с нормальным законом
распределения. Формула расчета этих критериев содержат параметры выборки: среднее,
дисперсии и др. Поэтому они называются параметрическими. Нормальность закона
распределения должна быть статистически доказана с помощью одного из критериев
согласия: критерий Пирсона, F-критерия Фишера,  -критерия Колмогорова и др.
В ряде случаев параметрические критерии мощнее непараметрических критериев. У
последних выше вероятность возникновения ошибки второго рода – принятия ложной
нулевой гипотезы.
К параметрическим методам относятся следующие:
– Критерий Стьюдента
– Критерий Фишера
– Методы однофакторного анализа
– Методы двухфакторного анализа
1.9.Критерий Стьюдента
Назначение.
Критерий позволяет оценивать различия средних значений выборок, имеющих
нормальное распределение.
Описание критерия.
Критерий применим для сравнения средних значений двух выборок полученных до и
после воздействия некоторого фактора.
Данный критерий был разработан Уильямом Госсеттом для оценки качества
пива в компании Гиннесс. В связи с обязательствами перед компанией по
неразглашению коммерческой тайны (а руководство Гиннесса считало
таковой использование статистического аппарата в своей работе), статья
Госсетта вышла в журнале «Биометрика» под псевдонимом «Student»
(Студент).
Зависимые(связанные) и независимые (несвязанные) выборки
При сравнении двух (и более) выборок важным параметром является их
зависимость. Если можно установить гомоморфную пару (то есть, когда
одному случаю из выборки X соответствует один и только один случай из
выборки Y и наоборот) для каждого случая в двух выборках (и это основание
взаимосвязи является важным для измеряемого на выборках признака), такие
выборки называются зависимыми. Примеры зависимых выборок:




пары близнецов,
два измерения какого-либо признака до и после экспериментального
воздействия,
мужья и жёны
и т. п.
В случае, если такая взаимосвязь между выборками отсутствует, то эти
выборки считаются независимыми, например:

мужчины и женщины,
психологи и математики.

Соответственно, зависимые выборки всегда имеют одинаковый объём, а
объём независимых может отличаться.
1.9.1.Двухвыборочный t-критерий для независимых выборок
Для двух несвязанных выборок(наблюдения не относятся к одной и той же группе
объектов ) возможны два варианта расчета:
– когда дисперсии известны
– когда дисперсии неизвестны, но равны друг другу.
1. Предварительно проверяется нормальность закона распределения по одному из
критериев согласия.
2. Рассчитывается средне арифметические значения X и Y для каждой выборки по
1 n
формуле X   xi где xi – значение i-го результата наблюдения.
n i 1
3. Рассчитывается t ýěď - эмпирическое значение критерия Стьюдента:
t
X Y
Sd
Где S d  S x2  S y2
2
2
квадратичного отклонения. Здесь S x и S y – оценки дисперсий.
Рассмотрим сначала равночисленные выборки . В этом случае n1  n2  n
Sd  S  S 
2
x
2
y
 x
 x    yi  y 
2
i
2
n  1n
В случае наравночисленных выборок n1  n2 , выражение
Sd  S  S 
2
x
2
y
 x
 x    yi  y  n1  n2
n1  n2  2
n1 n2
2
2
i
В обоих случаев подсчет числа степеней свободы осуществляется по формулам
  df  (n1  1)  (n2  1)  n1  n2  2
Понятно, что при численном равенстве выборок   2n  2
4. Эмпирическое значение t 'ýěď критерия Стьюдента сравнивается с критическим
значением t 'ęđ (по таблице 1 приложения) для данного числа степеней свободы.
Нулевая гипотеза H 0 при заданном уровне значимости  принимается, если
эмпирическое значение t 'ýěď .  t ęđ .
.
Пример рассчитаем на лабораторной работе.
Пример.
Психолог измерял время сложной сенсомоторной реакции выбора (в мс) в контрольной и
экспериментальных группах. В экспериментальную группу (Х) входило 9 спортсменов
высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не
занимающиеся спортом. Психолог приверяет гипотезу о том , что средняя скорость
сложной сенсомоторной реакции выбора у спортсменов выше, чем та же величина у
людей, не занимающихся спортом.
№
Группы
1
2
3
4
5
6
7
8
9
Сумма
Среднее
X
Y
504
560
420
600
580
530
490
580
470
4734
526
580
692
700
621
640
561
680
630
5104
638
Отклонения от
среднего
 xi  x  yi  y
Квадраты отклонений
-22
34
-106
74
54
4
-36
54
-56
0
484
1156
11236
5476
2916
16
1296
2916
3136
28632
Cредне арифметические значения X и У:
-58
54
62
-17
-2
-77
42
-8
0
 x
 x
2
i
 y
 y
2
i
3368
2916
3844
289
4
5929
1764
64
18174
4734
5104
 526 , в контрольной группе
 638 .
9
8
X  Y  526  638  112
Sd  S  S 
2
x
2
y
 x
 x    yi  y  n1  n2

n1  n2  2
n1 n2
2
i
2
28632  18174 8  9
 736,8  27.14
892
8*9
Тогда
t
X Y
Sd

112
 4.1
27.14
Число степеней свободы k=9+8-2=15
По таблице приложения для данного числа степеней находим
t ęđ
 2,13 äë˙ p  0.05

  2,95 äë˙ p  0.01
4,07 äë˙ p  0.001

Строим ось значимости
Зона неопределенности
Зона незначимости
Зона значимости
0.05
t  2,13
0.01
t  2,95
t  4,07
t ýěď  4,1
Т.о. обнаруженные психологом различия между экспериментальной и контрольной
группами значимы более чем на 0,1% уровне или иначе говоря средняя скорость сложной
сенсомоторной реакции выбора в группе спортсменов существенно выше чем в группе
людей активно не занимающихся спортом.
В терминах статистических гипотез это утверждение звучит так : гипотеза Н0 о сходстве
отклоняется и на 0,1% уровне значимости принимается альтернативная гипотеза Н1 – о
различии между экспериментальной и контрольной группой.
1.9.2. Двухвыборочный t-критерий для зависимых(связанных) выборок
Под связанными выборками понимаются наблюдения для одной группы объектов, причем
все наблюдения попарно связаны с каждый объектом исследования и характеризуют его
состояние до воздействия и после воздействия некоторого фактора.
Гипотезы
H 0 : среднее значение в выборке не отличается от нуля.
H 1 : среднее значение в выборке отличается от нуля.
Данные в выборке измерены по шкале интервалов или по шкале
отношений
Сравниваемые данные должны иметь нормальный закон распределения
Сравниваемых выборок две для оной группы объектов наблюдения,
причем имеет место парность наблюдений в выборках.
1. Предварительно проверяется нормальность закона распределения по одному из
критериев согласия.
2. Рассчитывается  i  xi  yi (i=1..n) – попарные разности вариант, xi и yi результаты
измерений для i-го объекта до и после воздействия некоторого фактора. Величину  i
будем считать независимой для разных объектов и нормально распределенной
3. Рассчитываются (лучше в табличной форме): сумма попарных разностей
n

i 1
i
и
2
 n

вспомогательные параметры   i и   i  .
i 1
 i 1 
4. Рассчитывается t ýěď - эмпирическое значение критерия   (n  1) степенями свободы
по формуле
n
2
n
t

i 1
n
i
n
n  i  (  i ) 2
2
i 1
i 1
n 1
Где n – численность выборки.
5.Найденное эмпирическое значение t 'ýěď критерия Стьюдента сравнивается с
критическим значением t 'ęđ (по таблице 1 приложения) для данного числа степеней
свободы.
Нулевая гипотеза H 0 при заданном уровне значимости  принимается, если
эмпирическое значение t 'ýěď .  t ęđ .
Критическое значение для выбранной вероятности и заданного числа степеней свободы
можно найти по встроенной в Excel функции СТЬЮДРАСПОБР.
Пример.
Психолог предположил, что в результате тренировки, время решения эквивалентных задач
(т.е. имеющих один и тот же алгоритм решения ) будет значительно уменьшаться. Для
проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой
и третьей задачи.
Решение задачи представим в таблице.
Номер
испытуемого
1
2
3
4
5
6
7
8
Суммы
1 задача
4,0
3,5
4,1
5,5
4,6
6,0
5,1
4,3
37,1
3 задача
3,0
3,0
3,8
2,1
4,9
5,3
3,1
27
27,9
i
( i ) 2
1
0,5
0,3
3,4
-0,3
0,7
2,0
1,6
9,2
10
0,25
0,09
11,56
0,09
0,49
4
2,56
20,04
n
t ýěď 

i 1
n
i
n
n  i  (  i ) 2
i 1
2
i 1

9,2
8  20,04  (9.2)
8 1
2

9.2
10.81

9.2
 2.8
3.2879
n 1
Число степеней свободы  =8-1=7. По таблице Приложения находим
t ęđ
 2,37 äë˙ p  0.05

  3.5 äë˙ p  0.01
5.41 äë˙ p  0.001

Строим ось значимости
Зона неопределенности
Зона незначимости
Зона значимости
0.05
t  2,37
0.01
t ýěď  2.8
t  3,5
t  5,41
Т.о. на 5% уровне значимости, первоначальное предположение подтвердилось,
действительно, среднее время решения 3-ей задачи, существенно меньше времени
решения 1-ой задачи. В терминах статистических гипотез полученный результат будет
звучать так: на5% уровне гипотеза Н0 отклоняется и принимается гипотеза Н1 о
различиях.
1.10. Критерий Фишера.
Критерий используется для сравнения дисперсий двух выборок с нормальным
распределением.
Сравнения дисперсий двух выборок производятся по отношению большей по величине
дисперсии(записывается в числителе) к меньшей (записывается в знаменателе). Поэтому
значения критерия больше или равно 1,0.
Гипотезы
H 0 : Дисперсия выборке 1 не отличается от дисперсии в выборке 2
H 1 : Дисперсия выборке 1 отличается от дисперсии в выборке 2
Ограничения
Данные в выборках должны быть измерены по шкале интервалов или по шкале
отношений.
Обе сравниваемые выборки должны иметь нормальный закон распределения.
Алгоритм.
1. Предварительно проверяется нормальность закона распределения по одному из
критериев согласия.
2. Рассчитывается средне арифметические значения x1 и x2 для каждой выборки по
1 n
формуле x   xi где xi – значение i-го результата наблюдения
n i 1
3. Рассчитываются значение S x21 и S x22 –дисперсии для каждой выборке по
1 n
 x i  x 2

n i 1
4. Определяется число степеней свободы по выборкам:
df1  (n1  1) - по первой выборке и df 2  (n2  1) по второй выборке.
5. Рассчитывается Fýěď - эмпирическое значение критерия по одной из формул:
формуле S x2 
S x21
S x22
или
с учетом того, что дисперсия в числителе должна быть
F

ýěď
S x22
S x21
больше дисперсии в знаменателе.
Fýěď 
6. Найденное эмпирическое значение критерия Фишера F'ýěď сравнивается
критическим значением F'ęđ (по таблице 2 приложения) для данного числа степеней
свободы  .
Если эмпирическое значение F'ýěď < F'ęđ , то нулевая гипотеза H 0 о равенстве
дисперсий в выборках при заданном уровне значимости  принимается.
Пример.
В двух третьих классах проводилось тестирование умственного развития по тесту
ТУРМШ десяти учащихся. Полученные значения величин средних достоверно не
различались, однако психолога волнует вопрос – есть ли различия в степени однородности
показателей умственного развития между классами.
Решение
Для критерия Фишера необходимо сравнить дисперсии тестовых оценок в обоих классах.
Результаты тестирования представлены в таблице
Номер
учащегося
1
2
3
4
5
6
7
8
9
10
Суммы
Среднее
Первый
класс
Х
90
29
39
79
88
53
34
40
75
79
606
60,6
Второй
класс
Y
41
49
56
64
72
65
63
87
77
62
636
63,6
Как видно из таблицы, величины средних в обеих группах практически совпадают между
собой 60.3  60.6 и величина t критерия Стьюдента оказалась равной 0,341 и незначимой.
Рассчитав дисперсии
S x21  515,44
S x22  158,44
Тогда
S x21 515.44
Fýěď  2 
 3.25
S x 2 158.44
По таблице приложения 1 для F критерия при степенях свободы 10-1=9 находим Fкр.
3,18 äë˙ p  0.05

Fęđ  5.35 äë˙ p  0.01


Строим ось значимости
Зона неопределенности
Зона незначимости
Зона значимости
0.05
Fęę  3,18
0.01
Fýěď  3.25 Fęę  5,35
Т.о. полученная величина попала в зону неопределенности. В терминах статистических
гипотез можно утверждать, что Н0 (гипотеза о сходстве) м.б. отвергнута на 5% уровне
значимости, а принимается в этом случае гипотеза Н1.
Психолог может утверждать, что по степени однородности, такого показателя, как
умственное развитие, имеется различие между выборками 2-х классов.
Download