ïÔÞÅÔ 4 - Томский политехнический университет

advertisement
Министерство образования и науки РФ
«Национальный исследовательский Томский политехнический университет»
Институт кибернетики
Кафедра прикладной математики
Отчет по лабораторной работе 4
«Критерий хи-квадрат»
По дисциплине «Прикладная математическая статистика»
Выполнила
студентка гр. 8БМ10
Рожновская А.И.
Проверил
профессор кафедры ПМ
Берестнева О.Г.
Томск — 2013
Цель работы:
Теоретические положения
Проверку гипотез о нормальном законе распределения производят с
помощью ряда критериев. Один из них, нашедший широкое применение в
педагогических, психологических и медицинских исследованиях, – критерий
согласия, или соответствия 2 (хи-квадрат). Величина критерия 2
определяется по формуле
( f  f ) 2 k  d 2 
 
   ,
i 1
i 1  f  
f
k
2
(1)
где f – эмпирические частоты, f – ожидаемые частоты, d – раз-ность между
эмпирическими и вычисленными частотами.
Величина критерия 2 всегда положительна. При полном совпадении
эмпирических частот с вычисленными или ожидаемыми частотами
2
  fi  fi  0 и 2 = 0.
0,6
2
F( )?
0,5
0,4
0,3
0,2
0,1
0
1 2
3 4 5
6 7 8
9 10 11 12 13 14 15 16 17

Рисунок 1. Функция χ2-распределения в зависимости от разных чисел
2
Распределение вероятных значений случайной величины 2 является
непрерывным и асимметричным (рис. 1), оно зависит от числа степеней
свободы k и приближается к нормальной кривой по мере увеличения числа
испытаний n. Поэтому применение критерия 2 к оценке дискретных
распределений сопряжено с некоторыми погрешностями, которые
сказываются на его величине, особенно при малых выборках.
Число степеней свободы устанавливают по вторичному числу классов с
учетом ограничений свободы вариации, которая в разных случаях бывает
различной. Так, при оценке эмпирических распределений, следующих
нормальному закону, число степеней свободы равно v = n – 3 (с учетом трех
ограничений свободы вариации: n, x и sx).
На величине критерия 2 сказывается степень точности, с какой
определены теоретически вычисленные или ожидаемые частоты. Поэтому
при сопоставлении эмпирических частот с вычисленными частотами
последние не следует округлять до целых чисел.
Нулевая гипотеза сводится к предположению, что различия,
наблюдаемые между эмпирическими и вычисленными или ожидаемыми
частотами, носят исключительно случайный характер. Для проверки нулевой
2
гипотезы нужно фактически полученную величину  эмп
сравнить с ее
2
критическим значением  кр2 . Если  эмп
  кр2 , то нулевая гипотеза должна
быть отвергнута на принятом уровне значимости с числом степеней свободы
v. Критические точки  кр2 приведены в статистических таблицах.
Критерий 2 применяют и для оценки сходства между вариационными
рядами, частоты которых распределяются в границах одних и тех же классов.
В таких случаях критерий 2 определяют по формулам:
 k
f12 
  N ;
  4 
i 1 f  f

1
2 
при n1 = n2
при n1  n2
2
N 2  k f12
n2 

 
 .
n1n2  i 1 f1  f 2 N 
2
(2)
(3)
В этих формулах f1 и f2 – частоты сравниваемых распределений; n1 –
объем одного, а n2 – объем другого ряда распределения; N = n1 + n2. Число
степеней свободы v определяют по числу классов N без единицы, т. е. v = N –
1. При этом частоты, меньшие 5, не объединяют, как это принято в
отношении теоретически вычисленных частот.
Ход работы
Q1
OP
13,46 (χ2)
0.0092 (р)
кр2  7,8147 (3 степени свободы)
Рис. 1. Таблица частот для параметров "Отношение к работе" и "Консерватизм"
Выводы
В результате проведенных исследований в пакете StatGraphics были
вычислены коэффициенты взаимной сопряженности для различных
параметров.
Уровень значимости меньше, чем 0,01 и значение χ2. Больше, чем 7,81.
Таким образом, наблюдаемое значение Q1 связано со значением OP.
Download