о равенстве долей признака

advertisement
Дружининская И.М.
Решение задач математической
статистики
по теме
«Изучение связи номинальных признаков»
Учебное пособие для студентов
экономических специальностей
Москва - 2011
Аннотация:
В пособии рассмотрено решение задач по исследованию связи номинальных
переменных на основе таблиц сопряженности. Цель пособия – показать на конкретных
примерах приемы решения задач такого рода с целью адаптировать теоретические
положения математической статистики для получения практически значимых выводов,
причем акцент делается именно на алгоритмы решения задач без существенного
углубления в теоретические обоснования подходов к решению.
Подробные пояснения при решении примеров будут полезны студентам при
изучении соответствующего раздела математической статистики, причем особенно тем
студентам, которые хотели бы более основательно освоить разделы, имеющие
приложения в реальной исследовательской деятельности.
В пособии подобраны задачи экономической и социологической тематики. В
частности, формулировки некоторых задач предложены студентами факультета
менеджмента Национального исследовательского университета - Высшей школы
экономики (НИУ-ВШЭ), на котором автор пособия в течение ряда лет читал курсы по
теории вероятностей и математической статистике.
Пособие
будет
полезно
студентам,
изучающим
курсы
математической
статистики на экономических, социологических и психологических факультетах вузов,
в частности, при подготовке к выполнению домашних заданий, контрольных и
курсовых работ.
Автор выражает особую признательность доценту кафедры высшей математики
канд. физ.-мат. наук Матвееву В.Ф. за неоценимые советы и поддержку.
2
Краткое обоснование алгоритма решения задач по
исследованию связи номинальных признаков
В пособии рассматриваются задачи, цель которых – установить наличие связи
между так называемыми номинальными признаками. Примерами номинальных
признаков (или категориальных переменных) являются пол (мужской, женский),
возраст (юный, зрелый, пожилой), цвет глаз (голубой, карий), местность (город,
пригород, сельская местность),
переменным
нельзя
ответ (да, нет). Во всех этих случаях
приписать
конкретные
числовые
значения,
введенным
их
нельзя
проранжировать (иначе: перенумеровать их по мере ухудшения или улучшения какоголибо качества), т.е. указать, какая из предложенных категорий предпочтительнее, а
какая менее предпочтительна. В приведенных примерах мы можем лишь разбить
указанные объекты по классам (по категориям), причем объекты группируются по
различным классам так, чтобы внутри класса они были идентичны по изучаемому
признаку. Например, голубоглазых людей мы отнесем к одному классу, а кареглазых
людей отнесем к другому классу.
Ставится задача – изучить наличие связи между выделенными классами
объектов
(между
количественно
выделенными
оценить
тесноту
категориями).
Например,
связи
профессией
между
нам
и
бы
хотелось
политическими
убеждениями человека или же между уровнем его образования и музыкальными
пристрастиями (классика, барды, шансон, фолк и т.д.). Мы должны научиться выявлять
наличие или же отсутствие связи между выделенными категориями (иначе: между
номинальными признаками). Если будет установлено наличие такой связи между
признаками, то следует уметь количественно оценить тесноту связи между ними.
Алгоритм решения задачи такого рода будет показан на конкретном примере,
что позволит избежать чрезмерной формализации при описании этапов решения.
Отметим также, что в пособии не анализируются такие понятия как ошибки
первого и второго рода, мощность критерия, связь между ними, предпочтения,
3
связанные с выбором значений этих ошибок. Игнорирование этой части теоретического
обоснования решения проблемы принятия статистических гипотез сделано осознано,
поскольку автор ставил целью сделать основной акцент на алгоритме решения задач без
углубления в более тонкие, очень непростые и усложняющие алгоритм решения задачи
аспекты.
Напомним, что постановка задачи по установлению справедливости некоторого
высказанного утверждения (статистической гипотезы) начинается с выдвижения
основного утверждения (основной или нулевой гипотезы Н0), причем наряду с
выдвинутой гипотезой всегда рассматривают и противоречащую ей гипотезу, которую
называют конкурирующей или альтернативной гипотезой Н1.
Далее на основе теоретических соображений конструируется специально
подобранная случайная величина, являющаяся функцией от результатов наблюдений,
распределение которой известно при выполнении гипотезы Н0.
Поведение этой
случайной величины, которую называют статистическим критерием или просто
критерием, служит основой для проверки справедливости нулевой гипотезы Н0.
После выбора критерия множество всех его возможных значений разбивают на
два непересекающихся подмножества: одно из них содержит значения критерия, при
которых нулевая гипотеза принимается на фоне конкурирующей гипотезы, а другое
множество содержит значения критерия, при которых она отвергается и ,следовательно,
принимается конкурирующая гипотеза.
Областью принятия гипотезы называют совокупность значений критерия, при
которых нулевую гипотезу принимают. Это такие значения критерия, которые
характерны для известного при справедливости нулевой гипотезы
распределения
критерия. Характерными назовем такие значения критерия, которые возникают с
большой вероятностью.
Критической областью называют совокупность значений критерия, при которых
нулевую гипотезу отвергают в пользу конкурирующей гипотезы. Это такие значения
критерия,
которые
не
характерны,
не
правдоподобны
распределения. Имеются в виду значения критерия,
для
данного
закона
возникающие с малой
вероятностью при выполнении утверждения, высказанного в нулевой гипотезе.
Критическими точками называют точки, отделяющие критическую область от
области принятия гипотезы.
4
Процедура проверки статистической гипотезы выглядит так:
1.
Формируют нулевую гипотезу Н0 и альтернативную гипотезу Н1 на основе
выборочных данных.
2.
На основе результатов выборки конструируют критерий; распределение
критерия в случае истинности гипотезы Н0 известно.
3.
Вся область возможных значений критерия разбивается на два подмножества.
Одно подмножество – это область естественных, т.е. наиболее вероятных для данного
закона распределения значений. В это подмножество критерий попадает с высокой
вероятностью . Она носит название «доверительная вероятность» (иначе «уровень
доверия»). Обычно для  задают следующие стандартные значения:  = 0,90; 0.95; 0,99).
Другое подмножество – это область редко возникающих для данного закона
распределения значений (неправдоподобных значений), которые, напротив, являются
характерными для альтернативной гипотезы Вероятность попадания критерия в эту
область мала и равна  = 1-;  носит название «уровень значимости»
(стандартными значениями для  являются следующие значения: = 0,10;0,05;0,01).
Могут быть заданы и другие, помимо указанных выше, значения  и .
В условии задачи обязательно должно быть задано одно из этих значения (либо
значение , либо значение ).
Укажем на смысл значения величины  - это вероятность отклонить основную
гипотезу и принять, следовательно, альтернативную гипотезу при условии, что
справедливой является именно основная гипотеза.
4. На основе экспериментальных данных вычисляют значение критерия; получают тем
самым наблюдаемое значение критерия. Если наблюдаемое значение критерия
попадает в область естественных для данного закона распределения значений, то с
вероятностью
 утверждают, что гипотеза Н0 не противоречит экспериментальным
данным на фоне альтернативной гипотезы. Это дает основание считать справедливым
утверждение, высказанное в основной гипотезе (с заданным уровнем доверия  к
5
утверждению).
Если
наблюдаемое
значение
критерия
попадает
в
область
неправдоподобных для данного закона распределения значений, то гипотезу Н0
отвергают и принимают, следовательно, альтернативную гипотезу Н1 .
Что
касается
вида
критической
области,
то
он
определяется
типом
альтернативной гипотезы. В общем случае при проверке статистических гипотез могут
возникать левосторонние, правосторонние и двусторонние критические области.
Однако при изучении связи номинальных признаков, как это будет ясно из дальнейшего
изложения, может возникать только правосторонняя критическая область.
Конкретизируя сказанное выше применительно к анализируемой здесь проблеме
изучения связи категориальных признаков, следует заметить, что в качестве основной
гипотезы всегда рассматривается утверждение об отсутствии связи номинальных
признаков, в то время как в альтернативной гипотезе утверждается, что связь между
признаками имеется.
Рассмотрим конкретный пример:
Социологи провели исследование с целью изучить отношение школьников
разных полов (юношей и девушек) старших классов Москвы к компьютерным играм.
Была произведена случайная выборка 270 московских школьников. Их попросили
ответить на вопрос, какое количество времени в неделю они проводят за
компьютерными играми. Были выделены три временных градации затрат времени на
компьютерные игры: 1 – не более часа в неделю; 2 – от часа до четырех часов в неделю,
3 - более четырех часов в неделю. Кроме того, школьников разделили на две категории
- юношей и девушек. Результаты опроса занесены в таблицу. В клетках таблицы
указано количество школьников, отнесенных к данной категории.
6
Признак В
Затраченное
на игры
время
Итого
1
2
3
36
59
61
156
48
51
15
114
84
110
76
270
Пол
Юноши
Признак
А
Девушки
Итого
Возникла таблица, которая носит название «таблица сопряженности» или
«таблица кросстабуляции». В данном примере размер таблицы 2×3 (2 – число строк
таблицы; 3 - число столбцов таблицы).
Мы в нашем примере для простоты ограничились лишь двумя признаками.
Первый признак - это пол школьника (произвели разделение школьников по половому
или гендерному признаку); второй признак - это затраты времени на компьютерные
игры. Обозначим признаки заглавными буквами А и В.
Аналогичным образом устроены и более сложные таблицы сопряженности (с
большим числом включенных в таблицу признаков).
Поставлена задача: установить, есть ли связь между пристрастием школьника к
компьютерным играм и тем, является ли школьник девушкой или же юношей?
Формализуем данную задачу. Для этого сформулируем задачу по
проверке
статистической гипотезы о связи номинальных признаков. Введем две статистические
гипотезы (основную гипотезу и противоречащую ей альтернативную гипотезу):
Постановка задачи:
Н0: признаки независимы;
Н1: признаки зависимы.
7
Признаки независимы – в данном случае это означает, что нет связи между
полом школьника и временем, которое он проводит за компьютерными играми;
признаки зависимы – это значит, что связь между полом школьника и временными
затратами на компьютерные игры существует.
Конечно, данная постановка задачи должна быть дополнена заданием величины
уровня значимости . Пусть  = 5% . Отметим, что в задаче может быть задана и другая
величина, а именно величина  – уровень доверия (доверительная вероятность), которая
связана со значением  соотношением +=1.
Напомним, что смысл значения  следующий - это вероятность отвергнуть
нулевую гипотезу при условии ее справедливости.
Укажем число градаций по каждому признаку:
признак А (гендерный признак) имеет r уровней; в нашем примере r = 2;
признак В (затраты времени на компьютерные игры) имеет s уровней; в нашем примере
s = 3.
Введем обозначения:
i - номер строки (i=1,2,…,r)
j- номер столбца (j=1,2,…,s)
nij - частота события Ai∩Bj – это количество объектов, обладающих комбинацией
уровней Ai и Bj признаков А и В.
Через ● будем обозначать суммирование по соответствующему признаку, тогда
s
ni• = ∑nij = ni1 + ni2 + ni3 + ...+ nis
j=1
- это
частота
появления
события
Аi ;
r
n j   nij  n1 j  n2 j  n3 j  ...  nrj 
i 1
 частота
появления
события
Вj
Таблица сопряженности признаков А и В для нашей задачи может быть
переписана следующим образом (в ней введены обозначения, которые используются в
дальнейшем):
8
В
Итого
B1
B2
B3
A1
n11 =36
n12 =59
n13 =61
n1● =156
A2
48,53
n21 =48
63,56
n22 =51
43,91
n23 =15
n2● =114
35,47
n●1=84
46,44
n●2=110
32,09
n●3=76
n=270
А
Итого
Что означает, допустим, событие А1 в данном примере? Событие А1={случайно
выбранный школьник относится к категории юношей}.
Как на основе результатов эксперимента приближенно вычислить вероятность
этого события? Вероятность события может быть приближенно найдена как
относительная частота этого события:
n1• 156
P A1 ≈
=
≈0.58
n
270
( )
Что означает событие В3 в данном примере? Событие В3={случайно выбранный
школьник тратит на компьютерные игры более четырех часов в неделю}.
Как найти вероятность события В3? Также на основе экспериментальных данных
можно приближенно вычислить вероятность этого события как относительную частоту
этого события:
P (B3 ) ≈
n• 3
76
=
≈0.28
n
270
В общем случае вероятности событий приближенно определим так:
P Ai  
ni
;
n
PB j  
n j
n
9
Согласно основным теоремам теории вероятностей справедливо равенство
«Вероятность пересечения независимых событий равна произведению вероятностей
этих событий»:
В
предположении
P(Ai  B j ) = P(Ai ) • P(B j )
справедливости
утверждения
о
независимости
признаков,
заложенного в нулевой гипотезе, будем считать справедливым данное соотношение, в
котором перейдем к приближенным выражениям для вычисления вероятностей. Тогда
получим следующее приближенное равенство:
nij
ni• n• j
≈
•
n
n
n
Из данного соотношения после сокращения левой и правой частей равенства на n
получим:
ni• • n• j
nij ≈
n
Величины
ni• • n• j
n
(*)
называются ожидаемыми или теоретическими
частотами (имеется в виду ожидаемыми при выполнении гипотезы H0).
При выполнении гипотезы H0 ожидаемые частоты не должны сильно отличаться
от наблюдаемых частот nij . Наблюдаемые частоты – это частоты, полученные на основе
эксперимента (на основе выборки).Эти частоты присутствуют в исходной таблице
примера.
Наша
задача
заключается
в
следующем
приблизительно выполняются или же, напротив,
–
выяснить,
равенства
(*)
обнаруживаются существенные
различия в значениях правой и левой частей соотношения (*) .
Если будет найдено, что равенства (*) примерно выполняются, то гипотезу H0
следует признать справедливой. Если же будет установлено, что равенства (*) плохо
выполняются, то гипотезу H0 отвергнем, т.е. отвергнем утверждение о независимости
признаков и, следовательно, признаем справедливой альтернативную гипотезу H1 о
зависимости признаков.
Параллельно возникает еще один вопрос, на который нужно ответить. Что
означает, что равенство (*) примерно выполняется (насколько примерно), и что
10
означает, что равенство (*) выполняется плохо? Ответим на эти вопросы несколько
позже.
Вычислим для нашего конкретного примера ожидаемые (теоретические)
частоты:
n
• n
1
•
• 1 = 156 • 84 ≈48,53
n
≈
11
n
270
n
• n
156 • 110
n
≈ 1• • 2 =
≈63,56
12
n
270
n
• n
156 • 76
n
≈ 1• • 3 =
≈43,91
13
n
270
n
• n
2
•
• 1 = 114 • 84 ≈35,47
n
≈
21
n
270
n
• n
2
•
• 2 = 114 • 110 ≈46,44
n
≈
22
n
270
n
• n
114 • 76
n
≈ 2• •3 =
≈32,09
23
n
270
Эти
вычисленные величины частот проставим в каждую клетку ранее
приведенной таблицы, причем расположим их ниже наклонных линий.
Если видимые различия между наблюдаемыми частотами (т.е.частотами,
полученными на основе опытных данных) и ожидаемыми частотами (т.е. частотами,
рассчитанными на основе гипотезы о независимости признаков) можно объяснить
случайными колебаниями, то отвергать гипотезу о независимости признаков нет
оснований. Поэтому снова следует вернуться к проблеме сопоставления, выяснения
различий этих частот.
Применяется следующий общепринятый способ сопоставления этих частот.
Чтобы сформулировать критерий Пирсона - Фишера в общем и легко запоминающемся
виде, обозначим наблюдаемые частоты через Н, а ожидаемые или теоретические
частоты обозначим через Т. Если модель о независимости признаков верна, то числа Н и
Т должны быть близки друг другу, следовательно, сумма квадратов отклонений (Н-Т)2
не должна быть большой. Эту разность нормируют на Т (ибо чем больше Т, тем больше
Н может отклоняться от Т).
11
Мера согласия опытных данных с теоретической моделью:
X
2
(H  T )2

T
i, j
В формуле сумма берется по всем ячейкам таблицы сопряженности. Именно этот
критерий (эта случайная величина), обозначенная Х2, используется в задачах по
изучению связи номинальных признаков для ответа на вопрос о том, можно ли полагать
изучаемые признаки независимыми или же, напротив, следует полагать их зависимыми,
связанными друг с другом.
Для ответа на вопрос, какую величину следует принять за большое значение
случайной величины Х2, надо знать распределение этой случайной величины. Ответ на
этот вопрос дает следующая теорема:
Теорема (К. Пирсон, Р. Фишер):
Если справедлива гипотеза Н0, на основе которой рассчитаны теоретические
частоты Т, то при неограниченном росте числа наблюдений n распределение случайной
величины Х2 стремится к распределению χ - квадрат (χ2).
Число степеней свободы этого распределения равно разности между числом
событий и числом связей между частотами nij, заложенных в таблице сопряженности.
Посчитаем число степеней свободы k:
Число событий - это число ячеек в таблице сопряженности, оно равно r • s.
Изучим число связей между частотами, входящими в таблицу сопряженности:
1)
∑n = n;
i, j ij
12
s
2)
∑n
ij
= ni•
-
j=1
- число таких независимых соотношений равно (r-1), т.е. на единицу меньше r,
поскольку из-за наличия связи 1) любое из соотношений является следствием
остальных соотношений;
r
3)
∑n
ij
= n• j -
i=1
- здесь аналогично число независимых соотношений равно (s-1).
Подсчитаем число степеней свободы:
k  r  s  1  (r  1)  ( s  1)  r  s  1  r  1  s  1 
 r  s  r  s  1  r  ( s  1)  ( s  1) 

k  (r  1)  ( s  1)
Как было сказано, распределение χ2 (или распределение Пирсона) является
предельным для случайной величины Х2, поэтому использовать его как приближение
для реальных распределений Х2 можно только при большом числе наблюдений n .
Считается достаточным для возможности заменить распределение случайной величины
Х2 распределением случайной величины χ2 выполнение следующего ограничения: для
каждой ячейки теоретические частоты должны быть не меньше 5:
ni   n j
n
5
Какие же значения Х2 считаются настолько большими, что они несопоставимы с
гипотезой Н0?
Очевидно те, появление которых при выполнении гипотезы Н0
маловероятно, т.е. те, которые превосходят критические значения распределения χ2,
соответствующие выбранному уровню значимости.
В задачах данного типа всегда по смыслу рассматривается правосторонняя
критическая область, т.к. если нулевая гипотеза неверна, то Х2 принимает большое
значение и, следовательно, χ2 также принимает большое значение.
13
Обратим внимание на то, что для всех теоретических частот данного примера,
которые записаны в таблице под наклонной линией, выполняется указанное выше
ограничение – все они больше 5):
Продолжим вычисления:
X
2
(H  T )2

T
i, j
X2
ni   n j


n

 ij
n

ni   n j
i, j




2

n
Найдем наблюдаемое значение критерия:
(42 - 48,53) 2 (66 - 63,56) 2 (28 - 43,91) 2
+
+
+
набл =
48,53
63,56
43,91
(8 - 35,47) 2 (14 - 46,44) 2 (42 - 32,09) 2
+
+
+
≈
35,47
46,44
32,09
X2
≈0,88 + 0,09 + 5,76 + 21,27 + 22,66 + 3.06 = 53,72
Найдем число степеней свободы:
k=(2-1)•(3-1)=2. На основе этого числа
степеней свободы и заданного в условии задачи значения
использованием
приведенной
в
приложении
таблицы
 = 5% найдем с
«Критические
точки
распределения χ2» критическое значение χ2кр, которое оказалось равным χ2кр = 6.0. Это
значение при заданном уровне значимости отделяет область принятия нулевой гипотезы
от области отказа от нулевой гипотезы и перехода тем самым к области принятия
альтернативной гипотезы. Таким образом, найденное табличное значение χ2кр =6.0
является тем граничным значением, выше которого значения критерия
Х2 следует
считать большими и, следовательно, полагать, что изучаемые признаки связаны между
собой. Если же значение критерия Х2 оказывается меньше найденного критического
значения, то, напротив, различия в наблюдаемых и теоретических частотах следует
полагать мало отличающимися (говорят: незначимо различающимися), что
позволяет
принять нулевую гипотезу.
14
Итак, опишем еще раз алгоритм решения задачи:
если наблюдаемое значение критерия (иначе: значение критерия, вычисленное на
основе имеющихся экспериментальных данных) оказалось меньше критического
значения
критерия,
которое
определяется
по
таблице
«Критические
точки
распределения χ2» на основе двух значений - вычисляемого в задаче числа степеней
свободы и заданного условием задачи уровня значимости , то принимается нулевая,
т.е. основная, гипотеза об отсутствии связи между изучаемыми признаками как не
противоречащая экспериментальным данным с уровнем значимости  (или с уровнем
доверия ). Если же наблюдаемое значение критерия оказывается больше этого
критического значения, то отвергаем нулевую гипотезу как противоречащую
имеющимся наблюдениям и тем самым, переходя к альтернативе,
полагаем
справедливой конкурирующую гипотезу, которая говорит о наличии связи между
признаками.
Для наглядности изобразим полученные результаты графически, используя
график плотности распределения χ2. При построении графика был использован один
графиков плотности распределения Пирсона, приведенных в приложении (следует
обратить внимание на то, что поведение графиков плотности меняется в зависимости от
величины числа степеней свободы k; в нашем примере k=2):
15
Поскольку в примере наблюдаемое значение критерия, равное 53.72, попало в
критическую область, то следует отвергнуть нулевую гипотезу как противоречащую
экспериментальным данным и тем самым принять альтернативную гипотезу. Это
означает, что наше исследование показало наличие зависимости между полом
школьника старших классов и временем, которые затрачивается школьником на
компьютерные игры. На основе исходной информации можно заметить повышенный
интерес именно юношей к компьютерным играм.
Далее
возникает
естественный
номинальными признаками, то
вопрос:
если
обнаружена
связь
между
как количественно определить тесноту (силу) этой
связи, с помощью какого коэффициента?
Ответ на этот вопрос не столь однозначен, поскольку нет единого, повсеместно
принятого для этой цели коэффициента. Это объясняется тем обстоятельством, что ни
один из коэффициентов не может передать сложные связи признаков при анализе
взаимовлияний большого числа признаков с несколькими уровнями. Каждый из
используемых коэффициентов обладает определенными достоинствами и недостатками.
Из наиболее ранних и часто используемых коэффициентов можно упомянуть
следующие:
Коэффициент «фи»
=
X2
n
Здесь n- размер выборки; Х2- наблюдаемое значение критерия.
Достоинством этого коэффициента является простота вычисления; недостатком
коэффициента является то, что он не нормирован, т.е. может принимать значения,
большие единицы. Коэффициент «фи» не превосходит 1 лишь для таблиц
сопряженности 2×2. Для таких простейших таблиц его значение, равное единице,
означает наличие строгой линейной связи между признаками. Если одна из переменных
таблицы сопряженности имеет более двух уровней, то значение коэффициента может
превышать 1.
Для таблиц размера 2х2 может быть использован коэффициент контингенции,
который вычисляется по формуле:
n
•n
- n
•n
11
22
12
21
K =
c
n •n
•n
•n
1•
2• •1 • 2
16
Удобство этого коэффициента заключается в том, что он принимает значения от (-1) до
(+1), причем крайние значения возникают при наличии строгой обратной (-1)и строгой
прямой (+1) зависимостей между признаками.
Также используется коэффициент взаимной сопряженности Пирсона:
X2 ;
X 2 +n
KП =
0 ≤ K П < 1.
Можно показать, что коэффициенты «фи» и KП
иногда могут давать весьма
различные значения. Вычислим разность квадратов значений этих коэффициентов:
X2
X2
X 2  ( X 2  n  n)
( X 2 )2
 K 
 2


.
n
X n
n  ( X 2  n)
n  ( X 2  n)
2
2
П
Ясно,
если
что
X2
Однако
то
( X 2 )2
n  ( X 2  n)
очень
если
разность
если
0,
n
или
мало.
велико,
X2


2
 K П2

а
n
мало,
может
быть
существенной.
Можно с некоторой долей приближения предложить следующую градацию
значений коэффициента связи между признаками в случае, когда коэффициент связи
нормирован на единицу:
0-0.3 – слабая связь признаков;
0.3-0.7 – умеренная связь признаков;
0.7-1 – сильная связь признаков.
Для рассмотренного ранее примера вычислим тесноту связи признаков на основе
нескольких коэффициентов:
17
=
Х2
=
n
53.72
≈0.446 ≈0.45
270
Х2
=
Х 2 +n
KП =
53.72
≈0.407 ≈0.40
53.72 + 270
В данном случае значения коэффициентов получились близкими, поскольку
величина n велика. Величины коэффициентов говорят о наличии умеренной связи
между признаками, т.е. между полом школьника и его пристрастием к компьютерным
играм.
Замечание:
В частном случае сопряженности, когда признаки А и В принимают только
по два значения А1 , А2 и В1 , В2 (r=s=2), т.е. для таблиц сопряженности 2×2, формула
для вычисления критерия Х2 упрощается. Вычисления в данном случае удобнее вести
на основе формулы, которая получена на основе исходной формулы, введенной в
теореме Пирсона - Фишера:
n  n11  n22  n12  n21 

n1  n2  n1  n2
2
X
2
Рассмотрим пример:
Один пытливый молодой человек решил провести собственное расследование.
Он захотел установить, зависимы или нет такие два признака – цвет глаз девушки и
любимый цвет ее одежды. Для облегчения ситуации он сам задал цветовую гамму
всего из двух цветов – синего и коричневого. Каждая из опрошенных девушек должна
была из двух цветов выбрать один более предпочтительный для нее цвет. Кроме того,
он исключил из исследования зеленоглазых девушек. Случайным образом отобрав 100
девушек, он получил следующую таблицу сопряженности:
18
Предпочтительный
цвет
Синий
Цвет глаз
девушки
Голубые
Коричнев.
38
18
27
17
(серые)
Карие
На основе этой таблицы сопряженности следует установить, зависимы эти
признаки или же нет на уровне значимости  = 5%.
Решение:
Постановка задачи:
Н0: признаки независимы
Н1: признаки зависимы
Следует
проверить,
что
ni• • n• j
≥5. Например,
n
→ условие выполнено.
выполнено
условие
n2• • n• 2
44 • 35
=
= 15.4 > 5 →
n
100
Очевидно, что это условие выполняется для всех ячеек таблицы, поскольку оно
выполнено для наименьшей ожидаемой частоты.
Дополним исходную таблицу значениями частот, которые потребуются для
дальнейших вычислений:
19
Предпочтительный
цвет
Цвет глаз
девушки
Голубые
Синий
Коричнев.
38
(n11) 18
27
(n21) 17
65
(n●1)
(n12)
Итого
56
( n1●)
(n22)
44
(n2●)
( n●2)
100
(n)
(серые)
Карие
Итого
35
Поскольку в данном случае имеет место таблица сопряженности 2×2, то для
вычисления наблюдаемого значения критерия можно использовать более короткую и
удобную формулу для вычисления критерия Х2:
n • (n11 • n22 - n12 • n21 )2
X =
→
n1• • n2• • n•1 • n•2
2
→X
2
набл
100 • (38 • 17 - 27 • 18 ) 2
100 • 25600
=
=
≈0.46.
56 • 44 • 65 • 35
56 • 44 • 65 • 35
Определим число степеней свободы: k = (2 - 1) • (2 - 1) = 1 .
Для определения значения  2кр воспользуемся таблицей «Критические точки
распределения  2 », приведенной в приложении:
 2кр (k = 1;  = 0.05) = 3.8 .
20
Покажем полученные результаты на графике плотности распределения Пирсона,
учтя, что число степеней свободы равно 1 (соответствующий график плотности см. в
приложении):
Поскольку значение критерия Х2набл попало в область принятия нулевой
гипотезы, то это означает, что экспериментальные данные не противоречат нулевой
гипотезе об отсутствии связи между признаками, поэтому нулевую гипотезу принимаем
с уровнем доверия в 95% (или на уровне значимости в 5%). Иными словами скажем,
что на основе экспериментальных данных можно утверждать: цвет глаз девушки и
предпочтительный цвет ее одежды не связаны между собой.
Пример:
Проведено исследование по выяснению связи между такими признаками как
регулярное занятие спортом и статусное положение менеджера в компании. Изучалось
несколько крупных компаний, в которых были случайно выбраны и опрошены 150
менеджеров высшего и среднего звена по разным вопросам. В том числе выяснялось их
отношение к спорту (в исследовании исключены топ - менеджеры,
которых в
компаниях очень мало). Заметим, что такие исследования, нацеленные на поиск ответа
на вопрос: «Что такое хороший менеджер?», характерны для западных компаний.
Результаты исследования представлены таблицей:
21
Статус
менеджера
Среднее
Высшее звено
звено
Отношение
К спорту
Регулярно занимается
39
45
Изредка занимается
51
15
Выяснить на уровне значимости  = 5%. наличие взаимосвязи между
положением менеджера в компании и его взаимоотношениями со спортом.
Решение:
Постановка задачи
Н0: признаки независимы;
Н1: признаки зависимы.
Следует для каждой ячейки проверить выполнение условия для теоретической
частоты; она должна принимать значения, не меньшие 5:
ni  n j
n
5
Проверим самое неблагоприятное значение с наименьшей теоретической частотой.
Если будет найдено, что для этой частоты ограничение выполняется, то ограничения
будут выполняться и для больших частот:
n •n
n •n
66 • 60
i• • j
≥5 → n = 2 • • 2 =
≈26.4 > 5
22
n
n
150
Проверка выполнения этих ограничений позволит нам считать, что критерий Х2
имеет закон распределения, который приближенно совпадает с законом распределения
Пирсона.
22
Дополним исходную таблицу дополнительными значениями частот,
необходимыми для дальнейших вычислений:
Статус
менеджера
Среднее звено Высшее звено
Итого
Отношение
к спорту
Регулярно занимается
39
(n11)
45
(n12)
84
( n1●)
Изредка занимается
51
(n21)
15
(n22)
66
(n2●)
Итого
90
(n●1)
60
( n●2)
150
(n)
Далее
на
основе
экспериментальной
информации
следует
вычислить
наблюдаемое значение критерия:
X
2
n •( n1 1 • n 2 2 - n1 2 • n 2 1 )
=
n1• • n 2• • n•1 • n•2
2
150•( 39•15- 51• 45)
2
→ X набл =
84•66 • 90• 60
2
≈ 14.65
Определим число степеней свободы и найдем критическую точку распределения
Пирсона:
k = (2 - 1) • (2 - 1) = 1 ;
 2кр (k = 1;  = 0.05) = 3.8
(для нахождения значения
 2кр
использована таблица
«Критические точки распределения  2 », которая дана в приложении).
Покажем полученные результаты на графике плотности распределения Пирсона
(иначе: распределения χ2) для числа степеней свободы k=1:
23
Поскольку наблюдаемое значение критерия попало в критическую область, то
отвергаем нулевую гипотезу и, следовательно, переходим к альтернативе, которая
утверждает наличие значимой связи между признаками (статусом менеджера и его
занятием спортом). О причинах зависимости признаков данное исследование, конечно,
ничего сказать не может. Можно, например, предположить, что занятия спортом
вырабатывают особые лидерские черты характера, которые помогают менеджеру
добиваться более высокого положения на службе. Можно высказать и другое
обоснование такой связи: более высокий статус менеджера способствуют тому, что
человек более склонен обращать внимание на свой внешний облик и понимает, что
внешний вид человека наилучшим образом формируют именно занятия спортом.
Далее получим количественную меру этой взаимосвязи, для этого вычислим
введенные ранее коэффициенты:

KП 
Х2
14.65

 0.098  0,313  0,31
n
150
Х2
14.65

 0.089  0.298  0.30
2
Х n
14.65  150
И в этом случае значения коэффициентов получились очень близкими.
Величины этих значений говорят о наличии слабой связи между признаками (но ближе
к умеренной).
24
Замечание:
Используя одни и тех же исходные данные для получения статистических
выводов на основе идеи проверки статистических гипотез можно применить разные
подходы.
Покажем это на следующем примере:
На производстве работают старый и новый конвейеры по выпуску продукции. На
основе контроля случайных выборок партий продукции со старого и нового конвейера
выяснить, обеспечивает ли новый конвейер увеличение выхода качественной
продукции. Принять
уровень
значимости
равным 1%.
Результаты обработки
выборочных данных представлены в таблице:
Изделия
Качественные
Бракованные
изделия
изделия
Конвейер
Новый
140
10
Старый
185
15
Первый способ решения задачи (на основе изучения связи номинальных признаков):
Постановка задачи
Н0: признаки независимы (отсутствует зависимость количества качественных
изделий от типа конвейера);
Н1: признаки зависимы (зависимость количества качественных изделий от типа
конвейера наблюдается).
Дополним исходную таблицу нужными для дальнейших вычислений значениями:
25
Изделия
Качественные
Бракованные
изделия
изделия
Итого
Конвейер
Новый
140
(n11)
10
(n12)
150
( n1●)
Старый
185
(n21)
15
(n22)
200
(n2●)
Итого
325
(n●1)
25
( n●2)
350
(n)
Проверим выполнение ограничения для ожидаемых (теоретических) частот,
рассмотрев ячейку, которая дает наименьшее значение ожидаемой частоты, тогда
очевидно, что для других ячеек ограничение также будет выполняться:
n •n
n •n
150 • 25
i• • j
≥5 → n = 1 • • 2 =
≈10.7 > 5
12
n
n
350
Вычислим наблюдаемое значение критерия:
n  n11  n22  n12  n21 
X 

n1  n2  n1  n2
2
2
350  140 15  185 10 

 0.0897  0.09.
150  200  325  25
2
X
2
набл
Найдем
критической
использована
число
степеней
области:
свободы:
k = (2 - 1) • (2 - 1) = 1.
 2 (k = 1;  = 0.01) = 6.6 .
представленная
в
Для
приложении
определения
таблица
Найдем
границу
значения
«Критические
 2кр
точки
распределения Пирсона».
Покажем полученные результаты на графике плотности распределения Пирсона
для k=1:
26
Поскольку наблюдаемое значение критерия попало в область естественных
значений критерия, то с уровнем доверия в 99% принимаем нулевую гипотезу об
отсутствии связи между признаками, т.е. делаем вывод, что не наблюдается значимых
различий в производстве количества качественной продукции на новом и старом
конвейерах.
Второй способ
решения задачи (на основе проверки статистической гипотезы о
равенстве генеральных долей):
Постановка задачи
Н0: W1Г = W2Г (на новом и старом конвейерах доли качественных
изделий одинаковы);
Н1: W1Г > W2Г
(на новом конвейере доля качественных
изделий выше).
Здесь W1Г - доля качественных изделий на новом конвейере для всей генеральной
совокупности, т.е. для всех изделий, произведенных на новом конвейере;
W2Г - доля качественных изделий на старом конвейере для всей другой генеральной
совокупности, т.е. для всех изделий, произведенных на старом конвейере.
27
Вычислим на основе выборочных данных выборочные доли качественных изделий,
произведенных на новом ( w1 ) и старом ( w 2 ) конвейерах:
w1 =
k1 140
=
≈0.933 - новый
n 1 150
w2 =
k2
185
=
= 0.925 - старый
n2
200
конвейер;
конвейер.
В данной постановке задачи используется критерий t, который определяется
приведенной ниже формулой:
w1 - w2
t=
~
p • (1 - ~
p) •
(
,
где
1
1
+
)
n1
n2
k + k2
~
p= 1
n1 +n 2
При справедливости гипотезы Н0 критерий t имеет стандартный нормальный
закон распределения (здесь используем то, что выборки являются большими, т.е.
больше 30).
Вычислим наблюдаемое значение критерия:
140 + 185 325
~
p=
=
≈0.929 →
150 + 200 350
0.933 - 0.925
→ t набл ≈
1
1
0.929 • (1 - 0.929) • (
+
150
200
≈0.29.
)
Альтернативная гипотеза порождает правостороннюю критическую область.
Границу этой области найдем на основе табличного решения записанного ниже
28
уравнения. В этом уравнении используется интеграл вероятностей (функция Ф0),
таблица значений которого приведена в приложении:
(
)
( )
( )
P - ∞< t < t кр п = 0.99 → Ф0 t кр п - Ф0 (- ∞) = Ф0 t кр п + Ф0 (+ ∞) =
( )
( )
= Ф0 t кр п + 0.5 → Ф0 t кр п = 0.49 → t кр п ≈2.33
Покажем результаты на графике плотности стандартного нормального закона
распределения:
 (t )
График показывает, что наблюдаемое значение критерия попало в область
принятия нулевой гипотезы, следовательно, нулевую гипотезу принимаем с уровнем
значимости в 1% как не противоречащую экспериментальным данным. Это означает,
что новый и старый конвейеры дают примерно одинаковые доли качественных изделий
(иначе: новый конвейер не обеспечивает значимо большую долю качественных
изделий).
Следовательно, выводы по второму способу решения задачи получены те же, что
и по первому способу решения.
Следует напомнить, что принятие какой-либо гипотезы в статистике не означает
ее доказательства. Оно означает лишь, что имеющиеся данные и принятые методики
проверки не позволяют отвергнуть гипотезу. Вполне возможно, и так бывает при
решении задач, что с увеличением числа наблюдений принятая гипотеза может быть
отвергнута.
29
Пример:
Один
студент-магистр,
обучающийся
в
ВШЭ,
решил
выяснить,
как
распределяются музыкальные пристрастия студентов экономических факультетов и
студентов гуманитарных факультетов. Для упрощения задачи он выбрал всего два
музыкальных направления
- классическая музыка и поп-музыка. Он случайным
образом выбирал студентов различных факультетов и просил выбранного студента
высказаться насчет музыкальных предпочтений. Результаты своего исследования он
свел в таблицу:
Музыкальные Классика
направления
Поп-музыка
Специальности
Экономические
55
46
Гуманитарные
28
39
На основе этих исходных экспериментальных данных следует выяснить,
существует
ли
связь
между
выбранной
специальностью
и
музыкальными
предпочтениями. Принять уровень значимости 2.5%.
Решим задачу также несколькими способами, чтобы показать, что для получения
обоснованного вывода можно использовать разные пути.
Первый способ решения задачи (на основе изучения связи номинальных признаков):
Постановка задачи
Н0: признаки независимы (отсутствует зависимость между выбранной
специальностью и музыкальными предпочтениями);
Н1: признаки зависимы (зависимость между выбранной специальностью и
музыкальными предпочтениями наблюдается).
30
Дополним исходную таблицу, добавив новый столбец и новую строку (в новых
ячейках запишем частоты, которые понадобятся для вычислений):
Музыкальные Классика
направления
Поп-музыка
Итого
Специальности
Экономические
55
(n11)
46
(n12)
101 (n1●)
Гуманитарные
28
(n21)
39
(n22)
67 (n2●)
Итого
83
(n●1)
85
( n●2)
168 (n)
Проверим выполнение ограничения для ожидаемых (теоретических) частот,
рассмотрев ячейку, которая дает наименьшее значение ожидаемой частоты, тогда
очевидно, что для других ячеек ограничение также будет выполняться:
n •n
n •n
67 • 83
i• • j
≥5 → n = 2 • • 1 =
≈33.10 > 5
21
n
n
168
Вычислим наблюдаемое значение критерия:
X
2
n •( n1 1• n2 2 - n1 2 • n2 1 )
=
2
n1• • n2• • n•1 • n•2
→
168• ( 55•39- 28•46 ) 2
2
→ X набл =
≈ 2,58
101•67 •83•85
Найдем число степеней свободы и критическую точку распределения Пирсона:
k = (2 - 1) • (2 - 1) = 1; χ 2
кр
(k = 1; α = 0.025) = 5.0
31
Для определения критического значения  2кр , отделяющего критическую область от
области принятия нулевой гипотезы, использована таблица «Критические точки
распределения Пирсона», которая дана в приложении.
Результаты вычислений представим на графике плотности распределения
Пирсона для числа степеней свободы, равного единице:
Поскольку наблюдаемое значение критерия попало в область характерных для
данного закона распределения значений, то следует принять нулевую гипотезу с
уровнем значимости, равным 2.5% (иначе: с уровнем доверия в 97.5%), как не
противоречащую экспериментальным данным. Это означает: нет оснований полагать,
что студенты разных специальностей привержены разным музыкальным направлениям.
Напротив, следует заключить, что независимо от специализации у студентов не
наблюдается различия в музыкальных вкусах.
Второй способ
решения задачи (на основе проверки статистической гипотезы о
равенстве генеральных долей):
Постановка задачи
Н0: W1Г = W2Г
Н1: W1Г ≠ W2Г
32
В данной постановке задачи:
W1Г – это генеральная доля студентов экономических факультетов, которые
предпочитают классическую музыку;
W2Г – это генеральная доля студентов гуманитарных факультетов, которые
предпочитают классическую музыку.
На основе экспериментальной информации вычислим выборочные доли:
w1
–
это
выборочная
доля
студентов
экономических
факультетов,
которые
предпочитают классическую музыку;
w2 – это выборочная доля студентов гуманитарных факультетов, которые предпочитают
классическую музыку.
В такой постановке задачи для решения используется критерий:
w1 - w2
t=
~
p•
(1 - ~
p) • (
1
1
+
n1
n2
)
Эта случайная величина при справедливости нулевой гипотезы имеет стандартный
нормальный закон распределения.
На основе экспериментальных данных вычислим наблюдаемое значение
критерия:
w1 =
n11
55
=
≈0.54;
n1•
101
w2 =
n 21
28
=
= 0.42;
n 2•
67
n + n 21
55 + 28
83
~
p = 11
=
=
≈0.49
n1• + n 2•
101 + 67
168
t набл ≈
0.54 - 0.42
0.49 • (1 - 0.49) •
(
1
1
+
101 67
≈1.52.
)
33
Поскольку альтернативная гипотеза порождает двустороннюю критическую
область, то следует найти ее границы на основе табличного решения уравнения с
применением таблицы интеграла вероятностей (эта таблица помещена в приложении):
P
(
)
( )
t < t кр = 0.975 = 2Ф0 t кр → Ф
0
(t )= 0.4845 → t
кр
кр
≈ 2.16
Покажем результаты на графике плотности стандартного нормального закона
распределения:
 (t )
График показывает, что наблюдаемое значение критерия попало в область
принятия нулевой гипотезы, следовательно, нулевую гипотезу принимаем с уровнем
значимости в 2.5% как не противоречащую экспериментальным данным. Это означает,
что не наблюдается различий в музыкальных предпочтениях в зависимости от
специализации студента. Получен тот же вывод, который был сделан ранее при
использовании первого способа решения задачи.
Пример:
Менеджер по персоналу одной компании провел исследование по данным
прошедшего полугодия с целью измерения связи между опозданиями на работу и
семейным положением служащих. Выяснилось следующее:
34
Опоздания Систематически
опаздывают
Фактически не
опаздывают
Семейное
положение
Семейные
40
15
Семья отсутствует
17
33
Определить по этим данным на уровне значимости  = 1% наличие или же
отсутствие взаимосвязи между опозданиями на работу и семейным положением
служащих. Если будет найдено, что связь между признаками имеется, то определить
числовое значение коэффициента связи признаков. Сделать выводы.
Решение:
Постановка задачи
Н0: признаки независимы (отсутствует связь опозданий на работу
служащих с их семейным статусом);
Н1:
признаки зависимы (наблюдается связь опозданий на работу
служащих с их семейным статусом);
Дополним исходную таблицу необходимыми для вычислений данными:
Опоздания Систематически
опаздывают
Фактически не
опаздывают
Итого
Семейное
положение
Семейные
40
(n11)
15
(n12)
55 (n1●)
Семья отсутствует
17
(n21)
33
(n22)
50 (n2●)
Итого
57
(n●1)
48
( n●2)
105 (n)
35
Проверить самостоятельно выполнение ограничения для теоретических частот:
ni  n j
n
5
(эти ограничения выполняются).
Вычислим наблюдаемое значение критерия:
X
2
n •( n1 1 • n2 2 - n1 2 • n2 1 )
=
2
n1• • n2• • n•1 • n• 2
2
→ X набл =
→
105•( 40• 33-17 •15)
2
55•50•57• 48
≈ 15,83
Найдем число степеней свободы и найдем критическую точку распределения
Пирсона:
k =(2 -1) (2
• -1) = 1;
2
(k = 1; α = 0.01) = 6.6
кр
Для определения критического значения  2кр , использована таблица «Критические
точки распределения Пирсона», приведенная в приложении.
Покажем все результаты на графике плотности распределения Пирсона,
используя график плотности для числа степени свободы, равного единице:
36
Таким образом, на основе результатов вычислений можно сделать следующий
вывод:
отвергаем нулевую гипотезу и, следовательно, принимает альтернативу о наличии
значимой связи между признаками (опозданиями на работу и семейным положением
служащего).
Поскольку обнаружено наличие значимой связи между признаками, то вычислим
коэффициент Пирсона, позволяющий получить численное выражение этой связи:
KП 
Х2
15.83

 0.131  0.362  0.36
Х2 n
15.83  105
Связь между признаками умеренная, ближе к слабой. Это означает, что на наличие этой
связи (которая наблюдается в незначительной степени) оказывает влияние скорее не
семейное положение служащего, а психотип личности служащего (в частности,
является ли он человеком ответственным или же не является таковым).
Можно было бы решить эту задачу в упрощенном варианте, вычислив
коэффициент контингенции:
n
• n
- n
• n
11
22
12
21
K =
c
n
• n
• n
• n
1•
2•
•1 • 2
37
Если окажется, что значение коэффициента контингенции
значительное, то
можно сделать вывод о наличии связи между признаками. Если же величина этого
коэффициента окажется малой, то следует сделать вывод об отсутствии связи между
признаками. Достоинством этого коэффициента является то, что, принимая значения от
(-1) до 1, он позволяет судить не только о силе связи между признаками, но и о
направлении этой связи. Недостатком коэффициента, как уже указывалось, является то,
что он применим только для простейшего случая четырехклеточных таблиц
сопряженности (или таблиц сопряженности 2х2).
Вычислим значение коэффициента контингенции для данного примера:
40 • 33 - 17 • 15
K =
≈0.39
c
55 • 50 • 57 • 48
Поскольку найденное значение коэффициента контингенции показывает наличие
умеренной зависимости признаков (ближе к слабой зависимости), то следует заключить,
что признаки взаимосвязаны, однако связаны весьма умеренно. Более того,
одновременно получено числовое значение этой связи. Значение коэффициента
оказалось близким к значению ранее вычисленного значения коэффициента взаимной
сопряженности Пирсона. Положительное значение коэффициента контингенции
свидетельствует о том, что связь между признаками положительная, т.е. все же меньше
опаздывают работники, не обремененные семьей.
Пример:
Исследовались жительницы Москвы с целью изучения связи их возраста и веса.
Случайная выборка из 289 женщин разного возраста показала результаты,
представленные в расположенной ниже таблице. Проверить на уровне значимости в 1%
гипотезу о независимости веса женщин от их возраста против альтернативы – «вес
женщин зависит от их возраста». Если будет найдено, что связь между признаками
имеется, то определить числовое значение коэффициента связи признаков. Сделать
выводы.
38
Вес
Меньше
нормы
Норма
Больше
нормы
31-40 лет
21
50
26
41-50 лет
15
38
52
51-60 лет
10
24
53
Возраст
Решение:
Постановка задачи
Н0: признаки независимы (вес женщин не зависит от их возраста);
Н1: признаки зависимы (вес женщин зависит от их возраста).
Вычислим ожидаемые (теоретические) частоты на основе исходной
экспериментальной информации. Занесем вычисленные результаты в приведенную
далее таблицу, причем теоретические частоты поместим в клетках таблицы под
наклонной чертой.
n
• n
• 1 = 97 • 46 ≈15,44
n
≈ 1•
11
n
289
n
• n
• 2 = 97 • 112 ≈37,59
n
≈ 1•
12
n
289
n
• n
• 3 = 97 • 131 ≈43,97
n
≈ 1•
13
n
289
n
• n
2
•
• 1 = 105 • 46 ≈16,71
n
≈
21
n
289
n
• n
• 2 = 105 • 112 ≈40,69
n
≈ 2•
22
n
289
n
• n
• 3 = 105 • 131 ≈47,60
n
≈ 2•
23
n
289
n
• n
• 1 = 87 • 46 ≈13,85
n
≈ 3•
31
n
289
n
• n
3
•
• 2 = 87 • 112 ≈33,72
n
≈
32
n
289
n
• n
3
•
• 3 = 87 • 131 ≈39,44
n
≈
33
n
289
39
Запишем расширенную таблицу значений, содержащую наблюдаемые и
ожидаемые частоты:
В
B1
B2
B3
n11 =21
n12 =50
n13 =26
А
A1
Итого
n1● =97
A2
15,44
n21 =15
37,59
n22 =38
43,97
n23 =52
n2● =105
A2
16,71
n31 =10
40,69
n32 =24
47,60
n33 =53
n3● =87
13,85
Итого
n●1=46
33,72
n●2=112
39,44
n●3=131
n=289
По значениям вычисленных частот проверим выполнение ограничений для
теоретических частот:
ni  n j
n
5
Ясно, что ограничения выполнены для каждого значения ожидаемой частоты,
что позволит считать распределение критерия задачи очень близким к распределению
Пирсона.
Запишем критерий, используемый для решения данной задачи:
(H - T)2
X =∑
→
T
i, j
2
X2
ni   n j


n

 ij
n

ni   n j
i, j




2

n
40
Н - наблюдаемые частоты; Т - ожидаемые или теоретические частоты. Суммы в
формулах берутся по всем ячейкам таблицы сопряженности.
Вычислим наблюдаемое значение критерия:
(21 - 15,44) 2 (50 - 37,59) 2 (26 - 43,97) 2
2
→ X набл =
+
+
+
15,44
37,59
43,97
(15 - 16,71) 2 (38 - 40,69) 2 (52 - 47,60) 2
+
+
+
+
16,71
40,69
47,60
(10 - 13,85) 2 (24 - 33,72) 2 (53 - 39,44) 2
+
+
+
≈
13,85
33,72
39,44
≈ 2,00 + 4,10 + 7,34 + 0,17 + 0,18 + 0.41 + 1,07 + 2,80 + 4,66 = 22,73
Определим число степеней свободы k = (3 - 1) • (3 - 1) = 4 .На основе этого
числа с помощью таблицы «Критические точки распределения Пирсона», помещенной
в
приложении,
найдем
границу
критической
области:
 2кр (k = 4;  = 0.01) = 13.3 .
Покажем полученные результаты графически, используя график плотности
распределения  2 (учтем k=4 и вид графика для этого значения k, приведенный в
приложении):
41
На основе изложенного выше можно сделать следующий вывод:
поскольку наблюдаемое значение критерия попало в область критических, т.е.
неправдоподобных
для
закона
распределения
Пирсона
значений,
который
характеризует поведение критерия при справедливости нулевой гипотезы, то следует
отвергнуть нулевую гипотезу об отсутствии связи признаков и, следовательно, принять
альтернативную гипотезу. Это означает, что экспериментальные данные показывают
значимую связь признаков: вес женщин связан с их возрастом.
Вычислим количественную меру тесноты этой связи на основе коэффициента
взаимной сопряженности Пирсона:
KП =
Х2
=
Х 2 +n
22.73
≈ 0.0729 ≈0.27
22.73 + 289
Отсюда ясно, что связь между признаками (между возрастом женщины и ее весом)
является слабой.
Пример:
(предложен и решен студенткой факультета менеджмента ВШЭ Гибадуллиной А.)
Международная фирма подготовки логистов принимает 150 выпускников школ
для обучения по специальности “Логистика и управление цепями поставок” по
результатам персональной беседы с каждым кандидатом. Приемная комиссия хочет
сравнить результаты обучения во время первого года обучения с оценками школьного
аттестата, чтобы выяснить, есть ли между ними связь. Результаты исследования
приведены в таблице:
Школьный аттестат
Хороший
аттестат
Средний
аттестат
Хорошие
18
17
Средние
39
52
Плохие
6
18
Результаты обучения
42
На основе таблицы следует установить отсутствие или же наличие связи между
школьными результатами и результатами годичного обучения бывших школьников
новой специальности. Если окажется, что связь имеется, то вычислить количественную
меру этой связи. Принять уровень значимости равным 5 %.
Решение:
Постановка задачи:
H0: признаки независимы (отсутствует связь между результатами
обучения за первый год и школьными оценками (аттестатом));
H1: признаки зависимы (имеется связь между результатами обучения и
аттестатом).
Вычислим
ожидаемые
(теоретические)
экспериментальной информации:
n
11
n
12
n
21
n
22
n
31
n
32
частоты
на
основе
исходной
n
• n
1
•
• 1 = 35 • 63 = 14,7
≈
n
150
n
• n
35 • 87
≈ 1• • 2 =
= 20,3
n
150
n
• n
2
•
• 1 = 91 • 63 = 38,22
≈
n
150
n
• n
91 • 87
≈ 2• •2 =
= 52,78
n
150
n
• n
3
•
• 1 = 24 • 63 = 10,08
≈
n
150
n
• n
24 • 87
≈ 3• • 2 =
= 13,92
n
150
Значения теоретических частот показывают, что ограничения
ni  n j
по теоретическим частотам выполнены.
n
5
Это позволит считать, что используемый в задаче критерий приближенно распределен
по закону Пирсона.
Построим вспомогательную рабочую таблицу, в которую поместим как
наблюдаемые значения, так и ожидаемые (теоретические) значения частот:
43
В
B1
B2
A1
n11 =18
n12 =17
A2
14,7
n21 =39
20,3
n22 =52
A2
38,22
n31 =6
52,78
n32 =18
10,08
13,92
Итого
А
Итого
n●1=63
n●2=87
n1● =35
n2● =91
n3● =24
n=150
Вычислим наблюдаемое значение критерия для данной задачи:
(H - T)2
X =∑
→ X2
T
i, j
2
ni   n j


n

 ij
n

ni   n j
i, j




2

n
(18 - 14,7)2 (17 - 20,3)2 (39 - 38,22)2
2
→ X набл =
+
+
+
14,7
20,3
38,22
(52 - 52,78)2 (6 - 10,08)2 (18 - 13,92)2
+
+
+
≈
52,78
10,08
13,92
≈0,74 + 0,54 + 0,02 + 0,01 + 1,65 + 1,20 ≈ 4,16
44
Определим число степеней свободы и критическую точку распределения
Пирсона:
k = (3 - 1) • (2 - 1) = 2;
Значение
границы
критической
 2кр (k = 2;  = 0.05) = 6.0
области
найдено
на
основе
таблицы
«Критические точки распределения Пирсона», помещенной в приложении.
Покажем полученные результаты графически, используя график плотности
распределения Пирсона для k=2:
Поскольку наблюдаемое значение критерия попало в область естественных для
данного закона распределения значений, то принимаем гипотезу Н0 на уровне
значимости 5% (иначе: с доверительной вероятностью 95%). Следовательно,
заключаем, что не существует связи между результатами обучения будущих логистов за
первый год обучения новой специальности и оценками школьного аттестата. Т.к. связь
между признаками в данном случае отсутствует, то вычислять тесноту этой связи не
следует (коэффициент связи покажет очень малое значение связи).
45
Задачи для самостоятельного решения:
1.
Изучалась связь между уровнем образования москвичей и степенью влияния
астрологических советов на их жизненные ориентиры. У случайно выбранных
москвичей
выясняли,
сверяют
ли
они
свое
поведение
с
астрологическими
рекомендациями. Результаты опроса занесены в таблицу:
Уровень
образования
Среднее или
неполное
среднее
Высшее
Равнодушны
91
64
Принимают во внимание
101
178
Отношение к
астролог. рекомендациям
Проверить гипотезу о независимости этих признаков на уровне значимости в 5%.
Если окажется, что признаки зависимы, то найти тесноту их связи с помощью любого
предназначенного для этих целей и известного вам коэффициента. Сделать вывод о
силе связи между признаками.
Ответ:
X2=
(
)
2
n • n •n
-n
•n
11 22
12 21
2
→ X набл
≈20,50;
n •n •n •n
1• 2• •1 •2
критическ.
точка
распредел.
χ 2 кр (k = 1; α = 0.05) = 3,8
Поскольку наблюдаемое значение критерия попало в критическую область, то
следует отвергнуть нулевую гипотезу как противоречащую экспериментальным данным
и, следовательно, принять альтернативную гипотезу о наличии значимой связи между
признаками. Иными славами можно сказать, что экспериментальные данные
показывают наличие зависимости между уровнем образования москвичей и их реакцией
на астрологические прогнозы.
46
Значение коэффициента взаимной сопряженности Пирсона:
KП =
Х2
Х 2 +n
≈0,21
Числовое значение меры связи говорит о наличии слабо выраженной связи между
признаками. Однако можно отметить, что с ростом уровня образования москвичи более
склонны прислушиваться к астрологическим прогнозам.
2. Изучалась связь между такими признаками как возраст мужчины и его пристрастие
к компьютерным играм. Рассматривались мужчины-москвичи в возрасте от 31 до 40 лет
и более зрелые мужчины от 41 до 50 лет. Случайно выбранным мужчинам этих
возрастных категорий задавался вопрос о том, равнодушны ли они к компьютерным
играм любого вида или же любят скоротать время у компьютера за таким развлечением.
Результаты опроса занесены в таблицу:
Отношение к играм
Любят
Равнодушны
31-40
145
17
41-40
11
65
Возраст
Проверить гипотезу о независимости этих признаков на уровне значимости в 1%.
Если окажется, что признаки зависимы, то найти тесноту их связи с помощью любого
предназначенного для этих целей и известного вам коэффициента. Сделать вывод о
силе связи между признаками.
Ответ:
(
)
2
n• n •n - n •n
2
11 22 12 21
X2=
→ X набл
≈129,0
n •n •n •n
1• 2• •1 •2
47
критическ.
точка
распредел.
χ 2 кр (k = 1; α = 0.01) = 6,6.
Поскольку наблюдаемое значение критерия попало в критическую область, то
следует отвергнуть нулевую гипотезу как противоречащую экспериментальным данным
и, следовательно, принять альтернативную гипотезу о наличии значимой связи между
признаками. Можно сказать, что наблюдения показывают наличие зависимости между
возрастом мужчин-москвичей и их пристрастием к компьютерным играм.
Значение коэффициента взаимной сопряженности Пирсона равно:
KП =
Х2
Х
2
≈0,59
+n
Числовое значение коэффициента свидетельствует о наличии умеренной связи между
этими признаками. Причем по таблице можно заметить, что более молодые мужчины
имеют повышенную склонность к компьютерным играм.
3. Для московских школьников выяснялось, кто лучше учится в младших классах –
девочки или мальчики. Был проведен опрос случайно выбранных школьников.
Результаты опроса занесены в таблицу:
Хорошо
учатся
Плохо
учатся
Мальчики
23
142
Девочки
170
93
Отношение к учебе
Пол ученика
Проверить гипотезу о независимости этих признаков на уровне значимости в 1%.
Если окажется, что признаки зависимы, то найти тесноту их связи с помощью любого
предназначенного для этих целей и известного вам коэффициента. Сделать вывод о
силе связи между признаками.
48
Ответ:
(
)
n • n •n - n •n 2
2
11 22 12 21 → X 2
X =
n •n •n •n
набл ≈105,3
1• 2• •1 •2
критическ.
точка
распредел.
χ 2 кр (k = 1; α = 0.01) = 6,6.
Поскольку наблюдаемое значение критерия попало в критическую область, то
следует отвергнуть нулевую гипотезу как противоречащую экспериментальным данным
и, следовательно, принять альтернативную гипотезу о наличии значимой связи между
признаками. Можно
сказать, что выявлена связь между полом школьника и его
успехами в учебе.
Значение коэффициента взаимной сопряженности Пирсона:
KП =
Х2
Х 2 +n
≈0,44
Величина коэффициента говорит о наличии средней тесноты связи между признаками,
причем из таблицы ясно, что девочки в среднем учатся лучше мальчиков.
4. Изучалась связь между такими признаками как пол автолюбителя и предпочтениями
в выборе типа коробки передач автомашины (механическая или автомат). У случайно
выбранных автолюбителей были выяснены эти предпочтения и результаты сведены в
таблицу:
Предпочтение
Механическая
Автомат
Мужской
77
14
Женский
15
53
Пол
Проверить гипотезу о независимости этих признаков на уровне значимости в 1%.
Если окажется, что признаки зависимы, то найти тесноту их связи с помощью любого
предназначенного для этих целей и известного вам коэффициента. Сделать вывод о
силе связи между признаками.
49
Ответ:
(
)
n• n •n - n •n 2
2
11 22 12 21 → X 2
X =
n •n •n •n
набл ≈62,46
1• 2• •1 •2
критическ.
точка
распредел.
χ 2 кр (k = 1; α = 0.01) = 6,6.
Поскольку наблюдаемое значение критерия попало в критическую область, то
отвергаем нулевую гипотезу и, следовательно, принимаем альтернативную гипотезу о
наличии значимой связи между признаками. Исследование показало наличие
зависимости между полом автолюбителя и его предпочтениями, связанными с
устройством коробки передач.
Значения коэффициента «фи» и
коэффициента взаимной сопряженности
Пирсона таковы:
=
Х2
≈0,63;
n
KП =
Х2
Х
2
≈0,53
+n
Видно, что значения коэффициентов незначительно отличаются друг от друга и говорят
о наличии умеренной связи между признаками. Можно заметить, что женщины
предпочитают автоматическую коробку передач, в то время как мужчины больше любят
механическую коробку передач.
5. (Задача предложена и решена студенткой факультета менеджмента ВШЭ
Гибадуллиной А.)
Ни для кого не секрет, что все женщины любят сладкое. Фирма “Красный
Октябрь” решила выявить зависимость между количеством съедаемого шоколада и
уровнем счастья женщины. Фирма провела опрос среди 157 случайно выбранных
женщин. Результаты опроса отображены в таблице:
50
Количество съеденного
шоколада
Много
Мало
Уровень счастья
женщины
Счастливая
55
13
Несчастливая
27
62
На уровне значимости в 1% определить, есть ли зависимость между рассматриваемыми
признаками. Если будет выявлено наличие этой связи, то вычислить количественную
меру связи.
Ответ:
X2=
(
)
n• n • n - n • n 2
11 22 12 21 → X 2
n •n •n •n
набл ≈39,47
1• 2• •1 •2
критическ.
точка
распредел.
χ 2 кр (k = 1; α = 0.01) = 6,6.
Поскольку наблюдаемое значение критерия попало в критическую область для данного
закона распределения, то отвергает гипотезу H0 о том, что нет зависимости между
количеством съеденного шоколада и счастьем женщины. Принимаем альтернативную
гипотезу H1 о зависимости этих признаков. Следовательно, уровень счастья женщины
зависит от количества съеденного шоколада. Вывод: если шоколад и портит фигуру, то
его отсутствие портит настроение.
Значения коэффициента «фи» и
коэффициента взаимной сопряженности
Пирсона таковы:
=
Х2
≈0,50; K П =
n
Х2
Х 2 +n
≈0,45
51
Значения коэффициентов мало отличаются друг от друга и говорят о наличии
умеренной связи между признаками. Как уже было сказано, чем больше женщина съест
шоколада, тем более счастливой она себя почувствует, т.е. оказывается (об этом
свидетельствует данное исследование), что женщину очень просто сделать счастливой.
Ей надо предоставить возможность съесть очень много шоколада!
Приложения:
Критические точки распределения χ2 (или распределения Пирсона)
Число
степеней
свободы k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Уровень значимости α
0,01
6,6
9,2
11,3
13,3
15,1
16,8
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34,8
36,2
37,6
38,9
40,3
41,6
43,0
44,3
45,6
47,0
48,3
49,6
50,9
0,025
5,0
7,4
9,4
11,1
12,8
14,4
16,0
17,5
19,0
20,5
21,9
23,3
24,7
26,1
27,5
28,8
30,2
31,5
32,9
34,2
35,5
36,8
38,1
39,4
40,6
41,9
43,2
44,5
45,7
47,0
0,05
3,8
6,0
7,8
9,5
11,1
12,6
14,1
15,5
16,9
18,3
19,7
21,0
22,4
23,7
25,0
26,3
27,6
28,9
30,1
31,4
32,7
33,9
35,2
36,4
37,7
38,9
40,1
41,3
42,6
43,8
0,95
0,0039
0,103
0,352
0,711
1,15
1,64
2,17
2,73
3,33
3,94
4,57
5,23
5,89
6,57
7,26
7,96
8,67
9,39
10,1
10,9
11,6
12,3
13,1
13,8
14,6
15,4
16,2
16,9
17,7
18,5
0,975
0,00098
0,051
0,216
0,484
0,831
1,24
1,69
2,18
2,70
3,25
3,82
4,40
5,01
5,63
6,26
6,91
7,56
8,23
8,91
9,59
10,3
11,0
11,7
12,4
13,1
13,8
14,6
15,3
16,0
16,8
0,99
0,00016
0,020
0,115
0,297
0,554
0,872
1,24
1,65
2,09
2,56
3,05
3,57
4,11
4,66
5,23
5,81
6,41
7,01
7,63
8,26
8,90
9,54
10,2
10,9
11,5
12,2
12,9
13,6
14,3
15,0
52
Графики плотности распределения χ2 для разных значений числа
степеней свободы k
f(χ2)
k=1
k=2
k=3
k=4
k=5
χ2
53
Таблица значений интеграла вероятностей
x
Ф0(x)
x
Ф0 (x)
x
Ф0(x)
x
Ф0(x)
x
Ф0(x)
x
Ф0(x)
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,10
0,11
0,12
0,13
0,14
0,15
0,16
0,17
0,18
0,19
0,20
0,21
0,22
0,23
0,24
0,25
0,26
0,27
0,28
0,29
0,30
0,31
0,32
0,33
0,34
0,35
0,36
0,37
0,38
0,39
0,40
0,41
0,42
0,43
0,44
0,45
0,46
0,47
0,0000
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,1554
0,1591
0,1628
0,1664
0,1700
0,1736
0,1772
0,1808
0,48
0,49
0,50
0,51
0,52
0,53
0,54
0,55
0,56
0,57
0,58
0,59
0,60
0,61
0,62
0,63
0,64
0,65
0,66
0,67
0,68
0,69
0,70
0,71
0,72
0,73
0,74
0,75
0,76
0,77
0,78
0,79
0,80
0,81
0,82
0,83
0,84
0,85
0,86
0,87
0,88
0,89
0,90
0,91
0,92
0,93
0,94
0,95
0,1844
0,1879
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,2580
0,2611
0,2642
0,2673
0,2703
0,2734
0,2764
0,2794
0,2823
0,2852
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,96
0,97
0,98
0,99
1,00
1,01
1,02
1,03
1,04
1,05
1,06
1,07
1,08
1,09
1,10
1,11
1,12
1,13
1,14
1,15
1,16
1,17
1,18
1,19
1,20
1,21
1,22
1,23
1,24
1,25
1,26
1,27
1,28
1,29
1,30
1,31
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
0,3315
0,3340
0,3365
0,3389
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3883
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
0,4192
0,4207
0,4222
0,4236
1,44
1,45
1,46
1,47
1,48
1,49
1,50
1,51
1,52
1,53
1,54
1,55
1,56
1,57
1.58
1,59
1,60
1,61
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,71
1,72
1,73
1,74
1,75
1,76
1,77
1,78
1,79
1,80
1,81
1,82
1,83
1,84
1,85
1,86
1,87
1,88
1,89
1,90
1,91
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
0,4713
0,4719
1,92
1,93
1,94
1,95
1,96
1,97
1,98
1,99
2,00
2,02
2,04
2,06
2,08
2,10
2,12
2,14
2,16
2,18
2,20
2,22
2,24
2,26
2,28
2,30
2,32
2,34
2,36
2,38
2,40
2,42
2,44
2,46
2,48
2,50
2,52
2,54
2,56
2,58
2,60
2,62
2,64
2,66
2,68
2,70
2,72
2,74
2,76
2,78
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
0,4772
0,4783
0,4793
0,4803
0,4812
0,4821
0,4830
0,4838
0,4846
0,4854
0,4861
0,4868
0,4875
0,4881
0,4887
0,4893
0,4898
0,4904
0,4909
0,4913
0,4918
0,4922
0,4927
0,4931
0,4934
0,4938
0,4941
0,4945
0,4948
0,4951
0,4953
0,4956
0,4959
0,4961
0,4963
0,4965
0,4967
0,4969
0,4971
0,4973
2,80
2,82
2,84
2,86
2,88
2,90
2,92
2,94
2,96
2,98
3,00
3,20
3,40
3,60
3,80
4,00
4,50
5,00
0,4974
0,4976
0,4977
0,4979
0,4980
0,4981
0,4982
0,4984
0,4985
0,4986
0,49865
0,49931
0,49966
0,499841
0,499928
0,499968
0,499997
0,499997
54
Литература:
1. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. М.: Инфра-М,
2003.
2. Наследов А.Д. SPSS15. Профессиональный статистический анализ данных.
М.- СПб.: Питер, 2008.
3. Наследов А.Д. Математические методы психологического исследования.
Анализ и интерпретация данных. СПб.: Речь, 2007.
4. Ниворожкина Л.И., Морозова З.А. Математическая статистика с элементами
теории вероятностей в задачах с решениями. М.-Ростов-на –Дону: МАРТ,
2005.
5. Сидоренко Е.В. Методы математической обработки в психологии. СПб.:
Речь, 2007.
55
Download