4. Проверка гипотез

advertisement
1
Проверка гипотез
В процессе принятия решений менеджеру приходится сталкиваться с
ситуациями, когда нет очевидных и убедительных аргументов в пользу того
или иного предложения. Кроме того, менеджеру часто бывает необходимо
доказать обоснованность своих решений.
В этих случаях в качестве одного из компонентов процесса принятия
решений выступает статистическая проверка гипотез, которая позволяет на
основе имеющейся информации сделать окончательный выбор.
Гипотеза представляет собой некоторое предположение (утверждение)
об окружающем мире, т.е. относится к генеральной совокупности. Такое
предположение может быть либо истинным, либо ложным. Проверка
позволяет ответить на этот вопрос.
В статистике рассматриваются две гипотезы, которые подлежат
проверке: нулевая гипотеза (Н0) и исследовательская (альтернативная)
гипотеза (Н1).
Нулевая и исследовательская гипотезы взаимно исключают друг друга.
Нулевую гипотезу не нужно доказывать. У нее существует «презумпция
доказанности».
Доказывать необходимо именно исследовательскую гипотезу. Причем,
если доказательств окажется недостаточно, то принимается нулевая гипотеза.
Для того, чтобы сформулировать нулевую и альтернативную гипотезы,
следует задать себе вопрос: «Какая из гипотез требует доказательства?». В
результате проверки исследователь принимает одно из возможных решений:
1. Принять нулевую гипотезу (ввиду недостаточности доказательств);
2. Отклонить нулевую гипотезу и принять альтернативную.
Примеры гипотез.
1. Ситуация. Отобранная случайным образом группа из 200 человек
посмотрела рекламу торговой марки. В течение следующей недели отмечено,
что некоторая часть из этой группы приобрела рекламируемый товар.
Нулевая гипотеза. Реклама не имела никакого эффекта. (Процент
покупателей в группе не отличается от генеральной совокупности).
Альтернативная гипотеза. Реклама имела эффект. (Процент
покупателей в группе отличается от генеральной совокупности).
2. Ситуация. Вы изучаете добавку для бензина, позволяющую снизить
расход топлива (так заявляет производитель).
Нулевая гипотеза. Добавка не оказывает влияния на расход топлива.
Альтернативная гипотеза. Добавка оказывает влияние на расход
топлива.
2
3. Ситуация. Вашей фирме предъявляются претензии в несоответствии
зарплат по гендерному признаку.
Нулевая гипотеза. Размеры заработной платы мужчин и женщин
равны.
Альтернативная гипотеза. Размеры заработной платы среди мужчин
и женщин не равны (присутствует закономерность).
В формализованном виде данные гипотезы примут следующий вид:
Н0 : μ = μ0
Н1 : μ ≠ μ0
где μ – неизвестное среднее значение генеральной совокупности
(которое нас интересует);
μ0 – заданное значение, в отношении которого проверяют гипотезу;
Х – среднее значение выборки (случайная величина), которое
представляет μ.
Проверка гипотезы заключается в сравнении двух известных величин Х
и μ0 . Если эти значения «достаточно близки» между собой (Х = μ0), то
принимается нулевая гипотеза. Если значения «сильно отличаются» друг от
друга (Х ≠ μ0), то принимается альтернативная гипотеза. «Близость»
значений определяется на основе значения стандартной ошибкой Sx .
Существует два различных метода проверки гипотез. Первый – метод
доверительных интервалов. Второй метод носит название t-тест, который
более распространен на практике, и основан на расчете t-статистики.
Метод «доверительных интервалов» заключается в построении
диапазона значений на 95% уровне достоверности:
Для среднего
X - t*SХ ≤µ≤ X + t*SХ
Для доли признака
ρ - t* Sр ≤ π ≤ ρ + t* Sр
Стандартная
ошибка среднего
Стандартная
ошибка доли

n
р(1 - р)
Sр =
n
SХ =
σ – ст. отклонение
n - объем выборки
ρ - доля изучаемого
признака
3
Если значение μ0 находится за пределами доверительного интервала,
то оно не может рассматриваться как возможное значение, т.е. равенство
μ = μ0 не выполняется. Соответственно, выполняется условие μ ≠ μ0 , т.е.
доказывается альтернативная гипотеза. В таком случае делается вывод о том,
что нулевая гипотеза отклоняется и принимается альтернативная гипотеза на
уровне достоверности 95%.
Пример 1. Предположим, изучается эффект от внесения добавки для
увеличения выхода продукции. Средний выход продукции до использования
добавки составляет 32,1 кг за день. По результатам 7 дней наблюдения после
внесения добавки наблюдался средний выход продукции 39,6 кг.
Стандартная ошибка при этом составила 4,2 кг (SХ =  / n ).
Вопрос заключается в том, имеется ли действительно эффект от
внесения добавки, или результаты носят «случайный» характер?
Решение.
Нулевая гипотеза утверждает, что внесение добавки не приносит
никакого эффекта (т.е. выход продукции до и после эксперимента не
отличается). Н0 : μ = 32,1.
Альтернативная гипотеза утверждает, что имеется эффект от внесения
добавки (т.е. выход продукции до и после эксперимента разный).
Н1 :
μ ≠ 32,1.
Значение коэффициента Стьюдента находится по таблице: для выборки
n=7, t = 2,447.
Доверительный интервал значений принимает вид:
39,6 – 2,447*4,2 ≤µ≤39,6 + 2,447*4,2
29,3 ≤µ≤49,9
Вывод: поскольку заданное значение 32,1 попадает в доверительный
интервал, то результаты эксперимента не подтверждают исследовательскую
гипотезу о том, что от применения добавки имеется эффект. Результат 32,1
является вполне возможным даже при использовании добавки. Поэтому
альтернативная гипотеза отклоняется и принимается нулевая гипотеза:
применение добавки не влияет на увеличение выхода продукции.
Пример 2. Изучается вопрос: действительно ли повышается качество
работы, если наемным работникам передать некоторую часть акций
компании? По результатам опроса 343 менеджеров различных фирм
установлено, что средний балл по шкале «от -2 (отрицательное влияние) до
+2 (положительное влияние)» составил 0,35 балла со стандартной ошибкой
0,14. О чем говорят такие результаты?
4
Решение.
Нулевая гипотеза утверждает, что передача акций не приносит
никакого эффекта (т.е. качество работы не повышается). Н0 : μ = 0.
Альтернативная гипотеза утверждает, что имеется эффект от передачи
акций (т.е. оценка менеджеров отлична от нуля).
Н1 :
μ ≠ 0.
Значение коэффициента Стьюдента находится по таблице: для выборки
n > 40, t = 1,96.
Доверительный интервал значений принимает вид:
0,35 – 1,96*0,14 ≤µ≤0,35 +1,96*0,14
0,076 ≤µ≤0,624
Вывод: поскольку значение «0» не попадает в границы доверительного
интервала, это является доказательством того, что обладание акций
предприятия у наемных работников ведет к увеличению качества работы.
Пример 3. Вы заинтересованы в том, чтобы не менее 10% выпускаемой
продукции можно было отнести к классу «Люкс» по стандартам качества.
После внедрения некоторых изменений на предприятии вы сформировали
случайную выборку из 500 образцов, среди которых 58 соответствуют
данному критерию, что составило 11,6%. Можно ли быть уверенным в том,
что вы достигли желаемого результата?
Решение.
Нулевая гипотеза утверждает, что внедрение изменений на
предприятии не принесло никакого эффекта (т.е. процент продукции класса
«Люкс» остался равен 10%). Н0 : π = 10%.
Альтернативная гипотеза утверждает, что имеется эффект от внедрения
изменений (т.е. процент такой продукции изменился т.е. увеличился).
Н1 :
π ≠ 10%.
Доверительный
интервал
значений
(биноминального распределения) составляет:
для
доли
признака
ρ - t* Sр ≤ π ≤ ρ + t* Sр
11,6 - 1,96*1,43 ≤ π ≤ 11,6 + 1,96*1,43
8,8 ≤ π ≤ 14,4
Вывод: поскольку значение 10% находится в границах доверительного
интервала, можно утверждать, что полученное значение 11,6% не значимо
отличается от 10%. Другими словами, нет убедительных доказательств того,
что будет обеспечен выпуск продукции класса «Люкс» не ниже 10%.
5
Таким образом, по результатам проверки гипотез, исследовательская
гипотеза отклоняется и принимается нулевая гипотеза на уровне 95%.
Метод «t – тест» заключается в расчете «t – статистики»,
сравнении ее с табличным значением и формулировкой вывода.
t-статистика, или t-коэффициент Стьюдента (использовал В.С. Госсет,
главный пивовар фирмы Guinness при публикации первой статьи, в которой
он и предложил t-таблицу) рассчитывается:
Для среднего
t
Для доли признака
t
X 
Sx
 
S
Для сравнения с табличным значением используется абсолютное
значение t, т.е. «по модулю».
t - статистика показывает на сколько стандартных ошибок отличаются
между собой средние значения по выборке (Х) и генеральной совокупности
(μ). Поскольку при 95% уровне достоверности значение t =1,96, то
существует эмпирическое правило, что «при t >2 нулевая гипотеза
отклоняется».
Принято считать, что результат проверки является статистически
значимым, если альтернативная гипотеза принимается на уровне 5%. Для
описания полученных результатов обычно пользуются следующими
терминами:
Незначимый
Значимый
Высоко значимый
Очень высоко значимый
Отсутствие значимости на уровне 5%
Значимость на уровне 5%
Значимость на уровне 1%
Значимость на уровне 0,01%
При расчетах в Excel программа выводит р-значение, которое
показывает вероятность того, что данные соответствуют нулевой гипотезе.
Обычно Н0 отклоняют, если р < 0,05. Другими словами, вероятность того,
что нулевая гипотеза истинна, не превышает 5% (что является статистически
значимым).
В рассмотренных примерах мы имели дело с данными по одной
выборке. Задача состояла в том, чтобы сравнить среднее значение по
выборке (Х) с некоторым заданным значением (μ0).
6
На практике часто приходится сравнивать средние значения по более,
чем одной выборке данных. В таких ситуациях также широкое применение
получил t - тест Стьюдента.
Подробное описание проведения t-теста
рассматривается в разделе «Дисперсионный анализ».
для
двух
выборок
Download