Лекция 1 - Постовалов С.Н.

Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИИ, ОСНОВННЫЕ НА ОТНОШЕНИИ ПРАВДОПОДОБИЯ Книга Бытие, глава 8 Воды убывали; ворон; выпуск голубя (1-14) … 8 Потом выпустил от себя голубя, чтобы видеть, сошла ли вода с лица земли, 9 но голубь не нашел места покоя для ног своих и возвратился к нему в ковчег, ибо вода была еще на поверхности всей земли; и он простер руку свою, и взял его, и принял к себе в ковчег. 10 И помедлил еще семь дней других и опять выпустил голубя из ковчега. 11 Голубь возвратился к нему в вечернее время, и вот, свежий масличный лист во рту у него, и Ной узнал, что вода сошла с земли. 12 Он помедлил еще семь дней других и выпустил голубя; и он уже не возвратился к нему. 13 Шестьсот первого года к первому дню первого месяца иссякла вода на земле; и открыл Ной кровлю ковчега и посмотрел, и вот, обсохла поверхность земли. 14 И во втором месяце, к двадцать седьмому дню месяца, земля высохла. 2 Проверка гипотезы о виде распределения Пусть x1, x2, x3,… - последовательность независимых наблюдений случайной величины ξ. Гипотезы о виде распределения ξ: H 0 : f ( x )  f 0 ( x,  0 ) H1 : f ( x)  f1 ( x, 1 ) • Критерий Неймана-Пирсона (1933) • Критерий Вальда (1947) • Проблема Кифера-Вейсса (1957) • Критерий Айвазяна (1965) • Критерий Лордена (1976) 3 Критерий Вальда (SPRT) n H1 c1 H0 c0 1 2 3 4 5 n 6 Абрахам Вальд (1902-1950) Статистика критерия:  (n) n f1 ( xi ) i 1 f 0 ( xi )   ln Области принятия проверяемых гипотез и область неопределенности:    H (n)  n   :   c0  , c0  ln   1   0 1    nH0   :  ( n )  c1 , c1  ln      *n   : c0   ( n )  c1 4 Оптимальность критерия Вальда Теорема 1. (А. Вальд, Дж. Вольфовиц, 1948) Пусть T – последовательный критерий отношения вероятностей с критическими границами - < c0 < 0 < c1 < + , с вероятностями ошибок первого и второго рода  и , а Т- другой критерий с вероятностями ошибок первого и второго рода  и . Если   и  и E[n|H0]<  и E[n|H1]<  Тогда E[n|H0]  E[n|H0] и E[n|H1]  E[n|H1] (1) (2) (3) Г. Саймонс (1976) доказал возможность заменить условие (1) на (4) + + (4) 5 Потеря оптимальности критерия Вальда 1. Проверка сложной гипотезы J. Kiefer and L. Weiss. Some properties of Generalized Sequential Probability Ratio Tests.Ann. Math. Stat., 28(1):57–75, March 1957. 2. Нарушение предположений об независимости наблюдений Matthew Finkelman (2008): The Wald–Wolfowitz Theorem Is Violated in Sequential Mastery Testing, Sequential Analysis: Design Methods and Applications, 27:3, 293-303 6 Средний объем выборки в критерии Вальда Теорема 2. (Вальда, 1947) Оценка снизу среднего числа наблюдений для любого последовательного критерия с вероятностями ошибок α и β имеет вид:  ( ,  )  ( , ) EH n( ,  )   EH n( ,  )   (H0 )  ( H1 ) 0 1    1 x   x  f1 ( x)  ( x, y)   (1  x) ln  dx   x ln    ,  ( H i )   f i ( x) ln f 0 ( x)  y   1 y     Теорема 3. (С.А. Айвазян, 1959). Если f0(x)=f1(x) и 1 0, то при выполнении ряда условий EH0 n( ,  )  2 ( ,  ) 2 (  ,  ) EH1 n( ,  )   ( H 0 , H1 )  ( H 0 , H1 )  f1  ( H 0 , H1 )   ( f1  f 0 ) ln dx   ( H1 )   ( H 0 ) f0  7 Распределение объема выборки в критерии Вальда при проверке гипотез «нормальное-логистическое»  ( H 0 )  0.010496503  ( H1 )  0.01436227472  ( H 0 , H1 )  0.0248587772     0.05  ( ,  )   (  ,  )  2,649995 EH 0 n( ,  )  252 EH1 n( ,  )  184 EHi n( ,  )  213 Средний объем выборки по 100000 реализаций равен 267 (при H0) и 232 (при H1) 8 Усечение последовательного критерия отношения правдоподобия 1. Потеря оптимальности 2. Нестатистические причины прекращения эксперимента  Высокая стоимость экспериментов  Этические причины в клинических испытаниях  … 9 Обобщенный последовательный критерий отношения правдоподобия (GSPRT) L. Weiss. Testing one simple hypothesis against another // Ann. Math. Stat., 24(1953): pp. 273-281. Области принятия проверяемых гипотез и область неопределенности:  nH 0   :  ( n )  c0 (n)  nH 0   :  ( n )  c1 (n) *n   : c0 (n)   ( n )  c1 (n) 10 Armitage, P. (1957). Restricted sequential procedures. Biometrika, 44, 9–56. 11 Hemanta K. Baruah & G.P. Bhattacharjee (1980): A generalization of anderson's modified sequential probability ratio test, Journal of Statistical Computation and Simulation, 11:3-4, 197-208 12 Jennison C., Turnbull B.W.: Group sequential methods with applications to clinical trials. Boca Raton, Chapman & Hall, 2000. 13 Критерий Айвазяна n c1 n  H1 H0 c0 1 2 3 4 5 6 n* n 8ln(min(, )) ( H 0 , H1 ) - граница усечения  ( H 0 , H1 )    ( f1  f0 ) ln  Айвазян С.А. f1 dx f0 Области принятия проверяемых гипотез и область неопределенности:  n  1   nH0   : ( n )  c0  1    , c0  2ln   n *    n  1   nH1   : ( n )  c1  1   , c1  2ln   n *    n n    *n   : c0  1     ( n )  c1  1      n   n   Anderson, T.W. (1960). A modification of the sequential probability ratio test to reduce the sample size. Ann. Math. Statist., 31, 165–197. Айвазян С.А. Различение близких гипотез о виде распределения в схеме обобщенного последовательного критерия // Теория вероятностей и ее применения Том X, №4 (1965) с. 713-725 14 Критерий Лордена (2-SPRT) H0 | H2 , H 2 | H1 H 2 : f 2  f 0  (1  ) f1  :  ( f 2 , f 0 )   ( f 2 , f1 ) Статистики критерия:  n (n) 0   ln i 1 f 2 ( xi ) f 0 ( xi ) ,  ( n) 1 n f1 ( xi ) i 1 f 2 ( xi )   ln Гарри Лорден Области принятия проверяемых гипотез и область неопределенности:    H  n  1 : 1  c0  , c0  ln   1   0   (n) 1      0 :  0  c1 , c1  ln      H1 n (n) *n   0 :  0( n )  c1 , 1 : 1( n )  c0  15 Оценивание точных критических границ методом Монте-Карло В работе Canner, P.L. (1977). Monitoring treatment differences in long-term clinical trials. Biometrics, 33, 603–615. применялся метод Монте-Карло для нахождения точных критических границ в последовательном критерии для биномиального закона распределения. В работах Гродзенской И.С. (2004) применялся метод Монте-Карло для сравнения критериев Вальда, Айвазяна, Лордена и Павлова. Постовалов С. Н. Проверка простых и сложных гипотез с использованием последовательного критерия Вальда// ДОКЛАДЫ АН ВШ РФ. - 2011. - № 2(17). - С.140-150. Постовалов С. Н. Проверка простых и сложных гипотез с использованием последовательных критериев Лордена и Айвазяна / С. Н. Постовалов, М. Р. Шахмаметова // Научный вестник НГТУ. - Новосибирск, 2011. - № 3 (44). - C. 17-28. 16 Вычисление вероятностей ошибок первого и второго рода для критерия Вальда Если нам нужно найти точные границы, мы должны вычислить вероятности ошибок первого и второго рода: i 1   1    P H 0 | H 0    P i  с0  j   с0 , с1  H 0  i 1 j 1   i 1    1    P H1 | H1   P i  с1  j   с0 , с1  | H1  i 1 j 1    Но это представляет собой сложную задачу, т.к. i зависит от j если i>j. 17 Вычисление вероятностей ошибок первого и второго рода для критерия Вальда методом Монте-Карло 1. Выбирается область моделирования. 2. Строится сетка с маленьким шагом на выбранной области. 3. Моделируется случайная величина по H0 . 4. Вычисляется статистика критерия. 5. Проверяется условие выхода для каждой точки сетки (с0,с1). 6. Если для какой-то точки сетки условие выхода не выполнено, то перейти на шаг 3. 7. Шаги 3-6 повторяются N раз. 8. Для каждой точки сетки вероятность ошибки вычисляется по формуле число ошибок  (c0 , c1 )  N 18 Выбор числа повторений N Какое число повторений надо взять, чтобы отклонение эмпирической вероятности ошибки первого рода от истинного значения не превосходило заданного уровня ? Согласно центральной предельной теореме m  P        2Ф( )  1   , N   N  где m – количество ошибок первого рода в серии из N повторов. Отсюда  (1   ) N  t , 2  2 Например, если 19 1    1 t      2    0.99,   0.01,   0.15 тогда N  8 460 Проверяемые гипотезы Нормальный закон распределения:  ( x   )2  1 H 0 : f ( x)  exp   ,  0 2  2  Логистический закон распределения: H1 : f ( x )     e x 3 x 3    3 1  e    2 20 Расчет параметров критериев Лордена и Айвазяна  ( x   )2  1 H 0 : f ( x)  exp   ,  0 2  2  H1 : f ( x )     x e 3 x 3    3 1  e    2 Критерий Лордена  :  ( f 2 , f 0 )   ( f 2 , f1 ), f 2   f 0  (1  ) f1      0.5526149445 f1    ( H 0 , H1 )   ( f1  f 0 ) ln f dx 0   Критерий Айвазяна  ( H 0 , H1 )  0.0248587772 min(α,β) 0.05 0.1 0.15 n* 964 741 610 21 H0 :  H1 :  N (0,1) Log  0,1 (с0, с1) 22 (с0, с1) H0 :  H1 :  N (0,1) Log  0,1 23 Вычисление точных критических границ для критерия Вальда 24 Вычисление точных критических границ для критерия Вальда α β 0.15 0.10 0.05 0.01 0.15 0.10 0.05 0.01 -1.67, 1.42 -2.07, 1.47 -2.74, 1.52 -4.33, 1.56 -1.72, 1.81 -2.12, 1.86 -2.80, 1.91 -4.39, 1.95 -1.78, 2.48 -2.18, 2.54 -2.85, 2.59 -4.45, 2.63 -1.82, 4.11 -2.22, 4.17 -2.89, 4.23 -4.48, 4.26 25 Вычисление точных критических границ для критерия Лордена 26 Вычисление точных критических границ для критерия Лордена α β 0.15 0.10 0.05 0.01 0.15 0.10 0.05 0.01 -1,18;0,95 -1,47; 1,02 -2,00; 1,14 -3,24; 1,29 -1,25; 1,23 -1,56; 1,31 -2,10; 1,44 -3,36; 1,62 -1,36; 1,75 -1,68; 1,86 -2,23; 1,98 -3,53; 2,21 -1,50; 2,98 -1,85; 3,11 -2,43; 3,29 -3,77; 3,55 27 Вычисление точных критических границ для критерия Айвазяна, n*=964 28 Вычисление точных критических границ для критерия Айвазяна, n*=964 α β 0.15 0.10 0.05 0.01 0.15 0.10 0.05 0.01 -1,9; 1,59 -2,48; 1,68 -3,69; 1,81 ---- -2,02; 2,11 -2,61; 2,20 -3,89; 2,35 ---- -2,15; 3,12 -2,82; -4,14;3,48 ---- --- --- ---- ---- 29 Распределение объема выборки в критерии Вальда при использовании приближенных границ  ( H 0 )  0.010496503  ( H1 )  0.01436227472  ( H 0 , H1 )  0.0248587772     0.05  ( ,  )   (  ,  )  2,649995 EH 0 n( ,  )  252 EH1 n( ,  )  184 EHi n( ,  )  213 Средний объем выборки по 100000 реализаций равен 267 (при H0) и 232 (при H1) 30 Распределение объема выборки в критерии Вальда при использовании оценок точных границ   0, 05006   0, 03467   0, 05089   0, 04712 Средний объем выборки по 100000 реализаций равен 251 (при H0) и 206 (при H1) 31 Сокращение среднего объема выборки на 6% (при H0) и на 11% (при H1) Распределение объема выборки в критерии Лордена при использовании оценок точных границ   0, 05038   0, 01776   0, 04986   0, 02469 Ср. объем выборки по 100000 реализаций равен 367 (при H0) и 318 (при H1) – приб. Ср. объем выборки по 100000 реализаций равен 268 (при H0) и 223 (при H1) –точн. 32 Сокращение среднего объема выборки на 27% (при H0) и на 30% (при H1) Распределение объема выборки в критерии Айвазяна при использовании оценок точных границ (n*=964)   0, 0513   0, 02044   0, 04999   0, 03026 Ср. объем выборки по 100000 реализаций равен 355 (при H0) и 312 (при H1) – приб. Ср. объем выборки по 100000 реализаций равен 265 (при H0) и 214 (при H1) –точн. 33 Сокращение среднего объема выборки на 25% (при H0) и на 31% (при H1) Сравнение среднего объема выборки для разных критериев (при H0, вероятности ошибок первого и второго рода равны 0.05) 400 367 355 Средний объем выборки 350 300 267 251 265 268 250 СОВ, приближенные границы 200 СОВ точные границы 150 100 50 0 Критерий Вальда Критерий Айвазяна Критерий Лордена 34 Сравнение распределений объема выборки для разных критериев (при H0, вероятности ошибок первого и второго рода равны 0.05) – приближенные границы 35 Сравнение распределений объема выборки для разных критериев (при H0, вероятности ошибок первого и второго рода равны 0.05) – точные границы 36 Сравнение среднего объема выборки для разных критериев (при H1, вероятности ошибок первого и второго рода равны 0.05) 350 318 312 Средний объем выборки 300 250 232 206 214 223 200 СОВ, приближенные границы СОВ точные границы 150 100 50 0 Критерий Вальда Критерий Айвазяна Критерий Лордена 37 Пусть x1, x2, x3,… - последовательность независимых наблюдений случайной величины ξ, подчиненной нормальному закону распределения N(,). У. Госсет Гипотезы о параметрах распределения ξ: H 0 :   0 ,  0 H1 :   1   0 ,   0 Параметр  - неизвестен, альтернатива не фиксирована (1-неизвестна) Статистика критерия имеет вид: 1   0 t S n 1  1    Fn1    2   где Fn-1 – функция распределения Стьюдента с (n-1) степенью свободы Гипотеза H0 не отвергается, если t 38 Гипотезы о параметрах распределения ξ:   0   ,  0    0 H1 :   1 : ,  0  H0 : Параметр  - неизвестен, альтернатива не фиксирована (1-неизвестна) Статистика критерия имеет вид:  p1n  p0 n 1 1 2 0  n   1 exp  2   2    1 n 2  x      exp  x             d  i 0 i 0 2  i 1   2 i 1   1  1 n 2 exp  x      d i 0 0  n  2 2  i 1  n 2 39 ; Гипотезы Н0 принимается, если p1n 1   A p0 n  Гипотезы Н1 принимается, если p1n  B p0 n 1 Производятся дополнительные наблюдения до тех пор, пока выполняются неравенства p1n B A p0 n 40 Вычисление оценок точных критических границ 41 Вычисление оценок точных критических границ при H 0 :   0 Таблица 1. Приближенные критические границы (B,A) α β 0,01 0,05 0,1 0,15 0,1 0.01, 9.9 0.06, 9.5 0.11, 9 0.17, 8.5 0,15 0.01, 6.6 0.06, 6.33 0.12, 6 0.18, 5.66 Таблица 2. Оценки точных критических границ α β 0,01 0,05 0,1 0,15 0,1 0.15, 5.44 0.32, 4.68 0.44, 4.14 0.52, 3.72 0,15 0.15, 3.65 0.32, 3.14 0.44, 2.77 0.53, 2.50 H1 :   1. Проблемы при оценивании точных границ последовательного t-критерия  Есть зависимость от расстояния между гипотезами  Есть зависимость от , Границы [B,A] Границы [B,A]   0.5   0.6   0.7 0.39, 4.95 0.25, 5.34 0.15, 5.44  H 1  0.7  H 1  0.75 0.02, 6.18 0.15, 5.40 H1  1 0.15, 5.44 H1  2  H 1  15 0.65, 3.01 0.78, 1.65 43 План выступления  Обзор последовательных критериев проверки гипотез  Алгоритм построения оценок точных критических границ методом Монте-Карло  Сравнение среднего объема выборки  Проверка сложных гипотез. Последовательный t-критерий Стьюдента  Группированные и цензурированные наблюдения  Применение последовательных критериев 44 Использование последовательных критериев по случайно цензурированным наблюдениям • Для всех наблюдений известно время начала наблюдения; • Для всех наблюдений известно время окончания наблюдения, либо время выбытия из-под наблюдения; • Выбор выбывших наблюдений производится случайно. 45 Модификация критерия Вальда по случайно цензурированным наблюдениям Введем обозначение: f j ( x), x-не цензурированное наблюдение  p j ( x)    Pj {  x}  1  Fj ( x), x-цензурированное наблюдение , j=0,1. тогда статистика критерия k k   i 1 p1 ( xi ) p0 ( xi ) или  p (x )   k   ln  1 i  i 1  p0 ( xi )  k 46 Актуальные области применения процедуры последовательной проверки гипотез о виде распределения • Задачи приемочного контроля качества Вальд А. Последовательный анализ. //М.: Физматгиз, 1960. - 325 с. Page E.S. Continuous inspection schemes // Biometrika, 1954, v. 41, p. 100-114. • Задачи статистического управления технологическими операциями Бендерский А.М. Статистическое регулирование технологических процессов методом кумулятивных сумм. – М.: Знание, 1973 – 70 c. 47 Актуальные области применения процедуры последовательной проверки гипотез о виде распределения • Задачи построения рациональных планов испытаний на надежность Гродзенская И. С., Гродзенский С. Я., Томилин Н. А. Рационализация контроля надежности элементов и систем // Наукоемкие технологии, 2003, № 2, с. 85-87. • Клинические испытания Armitage P. Sequential medical trials. Oxford: Blackwell, 1961. 105 p. 48 Актуальные области применения процедуры последовательной проверки гипотез о виде распределения • Радиолокационные задачи различения сигнала при наличии помех в системах, основанных на накоплении полезного сигнала Гродзенская И. С. Разработка и исследование методов обнаружения радиосигналов при наличии помех на основе оптимальных статистических последовательных критериев // Тезисы докладов Научно-технической конференции студентов, аспирантов и молодых специалистов МИЭМ. – М.: МИЭМ, 2006, с. 257. 49 Заключение 1. Использование оценок точных критических границ дает ощутимый выигрыш в среднем числе наблюдений, особенно для модификаций критерия Вальда – критериев Айвазяна и Лордена. 2. В рассмотренном примере в случае использования приближенных критических границ несколько лучше работает критерий Айвазяна, однако при использовании оценок точных критических границ критерии Айвазяна и Лордена становятся практически эквивалентными. 3. Вычисление оценок точных критических границ требует определенных вычислительных затрат, а также разработки программного обеспечения, поэтому применять этот метод имеет смысл в случае проведения дорогостоящих, трудоемких и длительных экспериментов. 4. Нахождение оценок точных критических границ возможно и в более сложных случаях: при проверке сложных гипотез, при цензурировании и при 50 группировании наблюдений.

Лекция 1 - Постовалов С.Н.

Related documents

Products

Support

Лекция 1 - Постовалов С.Н.

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib