417Научная статья (Ведерникова)x

advertisement
УДК 519.2
КРИТЕРИИ СОГЛАСИЯ В ЗАДАЧАХ ПРОВЕРКИ АДЕКВАТНОСТИ
ПАРАМЕТРИЧЕСКИХ МОДЕЛЕЙ НАДЕЖНОСТИ И ВЫЖИВАЕМОСТИ
М.А. Ведерникова
Новосибирский государственный технический университет
Введение
Исследование надежности является неотъемлемым этапом при производстве
новых технических изделий или совершенствовании существующих, также как при
создании эффективных медикаментозных методов лечения необходим анализ
выживаемости пациентов, проходящих тестовое лечение новым препаратом. По
данным, полученным в ходе подобных исследований, строятся вероятностные модели,
чаще всего это распределение Вейбулла, гамма-распределение, экспоненциальное,
логнормальное распределение или их обобщенные распределения. Если же
предполагается, что вероятность наступления системного события в заданный момент
времени зависит от определенных факторов, то для описания взаимосвязи между
значениями этих факторов (ковариат) и вероятностью наступления исследуемого
события в течение некоторого периода времени используются регрессионные
модели [1], [13]. Наиболее распространенной моделью зависимости времени жизни от
объясняющих переменных является модель пропорциональных интенсивностей [4].
Несмотря на активное использование модели в течение четырех десятилетий, вопросы
проверки ее адекватности остаются открытыми.
В работах М.С. Никулина рассматриваются критерии проверки адекватности
модели против определенных конкурирующих гипотез [1], однако количество таких
альтернатив слишком велико, и прежде чем проверять гипотезу о согласии таким
образом, можно воспользоваться неким универсальным критерием, который не зависел
бы от вида конкурирующей гипотезы. В случае полупараметрической модели – это
критерии о коэффициенте корреляции, основанные на остатках Шонфельда [19-21], в
случае параметрической модели – классические непараметрические критерии согласия,
основанные на остатках Кокса-Снелла [8], [11]. Данные подходы к проверке гипотезы о
согласии подробно описаны в работах Ф.Е. Харрелла, П.М. Грамбша, Д.И. Лина, Дж.Д.
Кальбфляйша и Р.Л. Прентиса [5], [8], [11], [17], [19-21]. В известных статистических
пакетах (R, SAS, SPSS, Statistica и др.) реализована возможность графической проверки
адекватности построенной модели. Однако в публикациях, посвященных исследованию
моделей пропорциональных интенсивностей, о проверке адекватности построенных
моделей на основе выборок остатков часто либо совсем не упоминается [4], [13], либо
проверка согласия выборки остатков с базовым законом распределения осуществляется
графическими методами [5]. Кроме того, результаты проверки гипотезы о согласии с
моделью пропорциональных интенсивностей Кокса различными критериями часто
противоречат друг другу.
Особенности применения критериев согласия Колмогорова [23], Крамера-МизесаСмирнова или Андерсона-Дарлинга при проверке адекватности параметрических
моделей надежности по выборкам без объясняющих переменных и цензурированных
наблюдений подробно исследованы в [24-27]. В [25], [26] построены вероятностные
модели, аппроксимирующие распределения статистик непараметрических критериев
относительно широкого спектра законов распределения, с которыми проверяется
согласие. Возможности применения данных критериев при проверке простых гипотез о
согласии по цензурированным I-го и II-го типа данным без ковариат рассмотрены
в [3], [10]. Распределения статистик и мощность критериев при проверке сложной
гипотезы исследованы в [27].
1
В [6], [7], [14], [15], [18] для проверки адекватности параметрических моделей
надежности и выживаемости по случайно цензурированным данным предлагаются
модификации непараметрических критериев, основанные на использовании вместо
эмпирического распределения непараметрической оценки Каплана-Мейера. Основной
сложностью в данном случае является отсутствие априорной информации о
распределении моментов цензурирования. Помимо этого, при проверке адекватности
параметрической модели Кокса распределение моментов цензурирования может
зависеть от ковариат. Другой подход к проверке адекватности параметрических
моделей по цензурированным данным, основанный на преобразовании исходной
цензурированной выборки в псевдополную и использовании классических критериев
согласия, предлагается в [12]. Использование классических критериев при проверке
адекватности моделей по цензурированным выборкам значительно упрощает
процедуру проверки по сравнению с проверкой модифицированными критериями
согласия, однако необходимо определить, корректен ли результат, полученный по
преобразованной выборке классическими критериями.
Целью данной работы является разработка математического и алгоритмического
обеспечения проверки адекватности параметрических моделей надежности и
выживаемости по цензурированным выборкам.
1. Основные определения
В общем случае данные, полученные в результате исследований надежности или
выживаемости, можно представить в виде  t1 , x1 , 1  ,  t2 , x 2 ,  2  ,...,  tn , x n ,  n  , где n – объем
выборки, ti – время до наступления системного события или момента цензурирования,
 i – индикатор цензурирования, который принимает значение 1, если наблюдение
полное, и 0, если цензурированное. Вектор ковариат или факторов x i , оказывающих
влияние на функционирование i-го объекта, может быть опущен в случае построения
модели для одинаково распределенных случайных величин, однако необходим при
построении параметрической модели пропорциональных интенсивностей.
Цензурирование первого типа возникает в ситуации, когда заранее фиксируется
время наблюдения за объектами. При цензурировании второго типа наблюдение за
объектами прекращается по наступлению заранее определенного количества
системных событий. При цензурировании третьего типа или случайном
цензурировании времена жизни T и моменты цензурирования C принадлежат законам
распределения F  t  и F C  t  , соответственно, и являются независимыми. Наблюдение,
соответствующее i-му объекту определяется следующим образом: ti  min Ti , Ci  ,
 i  1Ti  Ci  , i  1, n . Следует отметить, что моменты цензурирования могут зависеть от
значений ковариат, например, в выборке могут присутствовать цензурированные
наблюдения I-го типа с различными временами цензурирования, которые определялись
в зависимости от значений вектора ковариат того или иного объекта. Аналогичная
ситуация может наблюдаться для цензурированных II-го типа выборок в случае, если
необходимое количество наступлений системного события заранее определено для
каждой группы наблюдений, находящихся под одинаковым воздействием.
Функция надежности или выживаемости определяется соотношением
S x  t   P Tx  t   1  Fx  t  ,
а
кумулятивная
функция
риска
выражением
t
x  t    x  u  du   ln  S x  t   , где x  t   f x  t  S x  t  – функция интенсивности, f x  t  –
0
плотность распределения времен жизни.
Функция риска модели пропорциональных интенсивностей, предложенная
Коксом [4] определяется следующим соотношением: x  t;    r  x;    0  t  , где  –
2
вектор параметров регрессии, r  x;   – неотрицательная функция от ковариат, 0  t  –
базовая кумулятивная функция риска. Если при построении модели не вводится
предположение относительно закона распределения времен жизни, модель называется
полупараметрической. Если же вводится параметризация как для функции
воздействий, так и для базовой кумулятивной функции риска 0  t ;  , модель считается
параметрической.
Универсальными критериями проверки адекватности параметрических моделей
являются критерии Колмогорова, Крамера-Мизеса-Смирнова и Андерсона-Дарлинга.
В случае проверки адекватности модели пропорциональных интенсивностей
Кокса рассчитывают остатки Кокса-Снелла вида [8]: zi  0  ti   r  xi ;   , если модель
верна, остатки распределены по стандартному экспоненциальному закону. Таким
образом, при построении параметрической модели Кокса необходимо проверить
сложную гипотезу о согласии H 0 : zi Exp  0,1 .
Статистика критерия согласия типа Колмогорова с поправкой Большева [23]
имеет вид S KC   6nDn  1 6 n , где Dn  sup Fˆn  t   F  t  . Статистика критерия типа
t 
Крамера-Мизеса-Смирнова



определяется
следующим
образом
n2  n   F  t   Fˆn  t  dF  t  .
2
0
Статистика

 n2  n  
0
критерия
 F  t   Fˆ  t  
n
типа
Андерсона-Дарлинга
задается
выражением:
2
F  t   1  F  t  
dF  t  , где F  t  – функция распределения, соответствующая
проверяемой гипотезе H 0 , Fˆn  t  – эмпирическая функция распределения в случае
полных и псевдополных данных или оценка Каплана-Мейера в случае вычисления
статистик по цензурированным данным, при проверке согласия по полным данным
   , иначе  – время последнего полного наблюдения. При проверке адекватности
параметрической модели Кокса F  t  – функция распределения стандартного
экспоненциального закона.
Следует заметить, что в случае проверки сложной гипотезы о согласии
непараметрические критерии согласия даже для полных данных теряют свойство
свободы от распределения [24], и распределения G  S H 0  статистик S
непараметрических критериев согласия зависят от закона распределения F  t  ,
относительно которого проверяется согласие, от количества оцениваемых по выборке
параметров, метода оценивания параметров и других факторов.
2. Критерии согласия при проверке адекватности параметрических моделей
по данным без ковариат
Исследование распределений статистик модифицированных критериев
Колмогорова, Крамера-Мизеса-Смирнова и Андерсона-Дарлинга для цензурированных
I-го и II-го типа выборок при проверке простых и сложных гипотез представлено в [27].
Если же мы имеем дело со случайно цензурированной выборкой, то на распределения
статистик модифицированных критериев могут оказывать влияние не только степень
цензурирования, но и «расположение» моментов цензурирования в выборке. Так, в
случае одного семейства распределений моментов цензурирования выбытия
распределены в вариационном ряду практически равномерно, в отличие от другого
семейства распределений, для которого цензурированные наблюдения встречаются,
например, в конце вариационного ряда.
3
Проведенное с использованием методики компьютерного моделирования и
анализа статистических закономерностей, исследование изменения распределений
статистик с ростом объема выборок наблюдаемой случайной величины показало, что
распределения статистик модифицированных критериев зависят от объема выборок,
причем «характер» зависимости отличается для разных семейств распределений
моментов цензурирования. Также показано, что с увеличением степени цензурирования
распределения статистик модифицированных критериев согласия стремятся в область
больших значений. Более того, как уже было сказано, на вид распределений статистик
модифицированных критериев оказывает влияние семейство распределений моментов
цензурирования F C  t  . Следовательно, использование для вычисления достигнутого
уровня значимости соответствующих предельных распределений (при проверке
простых гипотез) или аппроксимаций предельных распределений (при проверке
сложных гипотез) может привести к некорректному результату.
Таким образом, при проверке как простых, так и сложных гипотез с помощью
модифицированных критериев согласия типа Колмогорова, Крамера-Мизеса-Смирнова
и Андерсона-Дарлинга для оценивания достигнутого уровня значимости необходимо
моделировать распределения статистик, подобрав распределение моментов
цензурирования. Однако для построения параметрической модели распределения
моментов цензурирования необходимо иметь некоторую априорную информацию,
более того, данная процедура также требует проверки гипотезы о согласии. Поэтому
был
разработан
непараметрический
алгоритм
моделирования
случайно
цензурированных выборок.
Методами компьютерного моделирования были построены эмпирические
распределения статистик классических критериев по псевдополным выборкам для
разных объемов выборок, типов цензурирования и при различных степенях
цензурирования в исходных выборках. Распределения статистик критериев
Колмогорова, Крамера-Мизеса-Смирнова и Андерсона-Дарлинга по псевдополным
выборкам
отличаются
от
соответствующих
аппроксимаций
предельных
распределений [24], однако, начиная с небольшого объема выборок (n=30),
смоделированные эмпирические распределения статистик совпадают с некоторыми
асимптотическими распределениями. Данный результат не противоречит классическим
представлениям о поведении распределений статистик критериев согласия
Колмогорова, Крамера-Мизеса-Смирнова и Андерсона-Дарлинга. Распределения
статистик классических критериев зависят от степени цензурирования, тем не менее,
при степени цензурирования не более 30% распределения статистик практически
совпадают с соответствующими аппроксимациями предельных распределений для
случая полных выборок, при увеличении степени цензурирования распределения
статистик оказываются левее аппроксимаций предельных распределений.
Полученные результаты позволяют рекомендовать применение разработанной
методики в случае малого количества цензурированных наблюдений в исходной
выборке (не более 30%).
3. Критерии согласия при проверке адекватности параметрической модели
пропорциональных интенсивностей Кокса
В результате проведенных исследований показано, что при проверке
адекватности параметрической модели пропорциональных интенсивностей Кокса на
распределения статистик непараметрических критериев согласия оказывают влияние
распределение времен жизни и количество оцениваемых параметров модели. Кроме
того, при проверке адекватности параметрической модели по данным без
цензурированных наблюдений можно использовать аппроксимации предельных
распределений статистик непараметрических критериев согласия, представленные
в [24] для выборок без ковариат.
4
Исследование мощности критериев Колмогорова, Крамера-Мизеса-Смирнова и
Андерсона-Дарлинга в случае полных выборок показало, что данные критерии
способны различать параметрические модели с разными базовыми распределениями,
критерий Андерсона-Дарлинга обладает наибольшей мощностью в сравнении с
критериями Колмогорова и Крамера-Мизеса-Смирнова [2].
Результаты компьютерного моделирования позволяют утверждать, что при
проверке адекватности модели пропорциональных интенсивностей Кокса по
цензурированным выборкам на основе модифицированных критериев согласия
Колмогорова, Крамера-Мизеса-Смирнова или Андерсона-Дарлинга необходимо
моделировать распределение статистики даже при небольшом количестве
цензурированных наблюдений в выборке. Для моделирования распределений статистик
модифицированных критериев при проверке адекватности модели по случайно
цензурированным выборкам был разработан непараметрический алгоритм
моделирования случайно цензурированных выборок в соответствии с моделью
пропорциональных интенсивностей Кокса, позволяющий корректное применение
модифицированных критериев согласия.
На основании исследования распределений статистик и мощности классических
критериев согласия Колмогорова, Крамера-Мизеса-Смирнова и Андерсона-Дарлинга по
псевдополным выборкам можно утверждать, что преобразование исходной выборки
позволяет отказаться от достаточно затратного процесса моделирования распределений
статистик и для вычисления достигнутого уровня значимости использовать
аппроксимации предельных распределений в случае малой степени цензурирования
(менее 30% цензурированных наблюдений).
1)
2)
3)
4)
5)
Заключение
В соответствии с целью работы были получены следующие основные результаты:
распределения статистик модифицированных критериев согласия зависят от
объема, типа и степени цензурирования выборок, а также распределения
моментов цензурирования в случае случайно цензурированных выборок, по
которым проверяется адекватность параметрических моделей надежности и
выживаемости;
разработана методика проверки простых и сложных гипотез о согласии с
параметрическими моделями по цензурированным данным с использованием
классических критериев Колмогорова, Крамера-Мизеса-Смирнова и АндерсонаДарлинга на основе преобразования исходной цензурированной выборки в
псевдополную;
при проверке простых гипотез классические критерии по псевдополным
выборкам не уступают по мощности модифицированным критериям, при
проверке сложных гипотез потери в мощности классических критериев по
сравнению с модифицированными незначительны;
исследование распределений статистик и мощности рассматриваемых
(классических и модифицированных) критериев при проверке адекватности
моделей надежности и выживаемости по цензурированным данным позволяет
рекомендовать применение классических критериев по преобразованным
выборкам при степени цензурирования, не превышающей 30%;
распределения статистик непараметрических критериев Колмогорова, КрамераМизеса-Смирнова и Андерсона-Дарлинга при проверке гипотезы о согласии с
параметрической моделью пропорциональных интенсивностей по полным
данным не зависят от плана эксперимента и вида функции воздействий, тогда как
параметризация
базовой
функции
риска
при
построении
модели
пропорциональных интенсивностей оказывает влияние на распределения
статистик рассматриваемых критериев;
5
6) в случае полных данных распределения статистик критериев проверки
адекватности параметрической модели пропорциональных интенсивностей
совпадают с соответствующими аппроксимациями предельных законов
распределения, полученными в [24] для одинаково распределенных случайных
величин;
7) мощность критерия Андерсона-Дарлинга превышает мощность критериев
Колмогорова Крамера-Мизеса-Смирнова при проверке гипотезы о согласии с
параметрической моделью пропорциональных интенсивностей с определенной
параметризацией базовой функции риска, однако рассматриваемые критерии не
способны различить параметрические модели с разными параметризациями
функции от ковариат;
8) сформулированные алгоритмы моделирования случайно цензурированных
выборок и распределений статистик модифицированных критериев согласия,
идентификации параметрической модели пропорциональных интенсивностей
Кокса, проверки простых и сложных гипотез о согласии по преобразованным
выборкам реализованы в программной системе статистического анализа данных
типа времени жизни «LiTiS».
Разработанное программное обеспечение позволяет провести корректный
статистический анализ данных типа времени жизни. Кроме этого, реализованные
модули моделирования выборок оценок и распределений статистик непараметрических
критериев при проверке адекватности моделей надежности и выживаемости
предоставляют возможность исследования методов построения соответствующих
моделей в зависимости от множества факторов, оказывающих влияние на свойства
оценок и критериев проверки согласия. Данная программная система может
использоваться в научных и образовательных учреждениях, а также на
производственных предприятиях. Результаты работы докладывались более чем на
десяти конференциях, в том числе на 4-х международных. Часть полученных
результатов работы включена в 5 отчетов по НИР, по данной теме опубликовано 11
печатных работ, в том числе статья в “Сборнике научных трудов НГТУ” и 10 работ в
трудах и материалах конференций. Приняты в печать 5 работ, в том числе статья в
рецензируемый международный журнал “Communications in Statistics” и 4 работы в
сборники трудов конференций. Исследования и разработка программного обеспечения
проводились при поддержке студенческих грантов НГТУ (2010 и 2011 гг.), в рамках
выполнения работ по государственным контрактам № П1190 от 27 августа 2009 г., №
П2611 от 26 ноября 2009 г. и № П950 от 20 августа 2009 г.
Список использованных источников
1. Bagdonavicius V., Nikulin M. Accelerated life models: modeling and statistical
analysis // Boca Raton, Florida : Chapman & Hall/CRC, 2002. – 334 p.
2. Balakrishnan N., Chimitova E., Galanova N., Vedernikova M. Testing goodness-of-fit
of parametric AFT and PH models with residuals. // Communications in Statistics –
Simulation and Computation, Taylor & Francis (in press).
3. Barr D.M., Davidson T. A Kolmogorov-Smirnov test for censored samples //
Technometrics. – 1973. – Vol. 15. № 4.
4. Cox D.R., Roy J. Regression models and life tables (with disscusion) // Journal of the
Royal Statistical Society. – 1972. – Series B. Vol. 34. – P. 187-220.
5. Harrel F.E. Regression modeling with applications to linear models, logistic
regression, and survival analysis. // New York: Springer, – 2001.
6. Hjort N.L. On Inference in Parametric Survival Data // International Statistical
Review. – 1992. – V.60. № 3. – P. 355-387.
7. Kac M., Kiefer J. On tests of normality and other tests of goodness of fit based on
distance methods // Annals of Mathematical Statistics. – 1955. – Vol. 26. – P. 189–211.
6
8. Kalbfleisch J.D., Prentice R.L. The statistical analysis of failure time data // – New
York : John Wiley and Sons, Inc., 1980. – 439 p.
9. Kaplan E.L., Meier P. Nonparametric estimation from incomplete observations //
Journal of the American Statistical Association. – 1958. – Vol. 53. – P. 457-481.
10. Koziol J.A., Green S.B. A Cramer-von Mises statistic for randomly censored data //
Biometrika. – 1976. – Vol. 63. № 3. – P. 465-474.
11. Lawless J.F. Statistical models and methods for lifetime data // University of
Waterloo. – New Jersey: John Wiley and Sons, Inc., Hoboken, 2003. – 630 p.
12. Lemeshko B.Yu., Chimitova E.V., Kolesnikov S.S. Nonparametric goodnessof-fit
tests for discrete, grouped or censored data // ASMDA'2007 International Conference. Book
of Abstracts.
13. Meeker W.Q., Escobar L. Statistical Methods for Reliability Data // New York: John
Wiley and Sons. – 1998.
14. Nair V. Plots and tests for goodness of fit with randomly censored data // Biometrika.
– 1981. – Vol. 68. – P. 99-103.
15. Nikulin M., Lemeshko B., Chimitova E., Tsivinskaya A. Nonparametric goodness-offit tests for censored data // Proceedings of the 7th international conference on “Mathematical
methods in reliability”: Theory. Methods. Applications. – 2011. – P. 817-823.
16. Oakes D. Multiple time scales in survival analysis // Lifetime Data Analysis. – 1995. –
№1. – P. 7-18.
17. Prentice R.L. Exponential survivals with censoring and explanatory variables //
Biometrika. – 1973. – №60. – P. 279-288.
18. Reineke D., Crown J. Estimation of hazard, density and survival functions for
randomly censored data // Journal of Applied Statistics. – 2004. – Vol. 31. – № 10. – P. 12111225.
19. Schoenfeld D. Partial residuals for the proportional hazards regression model. //
Biometrika, – 1982. – Vol. 69. – P. 239-241.
20. Tsiatis A.A. A large sample study of Cox's regression model // Annals of Statistics. –
1981. – №9. – P. 93-108.
21. Therneau T.M., Grambsch P.M., and Fleming T.R. Martingale based residuals for
survival models. // Biometrika, – 1990. – Vol. 77. – P. 147-160.
22. Wolynetz M.S. Maximum likelihood estimation in a linear model from confined and
censored normal data / M.S. Wolynetz // Applied Statistics. – 1979. – №28. – P. 185-206.
23. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. – М.: Наука,
1983. – 416 с.
24. Лемешко Б.Ю., Лемешко С.Б., Постовалов С.Н., Чимитова Е.В. Статистический
анализ данных, моделирование и исследование вероятностных закономерностей.
Компьютерный подход : монография // Новосибирск : Изд-во НГТУ. – 2011. – 888 с.
25. Лемешко Б.Ю., Лемешко С.Б. Модели распределений статистик
непараметрических критериев согласия при проверке сложных гипотез с
использованием оценок максимального правдоподобия. Ч.I // Измерительная техника. –
2009. – № 6. – С.3-11.
26. Лемешко Б.Ю., Лемешко С.Б. Модели распределений статистик
непараметрических критериев согласия при проверке сложных гипотез с
использованием оценок максимального правдоподобия. Ч.II // Измерительная техника.
– 2009. – № 8. – С.17-26.
27. Лемешко Б.Ю., Чимитова Е.В., Плешкова Т.А. Проверка простых и сложных
гипотез о согласии по цензурированным выборкам // Научный вестник НГТУ. - 2010. № 4(41). – С.13-28.
7
8
Download