Грюнер Дмитрий Александрович

advertisement
На правах рукописи
Грюнер Дмитрий Александрович
УСТОЙЧИВОЕ ОЦЕНИВАНИЕ СТАТИСТИЧЕСКИХ МОДЕЛЕЙ ПРИ
РАСПРЕДЕЛЕНИИ НАБЛЮДЕНИЙ ПО ЗАКОНУ МИНИМАЛЬНЫХ
ЗНАЧЕНИЙ
05.13.17 – Теоретические основы информатики
Автореферат диссертации на соискание ученой степени
кандидата технических наук
Новосибирск – 2010
Работа выполнена в Государственном образовательном учреждении высшего
профессионального образования «Новосибирский государственный технический университет»
Научный руководитель:
доктор технических наук, доцент
Лисицин Даниил Валерьевич
Официальные оппоненты:
доктор технических наук, профессор
Хабаров Валерий Иванович
кандидат технических наук
Щеколдин Владислав Юрьевич
Ведущая организация:
Государственное образовательное учреждение
высшего
профессионального
образования
«Томский государственный университет систем
управления и радиоэлектроники», г. Томск
Защита состоится «23» декабря 2010 г. в 1600 часов на заседании диссертационного совета Д 212.173.06 при Государственном образовательном
учреждении высшего профессионального образования «Новосибирский
государственный технический университет» по адресу: 630092, г. Новосибирск,
пр. К. Маркса, 20.
С диссертацией можно ознакомиться в
государственного технического университета.
библиотеке
Новосибирского
Автореферат разослан «____» ноября 2010 г.
Ученый секретарь
диссертационного совета
Чубич В. М.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Одна из основных задач в анализе данных – оценивание статистических
моделей, описывающих определенные процессы или явления. В классических
методах оценивания постулируется некоторое гипотетическое модельное распределение. Наиболее часто встречается гауссово распределение, основанное
на центральной предельной теореме. На практике данное предположение достаточно часто нарушается, например, из-за наличия в выборке засоряющих
наблюдений, вызванных нарушением условий эксперимента или неверным
вводом данных. В результате данного нарушения статистические выводы могут
быть существенно искажены. Классические методы оценивания оказались
крайне неустойчивы даже при малых отклонениях распределения наблюдений
от модельного (Дж. Тьюки). В связи с этим встал вопрос об устойчивом оценивании параметров, что привело к развитию так называемых непараметрических
методов (Ф. П. Тарасенко, Ю. Н. Тюрин, Т. П. Хеттманспергер), свободных от
какого-либо модельного распределения.
Отказ от постулирования модельного распределения приводит, с одной
стороны, к возможности решать широкий класс задач, но, с другой стороны, мы
существенно теряем в эффективности найденных оценок. Кроме того, непараметрические методы обладают преимуществом перед параметрическими лишь
при резких отклонениях наблюдений от центральной части распределения, в
противном случае они проигрывают по точности последним. Как правило, по
результатам первичной обработки данных исследователь может выбрать определенное гипотетическое (модельное) распределение, которое разумно использовать при построении более эффективных оценок.
Следующим этапом развития устойчивого оценивания являются методы,
основанные на минимаксном принципе построения оценок для некоторого
множества возможных распределений, в том числе и робастные методы (П.
Хьюбер, С. А. Смоляк, Б. П. Титаренко, Б. Т. Поляк, Я. З. Цыпкин). Однако
предложенные подходы, как непараметрический, так и минимаксный, теряют
устойчивость при асимметричном засорении симметричных распределений.
Ф. Хампель ввел понятие функции влияния и предложил свой локальноустойчивый подход, который позволил выделить оценки, обладающие устойчивостью к асимметричному засорению данных. Но введенное им понятие Bробастности не приводит к устойчивости для данного вида засорения.
Исследованиями по проблеме робастности занимались также Дж. Пфанзагль (J. Pfanzagle), Л. Жакель (L. A. Jaeckel), Д. Эндрюс (D. F. Andrews), Б. Ю.
Лемешко, Л. Д. Мешалкин, В. П. Шуленин и многие другие ученые.
В теории надежности, анализе выживаемости часто используются статистические модели с распределением наблюдений по закону Вейбулла–Гнеденко
(Б. В. Гнеденко, Ю. К. Беляев, А. Д. Соловьев, Д. К. Ллойд, М. Липов). Для
оценивания параметров удобнее преобразовать модели, перейдя к логарифмам
наблюдения. При этом от распределения Вейбулла–Гнеденко переходим к распределению минимальных значений. Исследованию оценок параметров рас3
пределения Вейбулла–Гнеденко и экстремальных значений посвящено множество научных работ (K. Boudt, D. Caliskan, C. Croux, R. W. Berger, K. Lawrence,
R. Langlois, S. D. Dubey, T. Kernane, Z. A. Raizah, N. B. Marks, V. Niola, R.
Oliviero, G. Quaremba), в которых авторы используют оценки, не обладающие
свойством устойчивости к асимметричным засорениям. Асимптотическая эффективность этих оценок существенно ниже, чем у метода максимального
правдоподобия.
Предлагаемые в диссертационной работе методы основаны на подходе
А. М. Шурыгина, обеспечивающем локальную устойчивость оценок к широкому множеству асимметричных засорений асимметричного модельного распределения и высокую асимптотическую эффективность. Данный подход применяется впервые к оцениванию параметров распределения минимальных значений,
а также к оцениванию параметров регрессии в предположении распределения
остатков по закону минимальных значений.
Цель и задачи исследований. Основной целью диссертационной работы
является построение и исследование устойчивых оценок параметров статистических моделей с распределением наблюдений по закону минимальных значений при асимметричном засорении данных.
Для реализации цели исследования были поставлены и решены следующие
задачи:
1) конструирование устойчивых оценок;
2) теоретическое исследование построенных оценок;
3) экспериментальные исследования построенных оценок;
4) практическое применение построенных оценок.
Методы исследования. При решении поставленных задач использовался
аппарат теории вероятностей, методы математической статистики, математического анализа, вычислительной математики, статистического моделирования.
Научная новизна. Автором были получены следующие основные новые
результаты, которые выносятся на защиту:
– построены локально-устойчивые и стойкие оценки параметров сдвига и
масштаба;
– найдены локально-устойчивые и стойкие оценки параметров регрессионной модели;
– сформулирован и доказан ряд теорем, касающихся свойств локальноустойчивых и стойких оценок параметров сдвига и масштаба;
– разработано программное обеспечение робастного оценивания статистических моделей и численного исследования оценок;
– численно исследованы локально-устойчивые и стойкие оценки сдвига и
масштаба, выявлены области их превосходства над оценкой максимального
правдоподобия;
– численно исследованы устойчивые оценки параметров регрессионной
модели и масштаба, выявлены области их превосходства над оценкой максимального правдоподобия;
4
– найдены оценки параметров регрессионной модели стойкости сверл с
использованием локально-устойчивого оценивания;
– найдены оценки параметров сдвига и масштаба распределения времени
жизни мышей, облученных радиацией, с использованием локально-устойчивого
оценивания;
– проведено оценивание регрессионной модели времени пробоя электроизоляционной жидкости при помощи локально-устойчивых оценок.
Обоснованность и достоверность научных положений, рекомендаций и
выводов обеспечиваются:
– применением для исследования свойств рассматриваемых оценок аналитического аппарата математического анализа, математической статистики и
теории вероятностей;
– подтверждением аналитических выводов результатами испытаний с использованием статистического моделирования;
– решением прикладных задач.
Практическая ценность результатов:
– построенные оценки устойчивы к наличию выбросов в массиве данных,
к асимметричному засорению наблюдений, а также обладают высокой асимптотической эффективностью;
– созданное программное обеспечение позволяет эффективно производить
вычисление оценок линейных регрессионных моделей;
– полученные результаты исследований используются в учебном процессе
в рамках читаемого магистрантам курса «Современные проблемы прикладной
математики и информатики» (направление 010500 – «Прикладная математика и
информатика», специализация «Математическое и программное обеспечение
информационных технологий моделирования и анализа данных») на факультете прикладной математики и информатики Новосибирского государственного
технического университета (НГТУ), при проведении лекционных и практических занятий по курсу «Эконометрика» для студентов Омского юридического
института, а также при подготовке аспирантов Омской государственной медицинской академии (ОмГМА); регрессионная модель стойкости сверл используется в научно-исследовательских работах кафедры проектирования технологических машин НГТУ.
Апробация работы. Основные результаты диссертационной работы опубликованы в ряде статей, докладывались и обсуждались на следующих конференциях: VI International Symposium on Optimization and Statistics (India, Aligarh,
2008); Всероссийская научная конференция молодых ученых «Наука. Технологии. Инновации» (Новосибирск, 2009); X юбилейная окружная конференция
молодых ученых «Наука и инновация XXI века» (Сургут, 2009); V Международный научный конгресс «Роль бизнеса в трансформации российского общества – 2010» (секция «Актуальные проблемы высшей и прикладной математики», Москва, 2010); Российская научно-техническая конференция «Информатика и проблемы телекоммуникаций» (Новосибирск, 2010); региональная конференция молодых ученых «Современные проблемы математики и ее прикладные
5
аспекты» (Пермь, 2010), а также на научных семинарах кафедры прикладной
математики НГТУ.
Публикации. По теме диссертации опубликовано 7 основных работ, в том
числе: 2 – в ведущих научных журналах и изданиях, входящих в перечень, рекомендованный ВАК РФ, 3 – в сборниках научных трудов, 2 – в материалах
Российских конференций.
Структура работы. Диссертационная работа состоит из введения, четырех
глав основного содержания, заключения, списка использованных источников из
72 наименований и приложений. Общий объем диссертации составляет 159
страниц, включая 22 таблиц и 78 рисунков.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Глава 1. Обзор методов оценивания статистических моделей
Equation Chapter (Next) Section 1
В главе приводятся основные понятия, ставятся в математической форме
задачи, описывается современное состояние направления, связанного с проблемой робастности, проводится обзор подходов к ее решению и обосновываются
задачи исследований.
Основные понятия. Пусть x1,..., xm – наблюдения случайной величины  ,
имеющей плотность распределения f ( x, ) , где x  X  R и параметр
   R .
М-оценка (П. Хьюбер, 1984) параметра  определяется следующим образом:
m
)
(1.1)
  arg min  M ( xi , )
 i 1
где M ( x, ) : X    R – непрерывная, дифференцируемая почти всюду
функция, которая называется функцией потерь. Оценочным уравнением называется необходимое условие минимума в выражении (1.1):
m
)
 ( xi , )  0 ,
i 1
где функция  ( x, )  M&( x, ) является оценочной функцией, определенной с
точностью до не зависящего от x множителя (здесь и ниже точкой сверху будем
обозначать дифференцирование по параметру θ).
Условие асимптотической несмещенности
E ( x, )    ( x, ) f ( x, )dx  0 ,
(1.2)
X
где E – оператор математического ожидания (по модельной плотности), является необходимым условием состоятельности оценок (А. А. Боровков, 1997).
Асимптотической дисперсией оценки (1.1) называется величина
6
V  , f   E 2  x,  N 2  , f  ,
где N ( , f )    ( x, ) f&( x, )dx    &( x, ) f ( x, )dx представляет собой
X
X
нормирующий множитель соответствующей оценочной функции. Будем называть оценочную функцию нормированной, если N  , f   1.
Пусть реальное распределение наблюдений является α-засоренным с плотностью f ( x, )  1    f  x,     x  y  , где 0 ≤ α < 1 – уровень засорения, δ
– функция Дирака, которая моделирует аномальное наблюдение y с засоряющей плотностью s (y, θ) (байесовское точечное засорение).
При наличии засорения оценка становится асимптотически смещенной,
асимптотическое смещение при некоторых условиях регулярности, малом
уровне
засорения
и
фиксированном
значении
y
равно
  , f , y,     IF  y, , f  , где IF  x, , f     x,  N  , f  – функция
влияния по Хампелю (Ф. Хампель, 1989).
Элементы теории локально-устойчивого оценивания. Квадрат евклидовой нормы функции влияния определяется функционалом вида (А. М. Шурыгин, 2000)
(1.3)
W ( , f )   2 ( x, )dx N 2 ( , f ) ,

X
и называется неустойчивостью оценки.
При использовании s (y,θ) = 1 приходим к максимально неопределенному
байесовскому точечному засорению (Д. В. Лисицин, К.В. Гаврилов, 2006) и
критерию (1.3) как математическому ожиданию квадрата функции влияния.
При минимизации функционала (1.3) по аргументу  получаем оценку
максимальной устойчивости (ОМУ) (А. М. Шурыгин, 2000) с оценочной функцией
 

 OMU ( x, )  c  ln f ( x, )    f ( x, ) ,
 

(1.4)
где    ( ) находится из условия асимптотической несмещенности (1.2),
c  c( ) – ненулевая функция параметра.
Устойчивостью оценки (А. М. Шурыгин, 2000) называется относительная
характеристика stb   W ( OMU , f ) W ( , f ) , определенная по аналогии с
эффективностью
eff   V ( OMP , f ) V ( , f ) , где  OMP ( x, ) 
 c f&( x, ) f ( x, ) – оценочная функция оценки максимального правдоподобия
(ОМП) (А. А. Боровков, 1997).
Условно-оптимальное семейство (ОУО) оценок (А. М. Шурыгин, 2000)
определяется оценочной функцией
7
1
 
 
 
(1.5)
 OUO ( x, )  c  ln f ( x, )    1 
 ,   0,


f
(
x
,

)

 

где константы c и  имеют тот же смысл, что и в (1.4). Данное семейство позволяет достичь минимума неустойчивости при фиксированном значении
асимптотической дисперсии и одновременно минимума асимптотической дисперсии при фиксированном значении неустойчивости. Параметр  в (1.5) позволяет изменять значения эффективности и устойчивости оценок. При значении
  0 получаем ОМП, при значении   VOMP WOMU – компромиссную оценку (ОК), при    имеем ОМУ. Условно-оптимальная оценка, для которой
выполняется условие eff   stb  , называется равнооптимальной (ОРО) (Д.
В. Лисицин, К. В. Гаврилов, 2006).
Помимо условно-оптимального семейства целесообразно рассматривать
семейство обобщенных радикальных оценок (ООР), которое предложил Л. Д.
Мешалкин для случая нормального распределения данных, с оценочной функцией



(1.6)
 OOR ( x, )  c  ln f ( x, )    f  ( x, ) , 0    1 ,
 

где  – представляет собой параметр радикальности, c и  определяются
так же, как и в (1.4). Обобщенная радикальная оценка при значении параметра
радикальности   1 2 называется радикальной (ОР) (А. М. Шурыгин, 2000).
Теория стойких оценок. Рассмотрим ситуацию, когда засоряющая плотность s (y, θ) принадлежит к классу модельных плотностей F.
Показатель неустойчивости оценки в этом случае определяется формулой
(А. М. Шурыгин, 2000):
U s ( , f )    2 ( x, ) s  x,  dx N 2 ( , f ) .
X
На практике засоряющая плотность s(x,θ) неизвестна. Один из подходов к
решению данной проблемы – использование максиминной формулировки
(А. М. Шурыгин, 2000):
(1.7)
s *  x,   arg max min U s  , f  .
sS 
При совпадении множества S с множеством модельных плотностей F соответствующая оптимальная оценка называется стойкой (А. М. Шурыгин,
2000).
В качестве засоряющей плотности рассмотрим семейство
(1.8)
s( x, s ,s )  f ( x,    , /  )
с параметрами сдвига s     и масштаба  s   /  , где δ – сдвиг засоряющей плотности относительно модельной, γ – отношение масштаба модельной
плотности к засоряющей. Требуется найти параметры γ* и δ* как решение задачи (1.7).
8
Оптимальной при засоряющей плотности (1.7) оценке, которую будем
называть стойкой оценкой максимальной устойчивости (СОМУ), соответствует оценочная функция
 
 f ( x, )
 SOMU ( x, )  c  ln f ( x, )   
,
 
 s *  x , 
(1.9)
где    ( ) определяется из условия асимптотической несмещенности (1.2),
c  c( ) – ненулевая функция параметра.
Стойкостью
оценки
назовем
относительную
характеристику
stk  U s* ( SOMU , f ) U s* ( , f ) , которая введена аналогично устойчивости
и эффективности.
Функционал, оптимизируемый при построении оценки, может иметь компромиссный вид, учитывающий как асимптотическую дисперсию, так и неустойчивость (А. М. Шурыгин, 2000, Д. В. Лисицин, 2009):
Ws*  , f ,    V  , f   U s*  , f  ,
где   0 – параметр компромисса. Его минимизация по оценочной функции
при s  x,   s *  x,  приводит к семейству стойких условно-оптимальных
оценок (СОУО). Оптимальное решение имеет вид (Д. В. Лисицин, 2009):
f ( x, )
 

ln f  x,    
,   0,
 
 f ( x, )   s *  x, 
 SOUO  x,   c 
(1.10)
где константы c и β имеют тот же смысл, что и в (1.9), и обеспечивают минимальную неустойчивость при фиксированной асимптотической дисперсии и
одновременно минимальную асимптотическую дисперсию при фиксированной
неустойчивости. Параметр λ в (1.10) позволяет изменять значения неустойчивости и асимптотической дисперсии оценок. Так, при λ = 0 получаем ОМП, при
  V ( OMP , f ) U s*( SOMU , f ) – компромиссную стойкую оценку (СОК), при
   – СОМУ. Условно-оптимальную стойкую оценку, удовлетворяющую
условию eff   stk  , назовем стойкой равнооптимальной (СОРО).
Обоснование задач исследований:
 теория робастности находится в стадии активного развития;
 классические подходы к проблеме устойчивости приводят к неустойчивым
решениям при асимметричном засорении;
 подход А. М. Шурыгина применен лишь к относительно небольшому числу статистических моделей;
 применяющиеся методы оценивания параметров распределений Вейбулла–
Гнеденко и минимальных значений в теории надежности (анализе выживаемости) не обладают свойством устойчивости к произвольным асимметричным видам засорений.
9
Глава 2. Построение и исследование устойчивых оценок
Equation Section (Next)
В данной главе рассматривается построение и исследование локальноустойчивых и стойких оценок параметров сдвига и масштаба распределения
минимальных значений с плотностью вида
y  
(2.1)
f  y,  ,   exp  y      e
,


где θ – параметр масштаба, μ – параметр сдвига.
Полученные оценки сдвига обобщены на случай оценивания параметров
регрессии с распределением отклика по закону минимальных значений:
f  yi , i ,   exp
 y      e
i
i
yi  i  
  , i = 1,…, m,
(2.2)
k
где θ – оцениваемый параметр масштаба, i  b0   b j x ji , i = 1,…,m – значеj 1
ние параметра сдвига, bj, j = 0,…,k – оцениваемые параметры регрессии, x ji –
значение j-го неслучайного фактора при i-м наблюдении, k – количество факторов.
Постановка задачи вида (2.2) соотносится с классической постановкой регрессионного анализа следующим образом:
yi  ( i   )  %i , i = 1,…,m,
(2.3)
где γ – постоянная Эйлера, %
i     i , εi – случайная величина, распределенная по закону минимальных значений (2.1) с нулевым сдвигом и параметром
масштаба θ. Для модели (2.3) выполняются основные предпосылки регрессионного анализа: независимость случайных величин %i , E%
i    6 ,
i  0 , D%
где D – дисперсия.
Получены следующие основные результаты.
Локально-устойчивые оценки сдвига. Параметр λ семейства ОУО (1.5)
для плотности (2.1) зависит от масштаба θ: λ = λ0 / θ, где λ0 ≥ 0. В дальнейшем
под значением λ будем понимать значение λ0, которое не зависит от параметра
масштаба θ.
Теорема 1. Семейства условно-оптимальных и обобщенных радикальных оценок параметра сдвига для плотности распределения (2.1) определяются соответствующими оценочными функциями:
2
f ( y ,  , )
e( y   )/  1
,  0,


f ( y,  , )   / 
c
 OOR ( y,  , )   e( y   )/  1 f  ( y,  , ) , 0    1 .

 OUO ( y,  , ) 
c
(2.4)
(2.5)
Теорема 2. Неустойчивости для ОУО и ООР параметра сдвига плотности распределения (2.1) имеют соответственно вид
10
2
W  OUO , f    3 D    DN
  ,
где D    


 z  12
z
0
f02
dz , DN    
 f0   
W  OOR , f    3 B   
2
где BN         1


 z  12
z
0
f02
dz ,
f0  
2
BN
  ,
   1  2 , B       2   2  2 1 ,
f0 ( z )  ze z , Г(z) – гамма-функция.
Теорема 3. Асимптотические дисперсии для ОУО и ООР параметра сдвига
плотности распределения (2.1) определяются соответственно:
2
V  OUO , f    2 DE    DN
  ,
где DE    


 z  12
f03
dz , а DN    определяется в теореме 2,
 f0   
2
V  OOR , f    2 BE    BN
  ,
2  1
где BE       2  1  2  1
, а BN    определяется в теореме 2.
0
2
z
На рис. 2.1 представлены некоторые оценочные функции семейств ОУО
(2.4) и ООР (2.5) при θ = 1, μ = 0. Рис. 2.2 демонстрирует зависимости устойчивости и эффективности ОУО для сдвига плотности (2.1) от параметра λ.
4
1.2
omp ( y ) 2.8
1
oro ( y )
1.6
stb (  ) 0.8
0.4
eff (  ) 0.6
 0.8
0.4
or ( y )
omu ( y )
2
4
2
0
2
4
Рис. 2.1. Графики оценочных
функy
ций семейств ОУО и ООР
y
0.2
λ
Рис. 2.2. Графики зависимости
stb и

eff для ОУО
0
0.1
0.2
0.3
0.4
Приведем характеристики ряда оценочных функций семейства (2.4) в формате λ (eff; stb): ОМП – 0 (100 %; 0 %), ОРО – 0,0728 (84,1 %; 84,1 %), ОК –
0,125 (80 %; 90,2 %) и ОМУ – ∞ (63,3 %; 100 %). Для оценочной функции ОР
семейства (2.5) имеем – 0,5 (82,7 %; 82,7 %).
Стойкие оценки сдвига. Основные характеристики стойких оценок сдвига
представлены следующими теоремами. Максиминные значения параметров γ и
δ приближенно равны γ* ≈ 1 и δ* ≈ 0,693∙θ.
11
Теорема 4. Семейство стойких условно-оптимальных оценок для параметра
сдвига плотности (2.1) определяется оценочной функцией


 e y    /     *,  * / ,    f  y,  , 
1
c 

,
 SOUO  y,  , ,   

f  y,  ,    f  y,    *, /  *

z 2 e 2 z

z
  / e z e /
0 ze   z e
где 1   ,  /  ,   

ze2 z

dz
,   0.
dz
 e /

z



/


z
e
0 ze   z e
Для СОУО были получены формулы асимптотической дисперсии и неустойчивости. Приведем характеристики конкретных оценочных функций
СОУО в формате λ (eff; stk): ОМП – 0 (100 %; 33,8 %), СОРО – 0,428 (86 %;
86 %), СОК – 0,593 (83,2 %; 89,4 %) и СОМУ – ∞ (63,3 %; 100 %).
Локально-устойчивые оценки масштаба. При оценивании параметра
масштаба плотность (2.1) удобно преобразовать к виду


f ( y, )  g  y   /   e y  exp  e y  /  ,
(2.6)
где θ параметр масштаба, переменная y имеет смысл остатка.
Теорема 5. Семейства условно-оптимальных и обобщенных радикальных оценок параметра масштаба для плотности распределения (2.6) определяются соответствующими оценочными функциями:
c  E1    y
y   gy 
,   0,

1

e


  E0    
g
y








ln z 1  z   g02  z 
g02  z 
dz , E1     
dz ,
где E0     
z ( g0  z    )
z
g0  z   

 OUO  y, ,   
0

(2.7)
0
g0  z   ze z ,
c 
1
y



 OOR  y, ,      1 
 1  e y   g   y   , 0    1.

 1    

(2.8)
Теорема 6. Неустойчивости ОУО и ООР параметра масштаба для плотности
распределения (2.6) имеют вид соответственно:
2
 E1    
E1   
J1     J 2   

 J0    2
E

E





0
0

W  OUO , f    3 
,
2
2
 E1   

 E2    

 E0   



12
где E0    , E1    определяются в теореме 5.

g02  z 
E2      ln z 1  z  
dz
z
g
z






0
0
2

2

,
,
0
1  g0  z  
J1      ln z 1  z  
 dz , J 2    
z  g0  z    
0
2
1  g0  z  
J0     
 dz
z  g0  z    



2
1  g0  z  
ln z 1  z   
 dz ,
z  g0  z    
2
 3 G0     2 1    G1     1    G2    
2
W  OOR , f  

,
 F0      2    F1     1    F2    

 1 
   
g10 
   
g0
где F0     
, F1      ln z 1  z 
,
dz  
dz 
2 
1 
z
z
1   
1   
0
0
F2    

  ln z 1  z  
2
g10 
dz
z
2
0

G0    
,
  2 
g02
G1      ln z 1  z 
dz  
, G2    
2 1
z
2

 
0


0

  2 
g02
dz 
z
 2  2 
  ln z 1  z  
2
0
,
g02
dz .
z
Теорема 7. Асимптотические дисперсии ОУО и ООР для масштаба плотности
распределения (2.6) имеют вид соответственно:
2
 E1    
 E1    
K


2



 0

 K1     K 2   
E

E





0

 0

V  OUO , f    2 
,
2
2
 E1   

 E2    

 E0   



g03  z 
g03  z 
dz , K1      ln z 1  z 
dz ,
где K 0     
2
2
z  g0  z    
0 z  g0  z    
0

K 2      ln z 1  z  
2
0
V  OOR , f   
g03  z 
z  g0  z    
2
dz ,
H 0     2 1    H1     1    H 2   
2
2
 F0      2    F1     1    F2    
13
2
,
где H 0    



0

g02 1  z 
g02 1  z 
dz , H1      ln z 1  z 
dz ,
z
z
H 2      ln z 1  z  
2 1
2 g0
z
0
0
 z  dz .
На рис. 2.3 представлены некоторые оценочные функции параметра масштаба семейств ОУО (2.7) и ООР (2.8). Рис. 2.4 демонстрирует зависимости
устойчивости и эффективности ОУО для параметра масштаба от параметра λ.
4
1
omp ( y )
oro ( y )
0.8
2
stb (  ) 0.6
or ( y )
eff (  ) 0.4
omu ( y ) 0
0.2
2
8
6
4
2
0
Рис. 2.3. Графики оценочных
y
семейств ОУО и ООР
0
λ
y
0
0.1
0.2
stb и
функций Рис. 2.4. Графики зависимости

eff для ОУО
2
4
Приведем характеристики для некоторых оценочных функций семейства
(2.7) в формате λ (eff; stb): ОМП – 0 (100 %; 0 %), ОРО – 0,04 (73 %; 73 %), ОК
– 0,065 (67,9 %; 80,8 %) и ОМУ – ∞ (43 %; 100 %). Для оценочной функции ОР
семейства (2.8) имеем – 0,5 (70,1 %; 70,1 %).
Стойкие оценки масштаба. Ниже рассматриваются стойкие оценки масштаба и их основные характеристики. Максиминные значения параметров γ и δ
приближенно равны γ* ≈ 0,5813 и δ* ≈ 0,1246 ∙ θ.
Теорема 8. Семейство стойких условно-оптимальных оценок для масштаба
плотности распределения (2.6) определяется следующей оценочной функцией:


c
y



*,

*
/

,


1  e y /  f ( y, )


1




 SOUO  y, ,    
,
f ( y, )   f  y   *, /  *


где
  
1   , ,   
  
ln z 1  z  ze2 z



0

 
ze z   z e  e z e


ze
dz
,   0.
2 z



0

 
ze z   z e  e z e
14
dz
(2.9)
Для СОУО были получены формулы асимптотической дисперсии и неустойчивости. Приведем характеристики конкретных оценочных функций
СОУО (2.9) в формате λ (eff; stk): ОМП – 0 (100 %; 4,47 %), СОРО – 0,321
(83,7 %; 83,7 %), СОК – 0,498 (80,0 %; 88,7 %) и СОМУ – ∞ (60,3 %; 100 %).
Выводы. Построенные оценочные функции позволяют в значительной
степени обеспечить и эффективность, и устойчивость оцениваемых параметров.
Анализ графиков зависимости эффективности и устойчивости оценок от параметра λ показывает, что устойчивость рассматриваемых семейств при увеличении параметра λ в начале диапазона его значений, возрастает быстрее, чем убывает эффективность. Это обстоятельство является аргументом в пользу использования локально-устойчивых методов, даже если реальным распределением
наблюдений окажется «чистое» модельное. При этом более привлекательным
представляется семейство ОУО и в частности ОРО, имеющая для параметра
сдвига stb = eff ≈ 84,1 %, для параметра масштаба stb = eff ≈ 73 %. Однако следует отметить, что в вычислительным аспекте весьма привлекательной выглядит ООР.
Стойкие оценки параметров проигрывают по точности оценке максимального правдоподобия, но обладают свойством робастности. Однако, для параметра сдвига стойкие оценки оказываются недостаточно устойчивыми при засорении слева от центра, более того, они проигрывают по устойчивости ОМП.
Глава 3. Экспериментальные исследования оценок
Equation Section (Next)
Целью исследования является выявление свойств предложенных устойчивых оценок в условиях засорения распределения, а также сравнение устойчивых оценок с ОМП.
Засоренное распределение представляется собой смесь модельного и засоряющего распределений.
Исследование проведено методом Монте-Карло. Для определения качества
оценивания использовались среднее значение оценки и среднеквадратическая
ошибка (СКО)
2
) m% )
%,
D    i    m
i 1
% – число испытаний в методе Монте-Карло,  – истинное значение парагде m
)
метра,  i – значение оценки в i -м испытании. Также использовался показатель
относительного СКО (ОСКО)
)
) )
RaD  D D OMP .
% 5000 . Значения параметров
В исследовании использовалось значение m
были равны   1/ 2 и   1 . Основное внимание уделено случаю, когда число
наблюдений m  200 , уровень засорения   0,1 .
Рассматривается случай, когда засорение сосредоточено в точке z * , которая определяется как z*  z     , где z – параметр, имеющий смысл точки за-
15
сорения в модели стандартного распределения с параметрами   0 и   1 .
Параметр z меняется в диапазоне от –5 до 3.
На рис. 3.1 и 3.2 приведены соответственно средние значения и СКО оценок сдвига при изменении точки засорения ( = 0,1, m= 200).
1,2
ОМП
ОРО
ОР
ОМУ
1,15
0,03
СКО
1,1
Среднее
0,04
ОМП
ОРО
ОР
ОМУ
1,05
0,02
1
0,01
0,95
0,9
0
z
z
-5 -4 -3 -2 -1 0 1 2 3
z для точечного
Рис. 3.2. СКО оценок
-5 -4 -3 -2 -1 0 1 2 3
z
Рис. 3.1. Средние значения
оценок
для точечного засорения при измене- засорения при изменении точки засонии точки засорения ( = 0,1, m= 200) рения ( = 0,1, m = 200)
Анализ рис. 3.1 и 3.2 показывает, что качество ОМП немного выше, чем у
устойчивых оценок, при значениях параметра z примерно от –2,5 до 1,5 и существенно ниже при других значениях z.
На рис. 3.3, 3.4 приведены соответственно средние значения и СКО оценок
масштаба при изменении точки засорения ( = 0,1, m = 200).
ОМП
ОРО
ОР
ОМУ
0,8
0,7
0,06
0,04
СКО
Среднее
ОМП
ОРО
ОР
ОМУ
0,6
0,02
0,5
0,4
-8
-6
-4
-2
0
2
4
z
Рис. 3.3. Средние значения оценок
0
z
-8
-6
-4
-2
z
0
2
4
Рис. 3.4. СКО оценокz для точечного
для точечного засорения при измене- засорения при изменении точки засонии точки засорения ( = 0,1, m= 200) рения ( = 0,1, m = 200)
Рис. 3.3 и 3.4 демонстрируют неустойчивость ОМП при засорении как слева (при z  4 ), так и справа (при z  2 ) от центра распределения, что соответствует теоретическим свойствам. ОМП имеет преимущество лишь при значе16
ниях параметра z от –3,5 до 1,75, в любой другой точке засорения ОМП проигрывает устойчивым оценкам.
На рис. 3.5, 3.6 приведены значения СКО локально-устойчивых оценок
сдвига при изменении объема выборки (случай   0,1 , z = – 4) и уровня засорения (случай m = 200, z = – 4) соответственно.
0,02
0,01
ОМП
ОРО
ОР
ОМУ
0,006
0,015
СКО
СКО
0,008
ОМП
ОРО
ОР
ОМУ
0,004
0,01
0,005
0,002
0
α
0
m
0
0
200 400 600 800 1000
Рис. 3.5. СКО оценок сдвига
для точечm
ного засорения в зависимости от объема выборки при α = 0,1, z = – 4
0,1
0,2
0,3
α
Рис. 3.6. СКО оценок сдвига
для точечного засорения в зависимости от
уровня засорения при m = 200, z = – 4
Анализируя рис. 3.5 приходим к заключению об уменьшении СКО оценок
при увеличении объема выборки.
Рис. 3.6 показывает, что ОМП по качеству превосходит устойчивые оценки
лишь при небольших уровнях засорения (α < 0,04), при больших уровнях засорения преимущество имеют устойчивые оценки.
Аналогичные исследования проведены для стойких оценок. Также исследованы локально-устойчивые и стойкие оценки параметров сдвига и масштаба
при равномерной и модельной (со значениями параметров, отличающимися от
истинных) засоряющих плотностях. Кроме того, исследованы локальноустойчивые оценки параметров регрессии при точечном и равномерном засорениях.
Выводы. В результате исследования выявлено, что если засоряющие
наблюдения сосредоточены главным образом в центральной части распределения, то качество устойчивых оценок ниже, чем у ОМП. Если засоряющие
наблюдения попадают, в том числе, и в хвосты распределения, качество устойчивых оценок может быть существенно выше, причем выигрыш появляется уже
при небольших уровнях засорения (выше 0,02 – 0,04). С увеличением объема
выборки качество оценок возрастает.
Однако стойкие оценки параметра сдвига являются недостаточно устойчивыми при засорении слева от центра, в частности, они проигрывают ОМП.
17
Глава 4. Решение прикладных задач
Equation Section (Next)
В данной главе рассмотрено несколько примеров из практики с реальными
данными.
Исследование стойкости сверл. Рассмотрим пример из области теории
надежности. Изучается регрессионная зависимость стойкости сверла Y (время
жизни сверла в мм) от двух факторов – частота вращения n (об/мин) и подача
на оборот S (мм/об). Имеется m = 50 наблюдений.
Регрессионная модель является квадратичной без взаимодействия факторов (В. С. Карманов, 2006). Требуется оценить параметры модели. Для решения
задачи использовались МНК-оценки, ОМП, ОРО, ОР и ОМУ в предположении,
что ошибки наблюдений имеют распределение минимальных значений. Целью
исследования является сравнение вышеперечисленных оценок.
В таблице 4.1 приведены значения оценок дисперсии наблюдений, асимптотической дисперсии сдвига (АДС), энтропийного значения погрешности Δ (П.
В. Новицкий, И. А. Зограф, 1991). Если не учитывать факт оценивания параметра масштаба, то получаемая АДC является коэффициентом пропорциональности асимптотических ковариационных матриц оценок параметров регрессии.
Согласно приведенным показателям робастные оценки значительно выигрывают как у оценки МНК, так и у ОМП.
Таблица 4.1
Показатели
Дисперсия
МНК
ОМП
ОРО
ОР
ОМУ
0,600678
0,626946
0,310199
0,262574
0,02678
%
100,0
104,4
51,6
43,7
4,5
АДC
0,600678
0,381137
0,224229
0,19292
0,025727
%
100,0
63,5
37,3
32,1
4,3
Δ
1,876146
1,494467
1,051215
0,967157
0,308871
%
100,0
79,7
56,0
51,6
16,5
Значения показателей в процентах указаны относительно соответствующих показателей для оценки МНК.
Также были найдены оценки параметров сдвига и масштаба распределения
времени жизни мышей, облученных радиацией, с использованием локальноустойчивого оценивания; проведено локально-устойчивое оценивание регрессионной модели времени пробоя электроизоляционной жидкости.
ЗАКЛЮЧЕНИЕ
В соответствии с поставленными целями исследований получены следующие основные результаты.
Теоретические результаты:
1) построены локально-устойчивые и стойкие оценки параметров сдвига и
масштаба;
2) сконструированы локально-устойчивые и стойкие оценки параметров регрессионной модели;
18
3) сформулирован и доказан ряд теорем, касающихся свойств локальноустойчивых и стойких оценок параметров сдвига и масштаба.
Экспериментальные результаты:
4) методом статистических испытаний исследованы локально-устойчивые и
стойкие оценки сдвига и масштаба, выявлены области превосходства над
оценкой максимального правдоподобия;
5) методом статистических испытаний исследованы параметры регрессионной модели и масштаба, выявлены диапазоны проигрыша/выигрыша
оценки максимального правдоподобия.
Прикладные результаты:
6) разработано программное обеспечение робастного оценивания статистических моделей и численного исследования оценок;
7) найдены оценки параметров регрессионной модели стойкости сверл с использованием локально-устойчивого оценивания;
8) найдены оценки параметров сдвига и масштаба распределения времени
жизни мышей, облученных радиацией, с использованием локальноустойчивого оценивания;
9) проведено локально-устойчивое оценивание регрессионной модели времени пробоя электроизоляционной жидкости.
Основные результаты диссертации опубликованы в следующих работах:
1. Грюнер Д. А. Исследование устойчивых оценок параметров распределения минимальных значений при модельном засорении данных / Д. А.
Грюнер, Д. В. Лисицин // Материалы Российской науч.-техн. конф. «Информатика и проблемы телекоммуникаций». – Новосибирск : СиБГУТИ,
2010. – Т. 1. – С. 49–52.
2. Грюнер Д. А. Исследование устойчивых оценок параметров регрессии
с ошибками, имеющими распределение минимальных значений / Д. А.
Грюнер // Сборник научных трудов НГТУ. – Новосибирск : Изд-во НГТУ,
2010. – № 2 (60). – С. 33–38.
3. Грюнер Д. А. Устойчивое оценивание параметра сдвига распределения
минимальных значений / Д. А. Грюнер // Материалы Всерос. науч. конф.
молодых ученых «Наука. Технологии. Инновации». – Новосибирск : Издво НГТУ, 2009. – Ч. 1. – С. 14–16.
4. Лисицин Д. В. Исследование стойких оценок параметров распределения минимального значения / Д. В. Лисицин, Д. А. Грюнер // Доклады АН
ВШ РФ. – Новосибирск : НГТУ, 2010. – № 1 (14). – С. 6–17 (из перечня
ВАК).
5. Лисицин Д. В. Исследование устойчивых оценок параметров распределения минимальных значений / Д. В. Лисицин, Д. А. Грюнер // Научный вестник НГТУ. – Новосибирск : НГТУ, 2010. – № 2. – С. 21–30 (из
перечня ВАК).
19
6. Лисицин Д. В. Стойкие оценки параметров распределения минимальных значений / Д. В. Лисицин, Д. А. Грюнер // Сборник научных трудов
НГТУ. – Новосибирск : НГТУ, 2010. – № 1 (59). – С. 63–68.
7. Лисицин Д. В. Условно оптимальные и обобщенные радикальные
оценки параметров распределения минимальных значений /
Д. В. Лисицин, Д. А. Грюнер // Сборник научных трудов НГТУ. – Новосибирск : НГТУ, 2010. – № 1 (59). – С. 55–62.
20
Отпечатано в типографии
Новосибирского государственного технического университета
630092, г. Новосибирск, пр. К. Маркса, 20,
тел./факс (383) 346-08-57
формат 60х84/16, объем 1.5 п.л., тираж 100 экз.,
заказ №____ , подписано в печать ___.11.10 г.
21
Download