МОРФ

advertisement
Министерство образования и науки РФ
Новосибирский Государственный
Технический Университет
Расчетно-графическое задание
по курсу: «Математическая статистика»
Факультет:
Группа:
Студент:
Преподаватель:
Вариант: 2
Часть 1
ПМИ
ПМ-22
Бондарева И. В.
Постовалов С. Н.
Новосибирск
2005
Задание:
Пусть X 1 , X 2 ,..., X n - выборка из отрицательного биномиального распределения.
1. Найти точечную оценку неизвестного параметра θ (или некоторой функции τ(θ)) по
методу моментов или по методу максимального правдоподобия. Проверить полученную
оценку на несмещённость, состоятельность и эффективность.
2. Найти достаточную статистику.
3. Найти функцию τ(θ), допускающую эффективную оценку.
4. Построить точный доверительный интервал.
5. Построить асимптотический доверительный интервал.
Решение:
Имеется выборка X 1 , X 2 ,..., X n , X i  Bi (m, ) .
P{X i  k}  Cmk k 1 m (1   ) k , k  0, m ,
m(1   )
m(1   )
MX i 
, DX i 
.

2
Найдем точечную оценку функции  ( ) 
1
, используя метод максимального

правдоподобия: точка параметрического множества , в которой функция максимального
1.
n
L( X n ,  )   f ( X i ,  )
правдоподобия
достигает
наибольшего
значения:
i 1
L( X n , )  sup L( X n ,  ) , называется оценкой максимального правдоподобия параметра θ.
Из условия нашей задачи имеем:
n
n
n
i 1
i 1
 Xi
L( X n ,  )   P{ X i  xi }  [ CmXi X i 1 ] *  m n * (1   ) i 1 ,
n
ln L( X n , )  ln(  C mXi X i 1 )  nm * ln(  )  n X * ln( 1   ) ,
i 1
 ln L( X n ,  ) nm n X
1 m X
.


 0 , откуда получаем  ( )  

 1

m
Проверим знак второй производной при таком значении оценки:
 2 ln L( X n , )
mn
nX
, подставим вместо θ значение, выраженное из оценки
 2 
2


(1   )2
1
m
 ( )  ,  
, получим:

m X
2
2
m  X   0 ,
 2 ln L( X n ,  )
n
n
m X 
m X 


mn

nX


m

X

m

X


n




 m 
 X 
 2
m
X
mX




значит, данная точка является точкой максимума для функции максимального
правдоподобия.
Для дальнейших рассуждений нам понадобится знать распределение случайной величины
1 n
X   X i . Для этого воспользуемся связью отрицательного биномиального
n i 1
распределения с геометрическим: сумма m независимых случайных величин,
распределённых геометрически является случайной величиной с распределением Bi ( m,  ) .
2
2
3
n
Тогда величину
X
i 1
i
можно трактовать как сумму из m*n случайных величин,
распределённых геометрически, значит ее распределение Bi ( mn,  ) .
Проверим τ(θ) на несмещённость: оценка θ несмещённая, если M   .
X
1
1 1
m X 

 n

1
M M

M
1


1

M
Xi   1
 , оценка несмещённая.





m
nm  i 1 


 
 m 

Проверим τ(θ) на состоятельность, используя критерий состоятельности: оценка θ
состоятельная, если lim M    , lim D  0 .
n 
1 1
lim M    ,
n 
  
состоятельная.
n
m X
1
lim D    lim D 
n 
   n  m
X
1
1


D 1    lim 2 2 nm 2  0 ,
  lim
m  n m n

 n 
оценка
Проверим τ(θ) на эффективность, используя неравенство Рао-Крамера: оценка, для которой
[ `( )]2
достигается нижняя граница неравенства D[T ( X n )] 
, где i(θ) – информационное
ni( )
количество Фишера, называется эффективной.
Чтобы найти информационное количество Фишера, воспользуемся формулой:
DU ( X n , )  ni ( ) .
n
ln L( X n , )  ln(  C mXi X i 1 )  nm * ln(  )  n X * ln( 1   ) ,
i 1
 ln L( X n ,  ) nm n X
.



 1
2
 nm n X   nm 
1 nm(1   ) nm[nm(1   )  1]
Получим: ni ( )  D 
,



 
 
2
2
2

1



(1


)


(1


)




2
 1 
2
 2
1 1
[ `( )]
1
 
D[T ( X n )] 


,
, нижняя граница
2
nm[nm(1   )  1] nm[nm(1   )  1]
mn  2
ni ( )
 2 (1   )
неравенства не достигнута, оценка не эффективная.
U ( X n , ) 
2.
Для нахождения достаточной статистики воспользуемся критерием факторизации:
чтобы статистика T ( X n ) была достаточной для θ, необходимо и достаточно, чтобы функция
правдоподобия имела вид L( X n , )  g (T ( X n ); ) * h( X n ) .
n
n
n
i 1
i 1
 Xi
L( X n ,  )   P{ X i  xi }  [ CmXi X i 1 ] *  m n * (1   ) i 1 .
Для нашей задачи получаем:
n
h( X n )  [ C mXi X i 1 ] , g (T ( X n ); )   mn * (1   ) T ( X n ) ,
i 1
n
где T ( X n )   X i  n X - достаточная статистика.
i 1
3.
Для нахождения функции τ(θ), допускающей эффективную оценку, воспользуемся
критерием эффективности (см. п.1.). Для нашей задачи получаем:
n
ln L( X n , )  ln(  C mXi X i 1 )  nm * ln(  )  n X * ln( 1   ) ,
i 1
 ln L( X n ,  ) nm n X
1
nm  n X ,
, откуда получаем (1   )U ( X n ,  ) 




 1
 1
1
1
 1
1
U ( X n , )  X 
, где a ( ) 
, а T ( X n )  X - эффективная оценка для
nm
m

nm
m
1
функции  ( ) 
.

U ( X n , ) 
Будем строить γ-доверительный интервал для параметра
4.
распределения точечной оценки параметра τ(θ)=z. T ( X n ) 
1

z
с помощью
m X
, тогда
m
m  X

 n

FT ( x, z )  P Tn  x  P 
 x   P  X  m( x  1)  P   X i  nm( x  1)  
 i 1

 m

nm ( x 1)
nm ( x 1)
nm ( x 1) ( z  1)
 C nmx 1  mn (1   )nm ( x 1)  C nmx 1
.
z nmx
n
При выводе этой формулы мы учитываем, что величина
X
i 1
i
имеет распределение
Bi ( mn,  ) . Получаем, что функция FT ( x, z ) непрерывна и монотонна по z, значит мы можем
построить γ-доверительный интервал, основываясь на этой функции.
1
1 
 1 , FT ( x, z2 ) 
  2 . Для
Решим относительно z1, z2 уравнения FT ( x, z1 ) 
2
2
простоты выкладок будем решать его в общем виде, т.е. FT ( x, z )   , при этом обозначим
C
nm ( x 1)
nmx 1
как С (т.к. оно не зависит ни от Г, ни от z), получим:


( z  1)nm ( x 1)
( z  1) nm ( x 1)  z nmx ,
nm( x  1) ln( z  1)  nmx ln z ,
 ,
nmx
C
C
z
x
x
ln( z  1)

 log z ( z  1) , z C ( x 1)  z  1 . Решив соответствующее уравнение при
C ( x  1)
ln z
1
1 

, получим z1, а при  
получим z2. Один из них будет левой границей
2
2
искомого интервала, другой – правой границей.
C
5.
Оценки максимального правдоподобия являются асимптотически эффективными и
асимптотически нормальными, следовательно:


P z n  z ni ( zn )  c  (c )  ( c )  2(c )  1   , где Ф(х) – функция распределения
стандартного нормального закона, i ( z ) - информационное количество Фишера, z n - ОМП.


c
c
  1

 - асимптотически кратчайший γОтсюда c   1 
,
тогда
z

,
z


n
n

 2 
ni ( zn )
ni ( zn ) 

доверительный интервал для z.
Ранее было получено соотношение для информационного количества Фишера:
1
nm[nm(1   )  1]
, учитывая, что  z , получим:
ni ( ) 
2

 (1   )
  1 
nm  nm  1    1
z   nm[nm( z  1)  z ]z 2
 
ni ( z ) 

.
1  1
z 1
1  
z2 
z
m  X  m  X 

nm  nX 
2
n
m  m 2

Тогда ni ( zn ) 

m  X   nmX  m  X  .

X
mX
m
2
  1
Получаем, что z n и ni ( zn ) нам известны, c можно найти по формуле c   1 
 , взяв
 2 
любое интересующее нас γ. Получим асимптотический интервал:


c
c
 zn 
.
, zn 

ni ( zn )
ni ( zn ) 

Download