Статистика как наука

advertisement
Оценка значимости (достоверности) результата исследования.
Доверительные оценки параметров.
Пусть в результате статистического наблюдения получен ряд из n независимых измерений
дискретных случайных величин Х1, Х2, …, Хn (т.е. выборка). Требуется оценить истинное
значение а (т.е. для генеральной совокупности, из которой взяты выборки объемом n)
измеряемой величины. Это значит:
а) указать такую функцию g (Х1, Х2, …, Хn) от результатов измерений, которая дает
достаточно хорошее приближение к значению а. Такая функция называется точечной оценкой
или просто оценкой значения а ; g (Хi) a при п  .
б) указать границы интервала (g- X , g+ X ), который с заданной вероятностью Р
покрывает истинное значение а.
Такая оценка называется доверительной оценкой,
вероятность Р – доверительной вероятностью (надежностью, достоверностью), интервал
(g- X ,
g+ X )
–
доверительным
интервалом
(точностью),
а
его
границы
–
доверительными границами.
Обычно доверительная вероятность задается в виде одного из трех уровней:
0.95, 0.99 или 0.999.
Если все n измерений величины а произведены с одинаковой точностью (равноточные
измерения), то в качестве оценки истинного значения а измеряемой СВ применяют среднее
арифметическое значение результатов измерений. Если измерения не являются равноточными,
но известны веса измерений, то в качестве оценки истинного значения СВ применяют среднее
взвешенное значение.
Таким образом, g (Х1, Х2, …, Хn) = X .
При бесконечно большом числе измерений истинное значение измеряемой случайной
величины равно среднему значению всех случайных величин, т.е. a  X при n   .
Чем больше величина доверительного интервала ( X - X , X + X ), т.е. чем больше
задаваемая погрешность результата измерений X , тем с большей надежностью искомая
величина а попадет в этот интервал:
X  P  .
Естественно, что величина надежности будет зависеть от числа измерений n , а также от
величины задаваемой погрешности X :
n  X  .
Доверительный интервал X , который покрывал бы истинное значение а случайной
величины Хi с доверительной вероятностью Р, определяется по формуле
X  t ( P, n  1)   a  t ( P, n  1) 

n
.
2
А для самого истинного значения а случайной величины можно записать выражения
a  X  X  X  t ( P, n  1)

n
,
или
X  t ( P, n  1) 

n

 a  X  t ( P, n  1) 
n
,
X  [ X  X , X  X ]
где X – среднее значение СВ,  – среднеквадратичное отклонение, n – число измерений СВ,
Р – доверительная вероятность, t – коэффициент Стьюдента.
( X  X ) – нижняя граница доверительного интервала, ( X  X ) – верхняя граница
доверительного интервала.
Коэффициент Стьюдента определяется из таблиц и зависит от доверительной
вероятности Р и числа степеней свободы f = n-1. Называется он так в честь ученого,
предложившего этот параметр в 1908 г., – английского статистика и химика В.С. Госсета,
работавшего в пивоваренной промышленности и публиковавшего свои работы под
псевдонимом "Стьюдент" (студент).
Если, например, задана доверительная вероятность 95% , то уровень значимости в этом
случае будет равняться 5%. Для этих параметров в таблице приведены для примера значения
коэффициентов Стьюдента
f (или n-1)
t
1
12.71
2
4.3
5
2.57
10
2.23
20
2.09

1.96
Величину  = 1 – Р, называют уровнем значимости.  – это положительное малое число,
которое говорит об ошибке результата исследования.
Приближенная оценка величины доверительного интервала по правилу трех сигм
Так как выбор надежности доверительной оценки допускает некоторый произвол, в
практике статистической обработки результатов широкое распространение получило правило
трех сигм:
Отклонение истинного значения случайной величины от среднего арифметического
значения результатов измерений не превосходит утроенной средней квадратической ошибки
генеральной совокупности. Таким образом, правило
доверительную оценку
a  X  3 a ,
или
aX 
3
n
трех сигм представляет
собой
X
3
n
a X 
3
n
3
.
Надежность этой оценки существенно зависит от количества измерений n в выборке.
Зависимость Р от количества измерений n для правила трех сигм указана в следующей таблице
n
P
5
0.960
6
0.970
8
0.980
10
0.985
14
0.990
16
0.991
18
0.992
20
0.993
25
0.994
30
0.995
50
0.996
150
0.997

0.9973
Обычно для сгруппированного ряда применяют правило трех сигм с исправленной
эмпирической дисперсией
 *   2  h 2 / 12 ,
где  h 2 / 12 – поправка Шеппарда, h – ширина градации.
Необходимое количество измерений
Увеличивая количество измерений
даже при неизменной их точности, можно
n
увеличить надежность доверительных оценок или сузить доверительный интервал для
истинного значения случайной величины.
a  X  t ( P, n  1) 

n
.
Предположим, величина доверительного интервала для выборки из n1 значений равна
X 1 . Мы хотим сузить величину X 1 в m раз. Каков должен быть объем выборки для
достижения этой цели?
X 1  t ( P, n1  1) 
X 2 

n1
,
X 1 t ( P, n1  1)   t ( P, n1  1)  


,
m
m n1
m 2 n1
Т.е. n 2  m 2 n1 .
Таким образом, уменьшение доверительного интервала в
увеличением количества измерений в
m2
m
раз обеспечивается
раз. Например, уменьшение доверительного
интервала в 2 раза обеспечивается увеличением количества измерений в 4 раза.
Необходимое количество измерений для достижения требуемой достоверности Р можно
определить заранее, задавая величину отношения
q  X / 
(т.е. задавая величину
доверительного интервала X в долях от с.к.о., например, 0.5 или 0.1 ). Для определения
количества измерений n в зависимости от q и Р применяется таблица
4
P
q
1.0 ( X   )
0.5 ( X  0.5  )
0.4
0.3
0.2
0.1
0.05
0.95
7
18
27
46
99
387
1540
0.99
11
31
46
78
171
668
2659
На практике можно ограничиться меньшим числом измерений, если применить
следующий прием. Сначала нужно произвести сравнительно небольшое количество измерений
(в 3-4 раза меньше указанного в таблице). По результатам этих измерений рассчитать
доверительный интервал. Затем уточнить необходимое количество измерений из тех
соображений, что уменьшение доверительного интервала в m раз обеспечивается увеличением
количества измерений в m2 раз. Например, уменьшение доверительного интервала в 2 раза
обеспечивается увеличением количества измерений в 4 раза.
Односторонние и двухсторонние значения вероятностей
Если нам известен закон распределения СВ (пусть – дискретной), то в этом случае очень
часто приходится решать задачи, по крайней мере, трех стандартных типов:
 какова вероятность того, что случайная величина X окажется равной (или наоборот – не
равной) некоторому значению, например – Xk ?
 какова вероятность того, что случайная величина X окажется больше (или наоборот –
меньше) некоторого значения, например – Xk ?
 какова вероятность того, что случайная величина X окажется не меньше Xi и при этом не
больше Xk ?
Первую вероятность иногда называют точечной, ее можно найти из закона
распределения, но только для дискретной случайной величины. Разумеется, что вероятность
равенства задана самим законом распределения, а вероятность неравенства составляет
P(X # Xk) = 1 – P(X = Xk).
Вторую вероятность принято называть односторонней. Вычислять ее также достаточно
просто – как сумму вероятностей всех допустимых значений, равных и меньших Xk .
Вероятность третьего типа называют двухсторонней и вычисляют как сумму
вероятностей значений X внутри заданного интервала.
Односторонняя и двухсторонняя вероятности являются универсальными понятиями – они
применимы как для дискретных, так и для непрерывных случайных величин.
Download