Лабораторная работа №3. ИЗУЧЕНИЕ НОРМАЛЬНОГО

advertisement
Лабораторная работа №3
ИЗУЧЕНИЕ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
СЛУЧАЙНОЙ ВЕЛИЧИНЫ Н А ДОСКЕ ГАЛЬТОНА
ЦЕЛЬ РАБОТЫ
Получение экспериментальной кривой распределения случайной
величины, сравнение ее с теоретической кривой нормального рас пределения. Расчет оценочных значений числовых параметров рас пределения случайной величины. Изучение и экспериментальная
проверка правил, применяемых при обработке результатов измерений.
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ РАБОТЫ
Данная работа посвящена определению по ограниченному коли честву опытов неизвестных параметров, от которых зависит распределение случайной величины. Надо отметить, что любое значе ние искомого параметра, вычисленное на основании ограниченного
числа опытов, всегда будет содержать элемент случайности. Такое
приближенное, случайное значение называется оценкой параметра.
Например, оценкой для математического ожидания может служить
среднее арифметическое наблюденных значений случайной вели чины в n независимых опытах. При очень большом числе опытов
среднее арифметическое будет с большой вероятностью весьма
близким к математическому ожиданию. Если же количество опытов
n невелико, то замена математического ожидания средним значе нием приведет к некоторой ошибке. Эта ошибка будет те м больше,
чем меньше число опытов. Так же будет обстоять дело и с оцен ками других параметров. Любая из таких оценок случайна, при
пользовании ею неизбежны ошибки. Желательно выбрать такую
оценку, чтобы ошибки были по возможности минимальными.
Возьмем случайную величину X , закон распределения которой
содержит неизвестный параметр a . Требуется найти подходящую
оценку для параметра a по результатам n независимых опытов, в
которых величина X принимает определенное значение. Обозна чим наблюденные значения случайной величины:
x1 , x2 , x3 ,..., xn .
Обозначим как
44
(3.3.1)
a~ оценку для параметра a . Любая оценка
должна представлять собой функцию величин x1 , x 2 , x3 ,..., x n :
a~  a~x1 , x 2 , x3 ,..., x n  .
(3.3.2)
~ сама является случайной величиной. Закон распре Ясно, что a
~ зависит, во–первых, от закона распределения X , а воделения a
~ должна удовлетвовторых– от числа опытов. При этом оценка a
рять ряду требований, чтобы быть в каком -то смысле доброка~ при увеличении
чественной оценкой. Требование первое: оценка a
количества опытов должна приближаться к параметру a . Оценка,
обладающая таким свойством, называется состоятельной. Требо~ вместо a , мы не
вание второе: при использовании величины a
должны делать систематическую ошибку в сторону завышения или
занижения. Оценка, удовлетворяющая такому условию, называется
несмещенной. В качестве оценки для математического ожидания,
удовлетворяющей вышеприведенным требованиям, можно взять
~:
среднее арифметическое наблюдаемых значений m
n
~
m
 xi
i 1
n
.
(3.3.3)
Для оценки дисперсии можно взять величину, определяемую со гласно выражению:
n
~
D
 x
i 1
i
~ 2
m
n 1
.
(3.3.4)
Здесь в знаменателе стоит n  1 , а не n , т.к. в противном случае, как показывает теория, оценка дисперсии получается смещен ной.
Мы рассмотрели вопрос об оценке неизвестного параметра од ним числом. Такая оценка называется точечной. В ряде задач требуется не только найти для параметра a подходящее численное
значение, но и оценить его точность и надежность. Требуется уз нать, к каким ошибкам приведет замена параметра a его точечной
~ и с какой степенью уверенности можно ожидать, что
оценкой a
эти ошибки не выйдут за известные пределы. Такие задачи осо45
бенно актуальны при малом числе наблюдений, когда точечная
оценка в значительной мере случайна и приближенная замена a на
a~ может привести к серьезным ошибкам. Чтобы дать представле ~ , в математической статисние о точности и надежности оценки a
тике пользуются так называемыми доверительными интервалами и
доверительными вероятностями.
Рассмотрим задачу о доверительном интервале для математи ческого ожидания. Пусть произведено n независимых опытов над
случайной величиной X , характеристики которой (математическое
ожидание m и дисперсия D ) неизвестны. Для этих параметров по лучаем оценки:
n
~
m
x
i 1
n
n
i
~
; D
 x
i 1
i
~ 2
m
n 1
.
(3.3.5)
Требуется построить доверительный интервал  J , соответствующий доверительной вероятности  для математического ожидания m величины X . При решении этой задачи воспользуемся тем,
~ представляет собой сумму n независимых, одиначто величина m
ково распределенных случайных величин x i , и согласно центральной предельной теореме при большом n ее закон распределения
близок к нормальному. На практике даже при небольшом числе
слагаемых (порядка 10-20) закон распределения можно приблизи тельно считать нормальным. Будем исходить из того, что величина
~ распределена по нормальному закону.
m
Характеристики этого закона – математическое ожидание m и
дисперсия D . Предположим, что величина D нам известна, и найдем такую величину x , для которой
~  m  x    .
P m

(3.3.6)
Применяя распределение Гаусса, получим:
x  t  m~ ,
где
46
(3.3.7)
~;
 m~ – среднее квадратичное отклонение оценки m
t – функция, определяемая из распределения Гаусса.
Дисперсия D , через которую выражается величина  m~ , нам
точно неизвестна, и в качестве ее ориентировочного значения мож ~
но воспользоваться приближенным, оценочным значением D :
n
 m~ 
~
D

n
 x
i 1
i
~ 2
m
nn  1
.
(3.3.8)
Таким образом, задача построения доверительного интервала
решена:
~  x ; m
~  x )
J   (m
(3.3.9)

 .
Равенство (3.3.9) означает, что неизвестное значение математи ческого ожидания m попадет в интервал  J с вероятностью  .
При этом необходимо отметить, что ранее мы рассматривали ве роятность попадания случайной величины в заданный интервал.
Здесь дело обстоит иначе: значение математического ожидания m –
величина не случайная, зато случаен ин тервал  J . Случайно его
~ ; случайположение на оси абсцисс, определяемое его центром m
на и длина интервала, равная 2x , т.к. величина x вычисляется, как правило, по опытным данным. Поэтому в данном случае
лучше будет толковать величину  не как вероятность попадания
точки m в интервал  J , а как вероятность того, что случайный ин тервал  J накроет точку m .
Мы рассмотрели приближенный метод построения доверительно го интервала для математического ожидания m . Идея точных построений доверительных интервалов сводится к следующему. Лю бой доверительный интервал находится из условия, выражающего
вероятность выполнения некоторых неравенств, в которые входит
~ . Закон распределения оценки m
~ завиинтересующая нас оценка m
сит от самих неизвестных параметров величины X . Однако иногда
~ к какой-либо другой
удается перейти от случайной величины m
функции наблюдаемых значений x1 , x 2 , x3 ,..., x n , закон распределения которой не зависит от неизвестных параметров, а зависит толь ко от количества опытов n и от вида закона распределения X .
47
Например, доказано, что при нормальном распределении вели чины X случайная величина
~m
m
T n
~ ,
D
(3.3.10)
где
n
~
m
 xi
i 1
n
n
~
; D
 x
i 1
i
~ 2
m
n 1
(3.3.11)
подчиняется так называемому закону распределения Стьюдента.
Плотность этого распределения зависит только от числа n . Поэтому доверительный интервал для математического ожидания m
можно точно определить, пользуясь распределением Стьюдента.
Можно показать, что процедура определения его аналогична рас смотренной в предыдущем случае, только вместо значения функ ции t , определяемой из распределения Гаусса, берутся значения
функции t ,n , определяемой из распределения Стьюдента. Значения
функции t ,n обычно называют коэффициентами Стьюдента. Зна чения t ,n определяются не только вероятностью  , но и количеством опытов n . Распределением Стьюдента пользуются, в ос новном, когда число измерений невелико, т.е. n  2,3,4,5 . Значения
функции t ,n являются табличной величиной, зависящей от довери тельной вероятности  и количества опытов n (см.Приложение).
ОПИСАНИЕ ЭКСПЕРИМЕНТ АЛЬНОЙ УСТАНОВКИ
Работа выполняется на так называемой доске Гальтона , изображенной на рис.3.3.1.
Установка состоит из вертикальной доски -1, на которой закреплены в шахматном порядке стержни -2, служащие для рассеивания
шариков, поступающих из хранилища-3, расположенного вверху
доски. Под стержнями расположены 15 одинаковых ячеек, разде ленных перегородками одинаковой высоты-4. Шарики удерживаются в хранилище стерженьком-5, закрывающим отверстие, через
которое шарики высыпаются из хранилища. Лицевая часть доски
48
закрыта стеклом. Выпускное отверстие хранилища шариков распо ложено над 8-й ячейкой.
5
1
3
2
4
Рис.3.3.1. Доска Гальтона
Если бы не было стержней, то шарики, выпущенные из хранили ща, попали бы в 8-ю ячейку. В нашем же опыте шарик, соударяясь с
рядом стержней, может попасть практически в любую ячейку. Иначе
говоря, попадание шарика в ту или другую ячейку носит случайный
характер. Если выпустить три шарика, то, скорее всего, они попадут
в разные ячейки, номера которых будут отличаться от номера ячей ки, над которой расположено выпускное отверстие. Чаще всего даже
средние значения будут отличаться от истинного значения, т.е. x  8 .
При повторении этого опыта несколько раз вероятнее всего полу чатся иные результаты, нежели в первый раз. В каждой серии изме рений, состоящих из трех опытов n  3 , можно найти доверительный интервал по формуле Стьюдента.
Подсчитаем, сколько шариков находится в каждой ячейке. Тогда
статистическая вероятность попадания шарика в любую ячейку рав на отношению количества шариков, попавших в эту ячейку к сумме
шариков во всех ячейках. Для определения вероятности попадан ия
шариков в ту или иную ячейку неудобно считать количество шари ков в ячейках. Поэтому поступают следующим образом: измеряют
высоту столбика шариков в каждой ячейке– hi , а затем суммируют
15
высоты по всем 15 ячейкам
h
i 1
i
, тогда вероятность Pi попадания
49
шарика в i -ю ячейку равна:
Pi 
hi
15
 hi

(3.3.12)
i 1
Если выпустить все шарики,то на доске Гальтона они располо жатся так, как показано на рис.3.3.2.
hi
Выпуск шариков
8
xi
Рис.3.3.2. Распределение шариков по ячейкам
Итак, мы получаем экспериментальную кривую вероятности Pi
в зависимости от номера ячеек x i . По форме она напоминает форму
распределения шариков по ячейкам (рис.3.3.2). Если опыт прове ден аккуратно, то полученная кривая до лжна совпасть с теоретической кривой распределения случайной величины Гаусса.
Работа состоит из двух частей. В первой части работы по экспе риментальным данным необходимо построить кривую распределе ния Гаусса- f (x) . Во второй части работы нужно определить доверительный интервал для координаты выпускного отверстия при
двух значениях надежности (доверительной вероятности) –   0,5
и   0,95 . Также надо показать, что при надежности   0,5 примерно в половине ячеек (их будет пять) истинное значение изме ряемой величины (координаты выпускного отверстия) не попадают
в доверительный интервал, а при   0,95 практически все опыты
дают правильный результат.
50
ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ
Перед началом работы необходимо убедиться, что в ячейках нет
шариков.
Часть 1
1. Постепенно выпустить из хранилища все шарики.
2. С помощью линейки измерить высоты получившихся столби ков шариков в каждой ячейке – hi и занести результаты, округлив
их до 0,5 см, в таблицу 1.
3. Перевернув доску Гальтона, пересыпать все шарики в храни лище, расположенное в верхней части доски.
№
п/п
i
 xi  m x 
Таблица 1
2
hi
xi Pi
Pi
xi  mx 2 xi  mx 2 Pi
2 2
e

 x i  m x 2
2 2
f (x)
1
2
3
…
15
Часть 2
1. Выпустить из хранилища поочередно 3 шарика и записать в
таблицу 3 значения координаты x i , т.е. номера ячеек, куда попали
шарики.
2. Аналогичные опыты проделать еще 4 раза и заполнить четыре
таблицы, аналогичные таблице 2 (3, 4,5,6).
n
1
2
3
Среднее
xi
xi
xi 2
Таблица 2
Доверительный
интервал
1  0,5
 2  0,95
~  x
m
1
~  x
m
2
51
ОБРАБОТКА РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ
Часть 1
15
1. Подсчитать сумму высот hi во всех ячейках
 hi .
i 1
2. По формуле (3.3.12) определить экспериментальное значение
вероятности попадания шарика в каждую ячейку Pi  Phi  . Результаты занести в таблицу 1.
3. Вычислить произведение xi Pi и тоже занести в соответствующие столбцы таблицы 1. Подсчитать математическое ожидание оп ределяемой координаты выпускного отверстия по формуле (1.11),
взяв Pi , полученное в предыдущем пункте.
4. Вычислить величину xi  mx  и занести в таблицу 1.
2
5. Вычислить и занести в таблицу 2 значения xi  mx  Pi
6. По формуле (1.23) определить среднее квадратичное откло нение  x .
2
7. Для каждого x i подсчитать по формуле (1.26) значение функции f (x) , где m  m x и    x .
8. В одних осях координат построить график вероятности
Pi  Phi  в зависимости от координаты x i и график функции f (x) .
Сравнить полученные кривые.
Часть 2
~ координаты вы1. Найти оценку математического ожидания m
пускного отверстия по формуле (3.3.3) для каждой из пяти серий
измерений.
2. Найти погрешность xi :
~x
xi  m
i ,
а также xi  для каждого измерения и занести результаты в
таблицы 2-6.
2
52
3. По формуле (3.3.7), заменив предварительно величину t  на
коэффициент Стьюдента t ,n , и с использованием формулы (3.3.8)
вычислить x отдельно для 1  0,5 и  2  0,95 , т.е. использовать
формулу:
n
x  t , n 
 x
i 1
i
~ 2
m
n  n  1
.
4. Записать в каждой таблице, соответственно, для двух надеж ностей ответы в виде:
~  x
xm
.
5. В виде вывода по пяти сериям экспериментов записать
отдельно для двух надежностей 0,5 и 0,95 количество случаев, в
которых доверительный интервал перекрывает истинное значение
координаты выпускного отверстия x  8 .
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Какой процесс называется случайным?
2. Что такое случайная величина?
3. Какая величина называется частотой события?
4. Что называется законом распределения случайной величины?
5. Что такое функция распределения случайной велич ины?
6. Запишите основные свойства функции распределения случай ной величины.
7. Укажите основные числовые параметры, характеризующие
закон распределения случайной величины и объясните их смысл.
8. Что называется математическим ожиданием случайной вели чины?
9. Дайте определение величины дисперсии.
10. Что называется средним квадратичным отклонением?
11. В чем удобство использования среднего квадратичного от клонения по сравнению с использованием дисперсии?
12. Какова связь между функцией распределения и пл отностью
распределения?
13. Для каких случайных величин существует плотность распре деления– дискретных или непрерывных?
14. Запишите основные свойства плотности распределения.
53
15. Что такое кривая распределения?
16. Запишите выражение для функции плотност и распределения
непрерывной случайной величины.
17. Какова вероятность принятия случайной величиной конкрет ного значения при дискретном распределении? При непрерывном
распределении?
18. Как влияет дисперсия случайной величины на форму кривой
распределения?
19. Укажите аналог кривой распределения для дискретных слу чайных величин.
20. Укажите оценку основных параметров распределения.
21. Какая оценка называется точечной?
22. Какая оценка называется несмещённой?
23. Что такое доверительная вероятность или на дежность измерения?
24. Как измеряется доверительный интервал для среднего значе ния измеряемой величины и что он обозначает?
25. В классической физике имеет место классическое распреде ление Максвелла. Что это за распределение и чем оно отличается
от нормального распределения?
26. Рассмотрев систему материальных точек с массами
M 1 , M 2 , M 3 ,..., M n , располагающимися на оси X в точках x1 , x 2 , x3 ,..., x n ,
укажите механическую интерпретацию математического ожидания.
27. Воспользовавшись условиями предыдущего вопроса, укажите механическую интерпретацию дисперсии.
28. Как составляется статистический ряд?
29. Как производится построение гистограммы?
30. Как по гистограмме получить характеристики распределения
случайной величины?
54
Related documents
Download