 ЛАБОРАТОРНАЯ РАБОТА Цель работы: Основные соотношения:

advertisement
ЛАБОРАТОРНАЯ РАБОТА
Исследование свойств выборочного среднего
Цель работы:
Исследование статистическими методами сходимости по вероятности выборочного
среднего.
Основные соотношения:
Выборочное среднее X 
1 n
 X i с точки зрения математической статистики есть
n i 1
среднее арифметическое независимых одинаково распределенных случайных величин
X 1 , X 2 ,, X n . Следовательно, если для генеральной существуют конечные математическое
ожидание и дисперсия, то для выборочного среднего справедлив закон больших чисел
Чебышева.
Теорема
(Закон
больших
чисел
в
форме
Чебышева).
Если
X 1 , X 2 ,, X n ,
-
последовательность независимых и одинаково распределенных случайных величин,
имеющих конечные математическое ожидание M ( X 1 ) и дисперсию D( X 1 ) , то среднее
арифметическое этих величин сходится по вероятности к их математическому ожиданию:
X
1 n
p
X i 
 M ( X1 ) ,

n i 1
1 n

или, для любого   0 : P   X i  X 1     1 при n   .
 n i 1

Статистически данное утверждение можно проверить
следующим
образом.
Генерируем последовательности случайных величин разной длины, вычисляем среднее
значение для каждой последовательности и сравниваем с математическим ожиданием
величин (поскольку мы сами генерируем случайные последовательности, то математическое
ожидание генеральной совокупности нам известно). Если условия теоремы Чебышева
выполняются, то с ростом
n величина отклонения выборочного среднего
X
от
математического ожидания величин M ( X 1 ) должна в среднем уменьшаться. Чтобы учесть
случайный
характер
отклонений,
следует
для
каждой
длины
последовательности
генерировать несколько выборок (последовательностей) значений и сравнивать либо средние
значения отклонений для выборок различного объема, либо величины разброса значений
W  X max  X min . Кроме того, если наблюдается сходимость по вероятности, то всегда можно
для заданной величины отклонения  и вероятности  определить необходимый объем


выборки N, так, чтобы P X  M ( X 1 )     . Это можно сделать, например, используя
центральную предельную теорему (ЦПТ). Согласно ЦПТ, если
X 1 , X 2 ,, X n , -
независимые и одинаково распределенные случайных величины, имеющих конечные
математическое ожидание M ( X 1 ) и дисперсию D( X 1 ) , то их среднее (при n  1 ) имеет
приближенно нормальное распределение с математическим ожиданием M ( X 1 ) и дисперсией
D( X 1 ) / n . Тогда:



,
P(| X  M ( X 1 ) | )  2
 D( X ) / n 
1


где x  - функция Лапласа. Разрешив уравнение:




2
 D( X ) / n 
1


относительно n, получим необходимый объем выборки N. Определив N, можно убедиться,
что величина отклонения не превышает  (с вероятностью  ), сгенерировав несколько
последовательностей длиной N и подсчитав для каждой из них величину отклонения
выборочного среднего от математического ожидания.
Если для генеральной совокупности не существует конечного математического
ожидания, то сходимость выборочного среднего в этом случае не должна наблюдаться (то
есть разброс значений выборочных средних в этом случае с ростом объема выборок не
должен уменьшаться).
Задание.
Задан закон распределения F случайной величины  (приложение 1). Требуется:
a) Для каждого из
n  {15, 60, 240, 960} , сгенерировать, используя генератор
случайных чисел пакета EXCEL, по 10 выборок объемом n из генеральной совокупности F
(для генерации случайных чисел распределенных по законам, которые отсутствуют в
генераторе случайных чисел пакета EXCEL см. приложение 2). Для каждой выборки
определить среднее: X 
1 n
 X i , данные представить в виде таблицы:
n i 1
Выборочное среднее X
N п/п выборки
1
2
n=15
n=60
n=240
n=960
…
10
X min
X max
W  X max  X min
Таблица 1. Значения выборочных средних X для выборок различного объема
Оценить изменение величины разброса W  X max  X min с ростом объема выборки. Сделать
выводы о сходимости выборочных характеристик.
b) Если наблюдается сходимость выборочного среднего, используя центральную
предельную теорему определить для заданной в задании (приложение 1) вероятности  и


величины отклонения  необходимый объем выборки N, так чтобы P X  M ( X 1 )     .
Проверить, сгенерировав 10 выборок найденного объема N и подсчитав для каждой
величину X  M ( X 1 ) .
Примечание. Указанные в задании действия проделать для каждого из двух законов
распределений, указанных в варианте задания.
Приложение 1. Варианты заданий.
Вариант 1.
1) F - закон равномерной плотности на (1; 3).   0,01 ,   0,95 .
1 1
2) F - закон с плотностью распределения f ( x) 
, x  (, ) .   0,001 ,   0,9 .
 1 x2
Вариант 2.
1) F - нормальный закон с параметрами a  1 и   2 .   0,05 ,   0,9 .
1
2) F - закон с плотностью распределения f ( x) 
, x  (0, ) .   0,01 ,   0,99 .
(1  x ) 2
Вариант 3.
1) F - биномиальное распределение с n  20 и p  0,2 .   0,05 ,   0,9 9.
1
1
2) F - закон с плотностью распределения f ( x) 
, x  (, ) .   0,02 ,
 1  ( x  2) 2
  0,97 .
Вариант 4.
1). F - закон Пуассона с параметром   4 .   0,03 ,   0,8 .
2). F - закон с плотностью распределения f ( x) 
1/ 3
, x  (0, ) .   0,01 ,   0,9 .
(1  x / 3) 2
Вариант 5.
1. F - показательный закон с параметром   0,8 .   0,02 ,   0,85 .
1
1
2. F - закон с плотностью распределения f ( x) 
, x  (, ) .   0,03 ,
 1  ( x  1) 2
  0,85
Вариант 6.
1. F - показательный закон с параметром.   2 .   0,01 ,   0,9 .
1
2. F - закон с плотностью распределения f ( x) 
, x  (1, ) .   0,02 ,   0,999 .
(2  x) 2
Вариант 7.
1. F - закон Бернулли с параметром p  0,16 .   0,01 ,   0,95 .
1
1

2. F - закон с плотностью распределения f ( x) 
, x  (, ) .   0,03 ,
5 1  ( x / 5) 2
  0,9 .
Вариант 8.
1. F - нормальный закон с параметрами a  7 и   2 .   0,03 ,   0,8 .
1
2. F - закон с плотностью распределения f ( x) 
, x  (2, ) .   0,05 ,   0,8 .
( x  1) 2
Вариант 9.
1. F - биномиальный закон с параметрами n  50 и p  0,35 .   0,1 ,   0,95 .
1
2. F - закон с плотностью распределения f ( x) 
, x  (, ) .   0,01 ,   0,92 .
1  2 x2
Вариант 10.
1. F - закон равномерной плотности на (-3; 3).   0,04 ,   0,92 .
1
2. F - закон с плотностью распределения f ( x) 
, x  (3, ) .   0,002 ,   0,9 .
( x  2) 2
Вариант 11.
1. F - нормальный закон с параметрами a  2 и   1.   0,03 ,   0,99 .
2. F - закон с плотностью распределения f ( x) 
1
2
, x  (, ) .   0,02 ,   0,88 .
 2  x2
Вариант 12.
1. F - биномиальное распределение с n  30 и p  0,3 .   0,05 ,   0,95 .
3
2. F - закон с плотностью распределения f ( x) 
, x  (0, ) .   0,03 ,   0,94 .
(3  x) 2
Вариант 13.
1. F - закон Пуассона с параметром   4 .   0,025 ,   0,8 .
2. F - закон с плотностью распределения f ( x) 
1
3
, x  (, ) .   0,005 ,   0,8 .
 3  x2
Вариант 14.
1. F - показательный закон с параметром   0,1 .   0,2 ,   0,85 .
1
2. F - закон с плотностью распределения f ( x)  2 , x  (1, ) .   0,04 ,   0,98 .
x
Вариант 15.
1. F - нормальный закон с параметрами a  10 и   2 .   0,05 ,   0,99 .
1
2. F - закон с плотностью распределения f ( x) 
, x  (, ) .   0,08 ,
2
1   ( x  1) 2
  0,999 .
Вариант 16.
1. F - закон Бернулли с параметром p  0,35 .   0,01 ,   0,98 .
1
2. F - закон с плотностью распределения f ( x) 
, x  (1, ) .   0,01 ,   0,99 .
3
3 x4
Вариант 17.
1. F - нормальный закон с параметрами a  0 и   3 .   0,04 ,   0,85 .
1
1

2. F - закон с плотностью распределения f ( x) 
, x  (, ) .   0,05 ,
2 1  ( x / 2) 2
  0,98 .
Вариант 18.
1. F - биномиальный закон с параметрами n  20 и p  0,05 .,   0,015 ,   0,92 .
1
2. F - закон с плотностью распределения f ( x) 
, x  (1, ) .   0,02 ,   0,95 .
2 x3
Вариант 19.
1. F - закон равномерной плотности на 0, 4 .   0,02 ,   0,9 .
1
2. F - закон с плотностью распределения f ( x) 
, x  (0, ) .   0,008 ,   0,99 .
33 ( x  1) 4
Вариант 20.
3. F - показательный закон с параметром   2 .   0,01 ,   0,80 .
1
4. F - закон с плотностью распределения f ( x) 
, x  (0, ) .   0,001 ,
2 ( x  1) 3
  0,82 .
Приложение 2. Генерация случайных чисел.
Генерация случайных чисел при помощи пакета EXCEL.
Для генерации случайных чисел в пакете EXCEL 2003 выберите меню “Cервис”,
“Пакет анализа”, ”Генерация случайных чисел”. Если в меню “Сервис” отсутствует подменю
“Пакет анализа”, следует зайти в меню “Сервис”, “Надстройки” и подключить “Пакет
анализа”.
В EXCEL 2007 выберите меню “Данные”, “Анализ данных”. Если в меню
“Данные” отсутствует подменю “Анализ данных”, то следует нажать кнопку “Office”,
перейти в “Параметры Excel”, выбрать “Надстройки”, нажать “Перейти” и подключить
“Пакет анализа”. Параметры генератора случайных чисел “число переменных” и ”число
случайных чисел”.
определяют соответственно число столбцов и строк для вывода
случайных чисел. Можно использовать, например, “число переменных” для того, чтобы
получить
сразу
несколько
независимых
выборок-столбцов
объема,
определяемого
параметром “число случайных чисел”.
Генерация случайных чисел по законам, отсутствующим в пакете EXCEL.
Для генерации случайных чисел распределенных по законам, которые отсутствуют в
генераторе случайных чисел пакета EXCEL, можно использовать следующие приемы.
1.
Воспользуемся следующей теоремой из курса “Теория вероятностей”:
Если случайная величина 
имеет непрерывную и строго монотонную
1
1
функцию распределения F (x) , а величина   U 0,1 , то   F ( ) , где F ( x) функция обратная к F (x) .
Итак, если
y  F (x ) - функция распределения непрерывной случайной
величины, для которой можно найти обратную x  F 1 ( y ) , то генерируя случайную
величину  , равномерно распределенную на [0, 1] , получим величину   F 1 ( ) с
требуемой функцией распределения F (x) . Данный прием можно использовать для
генерации случайных величин, распределенных по показательному закону, по закону
Коши и др.
2.
Если случайная величина есть композиция других случайных величин, то генерируем
эти величины и строим из них искомую величину. Данный прием можно использовать,
например, для получения случайных величин распределенных по законам  2 ,
Стьюдента и др. Так, случайной величиной, имеющей распределение "хи-квадрат" с k
степенями свободы
называют величину равную сумме квадратов k независимых
k
стандартных нормальных случайных величин, т.е.  2    n2 ,   N 0,1 . Случайной
n 1
величиной t , имеющей распределение Стьюдента с k степенями свободы называют
величину равную t 

2 k
, где  - случайная величина распределенная по закону
N 0,1 , а  2 - независимая от нее случайная величина распределенная по закону хи-
квадрат с k степенями свободы.
3.
Используем “физический” смысл случайной величины. Например, случайная величина,
распределенная по геометрическому закону, есть номер первого успешного испытания
в бесконечной серии испытаний по схеме Бернулли. Тогда, можно сгенерировать
последовательность случайных величин, распределенных по закону Бернулли, и
определить порядковый номер всех единиц в этой последовательности, сбрасывая
счетчик после появления каждой единицы в ноль. Последовательность номеров,
очевидно, будет иметь геометрическое распределение. Приблизительно необходимую
длину исходной последовательности можно оценить следующим образом: если
M  1 / p - среднее число попыток до наступления успеха, то потребуется в среднем
n  M чисел, распределенных по закону Бернулли.
Download