Uploaded by poket19867

УМК Капусто-3

advertisement
Министерство образования Республики Беларусь
Учреждение образования
«Полоцкий государственный университет»
ВЫСШАЯ МАТЕМАТИКА
Учебно-методический комплекс
для студентов экономических специальностей
В трех частях
Часть 3
Теория вероятностей
Математическая статистика
Составитель А. В. Капусто
Новополоцк
ПГУ
2011
УДК 51(075.8)
ББК 22.11я73
В 93
Рекомендован к изданию методической комиссией
финансово-экономического факультета
в качестве учебно-методического комплекса (протокол № 6 от 30.06.2011)
РЕЦЕНЗЕНТЫ:
д-р физ.-мат. наук, проф. УО «ВГУ им. П. М. Машерова» Ю. В. ТРУБНИКОВ;
канд. физ.-мат. наук, проф. каф. высшей математики УО «ПГУ» И. Е. АНДРУШКЕВИЧ
В 93
Высшая математика : учеб.-метод. комплекс для студентов экон. специальностей. В 3 ч. Ч. 3. Теория вероятностей. Математическая статистика / сост.
А. В. Капусто. – Новополоцк : ПГУ, 2011. – 224 с.
ISBN 978-985-531-277-3.
Изложен теоретический материал третьего семестра по разделам «Теория вероятностей», «Математическая статистика». Содержит большое число примеров с подробным решением, приведены задания для практических занятий и самостоятельного
решения.
Предназначен для студентов экономических специальностей.
УДК 51(075.8)
ББК 22.11я73
ISBN 978-985-531-277-3 (Ч. 3)
ISBN 978-985-418-548-4
© Капусто А. В., составление, 2011
© УО «Полоцкий государственный университет», 2011
2
ВВЕДЕНИЕ
Этот учебно-методический комплекс – третья часть общей совокупности учебно-методического обеспечения дисциплины «Высшая математика» для студентов финансово-экономического факультета дневной формы обучения; он соответствует программе третьего семестра второго года
обучения.
В этой части приведен теоретический материал по разделам «Теория
вероятностей» и «Математическая статистика». Сложные или объемные
доказательства некоторых теорем и утверждений опущены и вместо них
приведено достаточное количество иллюстрирующих теорию примеров.
Отсутствие доказательства в тексте отмечено знаком «*», конец доказательства – знаком «■», окончание решения примера с громоздким или дублирующим решение ответом – знаком «□». Нумерация формул, теорем и
утверждений, примеров и рисунков ведется по темам внутри каждого раздела.
Для активизации самостоятельной работы студентов и выделения базового уровня теоретического материала после каждой из тем раздела приведен перечень вопросов для самоконтроля. Упражнения, встречающиеся в
тексте теоретического материала, обязательны для выполнения студентами, претендующими на 8 – 10 баллов. В конце каждого раздела приведены
вопросы к экзамену.
Весь теоретический материал сопровождается многочисленными
примерами подробного выполнения заданий, аналогичных предлагаемым
для решения на практических занятиях. Исходя из этого, материал практических занятий содержит только условия заданий по изучаемым темам для
решения в аудитории и домашнего выполнения. Кроме того, в УМК приведены 15 вариантов индивидуального домашнего задания «Основные законы распределения случайных величин».
В список литературы включены основные источники, использованные при составлении УМК. При самостоятельном изучении материала
студенты могут использовать также и другую литературу, соответствующую стандартам образования.
Ввиду наличия в тексте большого количества типичных заданий и
подробных пояснений теоретического материала УМК может быть использован и студентами заочной формы обучения финансово-экономического факультета.
3
РАБОЧАЯ ПРОГРАММА
Рабочая программа составлена на основе стандартов ОСРБ 1-25 01
04-2008 (для специальности 1-25 01 04 «Финансы и кредит») ОСРБ-1-25 01
07-2008 (для специальности 1-25 01 07 «Экономика и управление на предприятии») и ОСРБ 1-25 01 08 (для специальности 1-25 01 08 «Бухгалтерский учет, анализ и аудит»).
1. ЦЕЛИ И ЗАДАЧИ ДИСЦИПЛИНЫ
1.1. Цель преподавания дисциплины
Дисциплина «Высшая математика» является одной из первых общеобразовательных дисциплин, начинающих подготовку студентов финансовоэкономического факультета к изучению специальных и профилирующих
дисциплин.
Целью преподавания дисциплины является формирование у студентов математической базы, необходимой для успешного усвоения специальных дисциплин, ознакомление их с основами современного математического аппарата, привлекаемого для решения теоретических и практических задач экономики.
1.2. Задачи изучения дисциплины
В результате изучения дисциплины «Высшая математика» за третий
семестр обучения студенты должны знать:
− основные определения, теоремы и соотношения теории вероятностей;
− основные законы распределения случайных величин и их практическое приложение;
− методы обработки и анализа статистических данных.
Студенты должны приобрести навыки:
− применения вероятностных и статистических методов при решении задач прикладного характера;
− сбора и обработки статистических данных;
− применения методов анализа статистических данных.
4
2. ВИДЫ ЗАНЯТИЙ И ФОРМЫ КОНТРОЛЯ ЗНАНИЙ
Виды занятий,
формы контроля знаний
Дневная форма обучения
Курс
Семестр
Лекции (в часах)
Практические занятия (в часах)
Контрольные работы (кол-во)
Экзамен (семестр)
2
3
36
18
1
3
3. СОДЕРЖАНИЕ УЧЕБНОГО МАТЕРИАЛА
Наименования разделов, тем и их содержание
Раздел 8. Теория вероятностей
1. Элементы комбинаторики. Перестановки, размещения,
сочетания. Опыты и события. Виды событий. Пространство элементарных событий. Операции над событиями и их
свойства.
2. Статистическое, классическое, геометрическое и аксиоматическое определения вероятности. Свойства вероятности. Теорема сложения вероятностей.
3. Условная вероятность. Теорема умножения вероятностей. Полная вероятность. Вероятность гипотез. Формула
Байеса.
4. Последовательность независимых испытаний. Формула
Бернулли. Локальная и интегральная теоремы Лапласа.
Асимптотические формулы.
5. Теорема и асимптотическая формула Пуассона. Простейший поток событий.
6. Понятие случайной величины. Дискретные и непрерывные случайные величины.
7. Способы задания дискретной случайной величины
(ДСВ). Свойства функции распределения.
8. Понятие многомерной дискретной случайной величины. Закон распределения системы случайных величин.
Функция распределения двумерной случайной величины,
свойства. Независимость случайных величин. Условные
законы распределения.
5
Лекции
(объем
в часах)
Практические
занятия
(объем
в часах)
2
1
2
1
1
2
2
1
1
1
1
0
2
1
2
0
Окончание табл.
9. Числовые характеристики ДСВ: математическое ожидание, дисперсия, среднеквадратическое отклонение, мо1
менты. Свойства математического ожидания и дисперсии.
10. Основные законы распределения ДСВ (биномиальный, Пуассона, геометрический, гипергеометрический) и
2
их числовые характеристики.
11. Способы задания непрерывной случайной величины
(НСВ). Свойства плотности распределения вероятностей
2
случайной величины. Функция распределения и плотность
распределения двумерной НСВ.
12. Числовые характеристики НСВ.
1
13. Числовые характеристики системы СВ. Свойства корреляционного момента и коэффициента линейной корре1
ляции.
14. Наиболее часто встречающиеся законы распределения НСВ (равномерный, показательный, нормальный), их
2
числовые характеристики и практическое использование.
15. Распределение χ2 (распределение Пирсона), распре1
деление Стьюдента, распределение Фишера.
16. Неравенства Маркова и Чебышева. Теоремы Чебышева (закон больших чисел) и Бернулли. Центральная пре1
дельная теорема теории вероятностей.
Раздел 9. Элементы математической статистики
1. Понятие о статистических методах. Генеральная совокупность (ГС). Выборочная совокупность (ВС) и основные требования к выборке. Способы организации выбор2
ки. Эмпирическая функция распределения, полигон частот
и гистограмма.
2. Числовые характеристики ВС. Основные характери2
стики ГС и их связь с характеристиками ВС.
3. Классификация точечных оценок параметров распределения ГС. Методы нахождения точечных оценок: метод
2
моментов, наибольшего правдоподобия.
4. Интервальные оценки параметров распределения ГС.
Доверительные интервалы для параметров нормального
2
распределения.
5. Проверка статистических гипотез.
2
6. Метод дисперсионного анализа. Понятие функциональной, стохастической и корреляционной зависимости.
Поле корреляции. Выборочный коэффициент корреляции,
2
его свойства и проверка значимости. Функция регрессии.
Построение уравнения линейной регрессии методом наименьших квадратов.
Итого:
36
6
1
0
1
1
1
0
0
1
1
1
1
1
0
2
18
ТЕОРЕТИЧЕСКИЙ МАТЕРИАЛ
7
РАЗДЕЛ 8
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
1. ЭЛЕМЕНТЫ КОМБИНАТОРИКИ
Комбинаторика рассматривает вопросы, связанные с подсчетом числа всевозможных комбинаций из элементов данного конечного множества.
Задача 1.1. В студенческой группе 25 человек. Необходимо выбрать
старосту и профорга. Сколькими способами это можно сделать?
Решение. Старостой может быть выбран любой из 25 студентов, т.е.
существует 25 способов выбора старосты. После выбора старосты профоргом можно выбрать любого из 24 оставшихся студентов, т.е. одному способу выбора старосты соответствует 24 способа выбора профорга. Общее
число способов выбора старосты и профорга 25 ⋅ 24 = 600.
Ответ: существует 600 способов выбора старосты и профорга для
группы из 25 человек.
Рассмотренная задача 1.1 является иллюстрацией применения следующего правила умножения.
Утверждение 1.1 (правило умножения). Пусть требуется выполнить одно за другим какие-то k действий. Если первое действие можно
выполнить n1 способами, второе действие – n2 способами, третье – n3 и
так до k -того действия, которое можно выполнить nk способами, то
все действия вместе могут быть выполнены n1 ⋅ n2 ⋅ n3 ⋅ ... ⋅ nk способами.
Утверждение 1.2 (правило сложения). Если действия взаимно исключают друг друга, причем одно из них можно выполнить m способами,
а другое n способами, то выполнить одно любое из этих действий можно
m + n способами.
Задача 1.2. В первой студенческой группе 30 человек, во второй –
25. Необходимо выбрать двух представителей на конференцию. Сколькими способами это можно сделать, если оба представителя должны быть из
одной группы и важен порядок отбора?
8
Решение. Согласно условию задачи определим два взаимно исключающих действия: первое действие – оба представителя отобраны из первой студенческой группы, второе действие – оба представителя отобраны
из второй студенческой группы. Рассмотрим первое действие, когда оба
представителя отобраны из первой группы. Согласно правилу умножения
существует 30 ⋅ 29 = 870 способов отбора. Для отбора представителей из
второй группы существует 25 ⋅ 24 = 600 способов. Согласно условию задачи следует выбрать двух представителей из одной группы, не важно какой.
Таким образом, это могут быть представители либо первой группы, либо
второй. Эти действия взаимно исключают друг друга. Поэтому общее число способов отбора двух студентов из одной группы 870 + 600 = 1470.
Ответ: существует 1470 способов выбора представителей на конференцию.
1.1. Перестановки
Пусть имеется некоторое множество, содержащее конечное число n
элементов: a, b, c,..., l ′′ . В качестве примера можно рассмотреть множество
учебных групп в университете, множество книг на полке, множество целых положительных чисел, меньших 10, и т.д.
Все элементы такого множества можно пронумеровать, в результате
получается некоторая последовательность элементов данного множества:
a1 , a2 , a3 ,..., an .
(1.1)
Определение 1.1. Всякое упорядоченное (пронумерованное) конечное множество называется перестановкой, образованной из его элементов.
Каждая перестановка содержит все элементы множества, поэтому
различные перестановки отличаются друг от друга только порядком элементов.
Число перестановок из n элементов обозначают через Pn ( P – первая буква
французского слова permutation – перестановка).
Число перестановок из n различных элементов
Pn = n !
(1.2)
Пример 1.1. Сколько трехзначных чисел можно записать с помощью цифр 1, 2, 3, если каждая из них входит в изображение числа только один раз?
9
Решение. Согласно формуле (1.2)
P3 = 3! = 6 .
Действительно, возможные трехзначные числа:
123, 132, 213, 231, 312, 321.
Ответ: с помощью цифр 1, 2, 3 (без повторений) можно записать 6
трехзначных чисел.
Пример 1.2. Порядок выступления 8 участников конкурса определяется жребием. Сколько различных вариантов жеребьевки при этом возможно?
Решение. Каждый вариант жеребьевки отличается только порядком
участников конкурса, т.е. является перестановкой из 8 элементов. Их число, по формуле (1.2), составит: P8 = 8! = 1 ⋅ 2 ⋅ 3 ⋅ 4 ⋅ 5 ⋅ 6 ⋅ 7 ⋅ 8 = 40320 .
Ответ: возможно 40320 вариантов жеребьевки.
Число перестановок из n элементов, если среди них имеется p
элементов одного вида, q – другого, r – третьего и т.д., определяется
формулой
Pn ( p, q, r , …) =
n!
.
p !⋅ q !⋅ r !…
(1.3)
Пример 1.3. Сколько существует восьмизначных чисел, состоящих
из цифр 3, 4, 5 6, в которых цифра 4 повторяется три раза, а 5 и 6 – по два
раза?
Решение. Каждое восьмизначное число отличается от другого порядком следования цифр (причем повторы составят n1 = 1 , n2 = 3 , n3 = 2 ,
n4 = 2 ), т.е. является перестановкой с повторениями из 8 элементов. Их
число, по формуле (1.3), составит
P8 (1; 3; 2; 2) =
8!
= 1680 .
1!⋅ 3!⋅ 2!⋅ 2!
Ответ: существует 1680 восьмизначных чисел, удовлетворяющих
требованиям задания.
10
1.2. Размещения
Определение 1.2. Размещением из n элементов по k называется
всякая упорядоченная часть множества (1.1), содержащая k элементов.
Два различных размещения из данных n элементов, взятых по k ,
различаются либо составом входящих в них элементов, либо, при одном и
том же составе элементов, порядком их расположения.
Число размещений из n элементов по k обозначают через Ank ( A – первая буква французского слова arrangement – размещение, приведение в порядок).
Если среди n элементов нет одинаковых и повторение одного и того
же элемента не допускается, то число размещений без повторений определяется формулой
n!
Ank =
.
(1.4)
(n − k )!
Пример 1.4. Сколько двузначных чисел можно записать с помощью
цифр 1, 2, 3, если каждая из них может входить в изображение числа только один раз?
3!
3!
Решение. Согласно формуле (1.4) A32 =
= = 6.
(3 − 2)! 1!
Действительно, возможные двузначные числа: 12, 21, 13, 31, 23, 32.
Ответ: с помощью цифр 1, 2, 3 (без повторений) можно записать 6
двузначных чисел.
Пример 1.5. Расписание одного дня содержит 5 уроков. Определить
количество таких расписаний при выборе из 11 дисциплин.
Решение. Каждый вариант расписания представляет набор 5 дисциплин из 11, отличающийся от других вариантов как составом, так и порядком следования уроков, т.е. каждый вариант расписания представляет собой размещение из 11 элементов по 5. Согласно формуле (1.4)
5
A11
=
11!
11!
=
= 55440.
(11 − 5)! 6!
Ответ: возможно 55440 вариантов при составлении расписания.
Если все n элементов различны, но в размещениях допускаются повторения, то число размещений с повторениями определяется формулой
Ank ( повт) = n k .
11
(1.5)
Пример 1.6. Сколько двузначных чисел можно записать с помощью
цифр 1, 2, 3, если цифры могут повторяться?
Решение. Согласно формуле (1.5) A32 ( повт ) = 32 = 9.
Возможные двузначные числа: 12, 21, 13, 31, 23, 32, 11, 22, 33.
Ответ: с помощью цифр 1, 2, 3, если повторения допустимы, можно
записать 9 двузначных чисел.
1.3. Сочетания
Определение 1.3. Сочетанием из n элементов, взятых по k , называется всякая часть множества (1.1), содержащая k элементов.
Два различных сочетания из n элементов, взятых по k , отличаются
друг от друга составом входящих в них элементов, т.е. если два сочетания
различны, то в одном из них содержится хотя бы один элемент, не содержащийся в другом.
Число всех сочетаний из n элементов по k обозначают через Cnk ( C – первая буква французского слова combinasion – сочетание).
Пример 1.7. Вариант заполнения билета в игре «Спортлото». Для k
различных элементов из n различных число сочетаний без повторений
определяется формулой
n!
Cnk =
.
(1.6)
k!(n − k )!
Пример 1.8. В шахматном турнире участвуют 18 человек. Сколько
партий должно быть сыграно в турнире, если между любыми двумя участниками должна быть сыграна одна партия?
Решение. Каждая партия играется двумя участниками из 18 и отличается от других только составом пар участников, т.е. представляет собой
сочетание из 18 элементов по 2. Согласно формуле (1.6)
2
C18
=
18!
18! 17 ⋅ 18
=
=
= 153 .
2!(18 − 2)! 2!⋅ 16!
2
Ответ: в турнире должно быть сыграно 153 партии.
Для k различных элементов из n различных число сочетаний с повторениями определяется формулой
(n + k − 1)!
Cnk ( повт ) =
.
(1.7)
k !(n − 1)!
12
Свойства
1. Cnk = Cnn − k .
2. Правило Паскаля:
Cnk−−11 + Cnk−1 = Cnk , где 1 ≤ k < n .
3. Число всех подмножеств множества, содержащего n элементов,
равно 2n :
Cn0 + Cn1 + … + Cnn −1 + Cnn = 2n .
4. Соотношение между числом размещений, перестановок и сочетаний:
Ank = Pk Cnk .
1.4. Задача о выборке
В коробке имеется N деталей. Из них:
n1 – число деталей первого типа;
n2 – число деталей второго типа;
.......................
nm – число деталей m -ного типа.
m
Других деталей нет:
∑ ni = N .
i =1
Из коробки наугад выбирают K деталей.
Сколько существует вариантов отбора, если необходимо отобрать:
k1 деталей первого типа;
k2 деталей второго типа;
........................
km деталей m -ного типа.
n
Без других деталей
∑ ki = K .
i =1
Количество вариантов отбора определяется выражением
Cnk1 ⋅ Cnk2 ⋅…⋅ Cnkm .
1
2
m
(1.8)
Пример 1.9. В коробке имеется 10 карандашей одинакового размера, из них четыре красных, по два синих, зеленых и желтых. Сколько существует вариантов отбора шести карандашей, чтобы в выборке оказались
три красных, два синих и один зеленый карандаш?
13
Решение. Формулировка задачи позволяет классифицировать ее как
задачу о выборке. Всего имеется N = 10 карандашей, выбрать нужно K = 6
карандашей. При этом для красных карандашей: есть n1 = 4 карандаша,
нужно выбрать k1 = 3 карандаша; для синих: есть n2 = 2 , нужно выбрать
k2 = 2 ; для зеленых: есть n3 = 2 , нужно выбрать k3 = 1; для желтых: есть
n4 = 2 , нужно выбрать k4 = 0 .
Согласно (1.8) общее количество вариантов отбора составит:
C43 ⋅ C22 ⋅ C21 ⋅ C20 =
=
4!
2!
2!
2!
⋅
⋅
⋅
=
3!⋅ (4 − 3)! 2!⋅ (2 − 2)! 1!⋅ (2 − 1)! 0!⋅ (2 − 0)!
4!
2! 2! 2!
⋅
⋅
⋅
= 4 ⋅1 ⋅ 2 ⋅1 = 8 .
3!⋅ 1! 2!⋅ 0! 1!⋅ 1! 0!⋅ 2!
Ответ: существует 8 вариантов отбора карандашей.
Вопросы для самоконтроля
1. В чем состоит правило умножения в комбинаторике?
2. В чем состоит правило сложения в комбинаторике?
3. Что называют перестановкой?
4. Чем различаются две перестановки одного множества?
5. По какой формуле вычисляют число перестановок из n различных элементов?
6. По какой формуле вычисляется число перестановок из n элементов, если некоторые элементы повторяются?
7. Что называют размещением?
8. Чем различаются два размещения из n элементов, взятых по k ?
9. По какой формуле вычисляют число размещений из n различных
элементов по k элементов без повторений?
10. По какой формуле вычисляют число размещений из n различных элементов по k элементов с повторениями?
11. Что называют сочетанием?
12. Чем различаются два сочетания из n элементов, взятых по k ?
13. По какой формуле вычисляют число сочетаний из n различных
элементов по k элементов без повторений?
14. Каким равенством связаны числа перестановок, размещений и
сочетаний?
15. Сколько существует вариантов отбора требуемого набора элементов в задаче о выборке?
14
2. СОБЫТИЯ. ОПЕРАЦИИ НАД СОБЫТИЯМИ
2.1. События. Виды событий. Пространство элементарных событий
Основными понятиями теории вероятностей являются случайные
события и случайные величины.
Под событием понимается явление, которое происходит в результате
осуществления какого-либо определенного комплекса условий. Осуществление этого комплекса условий будем называть опытом или испытанием.
Определение 2.1. Событие называется достоверным, если оно обязательно наступает при некоторых данных условиях. Если при данных условиях событие никогда не наступает, оно называется невозможным. Случайным называется такое событие, которое в результате опыта может появиться (произойти) и не появиться (не произойти).
Случайные события обозначаются прописными буквами латинского алфавита:
A, B, C, ... . Достоверное событие обозначают буквой E, невозможное – символом ∅.
Пример 2.1. Бросается игральная кость. Возможны следующие случайные события:
А = {выпало четное число очков} = { 2; 4; 6} ;
B = {число выпавших очков не превышает 3} = { 1; 2; 3}.
Тогда достоверное событие
E = {выпало какое-либо число очков от 1 до 6} = { 1; 2; 3; 4; 5; 6} ,
невозможное событие ∅ = {выпало 7} = {7}.
Определение 2.2. Если появление одного события исключает появление другого, то они называются несовместными, в противном случае
два события называются совместными.
Пример 2.1 (продолжение). События А и В совместны. Рассмотрим событие D = {5} . Событие D несовместно по отношению к событиям А
и В.
Определение 2.3. Группа событий A1, A2 ,..., An называется группой
несовместных событий, если совместное появление любой пары событий
невозможно. Если хотя бы одно событие из группы A1, A2 ,..., An обязательно происходит в результате опыта, то говорят, что события образуют
полную группу несовместных событий.
15
Пример 2.1 (продолжение). Рассмотрим событие F = { 1; 3}. События A, D, F образуют полную группу несовместных событий.
Определение 2.4. Два события, образующие полную группу несовместных событий, называются противоположными. Для любого события A
противоположное событие обозначается через A (читается «не A »).
Пример 2.1 (продолжение)
A = {выпало нечетное число очков} = { 1; 3; 5} ;
B = {число выпавших очков превышает 3} = { 4; 5; 6}.
Определение 2.5. События называются равновозможными, если ни
одно из них не является более возможным, чем другое.
Пример 2.1 (продолжение). События A и A , B и B – равновозможные, события D и D равновозможными не являются.
Определение 2.6. Каждое событие (из полной группы несовместных
и равновозможных событий), которое может наступать в испытании, называется элементарным исходом испытания или элементарным событием.
Определение 2.7. Множество всевозможных исходов испытания называют пространством элементарных событий.
Обозначают пространство элементарных событий через Ω.
Таким образом, достоверное событие представляет собой множество
всех элементарных событий: E = Ω .
Пример 2.1 (продолжение). Ω = { 1; 2; 3; 4; 5; 6} .
2.2. Операции над событиями и их свойства
Рассмотрим два события A и B .
Определение 2.8. Суммой (объединением) событий A и B называется событие C = A + B или C = A ∪ B , заключающееся в появлении хотя бы
одного из этих событий.
Пример 2.1 (продолжение). C1 = { 1; 2; 3; 4; 6} .
16
Пример 2.2. Пусть A − событие, состоящее в попадании случайной
точки в область, обозначенную буквой A , а B − событие, состоящее в попадании точки в область, обозначенную буквой B . Событие A ∪ B представлено на рис. 2.1 в виде закрашенной области.
Определение 2.9. Произведением (совмещением, пересечением) событий A и B называется событие C = AB или C = A ∩ B , обозначающее
появление всех перемножаемых событий.
Пример 2.1 (продолжение). C2 = {2} .
Пример 2.2 (продолжение). Событие A ∩ B представлено на рис.
2.2 в виде заштрихованной области.
А
В
А
Рис. 2.1
В
Рис. 2.2
Определение 2.10. Разностью событий A и B называется событие
C = A − B или C = A \ B , обозначающее наступление события A и ненаступление события B .
Пример 2.1 (продолжение). C3 = {4;6} .
Пример 2.2 (продолжение). Событие A \ B представлено на рис. 2.3
в виде заштрихованной области.
В
А
Рис. 2.3
Свойства операций над событиями
1. A ⋅ A = ∅ .
2. A + ∅ = A .
3. A ⋅ ∅ = ∅ .
4. A + E = E .
17
5. A ⋅ E = A .
Если с наступлением события A появляется и событие B ( A влечет
за собой B ), то это записывается в виде A ⊂ B .
Пример 2.1 (продолжение). Событие A влечет за собой событие
G = {число выпавших очков больше 1} = {2; 3; 4; 5; 6} , т.е. A ⊂ G .
Произведение и сумма большего числа событий определяются по
аналогии с определениями 2.8 и 2.9.
Свойства операций сложения и умножения
1. A + B = B + A − коммутативность сложения.
2. A + ( B + C ) = ( A + B ) + C − ассоциативность сложения.
3. AB = BA − коммутативность умножения.
4. A( BC ) = ( AB )C − ассоциативность умножения.
5. A( B + C ) = AB + AC

 − законы дистрибутивности.
6. A + BC = ( A + B )( A + C ) 
Вопросы для самоконтроля
1. Что называют опытом или испытанием?
2. Что называют событием?
3. Какое событие называют достоверным в данном опыте?
4. Какое событие называют невозможным в данном опыте?
5. Какое событие называют случайным в данном опыте?
6. Какие события называют совместными в данном опыте?
7. Какие события называют несовместными в данном опыте?
8. Что называют полной группой событий?
9. Какие события называют противоположными?
10. Какие события считают равновозможными?
11. Что называют элементарным исходом?
12. Что называют пространством элементарных событий?
13. Что называют сумой или объединением двух событий?
14. Что называют произведением двух событий?
15. Что называют разностью двух событий?
18
3. РАЗЛИЧНЫЕ ОПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ.
СВОЙСТВА ВЕРОЯТНОСТИ
3.1. Статистическое определение вероятности
Определение 3.1. Относительной частотой ω или частостью случайного события A называется отношение числа m появлений данного события к общему числу n проведенных одинаковых испытаний, в каждом
из которых могло появиться или не появиться данное событие.
Из наблюдений различных явлений следует, что если число испытаний в каждой серии практически невелико, то относительные частоты появления события A в каждой серии могут существенно отличаться друг от
друга. Если же число опытов в серии велико, то, как правило, относительные частоты появления события A в различных сериях отличаются друг
от друга мало и это отличие тем меньше, чем больше число испытаний в
сериях.
Опыт показывает, что в подавляющем большинстве случаев существует число p , такое, что относительные частоты появления события A
при большом числе испытаний, кроме редких случаев, мало отличаются от
этого числа p :
m
lim = p.
(3.1)
n →∞ n
Число p называется вероятностью появления случайного события A :
P( A) = p.
(3.2)
Другими словами, равенство (3.1) формулируется так: при неограниченном увеличении числа опытов n относительная частота события A
сходится к вероятности p этого события.
Таким образом, при статистическом определении вероятности за вероятность события принимается его частость.
3.2. Классическое определение вероятности. Свойства вероятности
Пусть достоверное событие E (пространство элементарных событий Ω )
распадается на n равновозможных случаев A1, A2 ,..., An ( A1 + A2 + ... + An = E) ,
сумма m из которых дает событие A . Те случае из A1, A2 ,..., An , на кото19
рые распадается событие A , называются благоприятствующими для события A , так как появление одного из них обеспечивает наступление A .
Определение 3.2. Вероятностью p события A называется отношение числа m благоприятствующих случаев к числу всех возможных случаев n :
m
P( A) = = p.
(3.3)
n
Пример 2.1 (продолжение)
P( A) =
3 1
3 1
= ; P( B ) = = .
6 2
6 2
Пример 3.1. Буквы Т, Е, И, Я, Р, О написаны на отдельных карточках. Ребенок берет карточки и в случайном порядке прикладывает одну к
другой все шесть. Какова вероятность того, что получится слово
«ТЕОРИЯ»?
Решение. Пусть событие A – получено слово «ТЕОРИЯ». Различные
варианты буквосочетаний представляют собой перестановки из шести элементов и отличаются только порядком следования букв, поэтому общее
число случаев n = P6 = 6! = 720 . Благоприятствующим событию A будет
только один случай, поэтому m = 1 . Согласно формуле (3.3)
P( A) =
1
.
720
Ответ: вероятность получить слово «ТЕОРИЯ» составляет
1
.
720
Свойства вероятности
1. Для любого события A выполняется условие: 0 ≤ P ( A) ≤ 1.
Это следует из того, что P( A) =
2. P( E ) =
m
и 0≤ m≤n.
n
n
= 1.
n
20
3. Теорема сложения вероятностей для несовместных событий
Если AB = ∅, то
P( A + B ) = P ( A) + P ( B).
(3.4)
Доказательство. Пусть E распадается на n равновозможных случаев, из
которых событию A благоприятствует m A случаев, а событию B – mB
случаев. Тогда число случаев, благоприятствующих A + B , равно m A + mB
(ни один из случаев, благоприятствующих событию A , не входит в случаи,
благоприятствующие событию B ). Поэтому
m + mB m A mB
P( A + B ) = A
=
+
= P ( A) + P ( B ).
■
n
n
n
4. P( A) = 1 − P ( A).
Доказательство
A ⋅ A = ∅; A + A = E .
Поэтому
1 = P ( E ) = P ( A) + P ( A);
P( A) = 1 − P ( A).
■
5. P(∅) = 0.
Доказательство
∅ = E;
P(∅) = P ( E ) = 1 − P ( E ) = 1 − 1 = 0.
■
6. Теорема сложения вероятностей для совместных событий
P( A + B ) = P ( A) + P ( B ) − P ( AB )
(3.5)
для любых событий A и B .
Доказательство
Так как в суммах A + B = A + ( B − AB) и B = AB + ( B − AB) слагаемые
являются несовместными событиями, то в соответствии со свойством 3
P( A + B ) = P ( A) + P ( B − AB );
P( B ) = P( AB) + P ( B − AB).
Тогда
P( A + B ) = P ( A) + P ( B − AB ) = P ( A) + P ( B ) − P ( AB ).
21
■
7. Если событие A влечет за собой событие B , то P( A) ≤ P ( B) .
Доказательство
B = A + AB.
Тогда
P( B ) = PA) + P ( AB ) ≥ P ( A).
■
3.3. Геометрическое определение вероятности
Классическая формула вероятности предполагает конечное число
всех исходов испытания. Но часто встречаются такие испытания, для которых число возможных исходов бесконечно. Например, при изготовлении на станке некоторой детали нужно выдержать определенный размер.
Здесь точность изготовления детали зависит от мастерства рабочего, точности измерительного оборудования и т.д. Таким образом, можно получить деталь любого размера, как угодно близкого к требуемому. Если под
опытом понимать изготовление детали, то в результате такого опыта возможно бесконечное множество исходов.
Для преодоления указанного недостатка классической формулы вероятности, если позволяют обстоятельства опыта, часто используют понятия геометрии.
Пусть имеется некоторая n -мерная область D , n( D ) – n -мерный
объем этой области.
Заметим, что при n = 1 n -мерным объемом области D является длина отрезка; при n = 2 – площадь фигуры; при n = 3 – объем тела.
Пусть в области D содержится некоторая n -мерная область d , n(d ) –
ее n -мерный объем. В D наугад бросается точка, которая может оказаться
в любой точке области D , т.е. в результате бросания точки (опыта) возможно бесчисленное множество исходов. Обозначим через A событие, состоящее в попадании брошенной точки в область d . Тогда область d будет являться благоприятствующей появлению события A .
Определение 3.3. Геометрической вероятностью события A называется отношение n -мерного объема области, благоприятствующей появлению события, к n -мерному объему всей области:
n( d )
P( A) =
.
(3.6)
n( D )
22
Пример 3.2 (задача о встрече)
Два студента X и Y условились встретиться в определенном месте
между 12 часами и часом. Пришедший первым ждет второго в течение 20
минут, после чего уходит. Чему равна вероятность встречи студентов, если
приход каждого из них в течение указанного времени может произойти
наудачу и моменты прихода независимы (т.е. момент прихода одного студента не влияет на момент прихода другого)?
Решение (алгоритм)
1. Введение независимых переменных, которые полностью определяют ответ на вопрос задачи.
В задаче независимыми переменными будут: x – время прихода
первого студента, y – время прихода второго студента. Событие A –
встреча состоялась.
2. Описание области D :
D = {( x; y ) : 0 ≤ x ≤ 60, 0 ≤ y ≤ 60} .
3. Описание области, соответствующей событию, вероятность которого необходимо найти:
d = {( x; y ) : 0 ≤ x ≤ 60, 0 ≤ y ≤ 60, x − y ≤ 20}
(добавлено условие, гарантирующее встречу).
4. Построение на плоскости областей D и d , рис. 3.1.
y
D
60
y = x + 20
40
d
20
y = x − 20
О
20
40
60
x
Рис. 3.1
5. Исходя из построений на шаге 4 производится вычисление вероятности интересующего события по формуле (3.6):
n( D) = 60 ⋅ 60 = 3600;
40 ⋅ 40
n(d ) = n( D ) − 2 ⋅ S ∆ = 3600 − 2 ⋅
= 3600 − 1600 = 2000;
2
23
P( A) =
2000 5
= .
3600 9
Ответ: вероятность встречи составляет
5
.
9
Пример 3.3. Коэффициенты
q
p
и
квадратного уравнения
x 2 + px + q = 0 выбирают наудачу в промежутке [0;1]. Чему равна вероятность того, что корни будут действительными числами?
Решение
Независимыми переменными задачи являются p и q , так как корни
уравнения x1, x2 ∈ ℝ в том случае, когда D = p 2 − 4q ≥ 0, т.е. p 2 ≥ 4q.
Таким образом, событие A – корни являются действительными числами определяется значениями переменных p и q :
D = {( p; q ) : 0 ≤ p ≤ 1, 0 ≤ q ≤ 1} ;
{
}
d = ( p; q ) : 0 ≤ p ≤ 1, 0 ≤ q ≤ 1, p 2 ≥ 4q .
Изобразим области D и d (рис. 3.2).
q
1
D
d
O
р
1
Рис. 3.2
1
1
p2
p3
1 0
1
n( D ) = 1 ⋅ 1 = 1 ; n( d ) = ∫
dp =
= − = ;
12 0 12 12 12
0 4
1
1
P( A) = 12 = .
1 12
Ответ: вероятность того, что корни квадратного уравнения будут
1
действительными числами, составляет
.
12
24
3.4. Аксиоматическое построение теории вероятностей
(для ознакомления)
Аксиоматическое построение теории вероятностей предполагает построение математической модели, в которой учитывались бы все возможные исходы эксперимента.
Пусть Ω – множество элементарных событий;
F – некоторая система подмножеств множества Ω .
Система F называется алгеброй событий, если выполняются следующие условия:
1. Ω ∈ F .
2. Если из того, что A ∈ F , B ∈ F ⇒ A ∪ B ∈ F , A ∩ B ∈ F .
3. Если из того, что A ∈ F ⇒ A ∈ F .
Алгебра событий F называется σ -алгеброй, если условие 2 выполняется для любой последовательности множеств Ak (k = 1, 2, ...) .
Если задано множество Ω и какая-нибудь σ -алгебра F , то говорят,
что задано измеримое пространство Ω, F .
Определение 3.4. Вероятностью события называется некоторая
числовая функция P , определенная на σ -алгебре множества F измеримого пространства и удовлетворяющая следующим аксиомам:
P1. P( A) ≥ 0 для ∀ A ∈ F .
P2. P(Ω) = 1.
P3. Если A1, A2, A3,... – такая последовательность событий, что Ai ⋅ Aj = ∅
при i ≠ j , то
 ∞
 ∞
P  ∪ Ak  = ∑ P( Ak ).
 k =1  k =1
Аксиомы P1 − P3 предложены А.Н. Колмогоровым. Эквивалентной
P3 является следующая аксиома непрерывности.
P3′. Если B1, B2 , B3 ,... – последовательность таких событий, что
Bn +1 ⊂ Bn , где n = 1, 2,... и
∞
∩ Bn = B , то
n =1
lim P ( Bn ) = P ( B ).
n →∞
Тройка Ω, F , P называется вероятностным пространством.
25
Из определения вероятности вытекают следующие ее свойства:
1. P(∅) = 0.
2. 0 ≤ P( A ) ≤ 1.
3. P( A) = 1 − P ( A).
4. Если A ⊂ B, то P( A) ≤ P ( B).
5. P( A + B ) = P ( A) + P ( B) − P ( AB ).
Вопросы для самоконтроля
1. Что такое частота событий?
2. Чему равна частота достоверного события?
3. Чему равна частота невозможного события?
4. В каких пределах заключена частота случайного события?
5. Какое определение вероятности называют статистическим?
6. Какие элементарные исходы называют благоприятствующими
данному событию?
7. Что представляет собой полная группа событий при подбрасывании одной монеты?
8. Что представляет собой полная группа событий при подбрасывании двух монет?
9. Какое определение вероятности называют классическим?
10. В каких пределах заключена вероятность случайного события?
11. Чему равна вероятность достоверного события?
12. Чему равна вероятность невозможного события?
13. Чему равна вероятность суммы двух несовместных событий?
14. Чему равна вероятность суммы двух совместных событий?
15. Чему равна сумма вероятностей противоположных событий?
16. Как определяется геометрическая вероятность в общем случае?
17. Как определяется геометрическая вероятность в случае трехмерного пространства?
18. Как определяется геометрическая вероятность в случае двумерного пространства?
19. Как определяется геометрическая вероятность в случае одномерного пространства?
26
4. УСЛОВНАЯ ВЕРОЯТНОСТЬ. ТЕОРЕМА УМНОЖЕНИЯ
ВЕРОЯТНОСТЕЙ. ПОЛНАЯ ВЕРОЯТНОСТЬ
Определение 4.1. Событие A называется зависимым от события B,
если вероятность появления события A зависит от того, произошло или не
произошло событие B.
Определение 4.2. Вероятность того, что произошло событие A при
условии, что произошло событие B , называют условной вероятностью
события A при условии B , обозначают P( A / B ).
Пример 4.1. В коробке находятся три белых и два черных шара. Из
коробки извлекается сначала один шар, а затем второй. Событие B – появление белого шара при первом извлечении. Событие A – появление белого шара при втором извлечении.
Тогда P( A / B ) =
2 1
3
= ; P( A / B ) = .
4 2
4
Таким образом, P( A / B ) ≠ P ( A / B ).
Теорема 4.1 (умножения вероятностей). Вероятность совместного появления двух событий (вероятность произведения двух событий)
равна произведению вероятности одного из них на условную вероятность
другого, найденную в предположении, что первое событие уже произошло, т.е.
P( AB ) = P ( B) P ( A / B)
(4.1)
P( AB ) = P ( A) P ( B / A).
(4.2)
или
Доказательство (для случая классического определения вероятности).
Пусть достоверное событие E распадается на n равновозможных
случаев, из которых событию B благоприятствуют m случаев, а событию
AB – r случаев. После того, как произошло событие B , число всех равновозможных случаев для A сократилось до m, а число благоприятствующих равно числу благоприятствующих для события AB.
27
Поэтому
r
r
P ( AB )
P( A / B ) = = n =
.
m m
P( B )
n
(4.3)
Умножая правую и левую части формулы (4.3) на P ( B ) , получаем (4.1). ■
Замечание 4.1. Доказательство (4.2) можно провести аналогично.
Следствие 4.1. Когда А и B – независимые события, т.е. P( A/ B) = P( A),
то
P( AB ) = P ( A) ⋅ P ( B).
(4.4)
Другими словами, вероятность совместного наступления двух независимых событий равна произведению их вероятностей.
Следствие 4.2. Вероятность совместного появления нескольких зависимых событий A1, A2 ,..., An равна произведению вероятности одного из
них на условные вероятности всех остальных, причем вероятности каждого последующего события вычисляются в предположении, что все предыдущие события уже появились:
P( A1 A2 A3... An −1 An ) = P ( A1 ) P( A2 / A1 ) P( A3 / A1 A2 )...P( An / A1 A2 A3... An −1 ). (4.5)
Пример 4.2. Рекламное агентство претендует на два заказа от двух
крупных фирм. Эксперты агентства считают, что вероятность получения
заказа в фирме A равна 0,45. Они также полагают, что если агентство получит заказ у фирмы A , то вероятность того, что фирма B обратится к
ним, составляет 0,8. Какова вероятность того, что агентство получит оба
заказа?
Решение. Обозначим через A событие, состоящее в получении заказа в фирме A , через B – в получении заказа в фирме B . События A и
B зависимые, так как событие B зависит от того, произойдет или нет
событие A .
По условию имеем: P( A) = 0, 45 ; P( B / A) = 0,8 .
Согласно (4.2)
P( AB ) = 0, 45 ⋅ 0,8 = 0,36 .
Ответ: вероятность получения двух заказов составляет 0,36.
28
Пример 4.3. В коробке 6 белых и 4 черных шара. Из нее извлекают
подряд три шара. Найти вероятность того, что все три шара – белые.
Решение. Обозначим через А событие, состоящее в том, что все три
вынутых шара белые; через А1 – первым вынут белый шар; А2 – вторым
вынут белый шар; А3 – третьим вынут белый шар.
Искомое событие А состоит в совместном наступлении событий А1 ,
А2 , А3 . События А1 , А2 , А3 – зависимые.
Воспользуемся формулой (4.5):
6 6 −1 6 − 2 1
⋅
⋅
= .
10 10 − 1 10 − 2 6
1
Ответ: вероятность вынуть подряд три белых шара составляет .
6
P( A) = P ( A1 A2 A3 ) = P ( A1 ) P( A2 / A1 ) P( A3 / A1 A2 ) =
Теорема 4.2. Если событие A может произойти только при выполнении одного из событий H1, H 2 ,..., H n , которые образуют полную
группу несовместных событий, то вероятность события A вычисляется
по формуле
P( A) = P ( H1 ) P( A / H1 ) + P ( H 2 ) P ( A / H 2 ) + ... + P ( H n ) P ( A / H n ). (4.6)
Формула (4.6) – формула полной вероятности.
Доказательство
Поскольку события H1, H 2 ,..., H n образуют полную группу, их объединение есть достоверное событие. Событие A может произойти только
вместе с каким-нибудь событием H k . Таким образом, событие A есть объединение событий AH1, AH 2 ,..., AH n . Так как события H1, H 2 ,..., H n по
условию несовместны, то события AH1, AH 2 ,..., AH n тоже несовместны.
Следовательно, по теореме сложения вероятностей получаем:
P( A) = P ( AH1 ) + P ( AH 2 ) + ... + P ( AH n ) .
Заменяя слагаемые правой части по формуле (4.1), получим равенство (4.6).
■
Пример 4.4. Одна и та же контрольная работа была проведена в трех
параллельных группах. В первой группе, где обучаются 30 студентов, оказалось 8 работ, выполненных на «отлично»; во второй, где 28 студентов, –
6 работ; в третьей, где 27 студентов, – 9 работ. Найти вероятность того,
29
что первая работа, взятая наудачу при повторной проверке, из работ, принадлежащих группе, которая также выбрана наудачу, окажется выполненной на «отлично».
Решение
Обозначим через A событие, состоящее в том, что взятая при повторной проверке работа оказалась выполненной на «отлично»; H1 – работа выполнена студентом первой группы; H 2 – работа выполнена студентом второй группы; H 3 – работа выполнена студентом третьей группы.
Так как группа для повторной проверки выбирается наудачу, то
1
P( H1 ) = P ( H 2 ) = P( H 3 ) = .
3
На основании условия задачи
8
6
9
P( A / H1 ) = ; P( A / H 2 ) = ; P( A / H 3 ) = .
30
28
27
Тогда
P( A) = P ( H1 ) P ( A / H1 ) + P( H 2 ) P( A / H 2 ) + P( H 3 ) P( A / H 3 ) =
1 8 1 6 1 9 1  4 3 1  1 171 19
= ⋅ + ⋅ + ⋅
= ⋅ + +  = ⋅
= .
3 30 3 28 3 27 3  15 14 3  3 210 70
Ответ: вероятность того, что первая работа, взятая наудачу при по19
вторной проверке, окажется выполненной на «отлично», составляет
.
70
Вопросы для самоконтроля
1. Как определяется зависимость двух событий?
2. Чему равна вероятность совместного появления двух событий в
общем случае?
3. Чему равна вероятность совместного появления двух независимых событий?
4. Чему равна вероятность совместного появления нескольких зависимых событий?
5. В каких предположениях вычисляется вероятность события A по
формуле полной вероятности?
30
5. ФОРМУЛА БАЙЕСА
Байес (Бейес) Томас (Bayes Thomas) (1702 – 1761) – английский математик, член Лондонского королевского общества. Основные труды относятся к теории вероятностей, теорема Байеса опубликована в 1763 г.
Постановка задачи. В практических задачах достаточно часто представляет интерес полная группа несовместных событий H1, H 2 ,..., H n , вероятности которых P( H k ) ( k = 1, n ) известны. Эти события могут быть непосредственно не наблюдаемы, но можно наблюдать некоторое событие
A, с ними связанное, для которого известны условные вероятности
P( A / H k ) ( k = 1, n ). Допустим, что произведен опыт, в результате которого
появилось событие A. На основании этого опыта требуется сделать выводы относительно событий H1, H 2 ,..., H n , т.е. определить, как изменились
их вероятности после произведенного опыта. Иначе говоря, нужно найти
условные вероятности событий H1, H 2 ,..., H n относительно события A.
Решение.
На основании теоремы 4.1 (умножения вероятностей)
P( AH k ) = P( A) P ( H k / A) = P ( H k ) P ( H k / A).
Отсюда следует:
P( H k / A) =
P( H k ) P( A / H k )
.
P( A)
Подставляя в последнюю формулу выражение вероятности события
A из формулы полной вероятности (4.6), получим:
P( H k / A) =
P( H k ) P( A / H k )
n
∑ P( H k ) P ( A / H k )
( k = 1, n ) .
(5.1)
k =1
Формула (5.1), решающая поставленную задачу, обычно называется
формулой Байеса или теоремой гипотез.
Замечание 5.1. Вероятности P( H k ) ( k = 1, n ) интересующих нас
событий H1, H 2 ,..., H n до опыта обычно называются априорными вероятностями (от латинского «a priori», что значит «сперва», т.е. в данном
31
случае до того, как был произведен опыт). Вероятности P( H k / A) ( k = 1, n )
тех же событий после опыта называются апостериорными (от латинского слова «a posteriori», что значит «после», т.е. в данном случае после
опыта).
Пример 5.1. На некотором производстве 30 % всех приборов собирают специалисты высокой квалификации и 70 % приборов – специалисты
средней квалификации. Надежность работы прибора, собранного специалистом высокой квалификации, составляет 0,9; надежность работы прибора, собранного специалистом средней квалификации, – 0,8. Взятый наудачу прибор оказался надежным. Определить вероятность того, что он собран специалистом высокой квалификации.
Решение. Рассмотрим событие A, состоящее в безотказной работе
прибора. До проверки прибора возможны гипотезы: H1 – прибор собран
специалистом высокой квалификации, причем P( H1 ) = 0,3 ; H 2 – прибор
собран специалистом средней квалификации, причем P( H 2 ) = 0,7.
Согласно условию задачи P( A / H1 ) = 0,9; ( A / H 2 ) = 0,8.
Требуется определить P( H1 / A). Воспользуемся формулой Байеса
(5.1) для k = 1 и n = 2 :
P( H1 / A) =
P( H1 ) P ( A / H1 )
.
P ( H1 ) P ( A / H1 ) + P ( H 2 ) P ( A / H 2 )
P( H1 / A) =
0,3 ⋅ 0,9
0, 27
=
= 0,325.
0,3 ⋅ 0,9 + 0,7 ⋅ 0,8 0,83
Получаем
Ответ: вероятность того, что надежно работающий прибор собран
специалистом высокой квалификации, составляет 0,325.
Вопросы для самоконтроля
1. Какую задачу можно решить с использованием формулы Байеса?
2. Каким образом взаимосвязаны формула Байеса и формула полной вероятности?
32
6. ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ.
ФОРМУЛА БЕРНУЛЛИ
Бернулли Якоб (Bernoulli Jacob) (27.12.1654 – 16.08.1705) – швейцарский математик, профессор математики Базельского университета. Известны работы Я. Бернулли по алгебре, арифметике, геометрии, теории
рядов, теории вероятностей, физике. В работе «Искусство предположений» (опубл. В 1713 г.) доказал теорему (Бернулли) – важный частный
случай закона больших чисел.
Рассмотрим сложный опыт, состоящий из нескольких более простых
испытаний, в каждом из которых может появиться или не появиться некоторое событие A.
Определение 6.1. Несколько испытаний называются независимыми
относительно события A , если вероятность появления события A в каждом из них не зависит от исходов других испытаний.
Постановка задачи. Предположим, что производятся n независимых испытаний, в каждом из которых вероятность события A равна p,
0 < p < 1. Требуется найти вероятность Pn (k ) того, что событие A появится k раз.
Решение
Для того чтобы при n испытаниях событие A появилось k раз, необходимо и достаточно, чтобы появилась одна из последовательностей событий A1, A2 ,..., An , в которых k событий из A1, A2 ,..., An совпадают с A, а
n − k совпадают с противоположным событием A. Очевидно, что число
таких последовательностей равно числу сочетаний из n по k , т.е.
n!
Cnk =
. В силу независимости опытов вероятность каждой такой
k !(n − k )!
последовательности по теореме умножения для независимых событий равна p k q n − k , где q = 1 − p. В силу несовместности всех возможных последовательностей вероятность Pn (k ) равна сумме вероятностей всех последовательностей, состоящих из k событий A и n − k событий A , т.е. сумме
Cnk слагаемых, равных p k q n − k :
Pn (k ) = Cnk p k q n − k =
n!
pk qn−k
k !(n − k )!
(k = 0, n).
Формула (6.1) называется формулой Бернулли.
33
(6.1)
Замечание 6.1. Вероятность Pn (k ) равна коэффициенту при x k в
разложении бинома (q + px) n по степеням x . В силу этого свойства совокупность вероятностей Pn (k ) называют биномиальным законом распределения вероятностей.
Пример 6.1. Вероятность изготовления на автоматическом станке
стандартной детали равна 0,8. Найти вероятность того, что среди пяти отобранных деталей только одна бракованная.
Решение.
Вероятность
изготовления
бракованной
детали
p = 1 − 0,8 = 0,2 , тогда q = 0,8 . Общее количество отобранных деталей n = 5 .
Так как вероятность оказаться бракованной для каждой детали постоянна,
то имеем последовательность независимых испытаний. Порядок не важен,
поэтому применима формула Бернулли при k = 1 :
P5 (1) = C51 ⋅ 0, 21 ⋅ 0,85−1 =
5!
0, 2 ⋅ 0,84 = 0, 4096 .
1!(5 − 1)!
Ответ: вероятность, что среди пяти деталей только одна бракованная, составляет 0,4096.
6.1. Вероятность появления события некоторое число раз
Во многих практических задачах приходится определять вероятность того, что интересующее нас событие появится определенное число
раз. Рассмотрим эти случаи:
1) вероятность того, что событие наступит менее k раз, определяется формулой
Pn (m < k ) = Pn (0) + Pn (1) + ... + Pn (k − 1) =
k −1
∑ Pn (m) ;
m=0
2) вероятность того, что событие наступит более k раз, определяется формулой
Pn (m > k ) = Pn (k + 1) + Pn (k + 2) + ... + Pn (n) =
n
∑
m = k +1
Pn (m) ;
3) вероятность того, что событие наступит не менее k раз, определяется формулой
Pn (m ≥ k ) = Pn (k ) + Pn (k + 1) + Pn (k + 2) + ... + Pn (n) =
34
n
∑ Pn (m) ;
m=k
4) вероятность того, что событие наступит не более k раз, определяется формулой
Pn (m ≤ k ) = Pn (0) + Pn (1) + ... + Pn (k − 1) + Pn (k ) =
k
∑ Pn (m) .
m=0
Замечание 6.2. Совокупность событий, когда событие A появляется в n испытаниях 0, 1,..., n − 1, n раз, представляет собой полную
группу несовместных событий. Поэтому справедлива формула
n
∑ Pn (k ) = 1 , которая может быть использована при решении задач.
k =0
Пример 6.2. В среднем 20 % пакетов акций на аукционах продаются
по первоначально заявленной цене. Найти вероятность того, что из 9 пакетов акций в результате торгов по первоначально заявленной цене:
1) не будут проданы 5 пакетов;
2) будет продано менее 2 пакетов;
3) будет продано не более 2 пакетов;
4) будет продано хотя бы 2 пакета.
Решение. Вероятность того, что пакет акций будет продан по первоначально заявленной цене, составляет p = 0,2, тогда q = 0,8 . Общее количество пакетов, выставленных на торги, n = 9. Так как вероятность продажи по первоначально заявленной цене для каждого пакета акций постоянна, имеем последовательность независимых испытаний. Порядок продаж
не важен, поэтому применима формула Бернулли:
1) событие, состоящее в том, что по первоначально заявленной цене
не будут проданы 5 пакетов, означает, что проданы будут только k = 4 пакета. По формуле Бернулли P9 (4) = C94 ⋅ 0, 24 ⋅ 0,85 = 0,066;
2) P9 (k < 2) = P9 (0) + P9 (1) = C90 ⋅ 0, 20 ⋅ 0,89 + C91 ⋅ 0,21 ⋅ 0,88 = 0, 436;
3) P9 (k ≤ 2) = P9 (0) + P9 (1) + P9 (2) = C90 ⋅ 0,20 ⋅ 0,89 + C91 ⋅ 0, 21 ⋅ 0,88 +
+C92 ⋅ 0,22 ⋅ 0,87 = 0,738;
4) P9 (k ≥ 2) = 1 − P9 (k < 2) = 1 − 0,436 = 0,564.
Ответ: 1) 0,066; 2) 0,436; 3) 0,738; 4) 0,564.
35
6.2. Наивероятнейшее число наступлений события
Определение 6.2. Число m0 наступлений события в n испытаниях
называется наивероятнейшим, если вероятность наступления события m0
раз в этой последовательности испытаний наибольшая по сравнению с вероятностями других исходов.
Пусть n – число независимых испытаний; p – вероятность наступления события в отдельном испытании. Тогда наивероятнейшее число наступлений события m0 удовлетворяет неравенствам
np − q ≤ m0 ≤ np + p,
(6.2)
где q = 1 − p.
Если np + p – целое число, то наивероятнейших чисел два: np + p и
np − q.
Пример 6.3. Доля изделий высшего сорта на определенном производстве составляет 31 %. Чему равно наивероятнейшее число изделий
высшего сорта в случайно отобранной партии из 75 изделий?
Решение.
Согласно условию n = 75, p = 0,31, q = 1 − p = 0,69. На основании
(6.2) будем иметь:
75 ⋅ 0,31 − 0,69 ≤ m0 ≤ 75 ⋅ 0,31 + 0,31;
22,56 ≤ m0 ≤ 23,56.
Ответ: m0 = 23.
Пример 6.2 (продолжение). Найти наивероятнейшее число проданных пакетов акций и соответствующую вероятность.
Решение. Наивероятнейшее число пакетов акций, проданных по первоначальной цене, определим по формуле (6.2).
Получаем 9 ⋅ 0,2 − 0,8 ≤ m0 ≤ 9 ⋅ 0, 2 + 0, 2; 1 ≤ m0 ≤ 2.
Таким образом, наивероятнейших чисел два: m0′ = 1 и m0′′ = 2.
Поэтому P9 (m0 ) = P9 (1) + P9 (2) = C91 ⋅ 0, 21 ⋅ 0,88 + C92 ⋅ 0, 22 ⋅ 0,87 = 0,604.
Ответ: наивероятнейшее число проданных пакетов акций – 1 или 2,
вероятность этого события 0,604.
36
6.3. Необходимое число опытов для наступления события
Если некоторое событие может наступить при проведении каждого
опыта с вероятностью p , то количество n опытов, которые необходимо
провести, чтобы с вероятностью P можно было утверждать, что данное
событие произойдет, по крайней мере, один раз, определяется по формуле
lg(1 − P )
.
(6.3)
lg(1 − p )
Пример 6.4. Вероятность попадания снаряда в цель равна 0,3.
Сколько должно быть произведено независимых выстрелов, чтобы вероятность по меньшей мере одного попадания в цель была больше 0,9?
Решение
p = 0,3; P = 0,9.
По формуле (6.3)
lg(1 − 0,9) lg 0,1
n≥
=
= 6, 4557.
lg(1 − 0,3) lg 0,7
n≥
Ответ: необходимо произвести 7 выстрелов.
6.4. Локальная и интегральная теоремы Лапласа
Лаплас Пьер Симон (Laplace Pierre Simon) (1749 – 1827) – французский астроном, математик, физик.
Пример 6.5. Вероятность того, что изделие некоторого производства
окажется бракованным, равна 0,005 . Чему равна вероятность того, что из
10000 наудачу взятых изделий бракованных окажется:
1) ровно 40;
2) не более 70.
Решение. n = 10000 ; p = 0,005; q = 0,995.
40
1) P10000 (40) = C10000
(0,005) 40 (0,995)9960 = ... ;
2)
70
70
m =0
m =0
m
(0,005) m (0,995)10000 − m = ...
∑ P10000 (m) = ∑ C10000
Замечание 6.3. При решении реальных задач постоянно возникают
k
ситуации, требующие приближенного вычисления
∑ Pn (m)
m =l
ших n и малых k ; при малых p и больших n .
37
– при боль-
Теорема 6.1* (локальная теорема Лапласа). Если вероятность p
наступления события A в каждом испытании постоянна и отлична от 0
и 1 , то вероятность Pn (k ) того, что событие A произойдет k раз в n
независимых испытаниях, удовлетворяет предельному равенству
lim
n →∞
1 −x
где ϕ( x) =
e
2π
2
2
npq ⋅ Pn (k )
= 1,
ϕ( x)
(6.4)

 −x2  
1
k − np
ϕ
(
x
)
=
exp
.


  – функция Гаусса и x =
2
π
npq
2



Следствие 6.1. При сделанных предположениях относительно p ,
если n достаточно большое, имеет место приближенное равенство
Pn (k ) ≈
 k − np 
1
ϕ
.
npq  npq 
(6.5)
Замечание 6.4. Значения функции Гаусса табулированы. Эта функция четная, монотонно убывающая при положительных значениях аргумента (при x > 4 ϕ( x) ≈ 0 ).
Замечание 6.5. Приближенные значения вероятности Pn (k ) , даваемые формулой (6.5), на практике используются как точные при условии
npq ≥ 20 .
Теорема 6.2* (Интегральная теорема Лапласа). Если вероятность
p наступления события A в каждом испытании постоянна и отлична
от 0 и 1 , то вероятность Pn (k1, k2 ) того, что событие A произойдет не
менее k1 и не более k2 раз в n независимых испытаниях, удовлетворяет
предельному равенству
Pn (k1, k2 ) = lim
n →∞
где x1 =
k1 − np
k − np
; x2 = 2
.
npq
npq
38
1
2π
x2
∫e
x1
−
x2
2 dx,
(6.6)
Замечание 6.6. При решении задач используют следующую формулу,
вытекающую из интегральной теоремы Лапласа:
1
Pn (k1, k2 ) ≈ ( Φ ( x2 ) − Φ ( x1 ) ) ,
(6.7)
2
x
где Φ ( x) =
2
⋅ e
2π ∫0
−
t2
2 dt
− функция Лапласа, значения которой табулиро-
ваны.
Свойства функции Лапласа
1. D(Φ ) = ℝ .
2. Φ (0) = 0 .
3. Φ (− x) = −Φ ( x).
4.
lim Φ ( x) = 1 .
x →+∞
5. Функция монотонно возрастает на всей области определения.
Замечание 6.7. В случае если функция Лапласа определена формулой
x
t2
−
1
Φ( x) =
⋅ ∫ e 2 dt , (6.7) примет вид
2π 0
Pn (k1, k2 ) ≈ Φ ( x2 ) − Φ ( x1 ).
Замечание 6.8. Приближенные значения вероятности Pn (k1, k2 ) , даваемые формулой (6.7), на практике используются как точные при условии npq ≥ 20 .
Пример 6.6. Вероятность появления события в каждом из 2100 независимых испытаний равна 0,7 . Найти вероятность того, что событие появится:
1) ровно 1485 раз;
2) не менее 1470 и не более 1500 раз.
Решение
По условию p = 0,7 . Так как n = 2100
достаточно велико,
npq = 2100 ⋅ 0,7 ⋅ (1 − 0,7) = 441 > 20, то можно использовать локальную и
интегральную теоремы Лапласа.
39
1. На основании асимптотической формулы Pn (k ) ≈
P2100 (1485) ≈
 k − np 
1
ϕ

npq  npq 
1
 1485 − 1470  1  15  1
ϕ
 = ϕ   ≈ ⋅ ϕ(0,71) =
441 
441  21  21  21
=
0,3101
= 0,0147(6) ≈ 0,0148.
21
2. На основании асимптотической формулы (6.7)
1   1500 − 1470 
 1470 − 1470  
P2100 (1470,1500) ≈  Φ 
 − Φ
 =
2 
21
21



=
1
1
( Φ(1,43) − Φ(0) ) = ( 0,8473 − 0 ) = 0, 42365.
2
2
Ответ: 1) 0,0148 ; 2) 0, 42365 .
Вопросы для самоконтроля
1. В каком случае испытания называются независимыми относительно некоторого события?
2. Каким образом вычисляется вероятность появления события ровно k раз в n независимых испытаниях?
3. Какое событие является противоположным к событию: благоприятный исход наступил не менее k раз в n независимых испытаниях?
4. Какое событие является противоположным к событию: благоприятный исход наступил хотя бы один раз в n независимых испытаниях?
5. Как определяется наивероятнейшее число наступлений благоприятного исхода в n независимых испытаниях?
6. Каким образом определяется необходимое число опытов, чтобы
с заданной вероятностью обеспечить появление требуемого исхода по
крайней мере один раз?
7. В каком случае следует использовать при решении задач локальную теорему Лапласа?
8. В каком случае следует использовать при решении задач интегральную теорему Лапласа?
40
7. ФОРМУЛА ПУАССОНА. ПРОСТЕЙШИЙ ПОТОК СОБЫТИЙ
Пуассон Симеон Дени (Poisson Siméon Denis) (1781 – 1840) – французский механик, физик, математик.
Теорема 7.1 (Пуассона). Вероятность Pn (k ) того, что событие A
произойдет k раз в n независимых испытаниях, если вероятность p наступления события A в каждом испытании постоянна и достаточна
мала ( p → 0 ), число испытаний неограниченно возрастает ( n → ∞ ), причем np = λ = const , удовлетворяет предельному равенству
λ k ⋅ e−λ
lim Pn (k ) =
.
n →∞
k!
(7.1)
Доказательство
Так как np = λ , то p =
λ
и
n
lim Pn (k ) = lim Cnk p k q n − k = lim Cnk p k (1 − p ) n − k =
n →∞
n →∞
n →∞
n(n − 1)(n − 2)...(n − k + 1)  λ 
= lim
 
n →∞
k!
n
k
 λ
1 − 
 n
n
 λ
1 − 
 n
−k
=
λk
  1   2   k −1
=
lim 1 ⋅ 1 −  ⋅ 1 −  ...1 −
 ×
k ! n →∞   n   n  
n  
n
 λ
 λ
× lim 1 −  ⋅ lim 1 − 
n →∞ 
n  n →∞  n 
−k
=
λk
λ k ⋅ e−λ
⋅ 1 ⋅ e−λ ⋅ 1 =
.
k!
k!
■
Из предельного равенства (7.1) вытекает асимптотическая формула
Пуассона:
λ k ⋅ e−λ
Pn (k ) ≈
; λ = np ; k = 0 , 1, 2,...
k!
(7.2)
Формулу (7.2) рекомендуется использовать, когда вероятность успеха p крайне мала, т.е. сам по себе успех (появление события A ) является
41
редким событием, но количество испытаний n велико, среднее число успехов np = λ незначительно. Приближенную формулу (7.2) обычно используют, когда n ≥ 50 , а np ≤ 10 .
Пример 7.1. Учебник издан тиражом 100000 экземпляров. Вероятность того, что учебник сброшюрован неправильно, равна 0,0001. Найти
вероятность того, что тираж содержит пять бракованных книг.
Решение. Согласно условию n = 100000 ; p = 0,0001 ; k = 5. События
независимы, n велико, p мала. Воспользуемся формулой (7.2):
λ = np = 100000 ⋅ 0,0001 = 10;
105 ⋅ e −10 105 ⋅ 0,000045
P100000 (5) =
=
= 0,0375.
5!
120
Ответ: 0,0375.
Определение 7.1. Потоком событий называют последовательность
событий, которые наступают в случайные моменты времени.
Определение 7.2. Простейшим (пуассоновским) называют поток событий, который обладает свойствами стационарности, ординарности и отсутствия последействия.
Свойство стационарности означает, что вероятность появления k
событий в любом промежутке времени зависит только от длительности t
промежутка времени и не зависит от начала его отсчета. Следовательно,
среднее число событий, появляющихся в единицу времени, так называемая
интенсивность λ потока, есть величина постоянная: λ (t ) = λ .
Свойство ординарности означает, что появление двух или более событий за малый промежуток времени практически невозможно, т.е. события появляются не группами, а поодиночке.
Свойство отсутствия последействия означает, что вероятность появления k событий в любом промежутке времени не зависит от того, по-
42
являлись или не появлялись события в моменты времени, предшествующие началу рассматриваемого промежутка.
Если постоянная интенсивность потока λ известна, то вероятность
появления k событий простейшего потока за время t определяется формулой Пуассона:
Pλt (k ) =
(λt ) k ⋅ e−λt
.
k!
(7.3)
Пример 7.2. Среднее число заказов такси, поступающих не диспетчерский пункт в одну минуту, равно 3. Найти вероятность того, что за 2
минуты поступит 4 вызова.
Решение. По условию λ = 3 ; t = 2, k = 4. Воспользуемся формулой
Пуассона (7.3). Получим:
(3 ⋅ 2) 4 ⋅ e− (3⋅2) 1296 ⋅ 0,0025
P3⋅2 (4) =
=
= 0,135.
4!
24
Ответ: 0,135.
Вопросы для самоконтроля
1. В каком случае следует использовать при решении задач асимптотическую формулу Пуассона?
2. Что называют потоком событий?
3. Какой поток событий называют простейшим?
4. В чем состоит свойство стационарности?
5. В чем состоит свойство ординарности?
6. В чем состоит свойство отсутствия последействия?
43
8. ПОНЯТИЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Одним из важнейших понятий теории вероятностей является понятие
случайной величины.
Под случайной величиной понимается переменная, которая в результате опыта в зависимости от случая принимает одно из возможного множества своих значений (какое именно – заранее не известно).
Пример 8.1. Случайные величины:
1) число бракованных изделий в данной партии;
2) число детей, родившихся в течение суток в городе;
3) число выпадений «6» при пятикратном бросании игральной кости;
4) дальность полета артиллерийского снаряда;
5) расход электроэнергии на предприятии за месяц;
6) количество осадков, выпавших за сутки.
Определение 8.1. Случайной величиной X называется функция, заданная на множестве элементарных исходов Ω , т.е. X = f (ω), где ω∈ Ω .
Пример 8.2. Случайная величина (СВ) X – число дней во взятом
наудачу месяце невисокосного года есть функция элементарных исходов
ω , т.е. X = f (ω) . В результате случайного выбора месяца года все множество элементарных исходов Ω может быть представлено в виде
Ω = { ω1, ω2 , ω3 ,..., ω12 } ,
где ω1 , ω2 , ω3 ,..., ω12 – соответственно первый, второй, третий, …, двенадцатый месяц года.
Так как X (ω1 ) = 31 , X (ω2 ) = 28 , X (ω3 ) = 31 , X (ω4 ) = 30 , …, то
число дней во взятом наудачу месяце года (СВ X ) есть функция элементарных исходов ω .
□
Случайные величины будем обозначать прописными буквами латинского алфавита X , Y , Z ,... , а их значения – соответствующими строчными
буквами x, y, z...
Случайная величина, принимающая конечное или счетное множество значений, называется дискретной (ДСВ).
Если же множество возможных значений случайной величины несчетно (заполняет некоторый интервал), то такая величина называется непрерывной (НСВ).
44
Случайные величины 1 – 3 из примера 8.1 являются дискретными, а
4 – 6 – непрерывными.
Вопросы для самоконтроля
1. Что называют случайной величиной?
2. Как можно классифицировать случайные величины в зависимости от множества их возможных значений?
9. СПОСОБЫ ЗАДАНИЯ ДИСКРЕТНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Определение 9.1. Законом распределения ДСВ называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.
Дискретная случайная величина считается заданной, если известен ее
закон распределения, который может иметь разные формы:
− ряд распределения;
− многоугольник распределения;
− функция распределения.
9.1. Ряд распределения
Определение 9.2. Рядом распределения ДСВ X называется таблица,
в которой перечислены возможные значения x1 , x2 , …, xn случайной величины и соответствующие им вероятности p1 , p2 , …, pn .
Таблица распределения ДСВ
X
x1
x2
…
xn
P
p1
p2
…
pn
Таким образом, pi = P( X = xi ) , i = 1, n ,
n
∑ pi = 1.
i =1
Пример 9.1. В коробке 8 шаров, из которых 5 белых, остальные черные. Из нее вынимают наудачу 3 шара. Найти закон распределения числа
белых шаров в выборке.
Решение. Возможные значения СВ X числа белых шаров в выборке –
x1 = 0 , x2 = 1 , x3 = 2 , x4 = 3 .
45
Вероятности их соответственно будут
p1 = P ( X = 0) =
C50 ⋅ C33 1
= ;
56
C83
p2 = P ( X = 1) =
C51 ⋅ C32 15
= ;
56
C83
p3 = P ( X = 2) =
C52 ⋅ C31 30
= ;
56
C83
p4 = P ( X = 3) =
C53 ⋅ C30 10
= .
56
C83
n
Проверим выполнение условия
1
15
30
10
∑ pi = 1: 56 + 56 + 56 + 56 = 1 .
i =1
Закон распределения представим в виде таблицы распределения.
X
0
1
2
3
P
1
56
15
56
30
56
10
56
□
9.2. Многоугольник распределения
Определение 9.3. Графическое изображение ряда распределения называется многоугольником распределения.
Чтобы построить многоугольник распределения, необходимо по оси
абсцисс отложить возможные значения случайной величины, а по оси ординат – вероятности этих значений. Соединив точки ( xi , pi ) последовательно отрезками прямой линии, получим ломаную, которая и называется
многоугольником распределения вероятностей.
Пример 9.1 (продолжение). Многоугольник распределения для данной случайной величины представлен на рис. 9.1.
pi
1
30
56
15
56
10
56
О
xi
1
2
3
Рис 9.1
46
□
Замечание 9.1. Сумма ординат многоугольника равна единице. Если в
прямоугольной системе координат дана некоторая ломаная, удовлетворяющая определению функции и обладающая указанным свойством, то такая
ломаная задает закон распределения некоторой случайной величины.
9.3. Функция распределения вероятностей
Определение 9.4. Функцией распределения случайной величины X
называется функция F ( x) , задающая вероятность того, что случайная величина X принимает значение, меньшее x , т.е.
F ( x) = P( X < x) .
(9.1)
Функция распределения F ( x) для ДСВ вычисляется по формуле
F ( x) =
∑
xi < x
P ( X = xi ),
(9.2)
где суммирование ведется по всем значениям i , для которых xi < x .
Пример 9.1 (продолжение)
 0,
 1
 ,
 56
 16
F ( x) =  ,
 56
 46
 56 ,

 1,
x ≤ 0;
0 < x ≤ 1;
1 < x ≤ 2;
2 < x ≤ 3;
3 < x.
График функции распределения (рис. 9.2)
1
F ( x)
46
56
16
56
xi
О
1
2
3
Рис 9.2
47
□
Свойства функции распределения
1. 0 ≤ F ( x) ≤ 1 .
Функция распределения F ( x) − неотрицательная функция, заключенная между нулем и единицей.
2. F ( x) − неубывающая функция, т.е. x1 < x2 ⇒ F ( x1 ) ≤ F ( x2 ) .
Доказательство
Пусть x1 < x2 . Рассмотрим события A = ( X < x1 ) и B = ( x1 ≤ X < x2 ) .
Для данных событий AB = ∅ ; A + B = ( X < x2 ) .
Согласно теореме сложения вероятностей для несовместных событий A и B
P( A + B ) = P ( A) + P ( B ) , или P( X < x2 ) = P ( X < x1 ) + P ( x1 ≤ X < x2 ) , т.е.
F ( x2 ) = F ( x1 ) + P ( x1 ≤ X < x2 ) ⇒ F ( x2 ) ≥ F ( x1 ) .
■
3. Вероятность появления случайной величины в интервале, полузамкнутом слева [ x1; x2 ) , равна приращению функции на этом интервале:
P( x1 ≤ X < x2 ) = F ( x2 ) − F ( x1 ) .
Доказательство: следует из промежуточной формулы в доказательстве свойства 2.
■
4. Функция распределения всегда непрерывна слева:
lim F ( x) = F ( x0 ) .
x → x0 − 0
Доказательство
Пусть x1 , x2 , …, xn , … − произвольная числовая последовательность, удовлетворяющая условиям:
1) x1 < x2 < x3 < ... < x0 ; 2) lim xn = x0 .
n →∞
Обозначим An = ( xn ≤ X < x0 ) .
Тогда A1 ⊃ A2 ⊃ ... ⊃ An ⊃ ... ;
∞
∩ An = ∅ .
n =1
Согласно аксиоме непрерывности
lim P ( An ) = P (∅) = 0 , или lim ( F ( x0 ) − F ( xn )) = 0 ;
n →∞
n →∞
lim F ( xn ) = lim F ( x) = F ( x0 ) .
n →∞
x → x0 − 0
48
■
5.
lim F ( x) = 0 ; lim F ( x) = 1.
x →−∞
x →+∞
6. Величина скачка функции распределения в точке разрыва равна
вероятности появления СВ в этой точке:
P( X = x0 ) = lim F ( x) − F ( x0 ) .
x → x0 + 0
9.4. Операции над ДСВ
Определение 9.5. Суммой ДСВ X , принимающей значения xi с вероятностями pi = P( X = xi ) ( i = 1, n ), и ДСВ Y , принимающей значения y j
с вероятностями q j = P(Y = y j ) ( j = 1, m ), называется ДСВ Z = X + Y , принимающая значения zij = xi + y j с вероятностями pij = P( X = xi , Y = y j ) для
всех указанных значений i и j . В случае совпадения значений некоторых
сумм xi + y j соответствующие вероятности складываются.
Определение 9.6. Разностью ДСВ X , принимающей значения xi с
вероятностями pi = P( X = xi ) ( i = 1, n ), и ДСВ Y , принимающей значения
y j с вероятностями q j = P(Y = y j ) ( j = 1, m ), называется ДСВ Z = X − Y ,
принимающая значения zij = xi − y j с вероятностями pij = P( X = xi , Y = y j )
для всех указанных значений i и j . В случае совпадения значений некоторых разностей xi − y j соответствующие вероятности складываются.
Определение 9.7. Произведением ДСВ X , принимающей значения
xi с вероятностями pi = P( X = xi ) ( i = 1, n ), и ДСВ Y , принимающей значения y j с вероятностями q j = P(Y = y j ) ( j = 1, m ), называется ДСВ Z = X ⋅ Y ,
принимающая значения zij = xi ⋅ y j с вероятностями pij = P( X = xi , Y = y j )
для всех указанных значений i и j . В случае совпадения значений некоторых произведений xi ⋅ y j соответствующие вероятности складываются.
Определение 9.8. Произведением ДСВ X , принимающей значения
xi с вероятностями pi = P( X = xi ) ( i = 1, n ), на число C называется ДСВ
Z = CX , принимающая значения zij = Cxi с вероятностями pi = P( X = xi )
( i = 1, n ).
49
Определение 9.9. Две ДСВ X и Y называются независимыми, если
события Ai = ( X = xi ) и B j = (Y = y j ) независимы для любых i = 1, n ,
j = 1, m , т.е.
P( X = xi , Y = y j ) = P ( X = xi ) ⋅ P(Y = y j ) .
В противном случае СВ называются зависимыми.
Пример 9.2. Даны независимые СВ X и Y . Записать законы распределения суммы X + Y и произведения XY случайных величин X и Y .
X
1
2
3
Y
−2
−1
0
p
0,1
0,3
0,6
q
0,6
0,3
0,1
Решение. Для упорядочивания расчетов составим вспомогательную
таблицу.
xi
yj
Возможные
случаи
Вероятности
1
1
1
2
2
2
3
3
3
−2
−1
0
−2
−1
0
−2
−1
0
0,06 0,03 0,01 0,18 0,09 0,03 0,36 0,18 0,06
xi + y j
−1
0
1
0
1
2
1
2
3
xi ⋅ y j
−2
−1
0
−4
−2
0
−6
−3
0
Запишем законы распределения суммы X + Y и произведения XY в
виде рядов распределения.
X +Y
−1
0
1
2
3
p
0,06
0,21
0,46
0,21
0,06
XY
−6
−4
−3
−2
−1
0
p
0,36
18
0,18
0,15
0,03
0,10
□
Вопросы для самоконтроля
1.
личины?
2.
3.
4.
Что называют законом распределения дискретной случайной веКакие формы может иметь закон распределения ДСВ?
Что представляет собой ряд распределения ДСВ?
Что называют многоугольником распределения?
50
5. Как определяется функция распределения случайной величины X ?
6. Где определена функция распределения ДСВ?
7. Что является областью значений функции распределения ДСВ?
8. Как с помощью функции распределения F ( x) вычислить вероятность того, что случайная величина X примет значение из полуинтервала [α, β) ?
9. Чему равна величина скачка функции распределения ДСВ в точке
разрыва?
10. Каким образом определяется сумма (разность, произведение)
двух ДСВ?
11. Каким образом определяется произведение ДСВ на число?
12. Какие ДСВ называются независимыми?
10. СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН
Определение 10.1. Совокупность n случайных величин ( X1, X2,..., Xn ) ,
рассматриваемых совместно, называется системой n случайных величин
или n -мерной случайной величиной.
Законом распределения системы СВ называется соотношение, устанавливающее связь между областями возможных значений системы и вероятностями появления системы в этих областях.
Если X и Y − ДСВ, которые принимают значения x1, x2 ,..., xn и
y1, y2 ,..., ym соответственно, то двумерная ДСВ может принимать значения ( xi , y j ) , где i = 1, n , j = 1, m , причем вероятность pij = P( X = xi , Y = y j ) .
Вероятности pij сводятся в таблицу распределения двух ДСВ с конечным числом исходов (табл. 10.1).
Таблица 10.1
Y
y1
y2
…
ym
x1
p11
p12
…
p1m
x2
p21
p22
…
p2m
…
…
…
…
…
xn
pn1
pn 2
…
pnm
X
51
Все возможные события составляют полную группу событий, поэтому
n m
∑ ∑ pij = 1.
i =1 j =1
При этом
m
m
j =1
j =1
n
n
i =1
i =1
∑ pij = ∑ P( X = xi ,Y = y j ) = P( X = xi ) = pi ;
(10.1)
∑ pij = ∑ P( X = xi , Y = y j ) = P(Y = y j ) = q j .
(10.2)
Табл. 10.1 можно дополнить столбцом значений pi и строкой значений q j . Получим табл. 10.2.
Таблица 10.2
Y
y1
y2
…
ym
pi
x1
p11
p12
…
p1m
p1
x2
p21
p22
…
p2 m
p2
…
…
…
…
…
…
xn
pn1
pn 2
…
pnm
pn
qj
q1
q2
…
qm
1
X
Определение 10.2. Функцией распределения системы n случайных
величин ( X 1, X 2 ,..., X n ) называется вероятность совместного выполнения n
неравенств: X i < xi , i = 1, n , т.е.
F ( x1, x2 ,..., xn ) = P(( X1 < x1 ) ∩ ( X 2 < x2 ) ∩ ... ∩ ( X n < xn )) .
Для системы двух случайных величин X и Y функцией распределения F ( x, y ) является вероятность совместного выполнения двух неравенств
F ( x, y ) = P (( X < x) ∩ (Y < y )) .
Свойства функции распределения F ( x, y )
1. 0 ≤ F ( x, y ) ≤ 1 .
2. F ( x, y ) − неубывающая функция по каждой из переменных.
52
(10.3)
3.
4.
lim F ( x, y ) = lim F ( x, y ) = 0 ; lim F ( x, y ) = 1 .
x →−∞
x →+∞
y →+∞
y →−∞
lim F ( x, y ) = lim P( X < x, Y < y ) = P(Y < y ) = FY ( y ) − получена
x →+∞
x →+∞
функция распределения случайной величины Y .
Аналогично можно получить функцию распределения для X :
lim F ( x, y ) = lim P ( X < x, Y < y ) = P( X < x) = FX ( x) .
y →+∞
y →+∞
Пусть распределение двумерной случайной величины задано табл. 10.2.
Рассмотрим функцию распределения случайной величины X при условии,
что СВ Y приняла значение y j ( j = 1, m ). Эту функцию обозначим
F ( x / y j ) . Найдем вероятность того, что СВ X примет значение xi , когда
СВ Y приняла значение y j :
P( xi / y j ) =
P ( X = xi , Y = y j )
P (Y = y j )
=
pij
qj
, ( q j ≠ 0 ).
Тогда
F(x / y j ) =
∑
X <x
P( xi / y j ) =
Аналогично, учитывая P( y j / xi ) =
∑
pij
xi < x q j
.
pij
, ( pi ≠ 0 ), можно получить F( y / xi ) .
pi
Исходя из определения, в случае независимости двух случайных величин вероятность совместного выполнения равенств P( X = xi ,Y = y j ) = pij
будет определяться как pij = pi q j .
Пример 10.1. Закон распределения дискретной двумерной случайной величины ( X , Y ) задан таблицей.
yj
−2
0
3
5
0
0,10
0, 25
0,30
0,15
2
0,10
0, 05
0,00
0, 05
xi
53
Найти:
1) законы распределения одномерных случайных величин X и Y ;
2) условные законы распределения случайной величины X при условии Y = 5 и случайной величины Y при условии X = 0 ;
3) вычислить P(Y < X ) .
Решение:
1. Случайная величина X может принимать значения:
X = 0 с вероятностью p1 = 0,10 + 0,25 + 0,30 + 0,15 = 0,8 ;
X = 2 с вероятностью p2 = 0,10 + 0,05 + 0,00 + 0,05 = 0, 2 .
Ее закон распределения можно задать рядом распределения
X
0
2
p
0,8
0,2
Случайная величина Y может принимать значения
Y = −2 с вероятностью q1 = 0,10 + 0,10 = 0, 2 ;
Y = 0 с вероятностью q2 = 0,25 + 0,05 = 0,3 ;
Y = 3 с вероятностью q3 = 0,30 + 0,00 = 0,3 ;
Y = 5 с вероятностью q2 = 0,15 + 0,05 = 0,2 .
Ее закон распределения можно задать рядом распределения
Y
−2
0
3
5
q
0,2
0,3
0,3
0,2
2. Условный закон распределения X при условии, что Y = 5 , получим, если вероятности pij , стоящие в последнем столбце закона распреде-
ления СВ ( X , Y ) , разделим на их сумму, т.е. P(Y = 5) = 0,2 .
Получим
X
0
2
p ( xi / 5)
0,75
0,25
Для получения условного закона распределения Y при условии
X = 0 вероятности pij , стоящие в первой строке закона распределения СВ
( X , Y ) , разделим на их сумму, т.е. P( X = 0) = 0,8 .
54
Получим
Y
(
q yj /0
)
−2
0
3
5
0,125
0,3125
0,375
0,1875
3. Для нахождения вероятности P(Y < X ) необходимо сложить вероятности pij из таблицы распределения двумерной СВ ( X , Y ) , для кото-
рых y j < xi .
Получим
P(Y < X ) = 0,10 + 0,10 + 0,05 = 0, 25 .
□
Вопросы для самоконтроля
1. Что называют n -мерной случайной величиной?
2. Что называют законом распределения системы случайных вели-
чин?
3. Какую форму может иметь закон распределения двумерной случайной величины?
4. Что задает функция распределения системы двух случайных величин?
5. Какими свойствами обладает F ( x, y ) ?
6. Каким образом определяется вероятность совместного выполнения равенств P( X = xi , Y = y j ) в случае независимых случайных величин?
11. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ДСВ
11.1. Математическое ожидание
Определение 11.1. Математическим ожиданием (средним значением) дискретной случайной величины называют сумму всех произведений
значений случайной величины на соответствующие им вероятности.
Таким образом, если X – конечнозначная случайная величина с рядом распределения
x1
x2
xn
…
X
,
p1
p2
pn
…
P
55
то
n
M ( X ) = x1 p1 + x2 p2 + ... + xn pn = ∑ xk pk ,
(11.1)
k =1
в случае счетнозначной величины
∞
M ( X ) = ∑ xk pk ,
(11.2)
k =1
где предполагается абсолютная сходимость ряда. В противном случае считают, что у случайной величины нет математического ожидания.
Пример 11.1. ДСВ задана рядом распределения
X
P
1
2
3
0,1 0,3
0,6
Вычислить M ( X ) .
Решение
M ( X ) = 1 ⋅ 0,1 + 2 ⋅ 0,3 + 3 ⋅ 0,6 = 2,5.
Ответ: M ( X ) = 2,5 .
Свойства M ( X )
1. M (C ) = C , C = const, т.е. математическое ожидание постоянной
равно этой постоянной.
Доказательство. Постоянную C можно рассматривать как дискретную случайную величину, которая может принимать значение C с вероятностью единица, поэтому
M (C ) = C ⋅ 1 = C .
■
2. M (kX ) = kM ( X ) , т.е. постоянный множитель можно выносить за
знак математического ожидания.
n
n
Доказательство. M (kX ) = ∑ kxi pi = k ∑ xi pi = kM ( X ) .
i −1
■
i =1
3. Математическое ожидание алгебраической суммы конечного
числа случайных величин равно алгебраической сумме их математических
ожиданий:
 n
 n
М  ∑ Xk  = ∑ M (Xk ).
 k =1  k =1
56
Доказательство. Для n = 2 : M ( X + Y ) = M ( X ) + M (Y ) .
Пусть совместное распределение ( X , Y ) задано табл. 10.2.
Тогда
n m
n m
n m
i =1 j =1
i =1 j =1
i =1 j =1
M ( X + Y ) = ∑ ∑ ( xi + y j ) pij = ∑ ∑ xi pij + ∑ ∑ y j pij =
n
m
m
n
n
m
= ∑ xi ∑ pij + ∑ y j ∑ pij = ∑ xi pi + ∑ y j q j =M ( X ) + M (Y ) .
i =1
j =1
j =1
i =1
i =1
■
j =1
4. Математическое ожидание произведения конечного числа независимых случайных величин равно произведению их математических
ожиданий:
 n
 n
M  ∏ Xk  = ∏ M (Xk ).
 k =1  k =1
Доказательство. Для n = 2 : M ( X ⋅ Y ) = M ( X ) ⋅ M (Y ) ;
n m
n
m
M ( X ⋅ Y ) = ∑ ∑ xi y j pi q j = ∑ xi pi ∑ y j q j = M ( X ) M (Y ) .
i =1 j =1
i =1
■
j =1
5. Математическое ожидание отклонения случайной величины от ее
математического ожидания равно нулю: M ( X − M ( X )) = 0 .
Доказательство
M ( X − M ( X )) = M ( X ) − M ( M ( X )) = M ( X ) − M ( X ) = 0 .
■
Математическое ожидание случайной величины характеризует ее в
среднем, это − центр распределения.
11.2. Дисперсия
Определение 11.2. Дисперсия случайной величины – это математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:
D( X ) = M ( X − M ( X )) 2 .
(11.3)
В случае ДСВ получаем
n
D( X ) = ∑ ( xi − M ( X )) 2 pi .
i =1
57
(11.4)
Пример 11.1 (продолжение). Вычислить дисперсию случайной величины X .
Решение
D( X ) = (1 − 2,5) 2 ⋅ 0,1 + (2 − 2,5)2 ⋅ 0,3 + (3 − 2,5) 2 ⋅ 0,6 =
= 2, 25 ⋅ 0,1 + 0,25 ⋅ 0,3 + 0, 25 ⋅ 0,6 = 0, 225 + 0,075 + 0,15 = 0,45.
Ответ: D( X ) = 0,45 .
Свойства D( X )
1. D(C ) = 0 , где C = const .
Доказательство. D(C ) = M (C − M (C ))2 = M (C − C ) 2 = M (0) = 0 .
■
2. D(kX ) = k 2 D ( X ) .
Доказательство
D(kX ) = M (kX − M (kX )) 2 = M (kX − kM ( X ))2 =
= M (k ( X − M ( X ))) 2 = k 2 M ( X − M ( X )) 2 = k 2 D ( X ) .
■
3. Дисперсия алгебраической суммы двух независимых случайных
величин равна сумме их дисперсий: D( X + Y ) = D( X ) + D (Y ) .
Доказательство
D( X + Y ) = M (( X + Y ) − M ( X + Y )) 2 = M ( X + Y − M ( X ) − M (Y )) 2 =
= M (( X − M ( X )) + (Y − M (Y ))) 2 =
= M (( X − M ( X ))2 + 2( X − M ( X ))(Y − M (Y )) + (Y − M (Y )) 2 ) =
= M ( X − M ( X )) 2 + 2 M (( X − M ( X ))(Y − M (Y ))) + M (Y − M (Y ))2 =
= D ( X ) + 2 ⋅ 0 ⋅ 0 + D(Y ) = D ( X ) + D (Y ) .
■
4. Упрощенное правило вычисления дисперсий:
D( X ) = M ( X 2 ) − ( M ( X ))2 .
58
(11.5)
Доказательство
D( X ) = M ( X − M ( X ))2 = M ( X 2 − 2 XM ( X ) + ( M ( X ))2 ) =
= M ( X 2 ) − 2 M ( XM ( X )) + M ( M ( X ))2 =
= M ( X 2 ) − 2( M ( X ))2 + ( M ( X ))2 = M ( X 2 ) − ( M ( X ))2 .
■
Пример 11.1 (продолжение). Вычислить дисперсию по упрощенному правилу.
Решение
M ( X 2 ) = 1 ⋅ 0,1 + 4 ⋅ 0,3 + 9 ⋅ 0,6 = 6,7 ;
D( X ) = 6,7 − 2,52 = 6,7 − 6, 25 = 0, 45 .
Ответ: 0,45.
Дисперсия характеризует степень разброса значений случайной величины по отношению к ее центру.
Недостаток дисперсии – ее размерность не совпадает с размерностью
случайной величины. Поэтому вводится среднее квадратичное отклонение
σ = D( X ) .
11.3. Теоретические моменты
Определение 11.3. Начальным моментом порядка k случайной величины X называют математическое ожидание случайной величины X k :
νk = M ( X k ) .
(11.6)
В частности, начальный момент первого порядка ν1 = M ( X ) .
Определение 11.4. Центральным моментом порядка k случайной
величины X называют математическое ожидание случайной величины
( X − M ( X ))k :
µ k = M ( X − M ) X ))k .
(11.7)
В частности, µ1 = M ( X − M ( X )) = 0 ; µ 2 = M ( X − M ( X )) 2 = D ( X ) .
59
Центральные моменты целесообразно вычислять, используя формулы, выражающие центральные моменты через начальные:
µ 2 = ν 2 − ν12 ;
µ3 = ν3 − 3ν1ν 2 + 2ν13 ;
µ 4 = ν 4 − 4ν1ν3 + 6ν12ν 2 − 3ν14 .
Вопросы для самоконтроля
1. Как определяется математическое ожидание дискретной случайной величины X , принимающей конечное множество значений?
2. Что называют математическим ожиданием дискретной случайной
величины X , принимающей счетное множество значений?
3. Как характеризует математическое ожидание случайную величину?
4. Каковы свойства математического ожидания случайной величины?
5. Чему равно математическое ожидание отклонения?
6. Как определяется дисперсия случайной величины?
7. Что характеризует дисперсия случайной величины?
8. По какой формуле можно вычислять дисперсию?
9. Каковы свойства дисперсии случайной величины?
10. Что такое среднее квадратичное отклонение?
11. Что называют начальным моментом k -того порядка случайной
величины?
12. Чему равен начальный момент первого порядка?
13. Что называют центральным моментом k -того порядка случайной величины?
14. Чему равен центральный момент первого порядка?
15. Что представляет собой центральный момент второго порядка?
12. ОСНОВНЫЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ ДСВ
12.1. Биномиальный закон распределения
Определение 12.1. Случайная величина X , которая принимает значение k ( k = 0, n, ) с вероятностью
Pn (k ) = Cnk p k q n − k ( 0 < p < 1, q = 1 − p ),
(12.1)
называется распределенной по биномиальному закону с параметрами n и p .
60
Ряд распределения биномиальной случайной величины представлен
табл. 12.1.
Таблица 12.1
X
0
1
…
n
P
qn
npq n −1
…
pn
n
По определению
∑ Рn ( k ) = 1.
k =0
Вычислим математическое ожидание и дисперсию.
Пусть ДСВ X k − число наступлений события в k -том испытании.
Тогда распределение ДСВ X k задается табл. 12.2.
Тогда
M ( X k ) = 0 ⋅ q + 1⋅ p = p ;
M ( X k2 ) = 02 ⋅ q + 12 ⋅ p = p ;
D( X k ) = p − p 2 = p (1 − p ) = pq .
Таблица 12.2
Xk
0
Pk
q
1
p
ДСВ X 1, X 2 ,..., X n − независимые случайные величины, причем
X1 + X 2 + ... + X n = X .
Тогда
n
 n
 n
M ( X ) = M  ∑ X k  = ∑ M ( X k ) = ∑ p = np ;
k =1
 k =1  k =1
n
 n
 n
D( X ) = D  ∑ X k  = ∑ D( X k ) = ∑ pq =npq ,
k =1
 k =1
 k =1
σ = npq .
Пример 12.1. В магазин поступили холодильники с двух заводов в
соотношении 2 : 3. Куплено 4 холодильника.
Найти закон распределения числа купленных холодильников, изготовленных первым заводом. Найти математическое ожидание и дисперсию
этой случайной величины.
Решение. Вероятность того, что случайно выбранный холодильник
2
изготовлен первым заводом, равна p =
= 0, 4 . Случайная величина X −
2+3
число холодильников, изготовленных первым заводом, среди четырех куп61
ленных, имеет биномиальный закон распределения с параметрами n = 4 и
p = 0,4 . Ряд распределения получим с использованием формулы (12.1),
табл. 12.3. Для примера приведем расчет первого значения случайной величины: P( X = 0) = P4 (0) = C40 ⋅ 0,40 (1 − 0, 4) 4 = 0,64 = 0,1296 .
Таблица 12.3
X
0
1
2
3
4
P
0,1296
0,3456
0,3456
0,1536
0, 0256
Заметим, что 0,1296 + 0,3456 + 0,3456 + 0,1536 + 0,0256 = 1 .
Математическое ожидание составит: M ( X ) = np = 4 ⋅ 0,4 = 1,6 , дисперсия: D( X ) = npq = 4 ⋅ 0, 4 ⋅ 0,6 = 0,96 .
Ответ:
X
0
1
2
3
4
P
0,1296
0,3456
0,3456
0,1536
0, 0256
M ( X ) = 1,6 ; D( X ) = 0,96 .
12.2. Закон распределения Пуассона
Определение 12.2. Случайная величина X , которая принимает значение k ( k = 0,1, 2,... ) с вероятностью
λ k e−λ
,
Pλ ( k ) =
k!
(12.2)
где λ > 0 , называется распределенной по закону Пуассона с параметром λ .
Ряд распределения случайной величины по закону Пуассона представлен табл. 12.4.
Таблица 12.4
X
0
1
2
…
k
…
P
e−λ
λe−λ
λ 2e−λ
2!
…
λ k e −λ
k!
…
По условию Pλ (k ) > 0 . Требуется убедиться, что
62
∞
∑ Pλ (k ) = 1 .
k =0
Действительно,

λ k e −λ
λ 2 λ3
−λ 
∑ Pk (λ) = ∑ k ! = e 1 + λ + 2! + 3! + ...  = e−λeλ = 1 .
k =0
k =0


∞
∞
Вычислим математическое ожидание и дисперсию:
M (X ) =
= λ⋅e
∞ λ k −1
k λ k e−λ ∞ λ k e−λ
−λ
=
=
λ
⋅
e
∑ k!
∑ (k − 1)!
∑ (k − 1)! =
k =0
k =1
k =1
∞
−λ 

λ 2 λ3
+
+ ...  = λ ⋅ e−λ ⋅ eλ = λ ;
1 + λ +
2! 3!


∞
λ k e−λ ∞ λ k e −λ
λk
−λ
M (X ) = ∑ k
= ∑k
= e ∑ (k − 1 + 1)
=
k
!
(
k
−
1)!
(
k
−
1)!
k =0
k =1
k =1
∞
2
2
∞
∞
λk
λk
λk
−λ
−λ
= e ∑ (k − 1)
+e ∑
=e ∑
+
(k − 1)!
k =1
k =1 ( k − 1)!
k = 2 (k − 2)!
−λ
∞


λk
λ2
= e−λ ⋅ λ 2 1 + λ +
+ ...  +
2!
k =1 ( k − 1)!


∞
+e −λ ∑
+e
−λ


λ2
⋅ λ 1 + λ +
+ ...  = e−λ ⋅ λ 2 ⋅ eλ + e−λ ⋅ λ ⋅ eλ = λ 2 + λ ;
2!


D( X ) = λ 2 + λ − λ 2 = λ .
Таким образом, параметр λ пуассоновского распределения равен одновременно математическому ожиданию и дисперсии СВ X , имеющей это
распределение.
По закону Пуассона распределены числа так называемых редких явлений: число несчастных случаев на производстве, число сбоев на автоматической линии, число вызовов на АТС в течение минуты и т.д.
Пример 12.2. Среднее число клиентов, обращающихся в парикмахерскую в течение 15 минут, равно 2. Клиенты приходят случайно и независимо друг от друга.
Найти закон распределения числа клиентов, обращающихся в парикмахерскую в течение 15 минут. Найти числовые характеристики этого
распределения. Определить вероятность того, что в течение 15 минут число обратившихся клиентов окажется меньше 3.
63
Решение. Пусть случайная величина X – число клиентов, обращающихся в парикмахерскую в интервал длительностью 15 минут. Возможные
значения данной случайной величины: 0, 1, 2, …, k , … .
По условию обращение клиентов происходит случайно и независимо
друг от друга, следовательно, испытания независимы. Такая последовательность обращения клиентов в парикмахерскую может быть описана
распределением Пуассона с параметром λ = 2 .
Составим ряд распределения. Воспользуемся формулой (12.2), табл. 12.5.
Для примера приведем расчет P( X = 0) = P2 (0) =
2 0 −2
⋅ e ≈ 0,1353 .
0!
29 −2
⋅ e ≈ 0,0002 , поэтому вычисление вероятно9!
стей последующих значений данной случайной величины с заданной точностью позволит получить только 0.
Заметим, что P2 (9) =
Таблица 12.5
X
P
0
1
2
3
4
5
6
7
8
9
0,1353 0,2707 0,2707 0,1804 0,0902 0,0361 0,0120 0,0034 0,0009 0,0002
…
…
Так как возможные значения случайной величины образуют полную
группу событий, сумма их вероятностей должны быть равна 1. В данном
случае 0,1353 + 0,2707 + 0, 2707 + ... + 0,0002 = 0,9999 ≈ 1 (за счет использованной точности вычислений).
Математическое ожидание и дисперсия случайной величины, распределенной по закону Пуассона, равны значению параметра λ данного
закона, поэтому M ( X ) = 2 , D( X ) = 2 , σ( X ) = 2 = 1,1442 .
Определим вероятность того, что в течение 15 минут число обратившихся клиентов окажется меньше 3:
P( X < 3) = P ( X = 0) + P ( X = 1) + P ( X = 2) ;
P( X < 3) = 0,1353 + 0, 2707 + 0, 2707 = 0,6767 .
□
12.3. Геометрический закон распределения
Определение 12.3. Случайная величина X , которая принимает значение k ( k = 1, 2,... ) с вероятностью
Pk = p (1 − p )k −1 ,
(12.3)
называется распределенной по геометрическому закону с параметром p .
64
Геометрическое распределение имеет СВ X , равная числу опытов в
схеме Бернулли, проведенных до первого положительного исхода (успех
наступает ровно при k -том испытании).
Ряд распределения случайной величины по геометрическому закону
представлен табл. 12.6.
Таблица 12.6
X
1
2
3
…
k
…
P
p
pq
pq 2
…
pq k −1
…
∞
Убедимся, что
∑ Рk = 1.
k =1
Действительно,
∞
∞
k =1
k =1
∑ Pk = ∑ p(1 − p)k −1 = p + p(1 − p) + p(1 − p)2 + ... =
= p (1 + q + q 2 + ...) =
p
p
p
=
= = 1.
1 − q 1 − (1 − p ) p
Вычислим математическое ожидание и дисперсию.
∞
M ( X ) = ∑ kpq k −1 = p (1 + 2q + 3q 2 + ...) =
k =1
ряд , стоящий в скобках, представляет собой результат дифференцирования геометрической прогрессии q + q 2 + q 3 + ... =
q
.
1− q
Тогда сумма ряда имеет производную
 q ′
1
1
p 1
= p⋅
= 2= .

 =
2
2
p
(1 − q )
p
 1 − q  (1 − q )
Чтобы воспользоваться правилом сокращенного вычисления дисперсии, найдем
∞
M ( X 2 ) = ∑ k 2 pq k −1 = p(1 + 22 q + 32 q 2 + ...) =
k =1
= рассмотрим ряд 1 + 2q + 3q 2 + ... =
65
1
.
(1 − q )2
Умножим на q : q + 2q 2 + 3q 3 + ... =
q
.
(1 − q )2
Продифференцируем по q :
1 + 22 q + 32 q 2 + ... =
1+ q
1+ q
2− p

=
p
⋅
=
.
(1 − q )3
(1 − q )3
p2
Тогда
2
2− p  1 
2 − p 1 1− p q
D( X ) = 2 −   = 2 − 2 = 2 = 2 .
p
p
p
p
p
 p
Замечание 12.1. Если значения k = 0, 1, 2,... , то М ( Х ) =
q
.
p
Пример 12.3 (задача об испытаниях до первого неблагоприятного
исхода). Проводится ряд испытаний, причем испытания заканчиваются на
k -том эксперименте, если (k − 1) испытаний имели благоприятный исход, а
k -тый – неблагоприятный. Ряд распределения СВ X – числа проведенных
экспериментов до прекращения испытаний представлен в табл. 12.7.
Таблица 12.7
X
1
2
3
…
k
…
P
q
pq
p 2q
…
p k −1q
…
Математическое ожидание и дисперсия принимают значения:
M (X ) =
1
p
и D( X ) = 2 .
q
q
□
Пример 12.4. Преподаватель задает студенту дополнительные вопросы. Вероятность того, что студент ответит на любой вопрос, равна 0,3.
Экзамен прекращается, как только студент обнаруживает незнание заданного вопроса. Составьте закон распределения СВ X – числа заданных дополнительных вопросов и найдите наивероятнейшее число m0 заданных
студенту дополнительных вопросов.
66
Ответ:
X
P
1
0, 7
2
0, 21
3
0, 063
…
…
k
0, 7 ⋅ 0,3k −1
…
…
Наивероятнейшее число заданных студенту дополнительных вопросов m0 = 1 .
12.4. Гипергеометрический закон распределения
Определение 12.4. Случайная величина X , которая принимает значение k с вероятностью
k n−k
CM
CN − M
P(k , n, M , N ) =
,
CNn
(12.4)
где k = max(0; n + M − N ), min(n; M ) , n, M , N − натуральные числа, n ≤ N ,
M ≤ N , называется распределенной по гипергеометрическому закону с параметрами n, M , N .
Гипергеометрическое распределение возникает в случаях, подобных
следующему: в урне N шаров, из них M белых, а остальные – черные, из
нее вынимается n шаров. Требуется найти вероятность того, что среди извлеченных шаров будет ровно k белых (остальные – черные). Случайная
величина X − число белых шаров среди извлеченных из урны. В примере
9.1 рассмотрена такая СВ.
Математическое ожидание для ДСВ X , распределенной по гипергеометрическому закону, определяется формулой
M
M (X ) = n ,
N
дисперсия
M ( N − M ) ⋅ ( N − n)
D( X ) = n ⋅
⋅
.
N −1
N2
Гипергеометрическое распределение используется в задачах контроля качества.
Заметим, что если n мало по сравнению с N (практически при
n < 0,1 ⋅ N ), гипергеометрический закон распределения приближается к биномиальному с параметрами n и p =
M
.
N
67
Пример 12.5 (см. пример 9.1). Получить числовые характеристики
данной случайной величины.
Решение. Случайная величина X распределена по гипергеометрическому закону с параметрами n = 3 , M = 5 , N = 8 . Согласно формулам вычисления числовых характеристик для данного закона ее матема5
тическое ожидание будет равно M ( X ) = 3 ⋅ = 1,875 , дисперсия составит
8
5 (8 − 5) ⋅ (8 − 3)
D( X ) = 3 ⋅
⋅
= 0,5022 , среднее квадратичное отклонение
8 −1
82
σ( x) = 0,7431 .
Ответ: M ( X ) = 1,875 ; D( X ) = 0,5022 ; σ( x) = 0,7431 .
Вопросы для самоконтроля
1. Какое распределение вероятностей называется биномиальным?
2. Чему равны математическое ожидание и дисперсия случайной величины, распределенной по биномиальному закону с параметрами n и p ?
3. Каким образом представляется биномиальный закон распределения вероятностей случайной величины в виде таблицы?
4. Каковы общие условия, необходимые для применимости закона
распределения Пуассона и биномиального закона распределения?
5. Чему равны математическое ожидание и дисперсия случайной
величины, распределенной по закону Пуассона?
6. Какая из величин в законе Пуассона больше: математическое
ожидание или число независимых испытаний?
7. Исследуется распределение Пуассона. Что вероятнее для распределения Пуассона: «событие произойдет ровно один раз» или «или событие не произойдет ни разу»?
8. Какое распределение дискретной случайной величины называется геометрическим?
9. Чему равны математическое ожидание и дисперсия случайной
величины, имеющей геометрическое распределение?
10. В чем состоит суть задачи об испытаниях до первого неблагоприятного исхода?
11. Как определяется гипергеометрическое распределение случайной величины?
12. При решении каких прикладных задач используется гипергеометрический закон распределения?
68
13. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
Выше было дано понятие непрерывной случайной величины как
имеющей бесконечное множество значений. Используя понятие функции
распределения, можно привести более строгое определение непрерывной
случайной величины.
Определение 13.1. Случайная величина X называется непрерывной,
если ее функция распределения непрерывна в любой точке и дифференцируема всюду, кроме, быть может, отдельных точек.
Теорема 13.1. Вероятность любого отдельно взятого значения непрерывной случайной величины равна нулю.
Доказательство
Покажем, что для любого значения x1 случайной величины X вероятность P( X = x1 ) = 0 . Представим P( X = x1 ) в виде
P( X = x1 ) = lim P ( x1 ≤ X < x2 ) .
x2 → x1
Согласно свойствам функции распределения и учитывая ее непрерывность, получим:
P( X = x1 ) = lim ( F ( x2 ) − F ( x1 ) ) = lim F ( x2 ) − F ( x1 ) = F ( x1 ) − F ( x1 ) = 0 . ■
x2 → x1
x2 → x1
Следствие 13.1*. Если X − непрерывная случайная величина, то вероятность попадания данной СВ в интервал ( x1, x2 ) не зависит от того,
является этот интервал открытым или замкнутым, т.е.
P( x1 < X < x2 ) = P( x1 ≤ X < x2 ) = P( x1 < X ≤ x2 ) = P( x1 ≤ X ≤ x2 ) .
Определение 13.2. Плотностью вероятности (плотностью распределения) f ( x) непрерывной случайной величины X называется производная ее функции распределения
f ( x) = F ′( x) .
(13.1)
Функцию f ( x) называют также дифференциальной функцией распределения. Данная функция является одной из форм закона распределения
непрерывной случайной величины.
69
Установим вероятностный смысл плотности распределения. Из определения производной получаем:
F ( x + ∆x) − F ( x)
f ( x) = F ′( x) = lim
.
∆x → 0
∆x
Согласно свойству функции распределения
F ( x + ∆x) − F ( x) = P ( x ≤ X < x + ∆x) .
P( x ≤ X < x + ∆x)
представляет собой среднюю вероят∆x
ность, которая приходится на единицу длины участка [ x, x + ∆x) , т.е. среднюю плотность распределения вероятности.
Тогда
Отношение
P ( x ≤ X < x + ∆x)
,
∆x → 0
∆x
f ( x) = lim
т.е. плотность распределения есть предел отношения вероятности попадания случайной величины в промежуток [ x, x + ∆x) к длине ∆x этого промежутка.
Свойства плотности распределения
1. Функция f ( x) неотрицательная, т.е. f ( x) ≥ 0 .
Доказательство: F ( x) – монотонно неубывающая функция, поэтому
производная от нее функция f ( x) – функция неотрицательная.
■
2. Вероятность попадания непрерывной случайной величины в
промежуток [ x1; x2 ] равна определенному интегралу от ее плотности в пределах от x1 до x2 , т.е.
P( x1 ≤ X ≤ x2 ) =
x2
∫
f (t )dt
x1
для любых x1 < x2 из (−∞, +∞) .
Доказательство
Так как F ( x) есть первообразная для f ( x) , то
x2
∫
f ( x)dx = F ( x2 ) − F ( x1 ) .
x1
70
(13.2)
В силу свойства функции распределения
F ( x2 ) − F ( x1 ) = P ( x1 ≤ X < x2 ) ,
получаем
x2
∫
f ( x)dx = P ( x1 ≤ X ≤ x2 ) .
■
x1
3. Функция распределения непрерывной случайной величины может быть выражена через ее плотность вероятности по формуле
F ( x) =
x
∫
f (t )dt .
−∞
Доказательство
Используя свойство 2, получаем:
F ( x) = P ( X < x) = P (−∞ < X < x) =
x
∫
−∞
f ( x)dx =
x
∫
f (t )dt .
■
−∞
4. Условие нормировки: несобственный интеграл от плотности вероятности непрерывной случайной величины в бесконечных пределах равен единице:
+∞
∫
f (t )dt = 1 .
−∞
Доказательство
Полагая в формуле (13.2) x1 = −∞ и x2 = +∞ , получаем достоверное
событие X ∈ (−∞; +∞) . Следовательно,
+∞
∫
−∞
f ( x)dx =P (−∞ < X < +∞) = 1 .
■
График функции y = f ( x) называют кривой плотности распределения вероятностей случайной величины X . Согласно свойствам f ( x)
можно отметить следующие особенности графика для кривой плотности
распределения вероятностей:
1) график функции y = f ( x) всегда лежит в верхней координатной
полуплоскости;
2) P( x1 ≤ X ≤ x2 ) – площадь заштрихованной фигуры, рис. 13.1.
3) площадь, заключенная между графиком этой кривой и осью абсцисс, равна 1.
Используя связь плотности распределения вероятностей и функции
распределения, можно дать следующее определение непрерывной случайной величины.
71
Определение 13.3. Случайная величина X называется непрерывной,
если существует неотрицательная функция f ( x) , такая, что при любом
значении x функцию распределения F ( x) можно представить в виде
x
F ( x) =
∫
f (t )dt .
−∞
y
x
O
x1
x2
Рис. 13.1
Так как f ( x) называют дифференциальной функцией распределения, то исходя из последнего равенства F ( x) называют интегральной
функцией распределения.
Таким образом, можно указать два способа задания непрерывных
случайных величин: с помощью плотности распределения вероятностей
f ( x) и с помощью функции распределения вероятностей F ( x) .
Пример 13.1. Дана функция
x < 0;
 0,
f ( x) = 
−x
Cxe , x ≥ 0.
При каком значении параметра C эта функция будет представлять
плотность распределения непрерывной СВ X ?
Решение. Чтобы функция f ( x) была плотностью распределения,
требуется выполнение свойств:
1.
f ( x) ≥ 0 для всех х ∈ ℝ .
+∞
2.
∫
f ( x)dx = 1 .
−∞
72
Из первого свойства следует, что C ≥ 0 .
Из второго свойства следует:
+∞
∫
f ( x)dx =
+∞
−∞
∫ Cxe
−x
dx = C
0
+∞
∫
−x
xe dx = C lim
b →+∞
0
b
∫ xe
−x
dx =
0
v = −e − x
u=x
du = dx dv = e− x dx
=
b
b
b
= C lim  − x ⋅ e− x + ∫ e − x dx  = C lim  −b ⋅ e−b + 0 − e− x  =
0
0
0
b →+∞ 
b →+∞ 

 b

= C lim  − b − e−b + 1 = C.
b →+∞  e

Откуда C = 1.
x < 0;
0,
Таким образом, f ( x) =  − x
 xe , x ≥ 0.
x < 0;
0,
Ответ: f ( x) =  − x
 xe , x ≥ 0.
В случае непрерывной двумерной случайной величины требованием
для функции распределения является дважды непрерывное дифференцирование. Тогда
P(( x ≤ X < x + ∆x) ∩ ( y ≤ Y < y + ∆y ))
f ( x, y ) = lim
=
∆x → 0
∆x∆y
∆y → 0
= по определению, F ( x, y ) = P ( X < x, Y < y ) − вероятность попадания точки
в заштрихованную область с вершиной ( x; y ), рис. 13.2, 13.3 =
( F ( x + ∆x, y + ∆y ) − F ( x + ∆х, y )) − ( F ( x, y + ∆у ) − F ( x, y ))
=
∆x → 0
∆x∆y
= lim
∆y → 0
= воспользуемся теоремой Лагранжа, полагая 0 < θ1 < 1,0 < θ2 < 1 =
= lim
( Fy′ ( x + ∆x, y + θ1∆y ) − Fy′ ( x, y + θ1∆y ))∆y
∆x → 0
∆y → 0
= lim
∆x → 0
∆y → 0
′′ ( x + θ2∆x, y + θ1∆y )∆x∆y
Fyx
∆x∆y
∆x∆y
=
′′ ( x + θ2∆x, y + θ1∆y ) = Fyx
′′ ( x, y ) .
= lim Fyx
∆x → 0
∆y →0
73
y
y
( x + ∆x; y + ∆y )
( x; y )
( x; y )
x
x
O
O
Рис. 13.2
Рис. 13.3
Таким образом, плотность распределения f ( x, y ) – вторая смешанная частная производная от функции распределения F ( x, y ) :
∂ 2 F ( x, y )
.
f ( x, y ) =
∂x∂y
Если задана плотность распределения вероятностей двумерной случайной величины f ( x, y ) , то функция распределения определяется интегрированием:
F ( x, y ) =
x
y
∫ ∫
f (u , v)dudv .
−∞ −∞
Свойства плотности распределения вероятностей
двумерной случайной величины
1. f ( x, y ) ≥ 0 .
2. Вероятность попадания точки ( x, y ) в область D при известной
плотности распределения определяется по формуле
P(( x, y ) ∈ D) = ∫∫ f ( x, y )dxdy .
D
+∞ +∞
3.
∫ ∫
f ( x, y )dxdy = 1.
−∞ −∞
74
По аналогии с ДСВ можно получить условные плотности распределения непрерывной случайной величины X , когда Y = y , и случайной величины Y , когда X = x :
f ( x, y )
f ( x, y )
f ( x, y )
f ( x, y )
f ( x / y) =
= +∞
и f ( y / x) =
= +∞
,
f2 ( y)
f1 ( x)
∫ f ( x, y)dx
∫ f ( x, y)dy
−∞
−∞
где f1 ( x) – плотность распределения СВ X , f 2 ( y ) – плотность распределения СВ Y .
В случае независимости случайных величин X и Y
f ( x, y ) = f1 ( x) ⋅ f 2 ( y ).
Вопросы для самоконтроля
1. Какую случайную величину называют непрерывной?
2. Что называют плотность распределения случайной величины?
3. Как по-другому называют плотность распределения?
4. Какие свойства имеет плотность распределения?
5. Как с помощью плотности распределения найти вероятность попадания значений случайной величины X в интервал (α, β) ?
6. Как выражается функция распределения через плотность распределения?
7. Как выражается плотность распределения через функцию распределения?
8. Как определяется функция распределения двумерной случайной
величины?
9. Каковы свойства функции распределения двумерной случайной величины?
10. Как определяется плотность распределения двумерной случайной величины?
11. Как выражается функция распределения двумерной случайной
величины через ее плотность распределения?
12. По какой формуле можно вычислить вероятность попадания
значений двумерной случайной величины в заданную область?
13. Как можно определить плотность распределения двумерной
случайной величины, если ее составляющие являются независимыми случайными величинами и их плотности распределения известны?
75
14. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ
НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН
14.1. Математическое ожидание
Определение 14.1. Математическим ожиданием непрерывной случайной величины X с плотностью вероятности f ( x) называется число
M (X ) =
+∞
∫ x ⋅ f ( x)dx
(14.1)
−∞
при условии, что интеграл сходится абсолютно.
Если f ( x) – функция четная, т.е. ее график симметричен относительно оси Oy , то, очевидно,
M (X ) =
+∞
∫ x ⋅ f ( x)dx = 0 .
−∞
В этом случае центр распределения вероятностей совпадает с началом системы координат.
Как и в случае ДСВ, для математического ожидания непрерывной
случайной величины будут выполнены свойства 1 – 5 (см. п. 11.1).
Пример 14.1. Для непрерывной случайной величины с плотностью
x < 0,
0,
распределения f ( x) =  − x
вычислить математическое ожидание.
 xe , x ≥ 0,
Решение:
M (X ) =
+∞
+∞
2 −x
∫ x f ( x)dx = ∫ x e
−∞
0
dx = lim
b →+∞
b
2 −x
∫x e
0
dx =
u = x2
v = −e − x
−x
du = 2 xdx dv = e dx
=
u=x
v = −e − x
b


2
−x b
−x
= lim  − x ⋅ e
+ 2 ∫ xe dx  =
=
0
0
b →+∞ 
 du = dx dv = e− x dx
b
 2 −b


 b2 2b

−x b
−x
= lim  −b ⋅ e + 0 + 2  − x ⋅ e
+ ∫ e dx   = lim  − b − b − 2e−b + 2  = 2 .


0
b →+∞ 
e

0

  b→+∞  e

Ответ: 2.
76
14.2. Дисперсия
Определение 14.2. Дисперсией непрерывной случайной величины X
с плотностью вероятности f ( x) называется число
+∞
D( X ) =
∫ ( x − M ( X ))
2
f ( x)dx .
(14.2)
−∞
Как и в случае ДСВ для дисперсии непрерывной случайной величины будут выполнены свойства 1 – 4 (см. п. 11.2), причем упрощенное правило вычисления дисперсии принимает вид
2
+∞
 +∞

D( X ) = ∫ x f ( x)dx −  ∫ xf ( x)dx  .


−∞
 −∞

2
(14.3)
Пример 14.1 (продолжение). Вычислить дисперсию.
Решение
Для вычисления дисперсии по формуле (14.3) найдем:
M (X ) =
2
+∞
∫x
−∞
2
f ( x)dx =
+∞
3 −x
∫xe
dx = lim
b →+∞
0
b
3 −x
∫x e
dx =
0
u = x3
v = −e− x
−x
du = 3x dx dv = e dx
2
=
b
 3 −x b

 b3

2 −x
= lim  − x ⋅ e
+ 3∫ x e dx  = lim  − b + 0  + 3 ⋅ 2 = 0 + 6 = 6,

0
b →+∞ 

0

 b →+∞  e
так как выше получено M ( X ) = 2 , то D( X ) = 6 − 22 = 6 − 4 = 2 .
Ответ: D( X ) = 2 .
14.3. Теоретические моменты
Моменты непрерывной случайной величины определяются аналогичным образом, как и для ДСВ.
Начальный момент k -того порядка ν k =
+∞
∫
x k ⋅ f ( x)dx , центральный
−∞
момент k -того порядка µ k =
+∞
∫ ( x − M ( X ))
−∞
77
k
⋅ f ( x)dx .
Вопросы для самоконтроля
1. Как определяется математическое ожидание непрерывной случайной величины, все значения которой принадлежат бесконечному промежутку (−∞, + ∞) ?
2. Как вычисляется математическое ожидание непрерывной случайной величины, все значения которой принадлежат отрезку [α, β] ?
3. Чему равно математическое ожидание случайной величины, если
плотность распределения вероятностей является четной функцией?
4. Какими свойствами обладает математическое ожидание непрерывной случайной величины?
5. Как вычисляется дисперсия непрерывной случайной величины,
все значения которой принадлежат отрезку [α, β] ?
6. Какими свойствами обладает дисперсия непрерывной случайной величины?
15. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СИСТЕМЫ
СЛУЧАЙНЫХ ВЕЛИЧИН
Пусть имеется двумерная случайная величина ( X , Y ) , распределение
которой известно, т.е. либо задан закон распределения в виде табл. 10.2,
либо плотность распределения вероятностей f ( x, y ) . Можно найти математические ожидания для случайных величин X и Y .
Пусть M ( X ) = mx , M (Y ) = m y . Тогда (mx , m y ) – центр распределения
случайной величины ( X , Y ) . При известном законе распределения можно
найти и дисперсии для случайных величин X и Y .
Пусть D( X ) = σ2x , D(Y ) = σ 2y . Однако математические ожидания и
дисперсии случайных величин X и Y недостаточно полно характеризуют
случайную величину ( X , Y ) , так как не выражают степень зависимости СВ
X и Y.
Определение 15.1. Корреляционным моментом (ковариацией) K XY
случайных величин X и Y называют математическое ожидание произведения отклонений этих величин от своих математических ожиданий:
K XY = M (( X − mx )(Y − m y )) .
78
(15.1)
В случае дискретного распределения
m n
K XY = ∑∑ ( xi − m x )( y j − m y ) pij .
(15.2)
i =1 j =1
В случае непрерывного распределения
K XY =
+∞ +∞
∫ ∫ ( x − mx )( y − my ) f ( x, y)dxdy .
(15.3)
−∞ −∞
Свойства корреляционного момента
1. K XY = KYX – свойство симметричности, следует из определения.
2. K XY = M ( XY ) − mx m y .
(15.4)
Доказательство:
K XY = M (( X − mx )(Y − m y )) = M ( XY − mxY − m y X + mx m y ) =
= M ( XY ) − M (mxY ) − M (m y X ) + M (mx m y ) =
= M ( XY ) − mx m y − mx m y + mx m y = M ( XY ) − mx m y .
■
3. Если случайные величины X и Y независимы, то K XY = 0 .
Доказательство
Из независимости случайных величин X и Y следует независимость
их отклонений X − mx и Y − m y , поэтому
K XY = M (( X − mx )(Y − m y )) = M ( X − mx ) ⋅ M (Y − m y ) = 0 ⋅ 0 = 0 .
Обратное, вообще говоря, не имеет места. Если K XY = 0 , тогда случае случайные величины X и Y называются некоррелированными.
4.
K XY ≤ σ xσ y .
Доказательство
2
 X − mx Y − m y 
Действительно, по определению M 
±
 ≥ 0 , тогда
 σx
σ
y


79
■
2
2
2

 X − mx Y − m y 


Y
−
m
Y
−
m

−
−
X
m
X
m
y
y
x
x
M
±
= M 
± 2⋅
⋅
+

 =

 σx




σ
σ
σ
σ
σ
y
x
x
y
y




 

=
1
2
1
M ( X − mx ) 2 ±
M (( X − mx )(Y − m y )) + 2 M (Y − m y ) 2 =
2
σ xσ y
σx
σy
σ2y
σ2x
2
2 K XY
= 2±
K XY + 2 = 2 ±
≥ 0.
σ xσ y
σ x σ xσ y
σx
Откуда 2 ±
2 K XY
K
K
≥ 0 , 1 ± XY ≥ 0 , 1 ≥ ∓ XY ,
σ xσ y
σ xσ y
σ xσ y
K XY ≤ σ x σ y .
■
Как следует из свойств корреляционного момента, он характеризует
степень зависимости случайных величин и их рассеяние вокруг точки
(mx , m y ) . Размерность корреляционного момента равна произведению размерностей СВ X и Y .
Заметим, что случайные величины
Y − my
X − mx
и
называются
σy
σx
нормированными (стандартными) отклонениями случайных величин X и
Y соответственно.
Определение 15.2. Коэффициентом линейной корреляции rXY случайных величин X и Y называется математическое ожидание произведения их нормированных отклонений:
 X − mx Y − m y  K XY
rXY = M 
⋅
.
 =
 σx
σ
σ
σ
y
x
y


(15.5)
Коэффициент линейной корреляции является безразмерной величиной и позволяет оценить степень влияния одной СВ на другую.
Свойства коэффициента линейной корреляции
1. rXY = rYX .
2. rXX = 1 .
3. Если случайные величины X и Y независимы, то rXY = 0 .
80
Доказательство. В случае независимости X и Y K XY = 0 . СледоваK
тельно, rXY = XY = 0 .
■
σxσ y
4.
rXY ≤ 1 .
Доказательство
Согласно свойству корреляционного момента K XY ≤ σ x σ y , тогда
rXY ≤ 1 .
■
5. Если rXY = ±1 , то между случайными величинами X и Y существует линейная функциональная зависимость.
Доказательство (для случая rXY = 1 )
Рассмотрим
 X − mx Y − m y
−
M
 σx
σy

2
2



X
m
X − mx Y − m y  Y − m y
−
x
−2
⋅
+
 = M  

 σy

σ
σ
σ
x
x
y





При rXY = 1 2 − 2rXY



2
=


= 2 − 2rXY .
= 2 − 2 ⋅ 1 = 0.
Таким образом, математическое ожидание неотрицательной случайной величины равно нулю, значит, сама эта величина – тождественный
нуль:
X − mx Y − m y
−
= 0.
σx
σу
Из последнего равенства получим выражение для Y :
σy
Y=
⋅ ( X − mx ) + m y ,
σx
которое задает линейную зависимость случайной величины Y от X .
■
Пример 15.1. По данным примера 10.1 определить корреляционный
момент и коэффициент корреляции случайных величин X и Y .
Решение. В примере 10.1 были получены следующие законы распределения одномерных случайных величин:
X
0
2
Y
−2
0
3
5
p
0,8
0,2
q
0,2
0,3
0,3
0,2
81
Найдем математические ожидания и средние квадратические отклонения этих случайных величин:
mx = M ( X ) = 0 ⋅ 0,8 + 2 ⋅ 0,2 = 0,4 ; M ( X 2 ) = 02 ⋅ 0,8 + 22 ⋅ 0, 2 = 0,8 ;
D( X ) = M ( X 2 ) − ( M ( X )) 2 = 0,8 − 0,42 = 0,64 ; σ x = 0,64 = 0,8 ;
m y = M (Y ) = (−2) ⋅ 0, 2 + 0 ⋅ 0,3 + 3 ⋅ 0,3 + 5 ⋅ 0, 2 = 1,5 ;
M (Y 2 ) = (−2)2 ⋅ 0, 2 + 02 ⋅ 0,3 + 32 ⋅ 0,3 + 52 ⋅ 0,2 = 8,5 ;
D(Y ) = M (Y 2 ) − ( M (Y )) 2 = 8,5 − 1,52 = 6, 25 ; σ y = 6, 25 = 2,5 .
Корреляционный момент (ковариацию) будем вычислять по формуле
(15.4). Для вычисления M ( XY ) можно сначала составить закон распределения СВ XY , но можно и непосредственно воспользоваться таблицей исходных данных примера 10.1. Получим
M ( XY ) = 0 ⋅ (−2) ⋅ 0,10 + 0 ⋅ 0 ⋅ 0, 25 + 0 ⋅ 3 ⋅ 0,30 + 0 ⋅ 5 ⋅ 0,15 + 2 ⋅ (−2) ⋅ 0,10 +
+2 ⋅ 0 ⋅ 0,05 + 2 ⋅ 3 ⋅ 0 + 2 ⋅ 5 ⋅ 0,05 = 0,1.
Тогда корреляционный момент составит K XY = 0,1 − 0, 4 ⋅ 1,5 = −0,5 .
Коэффициент корреляции вычислим по формуле (15.5):
rXY =
−0,5
= −0, 25 .
0,8 ⋅ 2,5
Ответ: K XY = −0,5 ; rXY = −0, 25 .
Вопросы для самоконтроля
1. Что можно сказать о взаимной связи случайных величин X и Y ,
зная их числовые характеристики M ( X ), M (Y ), D ( X ), D (Y ) ?
2. Что такое ковариация двух случайных величин?
3. Что называют коэффициентом корреляции и каковы его свойства?
4. Какая связь существует между равенством нулю коэффициента
корреляции и независимостью случайных величин?
82
16. ОСНОВНЫЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ
НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН
16.1. Равномерный закон распределения
Определение 16.1. Непрерывная случайная величина называется
распределенной по равномерному закону на отрезке [a; b] , если ее плотность распределения f ( x) постоянна на этом отрезке, а вне его равна
нулю:
x < a;
 0,
 1

f ( x) = 
, a ≤ x ≤ b;
(16.1)
b
−
a

x > b.
 0,
Числа a и b однозначно определяют равномерное распределение и
являются его параметрами.
Неотрицательность f ( x) следует из определения. Проверим выполнение условия нормировки:
b
1
1
1
b
dx
=
⋅
x
=
⋅ (b − a ) = 1 .
∫b−a
a
−
−
b
a
b
a
a
Найдем выражение для функции распределения. Согласно определению 13.3 получим:
при x < a
F ( x) =
x
∫ 0 ⋅ dt = 0 ;
−∞
при a ≤ x ≤ b
при x > b
F ( x) =
a
x
−∞
a
a
b
x−a
1
∫ 0 ⋅ dt + ∫ b − a dt = b − a ;
x
1
b−a
F ( x) = ∫ 0 ⋅ dt + ∫
dt + ∫ 0 ⋅ dt = 0 +
+ 0 = 1.
b
−
a
b
−
a
−∞
a
b
Окончательно получим:
 0,
x −a

F ( x) = 
,
b
−
a

 1,
83
x < a;
a ≤ x ≤ b;
x > b.
(16.2)
Графики функций f ( x) и F ( x) приведены на рис. 16.1 и 16.2 соответственно.
y
y
f ( x)
1
b−a
F ( x)
1
x
O
a
x
b
O
Рис. 16.1
a
b
Рис. 16.2
Найдем числовые характеристики этой случайной величины. По определению
+∞
x
b2 − a 2 a + b
1
1
2b
M ( X ) = ∫ x f ( x)dx = ∫
dx =
∫ xdx = 2(b − a) ⋅ x a = 2(b − a) = 2 ;
b
−
a
b
−
a
−∞
a
a
b
b
+∞
2
2
a+b
a+b 1


D( X ) = ∫  x −
dx =
 f ( x)dx = ∫  x −

2
2
b
−
a




−∞
a
1 
a+b
=
x−

3(b − a ) 
2 
3b
a
b
3
3
1 
a+b 
a+b 
=
b −
 −a −
 =
3(b − a )  
2  
2  
1  (b − a )3 (a − b)3  2(b − a )3 (b − a )2
=
−
=
.

=
3(b − a )  8
8  24(b − a )
12
a+b
(b − a )2
.
; D( X ) =
Таким образом, M ( X ) =
12
2
Получим формулу для определения вероятности попадания случайной величины в интервал (α, β) , целиком принадлежащий отрезку [a, b] .
По формуле (13.2) имеем
β
β−α
1
.
dx =
b
−
a
b
−
a
α
P(α < X < β) = ∫
84
(16.3)
Равномерный закон распределения находит применение при описании случайных величин, у которых каждое значение равновероятно, другими словами, значения случайной величины равномерно распределены в
некоторой области.
Например, если число округляется до целого, то ошибка округления
∆ распределена равномерно на отрезке [−0,5; 0,5] ; равномерно распределено время ожидания пассажиром транспорта, курсирующего с определенным интервалом.
Пример 16.1. Поезда метрополитена идут регулярно с интервалом
3 мин. Пассажир выходит на платформу в случайный момент времени. Какова вероятность того, что ждать пассажиру придется не больше минуты?
Найти математическое ожидание и среднее квадратичное отклонение случайной величины X – времени ожидания поезда.
Решение. Случайная величина X – время ожидания поезда на временнόм (в минутах) отрезке [0;3] имеет равномерный закон распределения
x < 0;
 0,
 1

f ( x) =  , 0 ≤ x ≤ 3;
 3
x > 3.
 0,
Тогда вероятность того, что пассажиру придется ждать не более минуты, составит
1
P(0 ≤ X ≤ 1) = ∫
0
1
1
x
1
dx =
= .
3
30 3
Математическое ожидание данной случайной величины будет равно
M (X ) =
0+3
= 1,5 ,
2
дисперсия
(3 − 0)2 9 3
D( X ) =
= = = 0,75 ,
12
12 4
отсюда
σ = 0,75 = 0,866 .
Ответ: вероятность того, что пассажиру придется ждать не более
1
минуты, составит ; M ( X ) = 1,5 ; σ = 0,866 .
3
85
16.2. Показательный закон распределения
Определение 16.2. Непрерывная случайная величина называется
распределенной по показательному закону, если ее плотность распределения имеет вид
 0, х < 0;
f ( x) =  −λx
(16.4)
λe , x ≥ 0,
где λ > 0 − параметр распределения.
По определению функция f ( x) принимает только неотрицательные
значения. Проверим выполнение условия нормировки:
+∞
∫
f ( x)dx =
+∞
−∞
∫
λe
−λx
b
b
dx = lim ∫ e −λx d (λx) = lim (−e −λx ) =
b →+∞
0
b →+∞
0
0
= lim (−e−λb + e0 ) = 0 + 1 = 1.
b →+∞
Найдем выражение для функции распределения.
Получим:
при x < 0
при х ≥ 0
F ( x) =
F ( x) =
x
∫ 0 ⋅ dt = 0 ;
−∞
0
x
−∞
0
∫
(
0 ⋅ dt + ∫ λå−λt dt == 0 + −e−λt
)
x
0
= −e−λx + 1 = 1 − e−λx .
Окончательно получим:
x < 0;
 0,
F ( x) = 
(16.5)
−λx
1
−
e
,
x
≥
0.

Графики функций f ( x) и F ( x) приведены на рис. 16.3 и 16.4 соответственно.
у
у
1
λ
F ( x)
p (x)
О
х
О
Рис. 16.3
х
Рис. 16.4
86
Найдем числовые характеристики этой случайной величины. По определению
M (X ) =
+∞
∫
x ⋅ λe−λx dx = λ lim
b →+∞
0
b
−λx
∫ x ⋅ e dx =
0
u=x
e−λx
v=−
λ =
du = dx dv = e−λx dx
 xe−λx b b e−λx 

 1 −λx b  
1  1

= λ lim  −
+∫
dx  = λ  0 + lim  − 2 e
 = λ ⋅0 + 2  = .


b →+∞ 
b →+∞  λ

λ 0 0 λ
λ  λ

0 




Выполнив аналогичные расчеты, можно получить M ( X 2 ) =
2
.
λ2
2
2 1
1
Тогда D( X ) = 2 −   = 2 .
λ λ
λ
1
1
; D( X ) = 2 .
λ
λ
Получим формулу для определения вероятности попадания случайной величины в интервал (α, β) , где α ≥ 0 , β > 0 .
Таким образом, M ( X ) =
По формуле (13.2) имеем:
β
(
P(α < X < β) = ∫ λe −λx dx = −e−λx
α
)
β
α
= −e −λβ + e−λα = e−λα − e −λβ . (16.6)
Показательный закон распределения находит применение в приложениях теории вероятностей – в теории массового обслуживания, в теории
надежности. По этому закону распределено время простоя в очереди, время ремонта, время обслуживания и т.п.
Пример 16.2. Установлено, что время ремонта холодильника –
случайная величина X , распределенная по показательному закону. Определить вероятность того, что на ремонт холодильника потребуется не менее 15 дней, если среднее время ремонта составляет 10 дней. Записать
плотность распределения вероятностей.
1
Решение. По условию математическое ожидание M ( X ) = = 10 , отλ
куда параметр λ = 0,1 .
87
Тогда плотность распределения вероятностей имеет вид
 0, х < 0;
f ( x) = 
−0,1x
, x ≥ 0.
0,1e
В данном случае определить искомую вероятность удобнее с привлечением формулы (16.6):
⋅
P( X > 15) = 1 − P (0 ≤ X ≤ 15) = 1 − (e−0,1⋅0 − e −0,115
) = 1 − 1 + e−1,5 = 0, 2231 .
Ответ: вероятность ремонта холодильника более 15 дней составит
 0, х < 0;
0,2231; f ( x) = 
−0,1x
, x ≥ 0.
0,1e
16.3. Нормальный закон распределения
Определение 16.3. Непрерывная случайная величина распределена
по нормальному закону, если ее плотность распределения определяется
функцией
−
1
f ( x) =
⋅e
σ 2π
( x − a )2
2 σ2
,
(16.7)
где a и σ > 0 – параметры распределения.
По определению функция f ( x) принимает только положительные
значения. Проверим выполнение условия нормировки:
+∞
1
⋅e
σ
2
π
−∞
∫
−
=
( x − a )2
dx =
2σ2
+∞
∫
−∞
+∞
1
⋅e
σ
2
π
−∞
∫
−
( x − a )2
2 σ2
 x−a x−a
⋅σ 2 ⋅d 
=t =
=
σ 2 σ 2
1 −t 2
1 +∞ −t 2
2 +∞ −t 2
⋅ e dt = =
∫ e dt = π ∫ e dt =
π
π −∞
0
интеграл Пуассона
=
+∞
∫e
0
−t 2
π
dt =
2
=
2
π
⋅
=1.
π 2
Найдем выражение для функции распределения.
88
Согласно определению 13.3 получим:
x
1
F ( x) = ∫
⋅e
σ
2
π
−∞
=
1
σ 2π
x−a
2
σ −u
e 2 σdu
∫
=
−∞
−
1
2π
t − a = σu t → −∞ ⇒ u → −∞
(t − a )2
2σ
dt =
2
x −a
2
σ −u
e 2 du
∫
−∞

u2
1
2 −∞ − 2
2
= −
e du +
∫
2
2π 0
2π

dt = σdu
t = x⇒u =
x−a =
σ

2
0 −u

1 2
2
= 
e 2 du +
∫
2  2π −∞
2π

x−a

2
σ −u

e 2 du
=


∫
0
x −a

2
σ −u

e 2 du
1
 х − а 
 =  −Φ ( −∞ ) + Φ 
 =
2
σ






∫
0
1
 х − а 
= 1 + Φ 
 ,
2
 σ 
t2
2 x −2
где Φ ( х) =
∫ е dt – функция Лапласа, см. п. 6.4.
2π 0
Таким образом,
1
 х − а 
F ( x) =  1 + Φ 
.
2
 σ 
(16.8)
Графики функций f ( x) в зависимости от значений a и σ приведены
на рис. 16.5 и 16.6.
у
у
f ( x)
f ( x)
σ = const
( а = 0)
σ =1
σ=2
О
−а
х
Рис. 16.5
О
а
Рис. 16.6
Найдем числовые характеристики этой случайной величины.
89
х
По определению
+∞
−
1
M (X ) = ∫ x ⋅
⋅e
σ 2π
−∞
t=
( x − a )2
2σ2
dx =
x−a
⇒ x = a + σ 2 ⋅t
σ 2
=
dx = σ 2 ⋅ dt
x → −∞ ⇒ t → −∞
x → +∞ ⇒ t → +∞
+∞
=
2
a + σ 2 ⋅ t −t 2
1 +∞
⋅
e
⋅
σ
2
dt
=
( a +σ 2 ⋅ t ) e − t dt =
∫ σ 2π
∫
π −∞
−∞
+∞
a +∞ −t 2
σ 2 +∞ −t 2
=
∫ e dt + π ∫ t ⋅ e dt =
π −∞
−∞
∫
e −t dt = π
−∞
+∞
∫ te
−t 2
dt =
−∞
D( X ) =
+∞
∫
( x − a)2 ⋅
−∞
1
⋅e
σ 2π
−
2
2
1
e −t dt 2 = 0
∫
2 −∞
t=
( x − a )2
2σ2
+∞
dx =
=
а
⋅ π +0=а;
π
x−a
⇒ x = a + σ 2 ⋅t
σ 2
=
dx = σ 2 ⋅ dt
x → −∞ ⇒ t → −∞
x → +∞ ⇒ t → +∞
=
+∞
∫
−∞
2σ 2t 2
+∞
2
2
u =t
1
2σ
⋅ e − t ⋅ σ 2 dt =
⋅ ∫ t 2 ⋅ e − t dt =
σ 2π
π −∞
du = dt
2
2σ 2
=
π

−t 2
te
⋅−

2

+∞
−∞
e −t
v=−
2
2
=
dv = te − t dt
2

1 +∞ − t 2  2 σ 2 
π
2
+ ∫ e dt =
⋅0 +
=σ .

2 −∞
2 
π 


Таким образом, M ( X ) = a ; D( X ) = σ2 .
Получим формулу для определения вероятности попадания случайной величины в интервал (α, β) . По определению
1
 β − а  1 
 α − а 
P (α < X < β) = F (β) − F (α ) =  1 + Φ 
  − 1 + Φ 
 =
2
 σ  2 
 σ 
=
1 β−а
 α − а .
Φ
 − Φ


2  σ 
 σ 
90
Таким образом,
1 β−а
 α − а 
P(α < X < β) =  Φ 
 − Φ
.
2  σ 
 σ 
(16.9)
Пример 16.3. Рост школьников определенной возрастной категории
распределен по нормальному закону с математическим ожиданием
а = 165 см и средним квадратичным отклонением σ = 5 см . Какую долю
костюмов III-го роста (170 – 176 см) следует предусмотреть в общем объеме производства для данной возрастной группы?
Решение. Пусть СВ Х – рост в сантиметрах представителя данной
группы школьников. Тогда доля p школьников ростом 170 – 176 см будет
определяться следующим образом:
1   176 − 165 
 170 − 165  
p = P(170 ≤ X ≤ 176) =  Φ 
 − Φ
 =
2 
5
5



=
1
⋅ ( Φ (2, 2) − Φ (1) ) = 0,1448 .
2
Ответ: доля костюмов III-го роста должна составлять приблизительно 14,5 % от общего объема производства.
Найдем вероятность того, что для случайной величины Х, распределенной нормально с параметрами а и σ, ее отклонение от своего математического ожидания не превысит ε :
1  а +ε−а
 а − ε − а 
P ( X − a < ε) = P (a − ε < X < a + ε) =  Φ 
 − Φ
 =
2 
σ
σ



1  ε 
 ε  1   ε 
 ε 
ε
= Φ  − Φ −  = Φ  + Φ  = Φ  ,
2  σ
 σ  2   σ 
 σ 
σ
т.е.
ε
Р ( Х − а < ε) = Φ   .
σ
(16.10)
Если в формуле (16.10) положить ε = 3σ , то
 3σ 
Р ( Х − а < 3σ ) = Φ   = Φ (3) = 0,9973 .
 σ 
91
(16.11)
Последнее равенство показывает, что вероятность того, что то или
иное значение величины X не попадет в интервал (а − 3σ, а + 3σ) , равна
0,0027, т.е. близка к нулю. Такое событие можно считать практически невозможным.
Утверждение 16.1* («правило трех сигм»). Если случайная величина имеет нормальное распределение, то отклонение этой величины от
математического ожидания по абсолютной величине практически не
превышает утроенного среднего квадратичного отклонения.
Заметим также, что случайная величина X , распределенная нормально с параметрами a и σ , обозначается как Х ∈ N (a, σ) . Для случайХ −а
ной величины Хɶ =
по свойствам математического ожидания и дисσ
персии аɶ = 0 и σɶ = 1 , и Хɶ является стандартной случайной величиной по
отношению к X . В случае, если a = 0 и σ = 1 , случайная величина
Х ∈ N (0,1) называется стандартной нормальной случайной величиной.
Теорема 16.1*. Алгебраическая сумма независимых нормально распределенных случайных величин имеет нормальный закон распределения с
математическим ожиданием, равным алгебраической сумме математических ожиданий слагаемых, и дисперсией, равной сумме дисперсий слагаемых.
Нормальный закон распределения находит широкое применение на
практике. По данному закону распределены, например, результаты измерения длины, массы, времени, плотности, температуры и т.д. Нормальный
закон распределения является предельным законом, к которому приближаются другие законы распределения при часто встречающихся аналогичных условиях.
16.4. Распределения, связанные с нормальным распределением
16.4.1. Распределение χ2 (хи-квадрат или распределение Пирсона)
Пирсон Карл (Чарлз) (Pearson Karl (Charles) (27.03.1857 – 27.04.1936) –
английский математик, биолог, философ.
Пусть независимые случайные величины U1,U 2 ,...,U n являются
стандартными нормально распределенными СВ, т.е. U k ∈ N (0,1) , k = 1, n .
92
Определение 16.4. Распределением χ 2 (n) с n степенями свободы
называется распределение суммы квадратов n независимых стандартных
нормальных случайных величин, т.е.
χ 2 (n) = U12 + U 22 + ... + U n2 .
(16.12)
Очевидно, что χ 2 (n) ≥ 0 .
Подобно тому, как математическое ожидание a и среднее квадратичное отклонение σ являются параметрами нормального закона распределения, так и число n является параметром распределения χ 2 (n) . Вообще, число степеней свободы n определяют как разность между числом
суммируемых СВ и числом линейных связей, ограничивающих свободу
изменения этих величин. Так как в сумме (16.12) слагаемые независимы,
то число степеней свободы равно числу слагаемых, т.е. n .
Плотность χ 2 (n) распределения
0
при


x
n
−
−1

1
f ( x) =  n
⋅e 2 ⋅ x2
при
 2 n
2 Г  2 
 

x ≤ 0;
x > 0,
∞
где Г ( x) = ∫ t x −1e−t dt − гамма-функция Эйлера, в частности, Г (n + 1) = n! .
0
С возрастанием числа степеней свободы n распределение χ 2 (n)
приближается к нормальному закону распределения (при n > 30 распределение случайной величины
2χ 2 (n) − 2n − 1 близко к стандартному нор-
мальному).
Числовые характеристики: M (χ 2 (n)) = n ; D(χ 2 (n)) = 2n .
Утверждение 16.2*. Если СВ χ 2 (n1 ) и χ 2 (n2 ) независимы, то их
сумма имеет распределение χ 2 (n1 + n2 ) .
На практике, как правило, используют не плотность вероятности, а
квантили распределения χ 2 (n) .
93
Определение 16.5. Квантилью распределения χ 2 (n) , отвечающей
уровню значимости α , называют такое значение χ 2 (n) = χα2 (n) , при котором
P (χ ( n )
2
> χα2 (n))
=
+∞
∫
χα2 ( n )
f χ2 ( n ) ( x)dx = α .
Геометрически нахождение квантили
χα2 (n) заключается в выборе такого значе-
f ( x)
ния χ 2 (n) = χα2 (n) , чтобы площадь зарисованной фигуры была равна α (рис. 16.7).
Значения квантилей приводятся в
специальных таблицах.
О
χα2 (n)
Рис. 16.7
х
Распределение χ 2 (n) имеет широкое
применение в математической статистике.
16.4.2. Распределение Стьюдента (t-распределение)
Стьюдент – псевдоним Уильяма Сили Госсета (William Sealy Gosset)
(13.06.1876 – 16.10.1937) – английского математика и статистика.
Пусть U ∈ N (0,1) , случайная величина χ 2 (n) имеет хи-квадрат распределение с n степенями свободы, причем U и χ 2 (n) − независимые
случайные величины.
Определение 16.6. Распределением Стьюдента ( t -распределением)
с n степенями свободы называется распределение случайной величины
t ( n) =
U
1 2
χ ( n)
n
.
Плотность t -распределения имеет вид:
n +1
 n +1
Г
2 − 2
 
x
2 
f ( x) = 
, x∈ℝ.
1 + 
n
n

Г   πn 
2
 
94
(16.13)
С возрастанием числа степеней свободы n t -распределение приближается к нормальному закону распределения (при n > 30 почти совпадает с
нормальным).
n
Числовые характеристики: M (t (n)) = 0 ; D(t (n)) =
, n > 2.
n−2
На практике используют квантили t -распределения t α (n) :
2
P( t > t α (n)) = 2 ⋅
+∞
∫
ft ( n ) ( x)dx = α .
tα (n)
2
2
Геометрически нахождение квантилей t α (n) и −t α (n) заключается в
2
2
выборе такого значения t (n) = t α (n) , чтобы общая площадь зарисованной
2
фигуры была равна α (рис. 16.8).
f ( x)
−t α ( n )
О
2
t α (n)
х
2
Рис. 16.8
Распределение Стьюдента имеет широкое применение в математической статистике и статистической проверке гипотез.
16.4.3. Распределение Фишера (F-распределение)
Фишер Роналд Эйлмер (Fisher Ronald Aylmer) (17.02.1890 – 29.07.1962) −
английский статистик и генетик.
Пусть χ 2 (n1 ) и χ 2 (n2 ) − независимые случайные величины, имеющие χ 2 -распределение с n1 и n2 степенями свободы соответственно.
95
Определение 16.7. Распределением Фишера ( F -распределением) с n1
и n2 степенями свободы называется распределение случайной величины
χ 2 (n1 )
F (n1, n2 ) =
χ 2 (n2 )
n1
.
(16.14)
n2
При n → ∞ F -распределение стремится к нормальному закону.
Числовые характеристики:
n2
2n22 (n1 + n2 − 2)
M ( F (n1, n2 )) =
, n2 > 2 ; D( F (n1, n2 )) =
, n2 > 4 .
n2 − 2
n1 (n2 − 2)2 (n2 − 4)
На практике используют квантили F -распределения Fα (n1 , n2 ) :
+∞
P( F > Fα (n1 , n2 )) =
∫
f F ( n1 ,n2 ) ( x)dx = α .
Fα ( n1 ,n2 )
Геометрически нахождение квантили Fα (n1 , n2 ) заключается в выборе такого
f ( x)
значения F (n1 , n2 ) = Fα (n1 , n2 ) , чтобы об-
О
Fα ( n1 , n2 )
Рис. 16.9
х
щая площадь зарисованной фигуры была
равна α (рис. 16.9).
Распределение Фишера имеет широкое применение в математической статистике и статистической проверке гипотез.
Вопросы для самоконтроля
1. Какое распределение вероятностей называют равномерным на
отрезке [α, β] ?
2. Как записывается плотность распределения f ( x) случайной ве-
личины X , равномерно распределенной на отрезке [α, β] ?
3. Какой вид имеет функция распределения F ( x) случайной вели-
чины X , равномерно распределенной на отрезке [α, β] ?
96
4. Чему равно математическое ожидание случайной величины X ,
равномерно распределенной на отрезке [α, β] ?
5. Чему равна дисперсия случайной величины X , равномерно распределенной на отрезке [α, β] ?
6. Как найти вероятность попадания значений случайной величины
X , равномерно распределенной на отрезке [α, β] , в интервал (a, b) ⊂ [α, β] ?
7. Где находит применение равномерный закон распределения?
8. Какое распределение вероятностей называют показательным?
9. Какой вид имеет функция распределения F ( x) случайной вели-
чины X , распределенной по показательному закону?
10. Чему равно математическое ожидание случайной величины X ,
распределенной по показательному закону?
11. Чему равна дисперсия случайной величины X , распределенной
по показательному закону?
12. Как найти вероятность попадания значений случайной величины
X , распределенной по показательному закону, в интервал (a, b) ⊂ [0, +∞) ?
13. Где находит применение показательный закон распределения?
14. Какое распределение вероятностей случайной величины называют нормальным?
15. Чему равно математическое ожидание нормальной случайной
величины?
16. Чему равна дисперсия нормальной случайной величины?
17. Как вычислить вероятность попадания значений нормальной
случайной величины X в заданный интервал?
18. Как вычислить вероятность отклонения нормальной случайной
величины от ее математического ожидания?
19. В чем состоит «правило трех сигм»?
20. Какая случайная величина называется стандартной нормальной
величиной?
21. Какой закон распределения и с какими параметрами будет иметь
алгебраическая сумма независимых нормально распределенных случайных
величин?
22. Где находит применение нормальный закон распределения?
97
17. ЗАКОН БОЛЬШИХ ЧИСЕЛ И ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ
Рассмотрим ряд теорем, устанавливающих связь между теоретическими и экспериментальными характеристиками случайных величин при
большом числе испытаний над ними. Эти теоремы условно делятся на две
группы. Первая группа теорем, называемая законом больших чисел, устанавливает устойчивость средних значений: при большом числе испытаний
их средний результат перестает быть случайным и может быть предсказан
с достаточной точностью. Вторая группа теорем, называемая центральной
предельной теоремой, устанавливает условия, при которых закон распределения суммы большого числа случайных величин неограниченно приближается к нормальному.
Марков Андрей Андреевич (2.06.1856 – 2.07.1922) – русский математик, академик Петербургской академии наук. Большое влияние на развитие теории вероятностей оказал учебник «Исчисление вероятностей»
(1900).
Теорема 17.1 (неравенство Маркова)
Если СВ X может принимать только неотрицательные значения и
у нее есть математическое ожидание, то какова бы ни была положительная величина ξ > 0 той же размерности, что и X , всегда выполняется неравенство
M (X )
P ( X < ξ) ≥ 1 −
.
(17.1)
ξ
Доказательство
Предположим, что X – непрерывная СВ с плотностью распределения f ( x) . Из условия теоремы следует, что f ( x) = 0 при x < 0 и f ( x) ≥ 0
при x ≥ 0 .
По определению
M (X ) =
+∞
∫
−∞
+∞
x ⋅ f ( x)dx = ∫ x ⋅ f ( x)dx =
0
разобъем данный интеграл от
=
непрерывной функции на два
ξ
+∞
+∞
0
ξ
ξ
= ∫ x ⋅ f ( x)dx + ∫ x ⋅ f ( x)dx ≥
+∞
∫
x ⋅ f ( x)dx ≥
= ξ ∫ f ( x)dx = ξ P( X ≥ ξ) ,
ξ
98
+∞
∫ ξ ⋅ f ( x)dx =
ξ
и окончательно получаем: M ( X ) ≥ ξ P ( X ≥ ξ) .
Тогда
M (X )
.
ξ
Вычтем последнее неравенство из тождества 1 = 1 :
M (X )
1 − P ( X ≥ ξ) ≥ 1 −
;
ξ
P ( X ≥ ξ) ≤
P ( X < ξ) ≥ 1 −
M (X )
.
ξ
■
Пример 17.1. Среднее значение расхода воды в населенном пункте
составляет 50000 л в день. Оценить вероятность того, что в этом населенном пункте расход воды не будет превышать 120000 л в день.
Решение. Пусть СВ X – расход воды в населенном пункте. Из условия задачи следует, что M ( X ) = 50000 . Требуется оценить вероятность того, что значение СВ X будет меньше 120000. Эту вероятность можно рассматривать как левую часть неравенства Маркова (17.1) с константой
ξ = 120000 .
Тогда
50000
P( X < 120000) ≥ 1 −
= 1 − 0, 41(6) ≈ 0,583 .
120000
Ответ: с вероятностью, большей 0,583, можно предположить, что
расход воды не будет превышать 120000 л в день.
Чебышев Пафнутий Львович (4.05.1821 – 26.11.1894) – русский математик и механик, академик Петербургской, иностранный член Берлинской и многих других академий. Основные труды относятся к интегральному исчислению, теории чисел, теории вероятностей, теории механизмов. П.Л. Чебышев – основоположник теории приближения функций.
Теорема 17.2 (неравенство Чебышева)
Если СВ X имеет математическое ожидание и дисперсию, то для
любого ε > 0 выполняется неравенство Чебышева
P ( X − M ( X ) ≥ ε) ≤
99
D( X )
.
ε2
(17.2)
Доказательство. Докажем неравенство (17.2) для непрерывной случайной величины.
Рассмотрим СВ Y = ( X − M ( X )) 2 − неотрицательная СВ, у которой
существует математическое ожидание M (Y ) = M ( X − M ( X ))2 = D ( X ) .
Тогда к СВ Y можно применить неравенство Маркова. В результате
для любого ξ > 0 будет выполнено неравенство
P(Y < ξ) ≥ 1 −
M (Y )
D( X )
=1−
.
ξ
ξ
Подставим в это неравенство выражение СВ Y через Х и ξ = ε 2 .
Тогда
D( X )
P(( X − M ( X )) 2 < ε 2 ) ≥ 1 − 2 ;
ε
P ( X − M ( X ) < ε) ≥ 1 −
D( X )
.
ε2
(17.3)
Вычтем последнее неравенство из тождества 1 = 1 :
1 − P ( X − M ( X ) < ε) ≤
P ( X − M ( X ) ≥ ε) ≤
D( X )
;
ε2
D( X )
.
ε2
■
Пример 17.2. Средняя длина детали 50 см, а дисперсия 0,1. Пользуясь неравенством Чебышева, оценить вероятность того, что случайно взятая деталь окажется по длине не меньше 49,5 см и не больше 50,5 см.
Решение. Пусть X – длина случайно взятой детали. Из условия задачи следует, что M ( X ) = 50 ; D( X ) = 0,1 . Требуется оценить вероятность
неравенств 49,5 < X < 50,5 , которые равносильны одному неравенству
X − 50 < 0,5 , т.е. оценить вероятность P( X − 50 < 0,5) .
Так как 50 = M ( X ) , то с помощью промежуточной формулы (17.3)
из доказательства неравенства Чебышева данную вероятность можно оценить снизу:
P( X − 50 < 0,5) ≥ 1 −
0,1
= 1 − 0, 4 = 0,6 .
(0,5) 2
100
Ответ: с вероятностью, большей 0,6, можно предположить, что случайно взятая деталь окажется по длине не меньше 49,5 см и не больше 50,5 см.
Основное утверждение закона больших чисел (ЗБЧ) содержится в
теореме Чебышева. В этой теореме, как и в других теоремах ЗБЧ, используется понятие сходимости случайных величин по вероятности.
Определение 17.1. Случайные величины X 1 , X 2 , …, X n … сходятся
по вероятности к величине A (случайной или неслучайной), если для любого ε > 0 вероятность события ( X n − A < ε) при n → ∞ стремится к единице, т.е.
lim P ( X n − A < ε) = 1 .
n→∞
Следует отметить, что сходимость по вероятности требует, чтобы
неравенство X n − A < ε выполнялось для подавляющего числа членов последовательности, а не для всех n > N , как в математическом анализе. Поэтому при n → ∞ практически все члены последовательности должны попасть в ε -окрестность точки A .
Теорема 17.3 (Чебышева). Если случайные величины X 1 , X 2 , …, X n …
попарно независимы и каждая из них имеет математическое ожидание
M ( X k ) и дисперсию D( X k ) ( k = 1, 2,... ), причем существует такое число
C > 0 , что D( X k ) < C ( k = 1, 2,... ), то для любого ε > 0
1 n

1 n
lim P  ∑ X k − ∑ M ( X k ) < ε  = 1 ,
n→∞
n k =1
 n k =1

(17.4)
т.е. среднее арифметическое этих случайных величин сходится по вероятности к среднему арифметическому математических ожиданий.
Доказательство
Так как D( X k ) < C ( k = 1, 2,... ), то
1
1 n
 1  n
 1 n
D  ∑ X k  = 2 D  ∑ X k  = 2 ∑ D( X k ) = 2 ( D( X1 ) + D( X 2 ) + ... + D( X n )) ≤
n
 n k =1  n  k =1  n k =1
≤
1
1
C
(C + C + ... + C ) = 2 ⋅ Cn = .
2
n
n
n
101
Тогда, применяя к СВ X =
1 n
∑ X k неравенство (17.3) из доказательn k =1
ства неравенства Чебышева, имеем:

P ( X − M ( X ) < ε) = P 

1 n

D ∑ Xk 
n
n

C
1
1
n
X k − ∑ M ( X k ) < ε  ≥ 1 −  k 2=1  ≥ 1 − 2 ,
∑
n k =1
n k =1
ε
nε

т.е
1 n

1 n
C
P ∑ Xk − ∑ M (Xk ) < ε ≥1− 2 .
n k =1
nε
 n k =1

(17.5)
Переходя к пределу при n → ∞ и учитывая, что вероятность любого
события не превышает 1, получим:
1 n

1 n
lim P  ∑ X k − ∑ M ( X k ) < ε  = 1 .
n→∞
n k =1
 n k =1

■
Следствие 17.1*. Если случайные величины X 1 , X 2 , …, X n … попарно независимы и одинаково распределены, причем M ( X k ) = a и D( X k ) = σ2
( k = 1, 2,... ), то для любого ε > 0
1 n

lim P  ∑ X k − a < ε  = 1 ,
(17.6)
n→∞
n
=
k
1


т.е. среднее арифметическое случайных величин сходится по вероятности к математическому ожиданию a .
Следствие теоремы Чебышева обосновывает постоянно используемый на практике «принцип среднего арифметического случайных величин
X k »: среднее арифметическое значение случайных величин, а это есть СВ,
при большом числе n как угодно мало отличается от истинного значения a .
Таким образом, согласно следствию, в качестве приближенного значения
величины a можно взять среднее значение результатов измерений:
1 n
a ≈ ∑ Xk = X .
n k =1
Равенство будет тем точнее, чем больше выполнено измерений n .
102
На теореме Чебышева основан широко применяемый в статистике
выборочный метод, суть которого состоит в том, что о качестве большого
количества однородного материала можно судить по небольшой его пробе.
Пример 17.3. Для определения средней урожайности поля площадью 1800 га взяли на выборку по 1 м2 с каждого гектара. Известно, что по
каждому гектару поля дисперсия не превышает 6. Оценить вероятность того, что отклонение средней выборочной урожайности отличается от средней урожайности по всему полю не более чем на 0,25 ц.
Решение
В правой части неравенства (17.5), определяющего искомую вероятность, условием определены значения C = 6 , n = 1800 , ε = 0, 25 .
Следовательно,
 1 1800

1 1800
6
P
Xk −
M ( X k ) < 0,25  ≥ 1 −
= 1 − 0,05(3) ≈ 0,947 .
∑
∑
1800 k =1
1800 ⋅ 0,252
 1800 k =1

Ответ: с вероятностью, большей 0,947, можно утверждать, что отклонение средней выборочной урожайности отличается от средней урожайности по всему полю в 1800 га не более чем на 0,25 ц.
Исторически первой и наиболее простой формой закона больших чисел является теорема Бернулли.
Теорема 17.4 (Бернулли). Если вероятность появления события A
в одном испытании равна p , число наступлений этого события при n независимых испытаниях равно m , то для любого числа ε > 0 имеет место
равенство
m

lim P  − p < ε  = 1 ,
(17.7)
n→∞
 n

т.е. относительная частота события сходится по вероятности к вероятности этого события.
Доказательство. Рассмотрим СВ X 1 , X 2 , …, X n следующего вида:
X k = 1 , если в k -том испытании появилось событие A , и X k = 0 , если не
появилось. Тогда общее число появлений (успехов) можно представить в
виде
n
m = ∑ Xk .
k =1
103
Для каждой из СВ X k ( k = 1, n ) ряд распределения можно задать в
виде следующей таблицы:
Xk
P
0
q
1
p
,
где q = 1 − p .
Числовыми характеристиками данной СВ будут M ( X k ) = p и
D( X k ) = pq . Заметим, что
2
1 
1 1
pq = p (1 − p ) = p − p = −  p −  ≤ .
4 
2 4
2
Таким образом, СВ X k ( k = 1, n ) независимы, их дисперсии ограничены одним и тем же числом
1
, поэтому к этим СВ можно применить тео4
рему Чебышева (17.3):
1 n

1 n
lim P  ∑ X k − ∑ M ( X k ) < ε  = 1 .
n→∞
n k =1
 n k =1

Так как
1 n
m 1 n
1
X
=
, ∑ M ( X k ) = ⋅ np = p , то
∑
k
n k =1
n n k =1
n
m

lim P  − p < ε  = 1 .
n→∞
 n

■
Теорема Бернулли обосновывает возможность приближенного вычисления вероятности события с помощью его относительной частоты.
n
Неравенство (17.3) для случайных величин m = ∑ X k принимает вид
k =1
m

pq
P − p ≥ ε ≥1− 2 .
nε
 n

(17.8)
Пример 17.4. Сколько следует провести независимых испытаний,
m
чтобы вероятность выполнения неравенства
− p < 0,06 превысила 0,78,
n
если вероятность появления данного события в отдельном испытании составляет p = 0,7 ?
104
Решение
СВ задачи удовлетворяет условию теоремы Бернулли. Согласно усm

ловию P  − p < 0,06  ≥ 0,78 . Если p = 0,7 , то правая часть неравенства
 n

0,7 ⋅ 0,3
= 0,78 , откуда n = 265,(15) . Так как n –
n ⋅ 0,62
количество испытаний, то значение n > 265 .
(17.8) принимает вид 1 −
Ответ: следует провести более 265 испытаний.
Вторую группу предельных теорем представляет центральная предельная теорема. Теоремы этой группы устанавливают связь между законом распределения суммы случайных величин и его предельной формой –
нормальным законом распределения.
Ляпунов Александр Михайлович (25.05.1857 – 3.11.1918) – русский
математик и механик, академик Петербургской, иностранный членкорреспондент Парижской академий. Создал современную теорию устойчивости равновесия и движения механических систем, определяемых конечным числом параметров. Известен работами по математической физике и теории вероятностей.
Теорема 17.5* (центральная предельная теорема Ляпунова)
Пусть случайные величины X1 , X 2 , …, X n – независимые случайные
величины, у каждой из которых существует математическое ожидание
M ( X k ) = ak и дисперсия D( X k ) = σ 2k , абсолютный центральный момент
(
третьего порядка M X k − ak
3
)=µ
3k
(k = 1, n) и
 n
  n

lim  ∑ µ3k  ⋅  ∑ σ2k 
n →∞  k =1
  k =1 
−3
2
= 0,
(17.9)
n
то закон распределения суммы
∑ Xk
при n→∞ неограниченно приближает-
k =1
n
ся к нормальному с математическим ожиданием
∑ ak
k =1
105
n
и дисперсией
∑ σ2k .
k =1
n
Неограниченное приближение закона распределения суммы
∑ Xk
к
k =1
нормальному закону при n → ∞ означает, что
 n
n

 ∑ X k − ∑ ak

2
1 x −t 2
1 1
k =1
k =1


lim P
≤x =
e
dt = + Ф( x) ,
∫

n
n →∞ 
2 2
2π −∞
2
σ


∑ k
k =1


(17.10)
где Ф( x) – функция Лапласа.
n
Смысл условия (17.9) состоит в том, что в сумме
∑ Xk
отсутствуют
k =1
слагаемые, влияние которых на рассеяние суммы было бы подавляюще велико по сравнению с влиянием остальных, кроме того, в сумме нет большого числа слагаемых, обладающих малым влиянием по сравнению с суммарным влиянием остальных. Таким образом, смысл условия (17.9) состоит в том, что удельный вес каждого отдельного слагаемого должен стремиться к нулю при увеличении числа слагаемых.
Например, расход воды для бытовых нужд в течение месяца в каждой квартире многоквартирного дома можно представить в виде n различных случайных величин. Если расход воды в каждой квартире по своему
значению резко не выделяется среди остальных, то на основании теоремы
Ляпунова можно считать, что расход воды всего дома, т.е. сумма n независимых случайных величин, будет случайной величиной, имеющей приближенно нормальный закон распределения. Если же в одном из помещений дома разместить прачечную, то уровень расхода воды в данном помещении резко возрастет и в сумме случайных величин значение данной случайной величины будет играть определяющую роль, поэтому вывод о нормальном законе распределения расхода воды для всего дома станет необоснованным.
Следствие 17.2* (для случая одинаково распределенных случайных величин). Пусть случайные величины X1 , X 2 , …, X n независимы,
одинаково распределены, имеют конечные математические ожидания
M ( X k ) = a и дисперсии D( X k ) = σ 2 (k = 1, n) . Тогда закон распределения
суммы этих величин будет неограниченно стремиться при n → ∞ к нормальному закону.
106
Замечание 17.1. Следствиями ЦПТ являются рассмотренные выше
локальная и интегральная теоремы Лапласа.
Замечание 17.2. На основании ЦПТ можно доказать, что случайные величины, имеющие такие законы распределения, как биномиальный,
Пуассона, гипергеометрический, χ 2 , Стьюдента, при n → ∞ распределены асимптотически нормально.
Вопросы для самоконтроля
1. Что называют неравенствами Маркова?
2. Какой вид имеет неравенство Чебышева?
3. Какую формулировку имеет теорема Чебышева?
4. Каким условиям должны удовлетворять случайные величины
X1, X 2 ,..., X n , чтобы к ним можно было применять теорему Чебышева?
5. Какая из теорем является наиболее простой формой закона больших чисел?
6. Какую словесную формулировку имеет теорема Бернулли?
7. Как записывается формула, выражающая теорему Бернулли?
8. Какая из теорем устанавливает связь между законом распределения суммы случайных величин и его предельной формой?
107
ВОПРОСЫ К ЭКЗАМЕНУ
1. Элементы комбинаторики (основные понятия, формулы).
2. Событие. Виды событий. Пространство элементарных событий. Операции над событиями и их свойства.
3. Статистическое определение вероятности. Классическое и геометрическое определения вероятности, свойства.
4. Теоремы сложения и умножения вероятностей, их следствия.
5. Формулы полной вероятности и Байеса.
6. Последовательность независимых испытаний. Формула Бернулли.
Наивероятнейшее число наступления события в n независимых испытаниях.
7. Последовательность независимых испытаний. Локальная и интегральная теоремы Лапласа. Асимптотические формулы. Свойства функции Лапласа.
8. Теорема и асимптотическая формула Пуассона. Простейший поток
случайных событий, его свойства.
9. Дискретная случайная величина (ДСВ). Способы задания. Свойства
функции распределения. Определения суммы и произведения ДСВ.
10. Системы случайных величин. Способы задания. Зависимые и независимые ДСВ.
11. Числовые характеристики ДСВ. Свойства математического ожидания.
12. Числовые характеристики ДСВ. Свойства дисперсии, моментов.
13. Биномиальный закон распределения ДСВ, его свойства и числовые
характеристики. Пример.
14. Закон распределения Пуассона ДСВ, его свойства и числовые характеристики. Пример.
15. Геометрический и гипергеометрический законы распределения ДСВ,
их свойства и числовые характеристики. Пример.
16. Непрерывные случайные величины (НСВ) и способы их задания.
Свойства функции распределения и плотности распределения вероятностей НСВ.
17. Непрерывные случайные величины. Числовые характеристики НСВ.
18. Числовые характеристики системы случайных величин, их свойства.
19. Равномерный закон распределения случайной величины. Свойства,
числовые характеристики, практическое использование.
20. Показательный закон распределения случайной величины. Свойства, числовые характеристики, практическое использование.
21. Нормальный закон распределения случайной величины. Свойства и
числовые характеристики. Правило трех сигм. Практическое использование.
22. Распределения, связанные с нормальным, их числовые характеристики и использование.
23. Неравенство Маркова.
24. Неравенство Чебышева.
25. Предельная теорема Чебышева (ЗБЧ), ее практическое использование.
26. Предельная теорема Бернулли, ее практическое использование.
27. Теорема Ляпунова (ЦПТ), ее следствия и практический смысл.
108
РАЗДЕЛ 9
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Математическая статистика – это раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений для выявления существующих закономерностей.
Предметом математической статистики является изучение случайных величин (или случайных событий, процессов) по экспериментальным
данным или, иначе, по результатам наблюдений. Объектом наблюдения
выступает совокупность предметов или явлений, объединенных какимлибо признаком или свойством качественного или количественного характера. Значения изучаемого признака X (или нескольких признаков
X1, X 2 ,..., X n ), отмеченные в результате наблюдений, являются случайными, так как зависят от многих условий во время проведения эксперимента
(точность приборов измерения, температура окружающей среды, влажность и т.д.). Поэтому признак X считается случайной величиной, а его
значения называют вариантами случайной величины X .
Можно выделить следующие этапы в статистическом анализе эксперимента:
1) сбор и упорядочение данных;
2) обработка данных и оценка характеристик случайной величины;
3) проверка статистических гипотез, т.е. решение вопроса о согласовании результатов оценивания с опытными данными;
4) принятие решений и статистических прогнозов.
1. ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫБОРКА
Пусть требуется изучить определенную совокупность объектов относительно некоторого признака. Для получения опытных данных необходимо провести обследование соответствующих объектов. Однако иногда обследование может быть затруднено в связи с большим объемом исследуемой совокупности объектов. В некоторых случаях обследование
всей совокупности объектов практически не имеет смысла, поскольку они
разрушаются в результате обследования.
109
Пример 1.1. При проверке качества производства лампочек последние должны находиться под напряжением довольно большое время, что,
естественно, невозможно в условиях массового производства. Поэтому для
проверки на стандартность подвергают контролю только небольшую часть
изготовленных лампочек.
□
Определение 1.1. Совокупность всех мысленно возможных объектов данного вида, над которыми производятся наблюдения с целью получения конкретных значений определенной случайной величины, или совокупность результатов всех мыслимых наблюдений, производимых в неизменных условиях над одной из случайных величин, связанных с данным
видом объектов, называется генеральной совокупностью (ГС).
Генеральную совокупность будем называть конечной или бесконечной в зависимости от того, конечна или бесконечна совокупность составляющих ее элементов.
Определение 1.2. Часть отобранных объектов из ГС (результаты наблюдений над ограниченным числом объектов из этой совокупности) называется выборочной совокупностью (ВС) или выборкой.
Число N объектов ГС и число n объектов ВС будем называть объемами генеральной и выборочной совокупностей соответственно. При этом
будем предполагать, что N ≫ n ( N значительно больше n ).
Однако не всякая выборка может быть действительным представлением о генеральной совокупности.
Пример 1.2. В цехе по производству специальных втулок на токарных станках работают квалифицированные токари и только начинающие.
Для проверки качества продукции на контроль взята партия втулок. Если
эти втулки изготовлены квалифицированным токарем, то, очевидно, представление о качестве всей продукции цеха будет «завышенным», а если
втулки изготовлены начинающим токарем, то это представление будет
«заниженным».
□
Для того чтобы по выборке можно было достаточно уверенно судить
о генеральной совокупности, выборка должна быть представительной (репрезентативной).
Репрезентативность выборки обеспечивается случайностью отбора.
Последнее означает, что любой объект выборки отобран случайно, при
этом все объекты имеют одинаковую вероятность попасть в выборку.
Для выборки из конечной совокупности на практике чаще используется выбор без возвращения (бесповторная выборка), когда каждый ото110
бранный объект перед выбором следующих объектов в исследуемую совокупность не включается (для определения выигрышных лотерейных билетов, при статистическом контроле качества, при демографических исследованиях). Выборка с повторением рассматривается, как правило, лишь в
теоретических исследованиях (регистрация числа частиц, коснувшихся в
течение определенного времени стенок сосуда, внутри которого совершается броуновское движение). Если n ≪ N , то повторный и бесповторный
отборы дают практически эквивалентные результаты.
В случае, когда объем ГС небольшой, или когда основной задачей
наблюдения является полный учет всех элементов, принимают сплошное
наблюдение (перепись страны).
Основой проведения наблюдений и формирования выборочной совокупности является интересующий исследователя группировочный признак или признаки. Схематичная классификация признаков приведена на
рис. 1.1.
ПРИЗНАК
качественный
количественный
дискретный
непрерывный
альтернативный
многомерный
Рис. 1.1
Вопросы для самоконтроля
1. Какие этапы можно выделить в статистическом анализе эксперимента?
2. Что называют генеральной совокупностью?
3. Почему не всегда целесообразно выполнять изучение всех объектов генеральной совокупности?
4. Что называют выборкой?
5. Каким свойством должна обладать выборка, чтобы она полно
представляла генеральную совокупность?
6. Чем обеспечивается репрезентативность выборки?
7. Какие бывают виды отбора объектов в выборку?
8. Как можно классифицировать группировочные признаки?
111
2. ВАРИАЦИОННЫЕ РЯДЫ
Пусть изучается одномерный количественный признак X , иначе –
случайная величина. С этой целью проводится серия независимых опытов
(наблюдений). В каждом из этих опытов величина X принимает то или
иное значение.
Пусть в результате наблюдений зафиксированы следующие значения: n1 раз значение x1 , n2 раз значение x2 , …, nk раз значение xk . При
этом n1 + n2 + ... + nk = n – объем выборки.
Первоначальная совокупность значений признака X является исходным статистическим материалом, который подлежит дальнейшей обработке, в первую очередь – упорядочению.
Операция расположения значений признака (случайной величины)
по возрастанию называется ранжированием статистических данных. Количество ni появлений варианта xi в ряде наблюдений называется частоn
той варианта, а отношение частоты к объему ωi = i – частостью или
n
относительной частотой.
Определение 2.1. Дискретным вариационным рядом распределения
называется ранжированная (упорядоченная по возрастанию) совокупность
вариантов xi с соответствующими им частотами ni или частостями ωi .
Пример 2.1. При опросе 50 сотрудников фирмы установлено следующее количество членов в их семьях: 5; 3; 2; 1; 4; 5; 2; 6; 8; 1; 3; 2; 5; 4;
7; 3; 5; 2; 3; 5; 7; 3; 4; 4; 5; 1; 4; 2; 3; 3; 4; 5; 6; 4; 2; 4; 2; 1; 4; 5; 6; 5; 3; 4; 2;
1; 5; 7; 6; 4.
Составить дискретный вариационный ряд распределения.
Ответ:
Число членов
семьи, xi
1
2
3
4
5
6
7
8
Частота, ni
5
8
8
11
10
4
3
1
Определение 2.2. Интервальным вариационным рядом распределения называется упорядоченная совокупность интервалов варьирования
значений случайной величины с соответствующими частотами или частостями попадания в каждый из них вариантов выборочной совокупности.
112
Алгоритм группировки выборочных данных при построении
интервального вариационного ряда
1. Найти наименьшее и наибольшее значения признака в совокупности и определить размах варьирования:
R = xнаиб − хнаим .
2. Определить число интервалов k . Для этого можно использовать
формулу Стерджесса: k = 1 + [3,322ln n] . Кроме того, в общей теории статистики принято ограничение: 8...10 ≤ k ≤ 20...25 .
R
3. Найти постоянную величину интервала: h = . Если окажется,
k
что h – дробное число, то в отдельных случаях для обеспечения равной
величины интервалов его значение можно округлить в бόльшую сторону.
4. Определить границы интервалов. Если округление значения h не
проводилось, то за начало первого интервала следует взять x0 = xнаим . Если же предварительно было выполнено округление, то в зависимости от
разрядности округления может быть выполнено смещение конца первого
интервала влево. Промежуточные интервалы получают, прибавляя к концу
предыдущего интервала длину частичного интервала h . Конец последнего
интервала должен удовлетворять условию: хнаиб ≤ хk .
5. Подсчитать число выборочных данных, которые попадут в каждый из полученных интервалов: n1 , n2 , …, nk . При этом только один из
промежутков будет замкнут с двух сторон: [ x0 ; x1 ] , а остальные промежут-
ки будут замкнуты только справа: ( xi ; xi +1 ] , i = 1, k − 1 .
6. Результаты вычислений занести в таблицу, которая называется
«Частотное распределение интервального вариационного ряда».
Пример 2.2. Данные о дневной выручке (млн ден. ед.) частного бизнеса по результатам выборочного обследования торговых роллетов рынка
приведены в табл. 2.1.
Построить интервальный вариационный ряд из 8 интервалов равной
длины.
Решение. Наименьшее значение варианта в совокупности составляет
xнаим = 0, 4 (млн ден. ед.), наибольшее − хнаиб = 10 (млн ден. ед.), поэтому
размах варьирования R = 10 − 0,4 = 9,6 (млн ден. ед.).
113
Таблица 2.1
6,2
5,4
8,4
5,9
7,5
4,3
4,9
8,9
2,8
4,9
4,0
5,3
1,8
1,8
5,5
5,1
2,6
6,8
7,6
6,5
4,3
3,9
4,7
6,5
5,5
2,9
3,3
4,2
5,1
9,5
8,5
4,6
4,5
4,2
4,8
0,6
7,3
5,4
7,0
5,6
6,9
6,6
3,3
10,0
5,8
4,2
8,9
4,1
3,6
7,2
5,4
5,0
5,4
4,5
4,8
1,1
6,2
3,3
3,2
6,1
3,6
3,1
8,4
6,1
2,6
5,3
6,4
5,0
6,6
6,3
7,7
3,1
6,8
6,0
0,8
7,5
7,6
5,5
1,9
4,8
0,9
3,0
6,9
6,0
0,9
3,0
0,4
2,7
7,4
6,2
1,9
4,2
5,5
7,9
7,7
3,1
9,2
3,0
3,9
9,6
Так как по условию число интервалов k = 8 , то длина каждого интервала составит h = 9,6 :8 = 1,2 (млн ден. ед.).
Выполнять округление в данном случае нет необходимости, поэтому
за начало первого интервала примем x0 = xнаим = 0,4 .
Тогда по формуле xi +1 = xi + h ( i = 0,7 ) получим:
х1 = 0, 4 + 1,2 = 1,6 ; х2 = 1,6 + 1,2 = 2,8 ;
x3 = 2,8 + 1,2 = 4 ; x4 = 4 + 1, 2 = 5, 2 ; x5 = 5, 2 + 1,2 = 6,4 ;
x6 = 6, 4 + 1, 2 = 7,6 ; x7 = 7,6 + 1, 2 = 8,8 ; x8 = 8,8 + 1, 2 = 10 .
Будем рассматривать следующие промежутки: [0, 4;1,6] , (1,6;2,8] ,
(2, 4;4,0], (4,0;5, 2] , (5, 2;6, 4] , (6,4;7,6], (7,6;8,8] , (8,8;10,0].
Найдем количество вариантов для каждого промежутка и результаты
занесем в итоговую таблицу (табл. 2.2).
Ответ:
Таблица 2.2
Частотное распределение дневной выручки
Интервал 0,4 – 1,6 1,6 – 2,8 2,8 – 4,0 4,0 – 5,2 5,2 – 6,4 6,4 – 7,6 7,6 – 8,8 8,8 – 10,0
Частота
6
8
16
20
22
16
6
6
114
Для графического изображения вариационных рядов используют полигон частот и гистограмму.
Полигон служит для изображения дискретного вариационного ряда,
представляет собой ломаную в прямоугольной системе координат, у которой концы отрезков прямой имеют координаты ( xi , ni ) , i = 1, k . Иногда при
построении полигона добавляют фиктивные точки ( x0 ,0) и ( xk +1,0) .
Гистограмма служит только для изображения интервальных вариационных рядов и представляет собой ступенчатую фигуру из прямоугольников с основаниями, равными интервалам значений признака в интервальном вариационном ряде, и высотами, равными частотам ni (частостям
ωi ) i = 1, k интервалов, в прямоугольной системе координат. Если соединить середины верхних оснований прямоугольников отрезками прямой, то
можно получить полигон того же распределения.
По виду полигона или гистограммы можно сделать предположение о
законе распределения совокупности (признака).
Пример 2.1* (продолжение). Построить полигон для полученного
дискретного вариационного ряда.
Ответ: полигон представлен на рис. 2.1.
Пример 2.2* (продолжение). Построить гистограмму и полигон для
полученного интервального вариационного ряда.
Ответ: гистограмма и полигон представлены на рис. 2.2.
ni
ni
22
11
5
1
x
1
4
8
x
0, 4
Рис. 2.1
10
Рис. 2.2
115
Определение 2.3. Эмпирической функцией распределения (функцией
распределения выборки) называется функция F ∗ ( x) , определяющая для
каждого значения x относительную частоту события X < x :
n
F ∗ ( x) = x ,
(2.1)
n
где nx − число вариантов, меньших x ; n − объем выборки.
Свойства F ∗ ( x)
1. 0 ≤ F ∗ ( x) ≤ 1 .
2. F ∗ ( x) − неубывающая функция.
3.
lim F ∗ ( x) = 0 ,
x →−∞
lim F ∗ ( x) = 1 .
x →+∞
Если для некоторой совокупности xнаим = а , хнаиб = b , то F ∗ ( x) = 0
при x ≤ a и F ∗ ( x) = 1 при x > b .
В случае построения эмпирической функции распределения для интервального вариационного ряда при ее графическом изображении можно
соединить точки графика, соответствующие правым концам интервалов,
отрезками прямой. В результате получим непрерывную линию, называемую кумулятивной кривой или кумулятой.
Пример 2.1* (продолжение). Для полученного дискретного вариационного ряда записать эмпирическую функцию распределения и построить ее график.
Ответ: эмпирическая функция распределения имеет вид
 0
 0,10

0, 26

0, 42

∗
F ( x) = 0,64
0,84

0,92
0,98

 1
график представлен на рис. 2.3.
при
при
при
при
при
при
при
при
при
116
x ≤ 1;
1 < x ≤ 2;
2 < x ≤ 3;
3 < x ≤ 4;
4 < x ≤ 5;
5 < x ≤ 6;
6 < x ≤ 7;
7 < x ≤ 8;
x > 8,
Пример 2.2* (продолжение). Для полученного интервального вариационного ряда записать эмпирическую функцию распределения и построить ее график, построить кумуляту.
Ответ: эмпирическая функция распределения имеет вид:
при
x ≤ 0, 4;
 0
0,06 при 0,4 < x ≤ 1,6;

 0,14 при 1,6 < x ≤ 2,8;

2,8 < x ≤ 4;
0,30 при

F ∗ ( x) = 0,50 при
4 < x ≤ 5, 2;
0,72 при 5,2 < x ≤ 6, 4;

 0,88 при 6,4 < x ≤ 7,6;
0,94 при 7,6 < x ≤ 8,8;

 1
при
x > 8,8,
ее график и кумулята представлены на рис. 2.4.
F ∗ ( x)
F ∗ ( x)
1
1
0,5
x
1
8
4
x
0, 4
Рис. 2.3
10
Рис. 2.4
Вопросы для самоконтроля
1. Какую операцию называют ранжированием статистических данных?
2. Что называют дискретным вариационным рядом?
117
3. Что называют интервальным вариационным рядом?
4. Каков алгоритм группировки выборочных данных при построении интервального вариационного ряда?
5. Что можно использовать для графического изображения вариационных рядов?
6. Что называют эмпирической функцией распределения выборки?
7. Какие основные свойства эмпирической функции распределения
выборки вы знаете?
3. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ
ВЫБОРОЧНОЙ СОВОКУПНОСТИ
Пусть распределение признака X задано вариационным рядом в виде табл. 3.1
Таблица 3.1
xi
x1
x2
…
ni
n1
n2
…
xk
nk
,
k
причем
∑ ni = n .
i =1
Замечание 3.1. Для того чтобы вычислить числовые характеристики признака, представленного интервальным вариационным рядом,
следует перейти к дискретному вариационному ряду, заменив интервалы
их серединными значениями.
3.1. Средние величины
Определение 3.1. Средней арифметической вариационного ряда
(математическим ожиданием признака X ) называется сумма произведений всех вариантов (значений признака) на соответствующие им частоты,
деленная на объем выборки:
x=
1 k
∑ xi ni .
n i =1
k
(3.1)
Очевидно, что x = ∑ xi ωi , где ωi − частости соответствующих вариi =1
антов.
118
Свойства средней арифметической
1. Средняя арифметическая постоянной равна самой постоянной.
2. Если все варианты увеличить (уменьшить) на одно и то же число,
то средняя арифметическая увеличится (уменьшится) на то же число:
x±C = x ±C .
3. Если все варианты увеличить (уменьшить) в одно и то же число
раз, то средняя арифметическая увеличится (уменьшится) во столько же
раз:
Cx = Cx .
4. Сумма отклонений вариантов от их средней арифметической равна нулю:
k
∑ ( xi − x )ni = 0 .
i =1
5. Средняя арифметическая алгебраической суммы соответствующих друг другу значений нескольких признаков равна алгебраической
сумме средних арифметических этих признаков:
x± y=x ± y.
6. Если ряд наблюдений состоит из нескольких непересекающихся
групп наблюдений, то средняя арифметическая всего ряда наблюдений
равна взвешенной средней арифметической групповых средних, причем
весами являются объемы групп:
1 m
x = ∑ xi ni ,
n i =1
где x − общая средняя, xi − групповая средняя i -той группы, объем которой равен ni ; m − число групп.
7. Если все частоты вариантов умножить на одно и то же число, то
средняя арифметическая не изменится.
Определение 3.2. Модой Mo выборочной совокупности называют
наиболее часто встречающееся значение признака в данном ряду распределения.
119
Для дискретного вариационного ряда (ДВР) мода определяется как
значение признака с наибольшей частотой. Для интервального вариационного ряда (ИВР) мода может быть определена как значение признака, которому отвечает наибольшая плотность распределения частости.
Если ( xl −1; xl ) – модальный интервал, т.е. интервал, которому соответствует наибольшая частота nl , и интервалы вариационного ряда имеют
постоянную длину h , то мода исследуемого признака X вычисляется по
формуле
nl − nl −1
Mo = xl + h
,
(3.2)
(nl − nl −1 ) + (nl − nl +1 )
где nl −1 и nl +1 – частоты, которые соответствуют предмодальному и послемодальному интервалам.
Определение 3.3. Медианой Me выборочной совокупности называется значение признака, относительно которого совокупность делится на
две равные по объему части, причем в одной из них содержатся члены, у
которых значения признака не больше медианы Me , а в другой – члены со
значениями признака не меньше Me .
Для нахождения медианы в ДВР первоначально сумму частот делят
n
пополам: . Если сумма частот упорядоченной совокупности нечетна, то
2
n +1
порядковым номером требуемого варианта является
. Если сумма час2
n
тот четна, то в качестве медианы берут значение варианта с номером
2
n n+2
или же среднее значений признака с номерами и
.
2
2
Для ИВР сначала находят медианный интервал ( xl −1; xl ) , его номер
соответствует интервалу, кумулятивная частота которого равна или превышает половину суммы частот. Медиану вычисляют по формуле
h
Me = xl +
nl
 n l −1 
⋅  − ∑ ni  ,
 2 i =1 
(3.3)
где l – порядковый номер медианного интервала, h – его длина, nl – частота медианного интервала.
120
Пример 3.1. Для ДВР (пример 2.1 – распределение сотрудников
фирмы по количеству членов в семье) найти среднюю арифметическую,
моду и медиану.
Число членов
семьи, xi
1
2
3
4
5
6
7
8
Частота, ni
5
8
8
11
10
4
3
1
Решение:
1
192
x = (1 ⋅ 5 + 2 ⋅ 8 + 3 ⋅ 8 + 4 ⋅ 11 + 5 ⋅ 10 + 6 ⋅ 4 + 7 ⋅ 3 + 8 ⋅ 1) =
= 3,84 (чел.),
50
50
Mo = 4 (чел.), так как варианту x4 = 4 соответствует наибольшая частота
n4 = 11 , Me = 4 (чел.), так как в упорядоченной по возрастанию совокупности 25-й и 26-й члены принимают значение 4.
Ответ: x = 3,84 (чел.); Mo = 4 (чел.); Me = 4 (чел.).
Пример 3.2. Для ИВР (пример 2.2 – распределение дневной выручки)
найти среднюю арифметическую, моду и медиану.
Интервал 0,4 – 1,6 1,6 – 2,8 2,8 – 4,0 4,0 – 5,2 5,2 – 6,4 6,4 – 7,6 7,6 – 8,8 8,8 – 10,0
Частота
6
8
16
20
22
16
6
6
Решение. Для вычисления указанных числовых характеристик перейдем к ДВР, заменив интервалы их серединными значениями, и для полученного ряда найдем требуемые характеристики. Результаты вычисления средней арифметической представим во вспомогательной таблице (табл. 3.2).
№
Интервал
1
2
3
4
5
6
7
8
Итого
0,4 – 1,6
1,6 – 2,8
2,8 – 4,0
4,0 – 5,2
5,2 – 6,4
6,4 – 7,6
7,6 – 8,8
8,8 – 10,0
Таблица 3.2
Середина, Частота,
xi′
ni
1,0
2,2
3,4
4,6
5,8
7,0
8,2
9,4
6
8
16
20
22
16
6
6
100
Тогда x = 5,152 (млн ден. ед.).
121
xi′ni
6,0
17,6
54,4
92,0
127,6
112,0
49,2
56,4
515,2
Так как наибольшая частота nl = 22 соответствует интервалу
(5, 2;6, 4) , то xl = 5, 2 , nl −1 = 20 , nl +1 = 16 , h = 1, 2 , и по формуле (3.2)
Mo = 5, 2 + 1,2
22 − 20
1, 2 ⋅ 2
= 5, 2 +
= 5,5 (млн ден. ед.).
(22 − 20) + (22 − 16)
8
Так как порядковый номер медианного интервала l = 4 , то на основании формулы (3.3) получим:
Me = 4 + 1,2 ⋅
50 − 30
= 5,2 (млн ден. ед.).
20
Ответ: x = 5,152 (млн ден. ед.); Mo = 5,5 (млн ден. ед.);
Me = 5, 2 (млн ден. ед.).
3.2. Дисперсия
Определение 3.4. Выборочной дисперсией вариационного ряда (признака X ) называется сумма произведений квадратов отклонений всех вариантов (значений признака) от средней арифметической на соответствующие им частоты, деленная на объем выборки:
σв2
= σв2 ( X )
1 k
= ∑ ( xi − x ) 2ni .
n i =1
(3.4)
Свойства выборочной дисперсии
1. Дисперсия постоянной величины равна нулю.
2. Если все варианты увеличить (уменьшить) на одно и то же число,
то дисперсия не изменится:
σв2 ( X ± C ) = σв2 ( Х ) .
3. Если все варианты увеличить (уменьшить) в одно и то же число
раз, то имеет место следующее равенство:
σв2 (СX ) = С 2σв2 ( Х ) .
4. Если частоты вариантов умножить на одно и то же число, то выборочная дисперсия не изменится.
122
5. Выборочная дисперсия равна разности между средней арифметической квадратов наблюдений над признаком Х и квадратом его средней
арифметической:
σв2 ( Х ) = x 2 − ( x ) 2 .
(3.5)
Определение 3.5. Средним квадратичным отклонением признака Х
называется арифметический квадратный корень из выборочной дисперсии:
σв = σв2 .
(3.6)
Среднее квадратичное отклонение (СКО) σв является мерой вариации признака и выступает показателем однородности статистической совокупности.
Для сравнения средних квадратичных отклонений различных вариаций вариационных рядов используют коэффициент вариации, который
вычисляют как процентное отношение СКО к средней арифметической:
σ
v = в ⋅ 100% .
(3.7)
x
Пример 3.1 (продолжение). Найти выборочную дисперсию, СКО и
коэффициент вариации ДВР (пример 2.1 – распределение сотрудников
фирмы по количеству членов в семье).
Решение. Ранее была вычислена средняя арифметическая:
x = 3,84 (чел.).
Для вычисления дисперсии составим вспомогательную таблицу
(табл. 3.3).
Таблица 3.3
№
1
2
3
4
5
6
7
8
Итого
Значение
Частота,
xi
ni
1
2
3
4
5
6
7
8
–
5
8
8
11
10
4
3
1
50
xi − x
( xi − x )2
( xi − x ) 2 ni
−2,84
−1,84
−0,84
0,16
1,16
2,16
3,16
4,16
–
8, 0656
3, 3856
0, 7056
0, 0256
1,3456
4, 6656
9, 9856
17,3056
–
40,3280
27, 0848
5, 6448
0, 2816
13, 4560
18, 6624
29, 9568
17,3056
152,7200
123
Тогда σв2 ( Х ) =
152,72
= 3,0544 ; σв ( Х ) = 1,7477 (чел.);
50
1,7477
v=
⋅ 100% ≈ 45,51% .
3,84
Ответ: σв2 = 3,0544 ; σв = 1,7477 (чел.); v = 45,51% .
Пример 3.2 (продолжение). Найти выборочную дисперсию, СКО и коэффициент вариации ИВР (пример 2.2 – распределение дневной выручки).
Решение. Ранее была вычислена средняя арифметическая:
x = 5,152 (млн ден. ед.).
Для вычисления дисперсии составим вспомогательную таблицу
(табл. 3.4).
Таблица 3.4
Середина,
xi′
Частота, ni
xi′ − x
( xi′ − x )2
( xi′ − x ) 2 ni
0,4 – 1,6
1,0
6
−4,152
17, 2391
103, 4346
2
1,6 – 2,8
2,2
8
−2, 952
8, 7143
69, 7144
3
2,8 – 4,0
3,4
16
−1, 752
3, 0695
49,1121
4
4,0 – 5,2
4,6
20
−0, 552
0,3047
6, 0941
5
5,2 – 6,4
5,8
22
0, 648
0, 4199
9, 2379
6
6,4 – 7,6
7,0
16
1,848
3, 4151
54, 6417
7
7,6 – 8,8
8,2
6
3, 048
9, 2903
55, 7418
8
Итого
8,8 – 10,0
9,4
6
4, 248
18, 0455
108, 2730
–
100
–
–
456,2496
№
Интервал
1
Тогда σв2 ( Х ) =
456, 2496
≈ 4,5625 ; σв ( Х ) = 2,136 (млн ден. ед.),
100
v=
2,136
⋅ 100% ≈ 41,46% .
5,152
Ответ: σв2 = 4,5625 ; σв = 2,136 (млн ден. ед.); v = 41,46% .
3.3. Начальные и центральные моменты вариационного ряда
Средняя арифметическая и дисперсия вариационного ряда являются
частными случаями более общего понятия – моментов вариационного ряда.
124
Определение 3.5. Начальным выборочным моментом p -того порядка называется средняя арифметическая p − x степеней наблюдаемых
значений признака:
1 k
ν p = ∑ xip ⋅ ni .
(3.8)
n i =1
По определению ν 0 = 1, ν1 = x – средняя арифметическая является
начальным моментом первого порядка вариационного ряда, ν 2 = x 2 , и т.д.
Определение 3.6. Центральным выборочным моментом p -того
порядка называется средняя арифметическая p − x степеней отклонений
наблюдаемых значений признака от их среднего арифметического:
µp =
1 k
( xi − x ) p ⋅ ni .
∑
n i =1
(3.9)
По определению µ 0 = 1 ; µ1 = 0 ; µ 2 = ν 2 − ν12 , причем центральный
момент второго порядка является дисперсией вариационного ряда.
Определение 3.7. Выборочным коэффициентом асимметрии вариационного ряда называется число A , определяемое формулой
A=
µ3
.
σ3в
(3.10)
Выборочный коэффициент асимметрии служит для характеристики
асимметрии полигона вариационного ряда. Если A = 0 , то распределение
имеет симметричную форму, т.е. варианты, равноудаленные от x , имеют
одинаковую частоту. Если полигон асимметричен, то одна из его ветвей,
начиная с вершины, имеет более пологий «спуск», чем другая. В случае
A < 0 более пологий «спуск» полигона наблюдается слева, в этом случае
асимметрию называют левосторонней. В случае A > 0 пологий «спуск»
полигона наблюдается справа – асимметрия правосторонняя.
Определение 3.8. Выборочным эксцессом вариационного ряда называется число ε , определяемое формулой
ε=
µ4
− 3.
σв4
125
(3.11)
Выборочный эксцесс служит для сравнения на «крутость» выборочного распределения с нормальным распределением. Если выборочному
распределению соответствует ε < 0 , то соответствующий полигон имеет
более пологую вершину по сравнению с нормальной кривой. В случае
ε > 0 полигон более крутой по сравнению с нормальной кривой.
Пример 3.1 (продолжение). Найти коэффициент асимметрии и эксцесс ДВР (пример 2.1 – распределение сотрудников фирмы по количеству
членов в семье).
Решение. Ранее были вычислены средняя арифметическая x = 3,84 (чел.)
и СКО σв = 1,7477 (чел.). Для вычисления центральных моментов третьего
и четвертого порядков на основе табл. 3.3 составим вспомогательную таблицу (табл. 3.5).
Таблица 3.5
Значение
№
xi
Частота, ni
xi − x
( xi − x )2 ni
( xi − x )3 ni
( xi − x )4 ni
1
1
5
−2,84
40,3280
–114,5315
325,2695
2
2
8
−1,84
27, 0848
–49,8360
91,6983
3
3
8
−0,84
5, 6448
–4,7416
3,9830
4
4
11
0,16
0, 2816
0,0451
0,0072
5
5
10
1,16
13, 4560
15,6090
18,1064
6
6
4
2,16
18, 6624
40,3108
87,0713
7
7
3
3,16
29, 9568
94,6635
299,1366
8
Итого
8
–
1
50
4,16
17,3056
–
152,7200
71,9913
55,5106
299,4838
1124,7561
Тогда
µ3 =
µ4 =
55,5106
1,0702
= 1,0702 ; A =
≈ 0, 2005 ;
50
(1,7477)3
1124,7561
22, 4951
≈ 22, 4951 ; ε =
− 3 ≈ −0,5889 .
50
(1,7477)4
Ответ: A ≈ 0, 2005 , ε ≈ −0,5889 .
Пример 3.2 (продолжение). Найти коэффициент асимметрии и эксцесс ИВР (пример 2.2 – распределение дневной выручки).
126
Решение. Ранее были вычислены средняя арифметическая
x = 5,152 (млн. ден. ед.) и СКО σв = 2,136 (млн ден. ед.). Для вычисления
центральных моментов третьего и четвертого порядков на основе табл. 3.4
составим вспомогательную таблицу (табл. 3.6).
Таблица 3.6
№
Середина
интервала,
Частота,
xi′
ni
1
1,0
2
xi′ − x
( xi′ − x ) 2 ni
( xi′ − x )3 ni
( xi′ − x ) 4 ni
6
−4,152
103, 4346
–429,4606
1783,1202
2,2
8
−2, 952
69, 7144
–205,7970
607,5128
3
3,4
16
−1, 752
49,1121
–86,0443
150,7497
4
4,6
20
−0, 552
6, 0941
–3,3639
1,8569
5
5,8
22
0, 648
9, 2379
5,9862
3,8790
6
7,0
16
1,848
54, 6417
100,9778
186,6070
7
8,2
6
3, 048
55, 7418
169,9012
517,8585
8
Итого
9,4
6
4, 248
108, 2730
–
100
–
456,2496
459,9438
12,1432
1953,8413
5205,4254
Тогда µ3 =
µ4 =
12,1432
0,1214
≈ 0,1214 ; A =
≈ 0,0125 ;
100
(2,136)3
5205, 4254
52,0543
≈ 52,0543 ; ε =
− 3 ≈ −0, 4996 .
100
(2,136)4
Ответ: A ≈ 0,0125 , ε ≈ −0, 4996 .
Замечание 3.2. Для нормального распределения признака X график
функции плотности будет симметричен по отношению к прямой x = x и
A = 0, ε = 0.
Согласно приведенным определениям можно выделить три вида числовых характеристик вариационного ряда:
– меры положения частотного распределения наблюдаемых значений признака X: x , Mo , Me ;
– меры вариации – измеряют количественную величину рассеивания вокруг мер положения: σв2 и σв ;
–
меры формы частотного распределения: A и ε .
127
Вопросы для самоконтроля
1. Что называют средней арифметической вариационного ряда?
2. Какими свойствами обладает средняя арифметическая?
3. Что называют модой выборочной совокупности?
4. Что называют медианой выборочной совокупности?
5. Что называют выборочной дисперсией вариационного ряда?
6. Какими свойствами обладает выборочная дисперсия?
7. В чем состоит смысл среднего квадратичного отклонения?
8. Какой показатель используют для сравнения средних квадратичных отклонений различных вариационных рядов?
9. Что называют начальным выборочным моментом p -того порядка?
10. Что называют центральным выборочным моментом p -того порядка?
11. Что называют выборочным коэффициентом асимметрии?
12. Что характеризует выборочный коэффициент асимметрии?
13. Что называют выборочным коэффициентом эксцесса?
14. Что характеризует выборочный коэффициент эксцесса?
15. На какие виды можно разделить числовые характеристики вариационного ряда?
4. ОСНОВНЫЕ ХАРАКТЕРИСТИКИ
ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ И ИХ СВЯЗЬ
С ХАРАКТЕРИСТИКАМИ ВЫБОРОЧНОЙ СОВОКУПНОСТИ
Пусть распределение количественного признака X генеральной совокупности известно и задано табл. 4.1
Таблица 4.1
xi
x1
x2
…
xk
mi
m1
m2
…
mk
,
k
причем
∑ mi = N
– объем генеральной совокупности.
i =1
Определение 4.1. Средней арифметической (генеральной средней)
распределения признака X в генеральной совокупности называется число
1 k
x0 = ∑ xi mi .
(4.1)
N i =1
128
Определение 4.2. Генеральной дисперсией признака X называется число
σ02 =
1 k
( xi − x0 ) 2 mi .
∑
N i =1
(4.2)
Пусть выборочная совокупность, соответствующая этой генеральной
совокупности, представлена в табл. 3.1, а x и σв2 определены формулами
(3.1) и (3.4).
Пусть из генеральной совокупности образуется повторная выборка
объемом n . Любая выборка x1 , x2 , …, xn есть n -мерная случайная величина ( X 1, X 2 ,..., X n ) , где случайные величины X i независимы, одинаково
распределены (табл. 4.2).
xi
x1
x2
pi
m1
N
m2
N
Таблица 4.2
xk
…
…
mk
N
Рассмотрим среднюю арифметическую распределения признака X в
выборочной совокупности, т.е.
1
x = X = ( X1 + X 2 + ... + X n ) ,
n
тогда
σв2
1 т
= ∑ ( X i − X )2 .
n i =1
Так как случайные величины X1, X 2 ,..., X n одинаково распределены,
то M ( X 1 ) = M ( X 2 ) = ... = M ( X n ) ; D( X1 ) = D( X 2 ) = ... = D( X n ) , причем
1 k
1 k
M ( X i ) = ∑ xi mi = x0 ; D( X i ) = ∑ ( xi − x0 )2 mi = σ02 .
N i =1
N i =1
Тогда
1 n
 1  n
 1 n
1
M ( X ) = M  ∑ X i  = M  ∑ X i  = ∑ x0 = ⋅ n ⋅ x0 = x0 , т.е. M ( x ) = x0 .
n
 n i =1  n  i =1  n i =1
1 n
 1  n
 1 n
σ2
D( X ) = D  ∑ X i  = 2 D  ∑ X i  = 2 ∑ D ( X i ) = 0 ;
n
 n i =1  n
 i =1  n i =1
129
1

M (σв2 ) = M ( x 2 ) − M ( x )2 = M  ( X 12 + X 22 + ... + X n2 )  − M ( x − x0 + x0 ) 2 =
n

1 n
1
= ∑ M (X i2 ) − M (( x − x0 ) + x0 )2 = ⋅ n ⋅ x02 − M (( x − x0 )2 + 2( x − x0 ) x0 + x02 ) =
n i =1
n
= x02 − M ( x − x0 ) 2 − 2 x0 M ( x − x0 ) − M ( x0 ) 2 = x02 − M ( x − x0 )2 − M ( x0 )2 =
=
x02
− D ( x ) − ( x0 ) =
2
x02
− ( x0 ) − D ( x )
2
Таким образом, получено M (σв2 ) =
= σ02
σ02 n − 1 2
−
=
σ0 .
n
n
n −1 2
σ0 .
n
(4.3)
Вопросы для самоконтроля
1.
2.
3.
4.
Что называют генеральной средней распределения признака X ?
Что называют генеральной дисперсией признака X ?
Чему равно математическое ожидание выборочной средней?
Чему равно математическое ожидание выборочной дисперсии?
5. ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ
ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ
Определение 5.1. Выборочная характеристика, используемая в качестве приближенного значения неизвестной генеральной характеристики,
называется ее точечной статистической оценкой.
«Точечная» означает, что оценка представляет собой число или точку на числовой оси. «Статистическая» означает, что оценка рассчитывается по результатом наблюдений, или иначе – по собранной исследователем статистике. В дальнейшем слово «статистическая» будем опускать.
Обозначим через θ некоторую генеральную характеристику. Пусть
ее числовое значение неизвестно, однако предложен некоторый алгоритм
или формула вычисления точечной оценки θ( n) этой характеристики по
результатам X1, X 2 ,..., X n наблюдений величины X .
Обозначая этот алгоритм буквой f , получаем:
θ( n) = f ( X 1, X 2 ,..., X n ) .
130
(5.1)
Подставив в (5.1) вместо X1, X 2 ,..., X n конкретные результаты наблюдений, получим число, которое и принимаем за приближенное значение неизвестной генеральной характеристики θ . Найти погрешность этого
приближения нельзя, поскольку числовое значение характеристики θ неизвестно. Интерпретация оценки θ( n) как случайной величины позволяет
сформулировать свойства, которыми должна обладать оценка, чтобы ее
можно было считать хорошим приближением к неизвестной генеральной
характеристике. Это свойства состоятельности, несмещенности и эффективности.
Определение 5.2. Оценка θ( n) генеральной характеристики θ называется состоятельной, если для любого ε > 0 выполняется равенство
(
)
lim P θ( n ) − θ < ε = 1 .
n→∞
(5.2)
Равенство (5.2) означает, что при очень малом положительном числе
ε чем больше число наблюдений n , тем больше вероятность незначительного по абсолютной величине отклонения оценки θ( n) от неизвестной характеристики θ .
Определение 5.3. Оценка θ( n) генеральной характеристики θ называется несмещенной, если для любого фиксированного числа наблюдений
n математическое ожидание оценки равно неизвестной характеристике,
т.е. выполняется равенство
M (θ( n ) ) = θ .
(5.3)
Равенство (5.3) означает: если оценка несмещенная, то при любом
фиксированном n среднее из значений оценки, вычисленное для всевозможных выборок объема n , совпадает с точным значением генеральной
характеристики θ .
Определение 5.4. Несмещенная оценка θ( n) характеристики θ называется несмещенной эффективной, если она среди всех прочих несмещенных оценок той же характеристики обладает наименьшей дисперсией.
Пример 5.1. Средняя выборочная x − состоятельная, несмещенная,
эффективная оценка средней генеральной x0 .
131
Пример 5.2. Дисперсия σв2 = x 2 − ( x ) 2 − состоятельная оценка генеральной дисперсии, однако, согласно формуле (4.3), это смещенная оценn
ка. Чтобы получить несмещенную оценку, умножим (4.3) на
:
n −1
n
n
n
 n

M (σ в2 ) =
⋅
σ 02 ; M 
σ в2  = σ 02 .
n −1
n −1 n −1
 n −1 
Таким образом, исправленная статистическая дисперсия выборки
n
S2 =
σ в2 является несмещенной оценкой генеральной дисперсии.
n −1
Вопросы для самоконтроля
1. Что называют точечной статистической оценкой неизвестной генеральной характеристики?
2. В каком случае точечная оценка генеральной характеристики называется состоятельной?
3. В каком случае точечная оценка генеральной характеристики называется несмещенной?
4. В каком случае несмещенная точечная оценка генеральной характеристики называется эффективной?
5. Какими свойствами точечных оценок обладает средняя выборочная?
6. Какими свойствами точечных оценок обладает выборочная дисперсия?
7. Что является несмещенной оценкой генеральной дисперсии?
6. МЕТОДЫ НАХОЖДЕНИЯ ТОЧЕЧНЫХ ОЦЕНОК
6.1. Метод моментов
Пусть известен закон распределения случайной величины X (признака X в генеральной совокупности), содержащий неизвестные параметры θ1 , θ2 , …, θr .
Произведем выборку объема n . Метод моментов состоит в том, что
эмпирические моменты
1 n k
∗
k
ν k = x = ∑ xi ;
(6.1)
n i =1
132
µ∗k
1 n
= ( x − x ) = ∑ ( xi − x ) k
n i =1
k
(6.2)
приравниваются теоретическим моментам соответствующего порядка:
νk = M ( X k ) ;
(6.3)
µ k = M (( X − M ( X )) k ).
(6.4)
Согласно формулам (6.1) и (6.2) эмпирические моменты вычисляются по данным наблюдений xi ( i = 1, n ).
В зависимости от закона распределения случайной величины теоретические моменты можно вычислить с использованием ряда распределения или плотности распределения. Тогда из (6.3) и (6.4) следует:
 n k
 ∑ xi pi ( x, θ1 , θ2 ,...., θr ) – для ДСВ;
 i =1
ν k = +∞
 x k f ( x, θ , θ ,..., θ ) dx – для НСВ;
1 2
r
∫
−∞
(6.5)
 n
k
 ∑ ( xi − M ( X )) pi ( x, θ1 , θ2 ,...., θr ) – для ДСВ;
 i =1
µ k = +∞
 ( x − M ( X )) k f ( x, θ , θ ,..., θ ) dx – для НСВ.
1 2
r
∫
−∞
(6.6)
Пример 6.1. Случайная величина X (число появлений события A в
5 независимых испытаниях) подчинена биномиальному распределению с
неизвестным параметром распределения p . Проведено 10 опытов по 5 испытаний в каждом. В результате получено эмпирическое распределение
(табл. 6.1), где xi − число появлений события A в одном опыте, mi − количество опытов, в которых A появилось xi раз. Методом моментов найти
точечную оценку параметра p биномиального распределения.
Таблица 6.1
xi
0
1
2
3
4
5
mi
4
2
1
1
1
1
133
Решение. Согласно условию определим случайную величину X как
число появлений события A в 5 независимых испытаниях. Эта случайная
величина подчинена биномиальному закону распределения, поэтому
M ( X ) = 5 ⋅ p = 5 p.
Так как в данном случае неизвестен один параметр p , то приравняем начальный эмпирический и начальный теоретический моменты первого
порядка: ν1* = ν1 .
В данном случае ν1 = 5 p . Для вычисления ν1* воспользуемся формулой
ν1*
1 k
= ∑ xi mi , где n = 10 согласно условию. Получаем
n i =1
ν1* =
1
16
(0 ⋅ 4 + 1 ⋅ 2 + 2 ⋅ 1 + 3 ⋅ 1 + 4 ⋅ 1 + 5 ⋅ 1) = = 1,6 .
10
10
Таким образом, равенство ν1* = ν1 принимает вид: 1,6 = 5 p,
откуда p = 0,32.
Ответ: 0,32.
Пример 6.2. Методом моментов по выборке x1 , x2 , …, xn найти точечную оценку неизвестного параметра λ распределения случайной величины X , зная, что плотность распределения вероятностей имеет вид
 0,
x < 0;
f ( x) =  −λx
λe , x ≥ 0.
Решение. Так как распределение определено одним параметром λ ,
то достаточно составить одно уравнение: ν1∗ = ν1 .
В данном случае
ν1∗
+∞
+∞
1 n
1
= ∑ xi = x ; ν1 = ∫ x ⋅ f ( x, λ)dx = ∫ x ⋅ λe −λx dx = .
λ
n i =1
−∞
0
Поэтому получаем: x =
Ответ: λ =
1
1
, или λ = .
λ
x
1
.
x
134
6.2. Метод наибольшего правдоподобия
Пусть известен закон распределения случайной величины X , содержащий параметр θ .
Определение 6.1. Функцией правдоподобия ДСВ X , принимающей
значения xi ( i = 1, n ) с вероятностями p ( xi , θ) , называют функцию
L( x1 , x2 ,..., xn , θ) = p ( x1 , θ) ⋅ p ( x2 , θ) ⋅ ... ⋅ p ( xn , θ).
(6.7)
Функцией правдоподобия НСВ X с плотностью распределения вероятностей f ( x, θ) называют функцию
L( x1 , x2 ,..., xn , θ) = f ( x1 , θ) ⋅ f ( x2 , θ) ⋅ ... ⋅ f ( xn , θ).
(6.8)
Логарифмической функцией правдоподобия называют функцию ln L .
Алгоритм оценки параметра распределения
методом наибольшего правдоподобия
1. Построить функцию правдоподобия L .
2. Определить логарифмическую функцию правдоподобия ln L .
d ln L
3. Найти
.
dθ
4. Определить критические точки производной из решения уравнения
d ln L
= 0.
(6.9)
dθ
d 2 ln L
d 2 ln L
5. Вычислить
в найденных точках. Если
< 0 , то
dθ2
d θ2 θ∗
при значении параметра θ∗ функция ln L
имеет максимум, если
d 2 ln L
> 0 , то при значении параметра θ∗ функция ln L имеет минимум.
2
d θ θ∗
6. Значение параметра θ∗ , при котором функция ln L достигает
максимума, принимается за величину оцениваемого параметра.
Пример 6.3. По выборке x1, x2 , …, xn методом наибольшего правдоподобия найти точечную оценку параметра p геометрического распределения P( X = xi ) = (1 − p ) xi −1 p , где p − вероятность появления события в
отдельном испытании.
135
Решение. Составим функцию правдоподобия:
L( x1, x2 ,..., xn , p ) = (1 − p ) x1 −1 ⋅ p ⋅ (1 − p ) x2 −1 ⋅ p × ... × (1 − p ) xn −1 ⋅ p =
= (1 − p ) x1 + x2 +...+ xn − n ⋅ p n .
Получим логарифмическую функцию правдоподобия:
ln L( x1, x2 ,..., xn , p ) = ln((1 − p ) x1 + x2 +...+ xn − n ⋅ p n ) =
= ( x1 + x2 + ... + xn − n)ln(1 − p ) + n ln p .
Найдем критические точки логарифмической функции правдоподобия:
d ln L x1 + x2 + ... + xn − n n
=
+ ;
dp
p −1
p
x1 + x2 + ... + xn − n n
+ = 0;
p −1
p
p ( x1 + x2 + ... + xn − n) + n( p − 1)
=0;
p ( p − 1)
( x1 + x2 + ... + xn ) p = n ;
p=
n
1
= ,
x1 + x2 + ... + xn x
т.е. логарифмическая функция правдоподобия имеет единственную критиn
1
ческую точку p∗ =
= .
x1 + x2 + ... + xn x
Определим наличие и характер экстремума логарифмической функции правдоподобия в этой точке. Найдем выражение второй производной:
d 2 ln L
x + x + ... + xn − n n n − ( x1 + x2 + ... + xn ) n
=− 1 2
− 2=
− 2=
2
dp
( p − 1)2
p
( p − 1)2
p
p 2 (n − x1 − x2 − ... − xn ) − n( p − 1)2 p 2 (n − x1 − x2 − ... − xn ) − np 2 + 2np − n
=
=
=
( p − 1)2 ⋅ p 2
( p − 1)2 ⋅ p 2
n
− p 2 ( x1 + x2 + ... + xn ) + 2np − n
=
=
( p − 1)2 ⋅ p 2
136
− p 2 ∑ xi + 2np − n
i =1
( p − 1) 2 ⋅ p 2
.
2
1
1 n
−
xi + 2n − n
∑


2
d ln L
x
 x  i =1
Тогда
=
.
2
2
dp 2 p = 1
1  1
x
 − 1 ⋅  
x
 x
Определим знак числителя:
−
n2
n 
 ∑ xi 
 i =1 
n
2
∑ xi + 2n
i =1
n
n
∑ xi
i =1
−n=−
n2
n
+
2n 2
n
−n=
∑ xi ∑ xi
i =1
n2
n
−n=
∑ xi
i =1
n
n(1 − x )
−n=
< 0,
x
x
i =1
так как x > 1 . Поэтому
d 2 ln L
dp 2
< 0.
1
p=
x
Таким образом, при значении параметра распределения p∗ =
1
лоx
гарифмическая функция правдоподобия достигает максимума.
Ответ: p =
1
.
x
Пример 6.2* (продолжение). Найти точечную оценку неизвестного
параметра λ методом наибольшего правдоподобия.
Решение
Составим функцию правдоподобия:
L( x1, x2 ,..., xn , λ) = (λe−λx1 ) ⋅ (λe−λx2 ) × ... × (λe−λxn ) = λ ne−λ ( x1 + x2 +...+ xn ) .
Получим логарифмическую функцию правдоподобия:
ln L( x1, x2 ,..., xn , λ ) = ln(λ n ⋅ e−λ ( x1 + x2 +...+ xn ) ) = ln λ n + ln e−λ ( x1 + x2 +...+ xn ) =
n
= n ln λ − λ ( x1 + x2 + ... + xn ) = n ln λ − λ ∑ xi .
i =1
Найдем критические точки логарифмической функции правдоподобия:
d ln L n n
= − ∑ xi ;
dλ
λ i =1
n n
n n
− ∑ xi = 0 ;
= ∑ xi ; λ = nn = 1 .
λ i =1
λ i =1
x
∑ xi
i =1
137
Таким образом, логарифмическая функция правдоподобия имеет
1
единственную критическую точку λ = .
x
Определим наличие и характер экстремума логарифмической функции правдоподобия в этой точке:
d 2 ln L
n
1
=
−
<
0
при
λ
=
.
x
d λ2
λ2
Это означает, что в указанной критической точке логарифмическая
функция правдоподобия имеет максимум.
1
Ответ: λ = .
x
Замечание 6.1. Если методом наибольшего правдоподобия требуется определить оценки r параметров, то соответствующая закону распределения функция правдоподобия (6.7) или (6.8) будет содержать параметры θ1 , θ2 ,..., θr . Условие (6.9) примет вид системы из r уравнений
 ∂ ln L
 ∂θ = 0;
 1
...

 ∂ ln L

= 0.
 ∂θr
(6.10)
Таким образом, метод наибольшего правдоподобия сводится к нахождению максимума функции одного или нескольких оцениваемых параметров.
Вопросы для самоконтроля
1. В чем состоит метод моментов получения точечных оценок параметров распределения случайной величины?
2. Что называют функцией правдоподобия случайной величины?
3. Чем определяется число переменных функции правдоподобия?
4. По какому алгоритму можно получить оценку параметра распределения методом наибольшего правдоподобия?
138
7. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ
НОРМАЛЬНОГО ЗАКОНА РАСПРЕДЕЛЕНИЯ
Точечная оценка θ( n) является лишь приближенным значением неизвестного параметра θ даже в том случае, если она несмещенная, состоятельная и эффективная, и для выборки малого объема может существенно
отличиться от истинного значения параметра θ .
Чтобы получить представление о точности и надежности оценки θ( n)
параметра θ , можно использовать интервальную оценку.
Определение 7.1. Интервал (θ1, θ2 ) , в который оцениваемый параметр θ попадает с заданной вероятностью γ , называется доверительным,
а γ − доверительной вероятностью (надежностью) оцениваемого параметра θ , т.е.
P(θ1 < θ < θ2 ) = γ .
Число α = 1 − γ называется уровнем значимости.
Величина доверительного интервала существенно зависит от объема
выборки (уменьшается с ростом n ) и от значения доверительной вероятности γ (увеличивается с приближением γ к единице).
Пусть имеется нормально распределенная по группировочному количественному признаку генеральная совокупность (СВ X ). Если известно среднее квадратичное отклонение σ0 , то определение доверительного
интервала для математического ожидания a происходит по следующему
правилу. На основании результатов выборки объемом n : x1, x2 , ..., xn рас1 n
считывается x = ∑ xi ; задается доверительная вероятность γ ; по таблице
n i =1
значений функции Лапласа определяется аргумент t , при котором
Φ (t ) = γ .
Требуемый интервал задается неравенствами
x −t⋅
где t ⋅
σ0
σ
<a< x +t⋅ 0 ,
n
n
(7.1)
σ0
σ
− предельная ошибка выборки, 0 − средняя ошибка выборки.
n
n
139
Действительно, из курса теории вероятностей известна оценка
ε
P ( X − a < ε) = Ф   .
σ
Тогда для отклонения выборочной средней от математического ожидания (генеральной средней) можно записать равенство
ε
P ( x − x0 < ε ) = Ф   ;
σ
σ0
tσ
ε n
и обозначив t =
, получим ε = 0 . Тогда оцениваеσ0
n
n
мые неравенства примут вид: −ε < x − a < ε или
σ
σ
x −t 0 < a < x +t 0 .
n
n
Если σ0 неизвестно, то для определения доверительных интервалов
используют σв . Предварительно следует найти s по формуле
учитывая σ =
s=
n
σв .
n −1
Тогда
x − tγ
s
s
< a < x + tγ
,
n
n
(7.2)
где t γ определяют по таблице «Критические точки распределения Стьюдента» по заданному уровню значимости
k = n − 1 , где α = 1 − γ .
α
при числе степеней свободы
2
Доверительный интервал для σ0 определяется по исправленному
среднему квадратичному отклонению на основании формул
s (1 − q) < σ0 < s (1 + q ) при q < 1;
(7.3)
0 < σ0 < s (1 + q )
при q > 1 ,
где q − параметр, определяется из соответствующего приложения q = q (n, γ ) .
Действительно, рассмотрим равенство P( σ0 − s < δ) = γ .
Тогда
P ( s − δ < σ 0 < s + δ) = γ;
140
  δ
 δ 
P  s  1 −  < σ0 < s  1 +   = γ ,
 s 
  s
и, обозначив q =
δ
, придем к интервальным оценкам (7.3).
s
Пример 7.1. Найти минимальный объем выборки, при котором с надежностью γ = 0,975 точность оценки математического ожидания mx генеральной совокупности по выборочному среднему равна δ = 0,3 , если известно среднее квадратичное отклонение генеральной совокупности
σ0 = 1, 2 , распределенной нормально.
Решение. Формула для определения доверительного интервала математического ожидания нормально распределенной совокупности имеет вид
x −t⋅
σ0
σ
<a< x +t⋅ 0 ,
n
n
где точность оценки математического ожидания δ представляет собой
σ
предельную ошибку t ⋅ 0 .
n
Так как значение t , при котором Φ (t ) = 0,975 , в данном случае со-
1,2
= 0,3 , откуда n = 2,24 ⋅ 4 , n = 80, 28 .
n
Так как объем выборки – натуральное число, то n = 81 .
ставляет t = 2,24 , то получаем 2,24 ⋅
Заметим, что при использовании табулированных значений функции
t2
1 х −2
Лапласа вида Φ∗ ( х) =
⋅ ∫ e dt значение t следует определять из ус2π 0
ловия Φ (t ) =
γ
γ 0,975
. В данном случае =
= 0, 4875 .
2
2
2
Ответ: n = 81 .
Вопросы для самоконтроля
1. Что называют доверительным интервалом параметра распределения?
2. Какое влияние оказывает объем выборки на величину доверительного интервала?
141
3. Какое влияние оказывает значение доверительной вероятности
на величину доверительного интервала?
4. Каким образом определяется доверительный интервал для математического ожидания нормально распределенной совокупности при известном генеральном среднем квадратичном отклонении?
5. Каким образом определяется доверительный интервал для математического ожидания нормально распределенной совокупности при неизвестном генеральном среднем квадратичном отклонении?
6. Каким образом определяется доверительный интервал для генерального среднего квадратичного отклонения нормально распределенной
совокупности?
8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
В процессе статистического исследования и анализа возникают ситуации, когда необходимо сформулировать и проверить некоторое предположение относительно величины независимых параметров или закона
распределения изучаемой генеральной совокупности. Такие предположения называются статистическими гипотезами.
Процедура сопоставления высказанной относительно генеральной
совокупности гипотезы с имеющимися выборочными данными, сопровождаемого количественной оценкой степени достоверности получаемого
вывода, называется проверкой статистической гипотезы.
Рассмотрим этапы проверки гипотезы и используемые при этом понятия.
Этап 1. Располагая выборочными данными x1, x2 ,..., xn и руководствуясь конкретными условиями рассматриваемой задачи, формулируют
гипотезу H 0 , которую называют основной или нулевой, и гипотезу H1 ,
альтернативную (конкурирующую) гипотезе H 0 .
Термин «альтернативная» означает, что противоположными являются
следующие два события:
– по выборке будет принято решение о справедливости для генеральной совокупности гипотезы H 0 ;
– по выборке будет принято решение о справедливости для генеральной совокупности гипотезы H1 .
Таким образом, целью статистической проверки гипотез является
принятие решения о справедливости основной гипотезы на основании
имеющихся выборочных наблюдений.
142
Если выдвигаемая гипотеза сводится к утверждению о том, что значение некоторого неизвестного параметра генеральной совокупности в
точности равно заданной величине, то эта гипотеза называется простой.
По содержанию статистические гипотезы можно разделить на несколько основных типов: гипотезы о виде закона распределения исследуемой случайной величины; гипотезы о числовых значениях параметров исследуемой генеральной совокупности; гипотезы об однородности двух или
нескольких выборок или некоторых характеристик анализируемых совокупностей; гипотезы об общем виде модели, описывающей статистическую зависимость между признаками; и др.
Этап 2. Задают вероятность α , которую называют уровнем значимости. Смысл ее можно пояснить следующим образом.
Так как решение о том, можно ли считать гипотезу H 0 справедливой
для генеральной совокупности, принимается по выборочным данным, т.е.
по ограниченному ряду наблюдений, то это решение имеет вероятностный
характер и может быть ошибочным. При этом возможны следующие
ошибки: отвергают гипотезу H 0 или, иначе, принимают альтернативную
гипотезу H1 , тогда как на самом деле гипотеза H 0 верна (ошибка первого
рода); принимают гипотезу H 0 , тогда как на самом деле верной является
гипотеза H1 (ошибка второго рода).
Уровень значимости α – это вероятность ошибки первого рода, т.е.
α = PH 0 ( H1 ) , где PH 0 ( H1 ) – вероятность того, что будет принята гипотеза
H1 , если на самом деле верна гипотеза H 0 .
Вероятность ошибки второго рода обозначают β , т.е. β = PH1 ( H 0 ) .
Более четкое объяснение связи между ошибкой I рода и ошибкой II
рода можно получить, рассмотрев варианты правильности вердиктов, выносимых в случае действия судебной системы присяжных заседателей
(табл. 8.1).
В данном случае присяжные проверяют гипотезу о невиновности обвиняемого. Если обвиняемый невиновен, а присяжные принимают решение о его виновности, т.е. отвергают нулевую гипотезу, когда фактически
она верна – это основная ошибка – ошибка первого рода. Этой ошибки
стараются избегать прежде всего, поэтому уровень значимости проверки
устанавливается с целью уменьшения вероятности совершения этой ошибки (обычно 5 или 1 %).
Этап 3. Определяют статистический критерий K , который является
некоторой функцией от результатов наблюдений и будет использован для
143
проверки статистической гипотезы H 0 . Этот критерий позволит определить меру расхождения результатов выборочного наблюдения с основной
гипотезой.
Таблица 8.1
Объективные
Субъективные действия (решение)
состояния гипотезы H 0
H 0 принята
H 0 отвергнута
(действительность)
(обвиняемый освобожден)
(обвиняемый наказан)
правильное
решение,
ошибка первого рода,
H 0 верна
его вероятность
ее вероятность
(обвиняемый
PH 0 ( H 0 ) = 1 − α
PH 0 ( H1 ) = α
невиновен)
H 0 ложна
(обвиняемый
виновен)
ошибка второго рода,
ее вероятность
PH1 ( H 0 ) = β
правильное решение,
его вероятность
PH1 ( H1 ) = 1 − β
Проверка каждого типа статистических гипотез осуществляется с
помощью соответствующего критерия, обладающего наибольшей мощностью (значение вероятности 1 − β ) в каждом конкретном случае. Если при
увеличении объема выборки мощность критерия стремится к единице, то
такой статистический критерий называют критерием согласия. Например,
проверка гипотезы о виде закона распределения случайной величины может быть выполнена с помощью критерия согласия Пирсона χ 2 ; ряд гипотез о неизвестных значениях параметров генеральных совокупностей может быть проверен с помощью U -критерия – нормальной распределенной
случайной величины и t -критерия Стьюдента; и т.д.
Значение критерия, рассчитываемое по специальным правилам на
основании выборочных данных, называется наблюдаемым значением критерия K набл .
Этап 4. Так как значения критерия позволяют судить о «расхождении выборки с гипотезой H 0 », то из области допустимых значений критерия K выделяют подобласть таких значений, которые свидетельствуют о
существенном расхождении выборки с гипотезой H 0 и, следовательно, о
невозможности принять гипотезу H 0 . Эту подобласть называют критической областью (КО). Подобласть значений, которые соответствуют несущественному расхождению выборки с гипотезой H 0 , принято называть
областью принятия гипотезы (ОПГ).
Заметим, что ориентируясь на критическую область, можно совершить ошибку первого рода, вероятность которой задана заранее и равна α .
144
Поэтому критическая область должна удовлетворять следующему
требованию: вероятность того, что критерий K примет значение из критической области, должна быть равна заданному значению α , т.е.
P( K ∈ КО) = α .
(8.1)
Однако критическая область равенством (8.1) определяется неоднозначно. Действительно, представив себе график функции плотности f K ( x)
критерия K , можно отметить, что на оси абсцисс существует бесчисленное множество областей-интервалов, таких, что площади построенных на
них криволинейных трапеций равны α, т.е. областей, удовлетворяющих
требованию (8.1). Поэтому кроме требования (8.1) выдвигается следующее
требование: критическая область должна быть расположена так, чтобы при
заданной вероятности α ошибки первого рода вероятность β ошибки второго рода была минимальной.
Различают одностороннюю (правостороннюю или левостороннюю) и
двустороннюю критические области (в зависимости от вида нулевой и альтернативной гипотез, вида и распределения критерия K ).
Например, если альтернативная гипотеза имеет вид H1 : a > a0 , то соответствующая критическая область будет правосторонней, ( К кр
пр , α; +∞)
кр
(рис. 8.1), причем точка К кр
пр ,α определяется из условия P ( K > K пр , α ) = α и
называется правосторонней критической точкой, отвечающей уровню значимости α.
Если альтернативная гипотеза имеет вид H1 : a < a0 , то соответствующая критическая область будет левосторонней, (−∞; К кр
лев , α ) (рис. 8.2),
кр
причем точка К кр
лев , α определяется из условия P ( K < K лев , α ) = α и называ-
ется левосторонней критической точкой, отвечающей уровню значимости α.
Если альтернативная гипотеза имеет вид H1 : a ≠ a0 , то соответствующая
критическая область будет двусторонней, состоящей из двух интервалов,
кр
кр
кр
(−∞; К кр
лев ,α 2) ∪ ( К пр , α 2; +∞ ) (рис. 8.3), где точки К лев , α 2 и К пр ,α 2 опре-
α
α
кр
, P( K > K пр
и называют,α / 2 ) =
2
2
ся двусторонними критическими точками.
Этап 5. Проверяют вычисленное значение K набл на принадлежность
критической области.
Основной принцип проверки статистических гипотез состоит в следующем: если наблюдаемое значение критерия K набл принадлежит критикр
деляются из условий P( K < K лев
,α / 2 ) =
145
ческой области, то нулевая гипотеза Н 0 отклоняется в пользу альтернативной гипотезы H1 ; если наблюдаемое значение критерия K набл принадлежит
области принятия гипотезы, то нулевую гипотезу Н 0 нельзя отклонить.
fK
fK
fK
α
кр
K пр
,α
α
α
кр
K лев
,α
Рис. 8.1
α
2
кр
K лев
,α 2
Рис. 8.2
2
кр
K пр
,α 2
Рис. 8.3
Заметим, что даже в том случае, когда нет оснований для отклонения
нулевой гипотезы Н 0 , это не означает, что высказанное предположение о
генеральной совокупности является единственно возможным – просто ему
не противоречат имеющиеся выборочные наблюдения.
Пример 8.1. Целью управляющего портфелем ценных бумаг является осуществление инвестиционных вложений в ценные бумаги с дисперсией годовой доходности не более чем 0,04. Расчеты по выборке из 52 наблюдений за доходом по активу «А» показали, что дисперсия равна 0,045.
Целесообразно ли продолжать инвестиционные вложения по активу «А»?
Решение. Сформулируем основную гипотезу: Н 0 : σ 2 = 0,04 ;
и альтернативную гипотезу:
Зададим уровень значимости равным
Н1 : σ2 > 0,04 .
α = 0,05 .
(n − 1) s 2
В качестве критерия рассмотрим величину χ (k = n − 1) =
,
σ02
2
где n – объем выборочной совокупности; s 2 – исправленная выборочная
дисперсия; σ02 – генеральная дисперсия.
Рассчитаем наблюдаемое значение критерия. В данном случае
σ02 = 0,04 ; σв2 = 0,045 ; n = 52 .
n 2
Так как s 2 =
σв , то
n −1
χ 2набл (51) =
51 52
⋅ ⋅ 0,045 = 58,5 .
0,04 51
146
Критическая область в данном случае будет правосторонней. Так как
χ 2пр,0,05 (51) = 67,5 , то КО: (67,5; +∞) .
Так как χ 2набл (51) ∉ КО , то нет достаточных оснований, чтобы отвергнуть основную гипотезу.
Вывод. С вероятностью 0,95 заключаем, что нет оснований прекращать начатые инвестиционные вложения по активу «А».
Пример 8.2. Компания по производству сахарного песка имеет две
производственные линии для наполнения пакетов сахарным песком весом
в 1 кг. Используя данные, собранные в течение длительного периода времени, управляющий оценивает генеральное среднее квадратичное отклонение веса пакетов, поставляемых с линии 1, в 0,02 кг и с линии 2 – в 0,04 кг.
Из продукции линии 1 была взята случайная выборка объемом n1 = 10 пакетов и найден средний вес сахарного песка в пакетах 1,018 кг. Подобная
выборка объемом n2 = 12 пакетов была взята из продукции линии 2 и найден средний вес 0,989 кг. Имеется ли какое-нибудь основание предположить, что две производственные линии развешивают сахарный песок по
пакетам, средний вес которых отличается?
Решение
Нулевая гипотеза в данном случае предполагает равенство двух
средних нормально распределенных генеральных совокупностей, генеральные дисперсии которых известны. По условию генеральные средние
составляют a1 = a2 = 1 кг.
Поэтому
Н 0 : а1 = а2 , т.е. а1 − а2 = 0 ;
Н1 : а1 ≠ а2 .
Зададим уровень значимости α = 0,01 .
В качестве статистического критерия рассмотрим величину
U=
( x1 − x2 ) − (a1 − a2 )
σ12
n1
+
σ 22
,
n2
где x1 и x2 – выборочные средние, a1 и a2 – генеральные средние, σ12 и
σ 22 – генеральные дисперсии, n1 и n2 – объемы выборочных совокупностей соответственно.
147
Найдем U набл .
По условию x1 = 1,018 кг; x2 = 0,989 кг; σ1 = 0,02 кг; σ2 = 0,04 кг,
поэтому
U набл =
1,018 − 0,989
0,022 0,042
+
10
12
=
0,029
0,029
0,029
=
=
≈ 2,197 .
0,00004 + 0,00013
0,00017 0,0132
Выделим критическую область. В данном случае она будет двусторонней. Критические точки определяются с использованием значений
кр
кр
функции Лапласа и составляют U лев
,0,005 = −2,576 и U пр ,0,005 = 2,576 .
Таким образом, критическая область определяется интервалами
(−∞; −2,576) и (2,576; +∞) .
Так как U набл ∉ КО , то в данном случае нет оснований отклонять нулевую гипотезу Н0.
Вывод. С вероятностью 0,99 можно предположить, что две производственные линии наполняют пакеты с сахаром с одинаковым средним
весом.
Вопросы для самоконтроля
1. Что называют статистической гипотезой?
2. Что называют проверкой статистической гипотезы?
3. Какие этапы предполагает проверка гипотезы?
4. Что называют ошибкой первого рода?
5. Что называют ошибкой второго рода?
6. Чему соответствует уровень значимости α ?
7. Как называется случайная величина, используемая для проверки
статистической гипотезы?
8. В каком случае статистический критерий называют критерием
согласия?
9. Что называют наблюдаемым значением статистического критерия?
10. Какую часть области допустимых значений критерия называют
критической областью?
11. Какой вид может иметь критическая область?
12. Чем определяется вид критической области?
13. В каком случае следует отклонить основную гипотезу?
14. Какой вывод следует сделать, если наблюдаемое значение критерия принадлежит области принятия гипотезы?
148
9. ДИСПЕРСИОННЫЙ АНАЛИЗ
Дисперсионный анализ позволяет устанавливать степень влияния
факторов на изменчивость признака. При этом устанавливается только существенное влияние. Количество факторов может быть различным, исходя
из этого различают однофакторный дисперсионный анализ, двухфакторный дисперсионный анализ и т.д.
Влияние факторов может быть двояким. Они могут изменять как истинный результат (среднее) наблюдений, так и дисперсию этих наблюдений.
Будем рассматривать ситуацию, когда дисперсия наблюдений остается неизменной. Данное предположение сохраняет силу в случае, когда
для фиксирования результатов наблюдений используется одна и та же методика, одни и те же приборы, что дает возможность рассматривать все
наблюдения как выборку из одной генеральной совокупности.
Пусть фактор X рассматривается на уровнях X1, X 2 , ... , X m , при
этом значение генеральной дисперсии σ 2 для результативного признака Y
неизвестно. Остановимся на случае, когда для каждого из m уровней фактора было проведено по одинаковому количеству n наблюдений признака
Y (табл. 9.1).
Таблица 9.1
Номер испытания
1
2
…
n
Групповые итоги
X1
y11
Уровни фактора X
X2
…
y12
…
y21
y22
…
…
yn1
y1
yn 2
y2
…
…
…
…
Xm
y1m
y2m
…
ynm
ym
Предварительное суждение о влиянии фактора X на результативный
признак Y можно вынести, сравнив групповые средние: если различие между ними существенно, то, по-видимому, такая зависимость имеется.
Применение метода дисперсионного анализа для установления влияния фактора X на результативный признак Y сводится к следующему:
проверить гипотезу
H 0 : a1 = a2 = ... = am ,
(9.1)
где a1 − математическое ожидание результативного признака при уровне
X1 ; a2 − математическое ожидание результативного признака при уровне
X 2 , ... , am − при уровне X m ;
при альтернативной гипотезе H1 – нарушение равенств (9.1).
149
Если при изменении уровней фактора групповые математические
ожидания не изменяются ( H 0 не отвергнута), считаем, что признак не зависит от влияния фактора X , в противном случае ( H 0 отвергнута) зависимость имеется.
Проверка гипотезы H 0 возможна при соблюдении следующих требований:
1) при каждом уровне фактора наблюдения независимы и проводятся в одинаковых условиях, при различных уровнях фактора наблюдения
независимы;
2) для каждого уровня фактора результативный признак имеет нормальный закон распределения, причем для различных уровней σ 2 = const .
Вариация признака Y может быть вызвана:
1) изменением уровней фактора X ;
2) изменением значений случайных неконтролируемых факторов,
влияющих на Y , которые называются остаточными.
Общее изменение (вариация) признака Y измеряется общей выборочной дисперсией
m
n
∑ ∑ ( yij − Y )2
i =1
σˆ 2 =
j =1
mn
,
(9.2)
где
Y=
y1 + y2 + ... + ym
.
m
Вариация признака Y , вызванная изменчивостью уровней фактора
X , измеряется факторной дисперсией
m
∑ ( yi − Y )2
σˆ ф2 = i =1
.
(9.3)
m
Вариация признака Y , вызванная изменчивостью остаточных случайных факторов, измеряется остаточной дисперсией
m
∑ σi2
σˆ 02 = i =1 .
m
150
(9.4)
Справедливо следующее тождество дисперсионного анализа:
σˆ 2 = σˆ ф2 + σˆ 02
общая
выборочная
=
дисперсия
факторная
дисперсия
(9.5)
остаточная
дисперсия
+
Несмещенными оценками указанных дисперсий являются:
1) для
σˆ 2 : s 2 =
mn 2
σˆ ;
mn − 1
2) для
σˆ ф2 : sф2 =
m 2
σˆ ф ;
m −1
3) для
σˆ 02 : s02 =
m
σˆ 02 .
mn − m
Проверка гипотезы (9.1) выполняется с использованием F -распределения
F (m − 1; mn − m) =
sф2
s02
,
(9.6)
причем в данном случае следует рассматривать только правостороннюю
критическую область: ( Fкрα , пр ; + ∞) .
Если значение Fнабл попадает в критическую область, то гипотезу о
равенстве групповых математических ожиданий отвергают: можно считать, что фактор X влияет на результативный признак Y . Если Fнабл ∉ КО ,
то говорят, что влияние фактора X на признак Y не подтвердилось выборочными наблюдениями.
В случае влияния фактора X на результативный признак Y для измерения степени влияния используют выборочный коэффициент детерминации R =
2
σˆ ф2
σˆ 2
, который показывает, какую долю общей выборочной дис-
персии σ̂ 2 составляет дисперсия σ̂ф2 групповых средних, т.е. какая доля
дисперсии σ̂ 2 объясняется зависимостью признака Y от фактора X .
151
Пример 9.1.
На заводе установлены 4 линии по выпуску по выпуску облицовочной плитки. С каждой линии случайным образом в течение смены отобрано по 10 плиток и сделаны замеры их толщины (в мм). Отклонения от номинального размера даны в табл. 9.2.
Таблица 9.2
Номер
измерения
№1
0,6
0,2
0,4
0,5
0,8
0,2
0,1
0,6
0,8
0,8
1
2
3
4
5
6
7
8
9
10
Линии по выпуску плиток
№2
№3
0,8
0,2
0,6
0,2
0,2
0,4
0,2
0,3
0,9
0,3
1,1
0,6
0,8
0,8
0,2
0,2
0,4
0,5
0,8
0,5
№4
0,8
0,8
0,5
0,5
0,9
0,3
0,4
0,4
0,5
0,9
Методом дисперсионного анализа требуется установить зависимость
качества выпущенных плиток от номера линии (фактор X ). Принять уровень значимости α = 0,05 .
Решение. Сформулируем основную и альтернативную гипотезы:
H 0 : a1 = a2 = a3 = a4
(9.7)
– все линии выпускают плитки одинакового качества;
H1 : нарушение равенств (9.7), т.е. качество плитки определяется выпускающей линией.
Для проверки основной гипотезы будем использовать F -распределение F (m − 1; mn − m) =
sф2
s02
, где исправленная факторная дисперсии опреm
деляется формулой sф2 =
∑ ( yi − Y )2
m 2
σˆ ф , а σˆ ф2 = i =1
m −1
m
m
точная дисперсия s02 =
∑ σi2
m
σˆ 02 , а σˆ 02 = i =1 .
mn − m
m
152
; исправленная оста-
Для получения наблюдаемого значения критерия сначала определим
групповые средние и групповые дисперсии (результаты промежуточных
вычислений приведены в табл. 9.3 – 9.6), затем – общую среднюю и межгрупповую дисперсию.
Для первой линии
y1 = 0,5 мм, σ12 = 0,064 , табл. 9.3.
Для второй линии
y2 = 0,6 мм, σ22 = 0,098 , табл. 9.4.
Для третьей линии
y3 = 0,4 мм, σ32 = 0,036 , табл. 9.5.
Для четвертой линии
y4 = 0,6 мм, σ32 = 0,046 , табл. 9.6.
Тогда выборочная остаточная дисперсия составит
σˆ 02 =
0,064 + 0,098 + 0,036 + 0,046 0, 244
=
= 0,061 ,
4
4
ее несмещенная оценка s02 =
4
⋅ 0,061 = 0,006778 .
40 − 4
Таблица 9.3
Номер
измерения
1
2
3
4
5
6
7
8
9
10
Итого
yi1
yi1 − y1
0,6
0,2
0,4
0,5
0,8
0,2
0,1
0,6
0,8
0,8
5
0,1
–0,3
–0,1
0
0,3
–0,3
–0,4
0,1
0,3
0,3
–
( yi1 − y1 )
Таблица 9.4
Номер
измерения
1
2
3
4
5
6
7
8
9
10
Итого
2
0,01
0,09
0,01
0
0,09
0,09
0,16
0,01
0,09
0,09
0,64
153
yi 2
yi 2 − y2
( yi 2 − y2 )2
0,8
0,6
0,2
0,2
0,9
1,1
0,8
0,2
0,4
0,8
6
0,2
0
–0,4
–0,4
0,3
0,5
0,2
–0,4
–0,2
0,2
–
0,04
0
0,16
0,16
0,09
0,25
0,04
0,16
0,04
0,04
0,98
Таблица 9.5
Номер
измерения
1
2
3
4
5
6
7
8
9
10
Итого
yi3
yi3 − y3
( yi3 − y3 )
0,2
0,2
0,4
0,3
0,3
0,6
0,8
0,2
0,5
0,5
4
–0,2
–0,2
0
–0,1
–0,1
0,2
0,4
–0,2
0,1
0,1
–
0,04
0,04
0
0,01
0,01
0,04
0,16
0,04
0,01
0,01
0,36
Таблица 9.6
Номер
измерения
1
2
3
4
5
6
7
8
9
10
Итого
2
yi 4
yi 4 − y4
( yi 4 − y4 )2
0,8
0,8
0,5
0,5
0,9
0,3
0,4
0,4
0,5
0,9
6
0,2
0,2
–0,1
–0,1
0,3
–0,3
–0,2
–0,2
–0,1
0,3
–
0,04
0,04
0,01
0,01
0,09
0,09
0,04
0,04
0,01
0,09
0,46
Выборочная средняя по совокупности измерений составит
Y=
10 ⋅ 0,5 + 10 ⋅ 0,6 + 10 ⋅ 0,4 + 10 ⋅ 0,6 21
=
= 0,525 ;
40
40
выборочная факторная дисперсия
σˆ ф2 =
(0,5 − 0,525)2 + (0,6 − 0,525) 2 + (0, 4 − 0,525) 2 + (0,6 − 0,525) 2
=
4
0,0275
=
= 0,006875 ;
4
исправленная факторная дисперсия составит
sф2 =
4
⋅ 0,006875 = 0,009167 .
4 −1
Тогда наблюдаемое значение F -распределения
Fнабл (3; 36) =
0,009167
= 1,352464 .
0,006778
Для определения критической области найдем табличное значение
Fкр0,05
, пр (3;36) = 2,87 , тогда КО определяется интервалом (2,87;+∞ ).
Так как Fнабл (3; 36) ∉ (2,87; +∞) , то нет оснований отвергать основную гипотезу.
Вывод. С доверительной вероятностью 0,95 можно утверждать, что
качество плиток не зависит от выпускающей линии.
154
Вопросы для самоконтроля
1. Что позволяет установить дисперсионный анализ?
2. Какого рода влияние могут оказывать факторы на результативный признак?
3. К чему сводится применение метода дисперсионного анализа?
4. Соблюдение каких требований необходимо для проверки основной гипотезы дисперсионного анализа?
5. Чем может быть вызвано изменение результативного признака?
6. В чем состоит тождество дисперсионного анализа?
7. Какое распределение используется при проведении дисперсионного анализа?
8. Какой показатель используют для измерения степени влияния
факторного признака на результативный?
10. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
10.1. Понятие функциональной, стохастической
и корреляционной зависимости
Зависимость величины Y от величины X называется функциональной, если каждому значению величины X соответствует единственное
значение величины Y , причем если X – детерминированная величина
(принимающая вполне определенные значения), то и функционально зависящая от нее величина Y тоже является детерминированной, если же X –
случайная величина, то и Y также случайная величина.
Однако в окружающем нас мире гораздо чаще имеет место не функциональная, а стохастическая, или вероятностная зависимость, когда
каждому фиксированному значению независимой переменной X соответствует не одно, а множество значений переменной Y , причем сказать заранее, какое именно значение примет величина Y , нельзя. Более частое появление такой зависимости объясняется действием на результативную переменную не только контролируемого фактора (переменной X ), но и многочисленных неконтролируемых факторов. В этой ситуации переменная Y
является случайной величиной, а переменная X может быть как детерминированной, так и случайной величиной.
Допустим, что существует стохастическая зависимость переменной
Y от X . Зафиксируем некоторое значение x переменной X . При X = x
155
переменная Y , в силу ее стохастической зависимости от X , может принять любое значение из некоторого множества, причем, какое именно, заранее неизвестно. Среднее значение этого множества будет представлять
собой математическое ожидание случайной величины Y при условии, что
X = x , т.е. M (Y / X = x) . Если при изменении значения x изменяются условные математические ожидания M (Y / X = x) , то говорят, что имеет место корреляционная зависимость величины Y от X , в противном случае
говорят об отсутствии корреляционной зависимости.
Уравнение f ( x) = M (Y / X = x) , описывающее изменение условного
математического ожидания зависимой случайной переменной Y при изменении значений x переменной X , называется уравнением регрессии, а
функция y = f ( x) – функцией регрессии.
Пример 10.1. Пусть X – уровень квалификации рабочего, Y – его
выработка за смену. Зависимость Y от X является стохастической, так как
на выработку, помимо квалификации, влияет множество других факторов.
Фиксированному значению уровня квалификации x соответствует некоторое множество значений выработки Y , а M (Y / X = x) представляет собой
среднюю выработку рабочего при условии, что его уровень квалификации
равен x , т.е. это норматив выработки при уровне квалификации x . Зная
зависимость этого норматива от уровня квалификации, можно для любого
уровня квалификации рассчитать норматив выработки и, сравнив его с реальной выработкой, оценить работу рабочего.
□
Стохастические связи между переменными можно изучать методами
корреляционного и регрессионного анализа. Основной задачей корреляционного анализа является выявление связи между случайными переменными и оценка ее тесноты. Основная задача регрессионного анализа – установление формы и изучение зависимости между переменными.
10.2. Поле корреляции.
Выборочный линейный коэффициент корреляции
Данные о стохастической зависимости удобно представлять в виде
корреляционной таблицы (табл. 10.1).
Графический метод используется для наглядного изображения формы связи между изучаемыми признаками. Для этого в прямоугольных осях
координат (ось абсцисс – значения факторного признака, ось ординат –
156
значения результативного признака) строят точки ( xi , y j ) ( i = 1, m, j = 1, l ) и
( xi , yi ) (i = 1, m) .
Таблица 10.1
Y
y1
y2
x1
k11
k12
x2
k21
k22
…
…
…
xm
km1
kj
k1
X
yl
ni
yi
…
k1l
n1
y1
k2l
km 2
…
…
…
kml
n2
…
nm
y2
…
ym
k2
…
kl
n
…
…
Точки ( xi , yi ) можно соединить отрезками, полученная ломаная носит название эмпирической линии регрессии Y по X (рис. 10.1). Совокупность построенных точек называется полем корреляции.
y
i
i
i
∗
i
i
i
i
∗
i ∗ i
i
i∗
ii i
i
∗
i
x
O
Рис. 10.1
Оценка тесноты связи между признаками предполагает определение
меры соответствия вариации результативного признака в зависимости от
факторного. В случае наличия между признаками линейной зависимости
тесноту и направление связи между ними характеризует линейный коэффициент корреляции
r=
m l

m
 l
n∑ ∑ xi y j kij −  ∑ xi ni   ∑ y j k j 

i =1 j =1
 i =1
  j =1

2
m
l
 l

m

n ∑ xi2 ni −  ∑ xi ni  ⋅ n ∑ y 2j k j −  ∑ y j k j 
 j =1

i =1
j =1
 i =1



157
2
.
(10.1)
Если данные не сгруппированы в виде корреляционной таблицы и
представляют n пар чисел ( xi , yi ) ( i = 1, n ), то для вычисления коэффициента корреляции в формуле (10.1) следует взять kij = ni = k j = 1 , j = i , а
n
m l
суммирование
∑∑
i =1 j =1
заменить на
∑.
i=1
Свойства коэффициента корреляции
1. Коэффициент корреляции принимает значения на отрезке [−1;1] ,
т.е. −1 ≤ r ≤ 1 . В зависимости от того, насколько r приближается к 1, различают слабую ( 0,1 < r < 0,3 ), умеренную ( 0,3 < r < 0,5 ), заметную
( 0,5 < r < 0,7 ), тесную ( 0,7 < r < 0,9 ) и весьма тесную ( 0,9 < r < 0,99 )
связь.
2. При r = 0 линейная корреляционная связь отсутствует.
3. При r = ±1 корреляционная связь представляет линейную функциональную зависимость ( r = 1 – зависимость прямая, r = −1 – обратная).
4. Величина статистического коэффициента корреляции не зависит
от выбора единиц измерения значений факторного и результативного признаков.
Полученный из выборки коэффициент корреляции r является оценкой коэффициента корреляции ρ в генеральной совокупности.
Пусть вычисленное значение r ≠ 0 . Возникает вопрос, объясняется
ли это действительно существующей линейной корреляционной зависимостью Y от X в генеральной совокупности или является следствием случайности отбора переменных в выборку.
Поэтому для установления значимости линейного коэффициента
корреляции выполняется проверка нулевой гипотезы H 0 об отсутствии
линейной корреляционной связи между переменными в генеральной совокупности, т.е.
H0 : ρ = 0
(10.2)
при альтернативной гипотезе
H1 : ρ ≠ 0 .
Для проверки гипотезы (10.2) можно использовать t -распределение
Стьюдента с n − 2 степенями свободы. Наблюдаемое значение критерия
вычисляется по формуле
158
tнабл =
r
,
σr
(10.3)
1− r2
где σr =
– среднеквадратическая ошибка выборочного коэффициn−2
ента корреляции.
Пример 10.2. Проверить при уровне значимости α = 0,05 значимость коэффициента корреляции между энерговооруженностью труда X
(кВт) (в расчете на одного работающего) и производительностью труда Y
(тыс. ден. ед.) для 20 предприятий региона по данным табл. 10.2.
Таблица 10.2
xi 2,8 2,2 3,0 3,5 3,1 3,7 4,0 4,2 4,8 6,0 5,4 5,1 5,4 5,4 6,0 7,0 7,4 7,4 8,2 9,0
yi 6,7 6,9 7,2 7,3 8,4 8,8 9,1 9,6 9,8 10,6 10,7 11,1 11,8 12,0 12,1 12,3 12,3 12,6 12,8 13,0
Решение. Так как исходные данные не сгруппированы в виде корреляционной таблицы, то для выполнения расчетов модифицируем формулу (10.1):
n
 n   n 
n∑ xi yi −  ∑ xi  ⋅  ∑ yi 
i =1
 i =1   i =1 
r=
.
(10.4)
2
2
n
n
n
n




n ∑ xi2 −  ∑ xi  ⋅ n∑ yi2 −  ∑ yi 
i =1
i =1
 i =1 
 i =1 
Вычислим необходимые суммы:
20
∑ xi = 2,8 + 2, 2 + 3 + ... + 8, 2 + 9 = 103,6 ;
i =1
20
∑ xi2 = 2,82 + 2,22 + 32 + ... + 8,22 + 92 = 606,16 ;
i =1
20
∑ yi = 6,7 + 6,9 + 7, 2 + ... + 12,8 + 13 = 205,1 ;
i =1
20
∑ yi2 = 6,72 + 6,92 + 7,22 + ... + 12,82 + 132 = 2190,53 ;
i =1
20
∑ xi yi = 2,8 ⋅ 6,7 + 2, 2 ⋅ 6,9 + 3 ⋅ 7, 2 + ... + 8, 2 ⋅12,8 + 9 ⋅ 13 = 1134,88 .
i =1
159
По формуле (10.4) получим:
20 ⋅ 1134.88 − 606,16 ⋅ 2190,53
r=
= 0,930569 ≈ 0,931 .
2
2
20 ⋅ 606,16 − 103,6 ⋅ 20 ⋅ 2190,53 − 205,1
Такое значение коэффициента линейной корреляции свидетельствует
о весьма тесной корреляционной связи между признаками.
Для проверки значимости полученного коэффициента корреляции
сформулируем основную и альтернативную гипотезы:
H0 : ρ = 0 ;
H1 : ρ ≠ 0 .
Для проверки основной гипотезы будем использовать t -распределение Стьюдента. Найдем наблюдаемое значение критерия по формуле
(10.3):
tнабл (18) =
0,931
=
0,931 ⋅ 18
= 10,821 .
1 − 0,931
1 − 0,931
20 − 2
Критическая область в данном случае будет двусторонней. Так как
tпр,0,025 (18) = 2,1, то КО (−∞; −2,1) ∪ (2,1; +∞) . В данном случае tнабл (18) ∈КО,
2
2
поэтому основная гипотеза отвергается и есть основания полагать, что коэффициент линейной корреляции между энерговооруженностью труда и
производительностью труда значимо отличается от нуля.
Вывод. Коэффициент линейной корреляции значим при α = 0,05 .
10.3. Построение уравнения линейной регрессии
методом наименьших квадратов
Выбор вида уравнения регрессии осуществляется на основе:
− содержательного анализа природы изучаемой зависимости;
− анализа эмпирической линии регрессии;
− графического представления связи между признаками с помощью
поля корреляции (позволяет предположить наличие нелинейной связи);
− параллельного сопоставления рядов значений факторного и результативного признаков, что позволяет исследовать характер изменения
разностей между парами значений x и y .
Предположим, что между признаками X и Y имеет место линейная
корреляционная зависимость. Уравнение регрессии будем искать в виде
y x = ax + b .
160
(10.5)
Найдем формулы для расчета неизвестных параметров уравнения
(10.5). С этой целью применим метод наименьших квадратов (см. с. 59), согласно которому неизвестные параметры a и b выбираются таким образом, чтобы сумма квадратов отклонений эмпирических групповых средних
yi от значений y xi , найденных по уравнению регрессии (10.5), была минимальной.
Система нормальных уравнений в данном случае примет вид
 ax + b = y ,
,
 2
ax + bx = xy,
где x =
(10.6)
1m
1 l
1m l
1m 2
2
x
n
;
y
=
y
k
;
xy
=
x
y
k
;
x
=
∑ ii
∑ j j
∑ ∑ i j ij
∑ xi ni .
n j =1
n i =1 j =1
n i =1
n i =1
Из решения системы (10.6) можно определить значения параметров
a и b уравнения (10.5). Коэффициент a в уравнении регрессии показывает, на сколько единиц в среднем изменяется переменная Y при увеличении
переменной X на одну единицу.
Пример 10.2 (продолжение). Найти уравнение регрессии Y по X .
Решение
103,6
205,1
606,16
Так как x =
= 5,18 ; y =
= 10,255 ; x 2 =
= 30,308 ;
20
20
20
1134,88
xy =
= 56,744 , то система нормальных уравнений в данном случае
20
принимает вид
 5,18a + b = 10,255;

30,308a + 5,18b = 56,744.
Решив эту систему одним из известных методов, получим a ≈ 1,042 ;
b ≈ 4,856 .
Тогда искомое уравнение регрессии принимает вид
y x = 1,042 x + 4,856 .
Заметим, что согласно полученному значению коэффициента a увеличение энерговооруженности на 1 кВт приведет к увеличению производительности труда на 1,042 тыс. ден. ед.
Ответ: y x = 1,042 x + 4,856 .
161
Заметим, что если в результате подбора будет предположено, что зависимость y от x описывается функцией, отличной от прямолинейной
регрессии, то для дальнейшего решения потребуется перейти к линеаризированной зависимости путем замены переменной. А именно, если зависиa
1
мость определяется уравнением = + b , то замена = t позволит полуx
x
чить линейное уравнение вида y = at + b ; для зависимости y = ax 2 + b замена определяется формулой x 2 = t ; в случае y = ae x + b замена e x = t ; в
случае y = a ln x + b замена ln x = t .
Для оценки адекватности построенного уравнения регрессии при
решении задач экономического содержания можно использовать среднюю
абсолютную процентную ошибку аппроксимации ε (МАРЕ):
ε=
1 m yi − yiрегр
⋅∑
⋅ 100%.
m i =1
yi
Уравнение признается адекватным, если ε < 20 %.
Пример 10.2 (продолжение). Проверить адекватность построенного
уравнения регрессии.
Решение. Используя полученное уравнение y x = 1,042 x + 4,856 , дополним табл. 10.2 значениями yiрегр и вычислим среднюю абсолютную
процентную ошибку аппроксимации ε (табл. 10.3).
Таблица 10.3
№
xi
yi
yiрегр
yi − yiрегр
(y − y )/ y
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
2
2,8
2,2
3,0
3,5
3,1
3,7
4,0
4,2
4,8
6,0
5,4
5,1
5,4
5,4
3
6,7
6,9
7,2
7,3
8,4
8,8
9,1
9,6
9,8
10,6
10,7
11,1
11,8
12,0
4
7,7736
7,1484
7,9820
8,5030
8,0862
8,7114
9,0240
9,2324
9,8756
11,1080
10,4828
10,1702
10,4828
10,4828
5
–1,0736
–0,2484
–0,7820
–1,2030
0,3138
0,0886
0,0760
0,3676
–0,0576
–0,5080
0,2172
0,9298
1,3172
1,5172
6
0,16024
0,03600
0,10861
0,16479
0,03736
0,01007
0,00835
0,03829
0,00588
0,04792
0,02030
0,08377
0,11163
0,12643
162
i
регр
i
i
1
15
16
17
18
19
20
Всего
2
6,0
7,0
7,4
7,4
8,2
9,0
–
3
12,1
12,3
12,3
12,6
12,8
13,0
–
4
11,1080
12,1500
12,5668
12,5668
13,4004
14,2340
–
5
0,9920
0,1500
–0,2668
0,0332
–0,6004
–1,2340
–
Окончание табл. 10.3
6
0,08198
0,01220
0,02169
0,00263
0,04691
0,09492
1,21997
1
⋅ 1,21997 ⋅ 100% ≈ 6,1% . Так как 6,1% < 20% , то постро20
енное уравнение регрессии можно считать адекватным исходным данным.
Тогда ε =
Вывод. Уравнение адекватно.
Вопросы для самоконтроля
1. В каком случае зависимость двух величин называется функциональной?
2. В каком случае зависимость двух величин называется стохастической?
3. В каком случае зависимость двух величин называется корреляционной?
4. Какими методами можно изучать стохастические связи между
переменными?
5. Что называют полем корреляции?
6. Что называют эмпирической линией регрессии Y по X ?
7. Какая величина характеризует тесноту и направление связи между признаками в случае наличия между ними линейной зависимости?
8. Какими свойствами обладает коэффициент линейной корреляции?
9. Каким образом можно проверить значимость коэффициента линейной корреляции?
10. На основе чего осуществляется выбор вида уравнения регрессии?
11. С помощью какого метода можно получить параметры уравнения линейной регрессии?
12. Как можно получить параметры уравнения в случае нелинейной
регрессии?
13. Каким образом можно оценить адекватность уравнения регрессии?
163
ВОПРОСЫ К ЭКЗАМЕНУ
1. Генеральная совокупность и выборка. Способы организации выборки.
Требования к выборке.
2. Вариационный ряд. Способы задания вариационного ряда. Алгоритм
построения интервального вариационного ряда. Эмпирическая функция распределения и ее свойства.
3. Числовые характеристики выборочной совокупности. Средние величины их свойства.
4. Числовые характеристики выборочной совокупности. Дисперсия,
среднее квадратичное отклонение, коэффициент вариации и их свойства.
5. Числовые характеристики выборочной совокупности. Начальные и
центральные моменты, коэффициенты асимметрии и эксцесса, свойства.
6. Основные характеристики генеральной совокупности и их связь с характеристиками выборочной совокупности.
7. Точечные оценки параметров распределения генеральной совокупности, их свойства, примеры.
8. Методы нахождения точечных оценок параметров генеральной совокупности.
9. Доверительные интервалы для параметров нормального закона распределения.
10. Статистическая гипотеза. Основные понятия. Этапы проверки статистической гипотезы.
11. Однофакторный дисперсионный анализ.
12. Понятие функциональной, стохастической и корреляционной зависимости. Методы изучения стохастических связей между переменными.
13. Поле корреляции. Выборочный коэффициент корреляции. Проверка
его значимости.
14. Выбор вида уравнения регрессии. Построение линейной функции
регрессии методом наименьших квадратов. Адекватность. Случаи нелинейной
регрессии.
164
ЗАДАНИЯ
ДЛЯ ПРАКТИЧЕСКИХ ЗАНЯТИЙ
И САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ
165
1. Элементы комбинаторики
1.1. Менеджер рассматривает кандидатуры 6 человек, подавших заявления о приеме на работу. Сколько существует способов приглашения кандидатов на собеседование?
Ответ: 720.
1.2. Начальник службы безопасности банка должен ежедневно расставлять десять охранников по 10 постам. В целях усиления безопасности одна
и та же комбинация расстановки охранников по постам не может повторяться чаще одного раза в месяц. Оценить, возможно ли это.
Ответ: возможно, так как у начальника службы безопасности есть
3628800 способов расстановки.
1.3. Команда из пяти человек выступает на соревнованиях по плаванию,
в которых участвуют еще 20 спортсменов. Сколькими способами могут
распределиться места, занятые членами этой команды?
Ответ: 6375600.
1.4. В вазе стоят 10 красных и 4 розовых гвоздики. Сколькими способами
можно выбрать:
1) три цветка;
2) один розовый и два красных цветка.
Ответ: 1) 364; 2) 180.
1.5. Пятнадцать человек разбиты на три группы, по пять человек в каждой. Сколько может быть различных составов групп?
Ответ: 756756.
1.6. В кредитном отделе банка работают восемь человек. Сколько существует способов распределить между ними три премии:
1) одинакового размера;
2) разных размеров, известных заранее.
Ответ: 1) 56; 2) 336.
1.7. Сколькими способами можно разбить на две подгруппы группу из
12 человек, если в одной из подгрупп должно быть не более пяти, а во
второй – не более девяти человек?
Ответ: 1507 способов.
166
1.8. Фирма нуждается в организации 4 новых складов. Ее сотрудники подобрали 8 подходящих одинаково удобных помещений. Сколько существует способов отбора 4 помещений из 8 в случайном порядке?
Ответ: 70.
1.9. Сколькими способами можно расставить девять различных книг на
полке, чтобы определенные четыре книги стояли рядом?
Ответ: существует 17280 способов размещения книг.
1.10. Сколько четырехзначных чисел, делящихся на 5, можно составить из
цифр 0, 1, 3, 5, 7, если каждое число не должно содержать одинаковых
цифр?
Ответ: 42.
1.11. Номер автомобильного прицепа состоит из двух букв и четырех
цифр. Сколько различных номеров можно составить, используя 30 букв и
10 цифр?
Ответ: 9 ⋅ 106 .
1.12. Сколько четырехзначных чисел, составленных из цифр 0, 1, 2, 3, 4, 5,
содержат цифру 3 (цифры в числах не повторяются)?
Ответ: 204.
1.13. Две ладьи расположены на шахматной доске так, что:
1) одна не может взять другую;
2) одна может взять другую.
Сколько существует таких расположений?
Ответ: 1) 3136; 2) 896.
1.14. В сессию в течение 20 дней студенты одной группы должны сдать
пять экзаменов. Сколькими способами можно составить расписание экзаменов, если:
1) запрещается сдавать два экзамена в один день;
2) между двумя экзаменами должен пройти хотя бы один день для
подготовки.
Ответ: 1) 1860480; 2) 524160.
167
2. Классическое и геометрическое определения вероятности
2.1. Набирая номер телефона, абонент забыл три последние цифры и,
помня, что они различны, набрал наудачу. Найти вероятность того, что он
набрал нужный номер.
1
Ответ:
.
720
2.2. Набирая номер телефона, абонент забыл три последние цифры и,
помня, что они различные и нечетные, набрал наудачу. Найти вероятность
того, что он набрал нужный номер.
1
Ответ:
.
60
2.3. Наудачу взятый телефонный номер состоит из 5 цифр. Какова вероятность того, что в нем все цифры: 1) различные; 2) одинаковые; 3) нечетные? Известно, что номер телефона не начинается с цифры 0.
27216
1
55
Ответ: 1)
; 2)
; 3)
.
90000
10000
90000
2.4. Из пяти букв разрезной азбуки составлено слово «книга». Ребенок
рассыпал эти буквы и собрал в произвольном порядке. Найти вероятность
того, что у него снова получилось слово «книга».
1
Ответ:
.
120
2.5. Из шести букв разрезной азбуки составлено слово «ананас». Ребенок
рассыпал эти буквы и собрал в произвольном порядке. Найти вероятность
того, что у него снова получилось слово «ананас».
1
Ответ:
.
60
2.6. Менеджер рассматривает кандидатуры 15 человек, подавших заявления о приеме на работу. В фирме имеется 2 равнозначные вакансии. Собеседование проводится в случайном порядке. Какова вероятность того, что
работу получат претенденты, зарегистрировавшиеся под номерами 4 и 12,
если шансы у всех одинаковы?
1
Ответ:
.
105
168
2.7. В цехе работают шесть мужчин и четыре женщины. По табельным
номерам наудачу отобраны семь человек. Найти вероятность того, что среди отобранных лиц окажутся три женщины.
1
Ответ: .
2
2.8. В коробке пять одинаковых изделий, причем три из них окрашены.
Наудачу извлечены два изделия. Найти вероятность того, что среди двух
извлеченных изделий окажутся:
1) одно окрашенное изделие; 2) два окрашенных изделия; 3) хотя бы одно
окрашенное изделие.
Ответ: 1) 0,6; 2) 0,3; 3) 0,9.
2.9. В лифт девятиэтажного дома на первом этаже вошли пять человек.
Каждый из них с одинаковой вероятностью выходит на любом из этажей,
начиная со второго. Найти вероятность того, что все пассажиры выйдут:
1) на одном и том же этаже; 2) на шестом этаже; 3) на разных этажах.
1
1
105
Ответ: 1)
; 2)
; 3)
.
4096
32768
512
2.10. Банковский сейф имеет кодовый замок, состоящий из шести дисков с
восемью буквами на каждом. Сейф открывается при наборе единственной
комбинации букв. Злоумышленник пытается открыть сейф, причем на проверку одной кодовой комбинации у него уходит 10 секунд. Какова вероятность того, что злоумышленник успеет открыть сейф, если в его распоряжении 2 часа?
45
Ответ:
.
16384
2.11. Брошены две игральные кости. Найти вероятность того, что сумма
очков на выпавших гранях равна 7.
1
Ответ: .
6
2.12. Брошены две игральные кости. Найти вероятности следующих событий:
1) сумма выпавших очков равна восьми, а разность – четырем;
2) сумма выпавших очков равна восьми, если известно, что их разность равна четырем;
3) сумма выпавших очков равна пяти, а произведение – четырем.
1
1
1
Ответ: 1) ; 2) ; 3) .
2
18
18
169
2.13. В урне a белых и b черных шаров.
1. Из урны вынимают наугад один шар. Найти вероятность того, что
он – белый.
2. Из урны вынимают один за другим все шары, кроме последнего.
Найти вероятность того, что он – белый.
a
a
Ответ: 1)
; 2)
.
a+b
a+b
2.14. На 200-километровом участке газопровода между компрессорными
станциями A и B происходит утечка газа, которая одинаково возможна в
любой точке газопровода. Найти вероятности следующих событий:
1) утечка расположена не далее 20 км от A и B ;
2) утечка расположена ближе к A , чем к B .
1
1
Ответ: 1) ; 2) .
2
5
2.15. При проведении инвентаризации для определения имеющегося на
складе количества жидкого химического реактива используется измерительный прибор с ценой деления шкалы 0,2. Показания прибора округляются до ближайшего деления шкалы. Найти вероятность того, что ошибка
округления не превысит 0,04 л.
1
Ответ: .
5
2.16. Наудачу взяты два положительных числа x и y , каждое из которых
не превышает двух. Найти вероятность того, что произведение xy будет не
больше единицы, а частное y
x
– не больше двух.
Ответ: 0,385.
2.17. На бесконечную шахматную доску, сторона каждой клетки которой
равна 2a , бросают монету радиусом r < a . Найти вероятность того, что
монета попадет целиком внутрь одной клетки.
Ответ:
(a − r )2
.
a2
170
3. Теорема умножения вероятностей. Полная вероятность.
Формула Байеса
3.1. Опыт состоит в последовательном бросании двух монет. События:
A – герб на первой монете; B – герб на второй монете; C – хотя бы одна
решка. Зависимы ли события: пара A и C ; пара A и B ?
Ответ: события А и С зависимы, события А и B независимы.
3.2. Игральная кость бросается два раза. Найти вероятность того, что оба
раза появится одно и то же число очков.
1
Ответ: .
6
3.3. Студент знает 20 вопросов из 25. Экзаменатор задал ему 2 вопроса.
Найти вероятность того, что студент ответит на оба вопроса.
19
Ответ:
.
30
3.4. В мешочке содержится 10 одинаковых кубиков с номерами от 1 до
10. Наудачу извлекают по одному три кубика. Найти вероятность того, что
последовательно появятся кубики с номерами 1, 2, 3, если кубики извлекаются: 1) без возвращения; 2) с возвращением.
1
Ответ: 1)
; 2) 0,001.
720
3.5. Вероятность появления каждого из независимых событий A1 и A2
соответственно равна p1 и p2 . Найти вероятность появления только одного из этих событий при совместном проведении опыта.
Ответ: p1q2 + q1 p2 .
3.6. Два стрелка стреляют по мишени. Вероятность попадания в мишень
при одном выстреле для первого стрелка равна 0,7, а для второго – 0,8.
Найти вероятность того, что при одном залпе в мишень: 1) попадет только
один из стрелков; 2) попадут оба стрелка; 3) оба промахнутся.
Ответ: 1) 0,38; 2) 0,56; 3) 0,06.
3.7. Вероятность того, что потребитель увидит рекламу определенного
продукта по телевидению, равна 0,12. Вероятность того, что потребитель
увидит рекламу того же продукта на рекламном стенде, равна 0,15. Пред171
полагается, что оба события независимы. Чему равна вероятность того, что
потребитель увидит: 1) обе рекламы; 2) хотя бы одну рекламу?
Ответ: 1) 0,018; 2) 0,252.
3.8. Предприниматель открывает одновременно три автостоянки в трех
районах города – Северном, Центральном и Южном. Вероятность того, что
удастся окупить затраты за первый год работы автостоянки в Северном
районе, предприниматель оценивает в 0,3, в Центральном – в 0,2, в Южном –
0,15. Предполагая, что окупаемость каждой автостоянки не влияет на другие, оцените вероятность того, что окупятся в течение первого года:
1) все три автостоянки;
2) только в Центральном районе;
3) только одна автостоянка;
4) хотя бы одна автостоянка.
Ответ: 1) 0,009; 2) 0,119; 3) 0,407; 4) 0,524.
3.9. В городе три независимых коммерческих банка A, B, C , оценка надежности которых – 0,95, 0,90 и 0,85 соответственно. В связи с определением хозяйственных перспектив развития города администрацию интересуют ответы на следующие вопросы: 1) какова вероятность того, что в течение года обанкротятся все три банка; 2) что обанкротится только один
банк; 3) что обанкротится хотя бы один банк?
Ответ: 1) 0,00075; 2) 0,24725; 3) 0,27325.
3.10. Вероятность хотя бы одного попадания в цель при четырех выстрелах равна 0, 9984. Найти вероятность попадания в цель при одном выстреле.
Ответ: 0,8.
3.11. Имеются три одинаковых с виду урны. В первой 5 белых и 10 черных шаров, во второй – 10 белых и 5 черных шаров, в третьей – только белые шары. Человек подходит наугад к одной из урн и вынимает шар. Какова вероятность того, что шар – белый?
2
Ответ: .
3
3.12. Электролампы, поступающие в магазин, изготавливаются на трех заводах. Первый завод поставляет 45 % общего количества электроламп, второй – 40 %, третий – 15 %. Продукция первого завода содержит 70 % стандартных ламп, второго – 80 %, третьего – 81 %. Какова вероятность того,
что лампа, предложенная покупателю, окажется стандартной?
Ответ: 0,7565.
172
3.13. Агент по недвижимости пытается продать участок земли под застройку. Он полагает, что участок будет продан в течение ближайших
6 месяцев с вероятностью 0,9, если экономическая ситуация в регионе не
будет ухудшаться. Если же экономическая ситуация будет ухудшаться, то
вероятность продать участок составит 0,5. Экономист, консультирующий
агента, полагает, что с вероятностью, равной 0,7, экономическая ситуация
в регионе в течение следующих 6 месяцев будет ухудшаться. Чему равна
вероятность того, что участок будет продан в течение ближайших 6 месяцев?
Ответ: 0,62.
3.14. Исследованиями психологов установлено, что мужчины и женщины
по-разному реагируют на некоторые жизненные обстоятельства. Результаты исследований показали, что 70 % женщин позитивно реагируют на изучаемый круг ситуаций, в то время как 40 % мужчин реагируют на них негативно. 15 женщин и 5 мужчин заполнили анкету, в которой отразили
свое отношение к предлагаемым ситуациям. Случайно извлеченная анкета
содержит негативную реакцию. Чему равна вероятность того, что ее заполнял мужчина?
Ответ: 0,308.
3.15. Экономист-аналитик условно подразделяет экономическую ситуацию в стране на «хорошую», «посредственную» и «плохую» и оценивает
их вероятности для данного момента времени в 0,15; 0,70 и 0,15 соответственно. Некоторый индекс экономического состояния возрастает с вероятностью 0,60, когда ситуация «хорошая»; с вероятностью 0,30, когда ситуация «посредственная», и с вероятностью 0,10, когда ситуация «плохая».
Пусть в настоящий момент индекс экономического состояния возрос. Чему
равна вероятность того, что экономика страны на подъеме?
Ответ: 0,286.
3.16. Три стрелка произвели залп, причем две пули поразили мишень.
Найти вероятность того, что третий стрелок поразил мишень, если вероятности попадания в мишень первым, вторым и третьим стрелками соответственно равны 0,6; 0,5; 0,4.
10
Ответ: .
19
173
3.17. Два автомата производят одинаковые детали, которые поступают на
общий конвейер. Производительность первого автомата вдвое больше
производительности второго. Первый автомат производит в среднем 60 %
деталей отличного качества, а второй – 84 % деталей отличного качества.
Наудачу взятая с конвейера деталь оказалась отличного качества. Найти
вероятность того, что эта деталь изготовлена: 1) первым автоматом; 2) вторым автоматом.
Ответ: 1) 0,588; 2) 0,412.
4. Формула Бернулли. Локальная и интегральная теоремы Лапласа.
Асимптотическая формула Пуассона
4.1. Продукция высшего сорта на предприятии составляет 30% общего
объема производства. Некто приобрел 6 изделий, изготовленных на этом
предприятии. Чему равна вероятность того, что 4 из них высшего сорта?
Ответ: 0,06.
4.2. В среднем пятая часть поступающих в продажу автомобилей – некомплектные. Найти вероятность того, что среди десяти автомобилей имеют некомплектность: 1) три автомобиля; 2) менее трех.
Ответ: 1) 0,201; 2) 0,677
4.3. Монету бросают пять раз. Найти вероятность того, что «герб» выпадет: а) менее двух раз; б) не менее двух раз.
Ответ: 1) 0,1875; 2) 0,8125.
4.4. Играют два равносильных шахматиста. Что вероятнее: выиграть две
партии из четырех или три партии из шести? Ничьи во внимание не принимаются.
Ответ: вероятнее выиграть две партии из четырех.
4.5. Известно, что из числа зрителей определенной телепрограммы 70 %
смотрят и рекламные блоки. Группы, состоящие из трех наугад выбранных
телезрителей, опрашивают относительно содержания рекламного блока.
Найти наивероятнейшее число лиц в группе, которые смотрят рекламные
блоки.
Ответ: 2.
174
4.6. Вероятность изготовления нестандартной детали составляет 0,05.
Сколько должно быть деталей в партии, чтобы наивероятнейшее число нестандартных деталей в ней было равно 63?
Ответ: количество деталей в партии должно изменяться в пределах
от 1259 до 1279.
4.7. За один час станок-автомат изготавливает 20 деталей. За сколько часов работы вероятность изготовления хотя бы одной бракованной детали
будет не менее 0,952, если вероятность того, что любая деталь бракованная, равна 0,01?
Ответ: 15,1 часа.
4.8. По результатам проверок налоговыми инспекциями установлено, что
в среднем каждое второе малое предприятие региона имеет нарушение
финансовой дисциплины. Найти вероятность того, что из 1000 зарегистрированных в регионе малых предприятий имеют нарушения финансовой
дисциплины:
1) 480 предприятий;
2) наивероятнейшее число предприятий;
3) не менее 480 предприятий;
4) от 480 до 520 предприятий.
Ответ: 1) 0,011; 2) 0,0252; 3) 0,898; 4) 0,796.
4.9. В некотором регионе из каждых 100 семей 80 имеют холодильники.
Найти вероятность того, что из 400 семей 30 имеют холодильники.
Ответ: 0,0022.
4.10. При обследовании уставных фондов банков установлено, что пятая
часть банков имеют уставный фонд свыше 100 млн руб. Найти вероятность
того, что среди 1800 банков имеют уставный фонд свыше 100 млн руб.:
1) не менее 300; 2) от 300 до 400 включительно.
Ответ: 1) 0,9998, 2) 0,9907.
4.11. На факультете насчитывается 1825 студентов. Какова вероятность
того, что 1 сентября является днем рождения одновременно четырех студентов факультета?
Ответ: 0,1755.
175
4.12. В банк отправлено 4000 пакетов денежных знаков. Вероятность того,
что пакет содержит недостаточное или избыточное число денежных знаков, равна 0,0001. Найти вероятность того, что при проверке будет обнаружено: 1) три ошибочно укомплектованных пакета; 2) не более трех пакетов.
Ответ: 1) 0,0072; 2) 0,9992.
4.13. Вероятность потерять кредитную карту в течение недели для случайно выбранного владельца кредитной карты составляет 0,001. Банк выдал кредитные карты 2000 клиентам. Найти:
1) вероятность того, что за предстоящую неделю будет утеряна ровно одна кредитная карта;
2) вероятность того, что за предстоящую неделю будет утеряна хотя
бы одна кредитная карта;
3) наиболее вероятное число кредитных карт, теряемых за месяц.
Ответ: 1) 0,27; 2) 0,865; 3) 8.
4.14. Вероятность для любого абонента позвонить на коммутатор в течение часа равна 0,02. Телефонная станция обслуживает 250 абонентов. Какова вероятность, что в течение часа позвонят 3 абонента?
Ответ: 0,1404.
4.15. Среднее число вызовов, поступающих на АТС в одну минуту, равно
двум. Найти вероятность того, что за 4 мин поступит: 1) три вызова; 2) менее трех вызовов; 3) не менее трех вызовов. Поток вызовов предполагается
простейшим.
Ответ: 1) 0,02863; 2) 0,0057; 3) 0,9943.
5. Построение законов распределения дискретных
случайных величин.
Числовые характеристики дискретных случайных величин
5.1. Вероятности того, что студент сдаст семестровый экзамен в сессию
по дисциплинам A и B , равны соответственно 0,7 и 0,9. Составить закон
распределения числа экзаменов, которые сдаст студент.
Ответ:
0
1
2
X
0,03
0,34
0,63
P
176
5.2. Найти математическое ожидание и дисперсию ДСВ Х, заданной законом распределения
−4
0,2
X
P
6
0,3
10
0,5
Ответ: M ( X ) = 6; D( X ) = 28.
5.3. Устройство состоит из трех независимо работающих элементов. Вероятность отказа каждого элемента в одном опыте равна 0,1. Составить закон распределения числа отказавших элементов в одном опыте, построить
функцию распределения и начертить ее график, вычислить числовые характеристики M ( X ) и D( X ) .
Ответ:
0
1
2
3
X
0,729
0,243
0,027
0,001
P
x ≤ 0;
 0,
 0,729, 0 < x ≤ 1;

F ( x) =  0,972, 1 < x ≤ 2; M ( X ) = 0,3;
0,999, 2 < x ≤ 3;

x > 3;
 1,
D( X ) = 0,27.
5.4. Охотник, имеющий пять патронов, стреляет в цель до первого попадания или пока не израсходует все патроны. Составить закон распределения случайной величины X – числа израсходованных патронов, если вероятность попадания при каждом выстреле равна 0,4; построить функцию
распределения и начертить ее график.
Ответ:
X
1
2
3
4
5
P
0,4
0,24
0,144
0,0864
0,1296
 0,
 0,4,

 0,64,
F ( x) = 
0,784,
0,8704,

 1,
177
x ≤ 1;
1 < x ≤ 2;
2 < x ≤ 3;
3 < x ≤ 4;
4 < x ≤ 5;
x > 5.
5.5. В группе из десяти изделий имеется одно бракованное. Чтобы его
обнаружить, выбирают наугад одно изделие за другим и каждое проверяют. Построить ряд распределения для ДСВ X – числа проверенных изделий, вычислить M ( X ) и D( X ).
Ответ:
X
1
2
3
4
5
6
7
8
9
10
P
0,1
0,1
0,1
0,1
0,1
0,1
0,1
0,1
0,1
0,1
M ( X ) = 5,5; D( X ) = 8, 25.
5.6. Найти математическое ожидание дискретной случайной величины
X – числа таких бросаний пяти игральных костей, в каждом из которых на
двух костях появится по одному очку, если число бросаний равно двадцати.
Ответ: 3,215.
5.7. Найти дисперсию дискретной случайной величины X – числа отказов элемента некоторого устройства в десяти независимых опытах, если
вероятность отказа элемента в каждом опыте равна 0,9.
Ответ: 0,9.
5.8. Найти дисперсию ДСВ X – числа появлений события A в двух независимых испытаниях, если вероятности появления события в этих испытаниях одинаковы и известно, что M ( X ) = 1,2.
Ответ: 0,48.
5.9. ДСВ X имеет только два возможных значения – x1 и x2 , причем
x1 < x2 . Вероятность того, что X примет значение x1 , равна 0,6. Найти закон распределения величины X , если математическое ожидание и дисперсия известны: M ( X ) = 1,4; D( X ) = 0,24.
Ответ:
X
1
2
P
0,6
0,4
5.10. ДСВ X принимает три возможных значения: x1 = 4 с вероятностью
p1 = 0,5 ; x2 = 6 с вероятностью p2 = 0,3 и x3 с вероятностью p3 . Найти x3
и p3 , зная, что M ( X ) = 8. Построить ряд распределения ДСВ и функцию
распределения.
178
Ответ:
X
P
4
0,5
6
0,3
21
0,2
x ≤ 4;
 0,
 0,5, 4 < x ≤ 6;

F ( x) = 
0,8, 6 < x ≤ 21;
 1,
x > 21.
5.11. Две игральные кости одновременно бросаются два раза. Записать
биномиальный закон распределения ДСВ X – числа выпадения четного
числа очков на двух игральных костях. Построить функцию распределения
ДСВ X .
Ответ:
0
1
2
X
P
9
16
6
16
1
16
x ≤ 0;
 0,
9
 , 0 < x ≤ 1;
16
F ( x) = 
15 , 1 < x ≤ 2;
16
 1,
x > 2.

5.12. Два стрелка стреляют по одной мишени, делая независимо друг от
друга по два выстрела. Вероятность попадания в мишень для первого
стрелка равна 0,5, для второго – 0,6. Построить ряд распределения ДСВ X –
общего числа попаданий, найти M ( X ) и D( X ) .
Ответ:
X
0
1
2
3
4
P
0,04
0,20
0,37
0,30
0,09
M ( X ) = 2,2; D( X ) = 0,98.
5.13. Вероятность того, что стрелок попадет в мишень при одном выстреле, равна 0,8. Стрелку выдаются патроны до тех пор, пока он не промахнется.
179
Требуется:
1) составить закон распределения ДСВ X – числа израсходованных
патронов, выданных стрелку;
2) найти наивероятнейшее число выданных стрелку патронов.
Ответ:
X
1
2
3
…
k
…
P
0,2
0,16
0,128
…
0,8k −1 ⋅ 0, 2
…
Наивероятнейшее число выданных стрелку патронов равно 1.
5.14. Отдел технического контроля проверяет изделия на стандартность.
Вероятность того, что изделие стандартно, равна 0,9. В каждой партии содержится пять изделий. Найти математическое ожидание ДСВ X – числа
партий, в каждой из которых окажется ровно четыре стандартных изделия,
если проверке подлежит 50 партий.
Ответ: 16,4025.
5.15. Производятся независимые испытания с одинаковой вероятностью
появления события A в каждом испытании. Найти вероятность появления
события A , если дисперсия числа появлений события в трех независимых
испытаниях равна 0,63.
Ответ: p1 = 0,3; p2 = 0,7.
5.16. Даны независимые случайные величины X и Y :
x
p
0
0,25
1
0,5
y
q
2
0,25
0
0,4
1
0,3
2
0,2
3
0,1
Записать закон распределения суммы X + Y и произведения XY
случайных величин X и Y . Найти M ( X ) ; M (Y ) ; M ( X + Y ) ; M ( XY ) ;
D( X ) ; D(Y ) ; D( X + Y ) .
Ответ:
X +Y
P
0
0,1
1
0,275
2
0,3
3
0,2
4
0,1
5
0,025
X ⋅Y
P
0
0,55
1
0,15
2
0,175
3
0,05
4
0,05
6
0,025
M ( X ) = 1 ; M (Y ) = 1; M ( X + Y ) = 1 ; M ( XY ) = 1 ; D ( X ) = 0,5 ; D (Y ) = 1 ;
D ( X + Y ) = 1,5 .
180
6. Непрерывные случайные величины.
Числовые характеристики непрерывных случайных величин
6.1. Дана функция распределения непрерывной случайной величины X .
Найти плотность распределения вероятностей, если

 0,
при
x ≤ 0;

π

F ( x) = sin x, при 0 < x ≤ ;
2

π

при
x> .
 1,
2

при
 0,
Ответ: f ( x) = 
cos x, при

π
x> ;
2
π
0< x≤ .
2
x < 0,
Случайная величина X распределена на всей числовой прямой с
C
плотностью f ( x) =
. Найти значение постоянной C . Чему равна ве1 + x2
роятность того, что X примет положительное значение меньше 1?
1
Ответ: C = ; P(0 < X < 1) = 0, 25 .
π
6.2.
6.3.
Задана плотность распределения непрерывной случайной величины
при
x ≤ 1;
 0,

1

f ( x) =  x − , при 1 < x ≤ 2;
2

при
x > 2.
 0,
Найти F ( x) .
Ответ:
0,
при
x ≤ 1;

1

F ( x) =  ( x 2 − x), при 1 < x ≤ 2;
2
1,
при
x > 2.

181
6.4.
Задана плотность распределения непрерывной случайной величины
 0,
 x,

f ( x) = 
 2 − x,
 0
x ≤ 0;
при
при 0 < x ≤ 1;
при 1 < x ≤ 2;
x > 2.
при
Найти F ( x) .
Ответ:




F ( x) = 
2
− x
 2


x ≤ 0;
0,
при
x2
,
2
при 0 < x ≤ 1;
+ 2 x − 1, при 1 < x ≤ 2;
при
1,
6.5. Пусть плотность вероятности
формулой
 0,

f ( x) = a sin x,
 0,

x > 2.
случайной величины X определена
при
x < 0;
при 0 ≤ x ≤ π;
при
x > π.
π

Найти: 1) коэффициент a ; 2) F ( x) ; 3) P  0 < X <  .
4

0,
при
x < 0;

1
1

Ответ: 1) a = ; 2) F ( x) =  (1 − cos x), при 0 ≤ x ≤ π; 3) 0,147.
2
2
1,
при
x > π.

6.6.
Случайная величина X задана функцией распределения
x ≤ 0;
 0, при
 3
F ( x) =  x , при 0 < x ≤ 1;
 1, при
x > 1.

Найти плотность распределения вероятностей, математическое ожидание и дисперсию случайной величины.
 0, при x ≤ 0, x > 1;
Ответ: f ( x) =  2
M ( X ) = 0,75; D( X ) = 0,0375 .
0 < x < 1;
3x , при
182
6.7.
Случайная величина X задана функцией распределения

 0,
при
x ≤ 0;

1

F ( x) = 3 x 2 + 2 x, при 0 < x ≤ ;
3

1

при
x> .
 1,
3
Найти плотность распределения вероятностей, математическое ожидание и дисперсию случайной величины.

 0,
при
x ≤ 0;

1

Ответ: f ( x) = 6 x + 2, при 0 < x < ; M ( X ) = 0,1852 ; D ( X ) = 0,0089 .
3

1

при
x> ;
 0,
3
6.8.
Плотность распределения случайной величины X определяется по

 0,
при
x < 0;

π

формуле f ( x) = cos x, при 0 < x ≤ ; Найти вероятность того, что X
2

π

x
0,
при
>
.

2
примет значение, меньшее своего математического ожидания.
Ответ: cos1.
Плотность распределения случайной величины X определяется по
0,
при
x < 1;

4

формуле f ( x) =  ( x3 − x) при 1 < x ≤ 2; Найти вероятность того, что
9
0,
при
x > 2.

6.9.
X примет значение, меньшее своего математического ожидания.
Ответ: 0,313.
183
6.10. Случайная величина X имеет равномерное распределение с математическим ожиданием M ( X ) = 1 и дисперсией D( X ) = 3 . Найти плотность
распределения вероятности случайной величины X .
x < −2;
0, при
1

Ответ: f ( x) = 
при −2 < x ≤ 4;
6

x > 4.
0, при
6.11. Среднее время безотказной работы прибора равно 80 ч. Полагая, что
время безотказной работы прибора имеет показательный закон распределения, найти: 1) функцию плотности вероятности и функцию распределения; 2) вероятность того, что в течение 100 ч прибор не выйдет из строя.
0,
при x < 0;

Ответ: 1) f ( x) = 
−0,0125 x
, при x ≥ 0;
0,0125e
0,
при x < 0;

F ( x) = 
2) 0,286.
−0,0125 x
, при x ≥ 0;
1 − e
6.12. Текущая цена акции может быть смоделирована с помощью нормального закона распределения с математическим ожиданием 15 ден. ед. и
средним квадратическим отклонением 0,2 ден. ед.
Найти вероятность того, что цена акции: 1) не выше 15,3 ден. ед.;
2) не ниже 15,4 ден. ед.; 3) от 14,9 до 15,3 ден. ед.
С помощью правила трех сигм найти границы, в которых будет находиться текущая цена акции.
Ответ: 1) 0,9332; 2) 0,0228; 3) 0,6246; X ∈ [14, 4;15,6] .
7. Системы случайных величин. Числовые характеристики
7.1. Закон распределения двумерной дискретной случайной величины
( X , Y ) задан таблицей. Найти:
1) законы распределения одномерных случайных величин X и Y ;
2) условные законы распределения случайной величины X при условии Y = 2 и случайной величины Y при условии X = 0 ;
3) вероятность P(Y > X ) .
184
Y
0
1
2
3
–1
0,02
0,03
0,09
0,01
0
0,04
0,20
0,16
0,10
1
0,05
0,10
0,15
0,05
X
Ответ:
1)
X
p
–1
0,15
0
0,50
2)
X / Y = 2 –1
p
0,225
3)
P(Y > X ) = 0,81
0
0,4
Y
q
1
0,35
0
0,11
Y/X =0
q
1
0,375
0
0,08
1
0,33
2
0,40
1
0,40
3
0,16
2
0,32
3
0,20
7.2. Двумерная случайная величина определяется следующим образом:
если при подбрасывании игральной кости выпадает четное число очков, то
X = 1 , в противном случае X = 0 ; Y = 1, когда число очков кратно трем, в
противном случае Y = 0 . Найти:
1) законы распределения двумерной случайной величины ( X , Y ) и
ее одномерных составляющих;
2) условные законы распределения X и Y .
Ответ: 1)
Y
0
1
0
1
0
1
X
Y
X
1
3
1
3
0
1
1
6
1
6
p
1
2
1
2
q
2)
X /Y = 0
P
0
X /Y =1
1
P
0,5 0,5
0
1
0,5 0,5
Y/X =0
0
1
Y / X =1
0
1
P
2
3
1
3
P
2
3
1
3
185
2
3
1
3
7.3.
Задана функция распределения двумерной случайной величины
x ≥ 0, y ≥ 0;
(1 − e −4 x )(1 − e −2 y ) при
F ( x, y ) = 
при x < 0 или y < 0.
0

Найти двумерную плотность вероятности системы ( X , Y ) .
Ответ:
x > 0, y > 0;
8e−4 x−2 y при
f ( x, y ) = 
при x < 0 или y < 0.
 0
7.4.
Задана функция распределения двумерной случайной величины
x ≥ 0, y ≥ 0;
1 − 3− x − 3 y + 3− x− y при
F ( x, y ) = 
при x < 0 или y < 0.
0

Найти двумерную плотность вероятности системы ( X , Y ) .
Ответ:
x ≥ 0, y ≥ 0;
ln 2 3 ⋅ 3x− y при
f ( x, y ) = 
при x < 0 или y < 0.
0

7.5. По данным примера 7.1 найти ковариацию и коэффициент корреляции.
Ответ: −0,012 ; −0,02 .
7.6. Закон распределения двумерной дискретной случайной величины
( X , Y ) задан таблицей. Найти коэффициент корреляции.
Y
–2
–1
0
1
2
–1
0,05
0,15
0,15
0,10
0,05
0
0,05
0,10
0,10
0,05
0
2
0
0,05
0,05
0,05
0,05
X
Ответ: 0,186.
8. Закон больших чисел
8.1. Среднее количество вызовов, поступающих на коммутатор завода в
течение часа, равно 300. Оценить вероятность того, что в течение следующего часа число вызовов на коммутатор: 1) превысит 400; 2) будет не более 500.
186
Ответ: 1) вероятность того, что число вызовов превысит 400, будет
не более 0,75; 2) вероятность того, что число вызовов не более 500, будет
не менее 0,4.
8.2. Сумма всех вкладов в отделение банка составляет 2 млн ден. ед., а
вероятность того, что случайно взятый вклад не превысит 10 тыс. ден. ед.,
равна 0,6. Что можно сказать о числе вкладов?
Ответ: число вкладчиков в банке не превышает 500.
8.3. В осветительную сеть параллельно включено 20 ламп. Вероятность
того, что за время Т лампа будет включена, равна 0,8. Пользуясь неравенством Чебышева, оценить вероятность того, что абсолютная величина разности между числом включенных ламп и средним числом (математическим ожиданием) включенных ламп за время Т окажется: 1) меньше трех;
2) не меньше трех.
Ответ: 1) 0,644; 2) 0,356.
8.4. Вероятность появления события в каждом испытании равна 0,25.
Используя неравенство Чебышева, оценить вероятность того, что число Х
появлений события заключено в пределах от 150 до 250, если будет произведено 800 испытаний.
Ответ: не менее 0,94.
8.5. Вероятность выхода с автомата стандартной детали равна 0,96. Оценить с помощью неравенства Чебышева вероятность того, что число бракованных деталей среди 2000 находится в границах от 60 до 100 (включительно). Уточнить вероятность того же события с помощью интегральной
теоремы Лапласа. Объяснить различие полученных результатов.
Ответ: по неравенству Чебышева вероятность интересующего события будет не менее, чем 0,808, по интегральной теореме Лапласа 0,9774.
8.6. Среднеквадратичное отклонение каждой из 450000 независимых случайных величин не превосходит десяти. Оценить вероятность того, что абсолютная величина отклонения среднеарифметической этих случайных величин от среднеарифметической их математических ожиданий не превзойдет 0,02.
4
Ответ: не менее .
9
8.7. Для определения средней продолжительности горения электроламп в
партии из 200 одинаковых ящиков было взято на выборку по одной лампе
из каждого ящика. Оценить вероятность того, что средняя продолжитель187
ность горения отобранных 200 электроламп отличается от средней продолжительности горения ламп во всей партии не более чем на 5 часов (по
абсолютной величине), если известно, что среднее квадратичное отклонение продолжительности горения ламп в каждом ящике меньше 7 ч.
Ответ: вероятность того, что средняя продолжительность горения
отобранных 200 электроламп отличается от средней продолжительности
горения ламп во всей партии не более чем на 5 часов, будет не менее, чем
0,9902.
8.8. Дисперсия каждой из 30000 независимых случайных величин не превышает 6. Какой должна быть верхняя граница абсолютной величины отклонения среднеарифметической случайных величин от среднеарифметической их математических ожиданий, чтобы вероятность такого отклонения превышала 0,92?
Ответ: 0,05.
8.9. Сколько надо провести измерений данной величины, чтобы с вероятностью не менее 0,95 гарантировать отклонение средней арифметической этих измерений от истинного значения величины не более, чем на 1
(по абсолютной величине), если среднее квадратичное отклонение каждого
из этих измерений не превосходит 5?
Ответ: потребуется не менее 500 испытаний.
8.10. Определить необходимое число опытов, которые нужно провести,
чтобы отклонение частоты появления события А от вероятности его появления в отдельном опыте, равной 0,75, не превзошло по абсолютной величине 0,05 с вероятностью 0,96.
Ответ: по крайней мере 1875.
8.11. При штамповке пластинок из пластмассы по данным ОТК брак составляет 3 %. Оценить вероятность того, что при просмотре партии из 1000
пластинок выявится отклонение от установленного процента брака менее
чем на 1 %.
Ответ: вероятность указанного события превышает 0,709.
8.12. В целях контроля из партии в 100 ящиков взяли по одной детали из
каждого ящика и измерили их длину. Требуется оценить вероятность того,
что вычисленная по данным выборки средняя длина детали отличается от
средней длины детали во всей партии не более чем на 0,3 мм, если известно, что среднее квадратическое отклонение не превышает 0,8 мм.
Ответ: вероятность указанного события превышает 0,929.
188
9. Ряд распределения. Числовые характеристики
выборочной совокупности
9.1. В таблице приведено распределение признака X – число сделок на
фондовой бирже за квартал, полученное по 400 инвесторам.
xi
0
1
2
3
4
5
6
7
8
9
10
ni
146
97
73
34
23
10
6
3
4
4
2
Требуется:
1) построить полигон, эмпирическую функцию распределения, кумуляту;
2) найти среднюю арифметическую, выборочную дисперсию и
среднее квадратичное отклонение, коэффициент вариации, коэффициенты
асимметрии и эксцесса.
Ответ: 2) x = 1,535 ; σв2 = 3,378 ; σв = 1,838 ; v = 119,7 %; A = 1,8 ; ε = 3,97 .
9.2. В таблице приведено распределение признака X – месячного дохода
жителя региона (в ден. ед.), полученное по 1000 жителей.
xi
менее 500
500 – 1000
ni
58
96
1000 – 1500 1500 – 2000 2000 – 2500 свыше 2500
239
328
147
132
Требуется:
1) построить гистограмму, эмпирическую функцию распределения;
2) найти среднюю арифметическую, выборочную дисперсию и
среднее квадратичное отклонение, коэффициент вариации.
Ответ: 2) x =1653 (ден. ед.); σв2 = 445591; σв = 667,5 (ден. ед.); v = 40,4 %.
9.3. В таблице приведено распределение признака X – урожайности ржи
на участке СПК (в ц/га), полученное по 100 участкам.
xi
9 – 12
12 – 15
15 – 18
18 – 21
21 – 24
24 – 27
ni
6
12
33
22
19
8
Требуется найти выборочную дисперсию и коэффициент вариации.
Ответ: σв2 = 15,3 ; v = 21,3 %.
189
9.4. В таблице приведено распределение признака X – времени, затраченного рабочим на обработку одной детали (в мин), полученное по 500
рабочим.
xi
2–4
4–6
6–8
8 – 10
10 – 12
ni
42
73
154
205
26
Требуется найти выборочную дисперсию и коэффициент вариации.
Ответ: x = 7, 4 (мин), σв2 = 4, 24 ; v = 27,84 %.
9.5. В таблице приведено распределение 50 рабочих по признаку X –
производительности труда (единиц за смену), разделенных на две группы –
30 и 20 человек.
xi
Прошедшие техническое
обучение (группа I)
85
94
96
102 103
Не прошедшие техническое
обучение (группа II)
63
69
83
89
106
ni
2
2
5
11
8
4
6
8
3
1
Вычислить общие и групповые средние и дисперсии.
Ответ: x = 90,02 (ед./за смену); σв2 = 142,18 ; x1 = 97,47 (ед /за смену);
σв21 = 22,72 ; x2 = 78,85 (ед./за смену); σв22 = 113, 43 .
9.6. В таблице приведено распределение признака X – выручки за сутки
(в тыс. ден. ед.), полученное по 100 инвесторам – торговым точкам города.
xi
4–6
6–8
8–10
ni
1
3
6
10–12 12–14 14–16 16–18 18–20 20–22 22–24 24–26
11
15
20
14
12
10
6
2
Требуется:
1) построить гистограмму, эмпирическую функцию распределения,
кумуляту;
2) найти среднюю арифметическую, выборочную дисперсию и
среднее квадратичное отклонение, коэффициент вариации, коэффициенты
асимметрии и эксцесса.
Ответ: 2) x = 15,6 (тыс. ден. ед.); σв2 = 19 ; σв = 4,36 (тыс. ден. ед.);
v = 27,9 %; A = 0,0017 ; ε = −0,5125 .
190
10. Точечные и интервальные оценки параметров распределения
генеральной совокупности
10.1. Случайная величина X представляет собой количество срывов поставок потребителям фирмами, производящими однородную продукцию.
За определенный период обследовано 8 фирм, у которых количество срывов поставок соответственно равно: 6; 3; 1; 3; 0; 4; 2; 5. Полагая, что случайная величина X распределена по закону Пуассона, найти оценку параметра λ : 1) методом моментов, 2) методом наибольшего правдоподобия.
Ответ: λ = 2,5 .
10.2. Случайная величина X – ошибка измерения – подчинена равномерному распределению с неизвестными параметрами a и b . Статистическое
распределение случайной величины X представлено в таблице.
xi
3
5
7
9
11
13
15
17
19
21
ni
21
16
15
26
22
14
21
22
18
25
Методом моментов найти точечные оценки параметров a и b равномерного распределения.
Ответ: a = 2,24 ; b = 22,38 .
10.3. В результате выборочного наблюдения получены следующие данные
о часовой выработке (в ед./ч) 50 рабочих.
xi
0,9
1,1
1,3
1,5
1,7
1,9
ni
1
2
10
17
16
4
С доверительной вероятностью 0,95 найти максимальное отклонение
средней часовой выработки рабочих в выборке от средней во всем цехе.
Ответ: 0,058 ед./ч.
10.4. С целью определения средней суммы вкладов в банке, имеющем
2200 вкладчиков, проведено выборочное обследование 111 вкладчиков, результаты которого приведены в таблице.
Сумма вклада,
xi , тыс. ден. ед.
10 – 30
30 – 50
50 – 70
70 – 90
90 – 110
110 – 130
ni
1
3
10
30
60
7
191
Найти доверительные границы для генеральной средней, которые
можно гарантировать с вероятностью 0,96.
Ответ: (86, 45; 93,37) .
10.5. Из большой партии изделий было проверено 150 с целью определения процента влажности древесины, из которой изготовлены эти изделия.
Считая, что процент влажности изделия – случайная величина, распределенная по нормальному закону, найти границы, в которых с вероятностью
0,95 будет заключен средний процент влажности изделий во всей партии.
Результаты наблюдений (в %) приведены в таблице.
xi
11 – 13
13 – 15
15 – 17
17 – 19
19 – 21
ni
8
42
51
37
12
Ответ: (15,71 %; 16,37 %).
10.6. Из всех коммерческих фирм некоторого региона налоговой инспекцией было проверено 100, статистика сокрытия налогов среди которых
(сумма в тыс. ден. ед.) приведена в таблице.
xi
40 – 42
42 – 44
44 – 46
46 – 48
48 – 50
ni
7
24
38
19
12
Найти доверительную вероятность того, что среднее значение сумм
сокрытых налогов всех фирм региона отличается от выборочной средней
не более чем на 0,4 тыс. ден. ед.
Ответ: 0,9334.
10.7. Каково должно быть число опытов, чтобы с надежностью γ = 0,95
точность оценки математического ожидания в нормально распределенной
совокупности была равной 0,2, если генеральное среднее квадратичное отклонение составляет 4?
Ответ: n ≥ 1537 .
10.8. По результатам социологического обследования при опросе 1500 респондентов рейтинг нового телевизионного канала (т.е. процент опрошенных, одобряющих его деятельность) составил 30 %. Найти границы, в которых с надежностью 0,95 заключен рейтинг канала по всей зоне его
192
трансляции. Сколько респондентов надо опросить, чтобы с надежностью
0,99 гарантировать предельную ошибку социологического обследования
не более 1 %?
Ответ: (27,68 %; 32,32 %); 13978.
10.9. Произведено 12 измерений одним прибором (без систематической
ошибки) некоторой величины, имеющей нормальное распределение, причем выборочная дисперсия оказалась равной 0,36. Найти границы, в которых с надежностью 0,95 заключено среднее квадратичное отклонение случайных ошибок измерений, характеризующих точность прибора.
Ответ: (0,44; 1,06).
11. Метод дисперсионного анализа.
Корреляционно-регрессионный анализ
11.1. В течение шести лет использовались пять различных технологий по
выращиванию сельскохозяйственной культуры. Данные по эксперименту
(в ц/га) приведены в таблице.
Технология (фактор Х)
Номер
наблюдения (год)
X1
X2
X3
X4
X5
1
2
3
4
5
6
Всего
1,2
1,1
1,0
1,3
1,1
0,8
6,5
0,6
1,1
0,8
0,7
0,7
0,9
4,8
0,9
0,6
0,8
1,0
1,0
1,1
5,4
1,7
2,4
1,3
1,5
1,2
1,3
8,4
1,0
1,4
1,1
0,9
1,2
1,5
7,1
Методом дисперсионного анализа при уровне значимости α = 0,05
установить влияние различных технологий на урожайность культуры.
Ответ: влияние типа технологии на урожайность значимо, так как
кр
Fнабл = 9,35 > F0,05
(4, 25) = 2,7 .
11.2. В цехе завода проводилось исследование влияния квалификации рабочих на заработную плату. Результаты опроса приведены в таблице
(в ден. ед.).
193
Номер
наблюдения
1
2
3
4
5
6
Всего
Квалификационный разряд (фактор Х)
1
0,15
0,17
0,09
0,12
0,10
0,14
0,77
2
0,18
0,14
0,15
0,19
0,19
0,20
1,05
3
0,20
0,19
0,17
0,23
0,25
0,27
1,31
4
0,30
0,25
0,27
0,28
0,32
0,30
1,72
5
0,35
0,34
0,35
0,31
0,36
0,34
2,05
Ответ: влияние квалификационного разряда на заработную плату
кр
значимо, так как Fнабл = 56,01 > F0,05
(4,25) = 2,76 .
11.3. В шести магазинах фирмы, расположенных в разных микрорайонах
города, проводилось исследование влияния расположения на объем товарооборота. Результаты наблюдений за 8 месяцев приведены в таблице
(в млн ден. ед.).
Номер
месяца
Микрорайон города (фактор Х)
1
19
23
26
18
20
20
18
35
179
1
2
3
4
5
6
7
8
Всего
2
20
20
32
27
40
24
24
22
209
3
18
14
15
19
19
20
16
18
139
4
16
15
18
26
19
17
19
18
148
5
25
24
20
26
28
27
26
30
206
6
20
19
17
23
25
27
25
22
178
7
30
25
27
28
32
30
32
28
232
8
35
34
35
31
36
34
28
30
263
Ответ: влияние расположения магазина на товарооборот значимо,
кр
так как Fнабл = 13,34 > F0,05
(7,56) = 2,19 .
11.4. Данные об уровне механизации работ X (%) и производительности
труда Y (т/ч) для 14 однотипных предприятий представлены в таблице.
xi
32
30
36
40
41
47
56
54
60
55
61
67
69
76
yi
20
24
28
30
31
33
34
37
38
40
41
43
45
48
Требуется:
1) оценить тесноту и направление связи между переменными с помощью коэффициента корреляции, проверить его значимость;
194
2) найти уравнение линейной регрессии Y по X .
Ответ: 1) r = 0,969 , связь весьма тесная и прямая, r значим;
2) y x = 0,5435 x + 7,04 .
11.5. Туристическая компания предлагает места в гостиницах приморского курорта. Менеджера компании интересует, насколько возрастает привлекательность гостиницы в зависимости от ее расстояния до пляжа.
С этой целью по 14 гостиницам города были выяснены среднегодовая наполняемость номеров (Y , %) и расстояние до пляжа ( X , км).
xi
0,1
0,1
0,2
0,3
0,4
0,4
0,5
0,6
0,7
0,7
0,8
0,8
0,9
0,9
yi
92
95
96
90
89
86
90
83
85
80
78
76
72
75
Требуется:
1) оценить тесноту и направление связи между переменными с помощью коэффициента корреляции, проверить его значимость;
2) найти уравнение линейной регрессии Y по X .
Ответ: 1) r = −0,944 , связь весьма тесная и обратная, r значим;
2) y x = −25, 477 x + 98, 252 .
11.6. Компанию по грузоперевозкам интересует зависимость между пробегом автомашины ( X , тыс. км) и стоимостью ежемесячного технического
обслуживания ( Y , ден. ед.). Для выяснения этой связи было отобрано 15
грузовых автомобилей.
xi
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
yi
13
16
15
20
19
21
26
24
30
32
30
35
34
40
39
Требуется:
1) оценить тесноту и направление связи между переменными с помощью коэффициента корреляции, проверить его значимость;
2) найти уравнение линейной регрессии Y по X .
Ответ: 1) r = 0,982 , связь весьма тесная и прямая, r значим;
2) y x = 1,9286 x + 1,1952 .
195
ИНДИВИДУАЛЬНОЕ ДОМАШНЕЕ ЗАДАНИЕ
«ОСНОВНЫЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН»
Вариант 1
1. Известно, что в определенном городе 20 % горожан предпочитают добираться на работу личным автотранспортом. Случайно выбраны 4 человека. Построить ряд распределения СВ X – числа людей в выборке, предпочитающих добираться на работу личным автотранспортом; записать F ( x) и
построить график; найти числовые характеристики M ( X ) и D( X ) ; найти
P(2 ≤ X < 4).
2. Промышленная телевизионная установка состоит из 2000 транзисторов. Вероятность выхода из строя каждого из них равна 0,0005. Построить
ряд распределения СВ X – числа вышедших из строя транзисторов, где Х
принимает значения 0, 1, …, k, …; найти числовые характеристики M ( X )
и D( X ) ; найти вероятность выхода из строя хотя бы одного транзистора.
3. Телефонист вызывает абонента, причем каждый последующий вызов
производится лишь в том случае, если предыдущий вызов не принят. Вероятность того, что абонент ответит, равна 0,4. Построить ряд распределения СВ X – числа выполненных вызовов абонента; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что было выполнено не более двух вызовов.
4. В группе спортсменов 6 лыжников и 4 конькобежца. Из нее случайным образом отобрано 3 спортсмена. СВ X – число лыжников среди отобранных. Построить ряд распределения СВ X ; записать F ( x) и построить
график; найти числовые характеристики M ( X ) и D( X ) ; найти P( X < 3).
5. Маршрутные такси определенного номера отходят от автовокзала регулярно с интервалом 10 мин. Пассажир пришел на автовокзал в случайный
момент времени. Найти закон распределения СВ X – времени ожидания
пассажира; записать f ( x) и F ( x) , построить графики; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что пассажир будет
ждать не больше 5 минут.
196
6. Среднее время разговора абонента, ежедневно регистрируемое на
АТС, составляет 35 мин. Найти закон распределения СВ X – длительности разговора абонента в сутки; записать f ( x) и F ( x) ; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что абонент разговаривал от 7 до 15 минут.
7. Производят взвешивание вещества без систематических ошибок. Случайная величина результата взвешивания Х распределена нормально с математическим ожиданием 20 кг и средним квадратичным отклонением
2 кг. Записать f ( x) . Найти вероятность того, что следующее взвешивание
отличается от математического ожидания не более чем на 100 г; сформулировать «правило трех сигм».
Вариант 2
1. Телевизионный канал рекламирует новый вид стирального порошка.
Вероятность того, что телезритель увидит эту рекламу, оценивается в 0,2.
В случайном порядке выбраны 5 телезрителей. Построить ряд распределения СВ X – числа лиц, видевших рекламу; записать F ( x) и построить график; найти числовые характеристики M ( X ) и D( X ) ; найти P(3 ≤ X < 5) .
2. Среднее число заказов такси, поступающих на диспетчерский пункт в
одну минуту, равно пяти. Построить ряд распределения СВ X – числа вызовов, поступивших за одну минуту, где X принимает значения 0, 1, …, k, …;
найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того,
что за минуту поступит 6 вызовов.
3. Покупатель осматривает холодильники, причем каждый последующий холодильник осматривается только в том случае, если у предыдущего
найдены царапины на корпусе. Вероятность того, что холодильник имеет
царапины, равна 0,3. Построить ряд распределения СВ X – числа холодильников, осмотренных покупателем; найти числовые характеристики
M ( X ) и D( X ) ; найти вероятность того, что было осмотрено не более двух
холодильников.
4. Из 10 книг, стоящих на полке, 8 художественных. Наугад берут 4 книги. СВ X – число художественных книг среди взятых. Построить ряд распределения X ; записать F ( x) и построить график; найти числовые характеристики M ( X ) и D( X ) ; найти P( X > 2) .
197
5. Цена деления шкалы измерительного прибора равна 0,2. Показания
округляют до ближайшего целого деления. Найти закон распределения СВ
X – ошибки округления; записать f ( x) и F ( x) , построить графики; найти
числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что
ошибка округления не превысит 0,05.
6. Среднее время безотказной работы прибора равно 7 часам. Найти закон распределения СВ X – времени безотказной работы прибора; записать
f ( x) и F ( x) ; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что прибор работал безотказно от 6 до 8 часов.
7. Для исследования продуктивности определенной породы домашней
птицы измеряют диаметр яиц. Поперечный диаметр яиц представляет собой СВ X , распределенную по нормальному закону со средним значением
5 см и средним квадратичным отклонением 0,3 см. Записать f ( x) . Найти
вероятность того, что диаметр случайно взятого яйца будет находиться в
пределах от 4,7 до 6,2 см; сформулировать «правило трех сигм».
Вариант 3
1. В городе 6 коммерческих банков. У каждого риск банкротства в течение года составляет 0,3. Построить ряд распределения СВ X – числа обанкротившихся банков; записать F ( x) и построить график; найти числовые
характеристики M ( X ) и D( X ) ; найти P(3 ≤ X ≤ 5) .
2. Среди семян ржи 0,04 % семян сорняков. Записать ряд распределения
СВ X – числа обнаруженных семян сорняков среди 5000, где X принимает
значения 0, 1, …, k, …; найти числовые характеристики M ( X ) и D( X ) ;
найти вероятность того, что будет обнаружено ровно пять семян сорняков.
3. Проводится проверка партии коробок шоколадных конфет для отправки на экспорт до обнаружения недовеса (без ограничения числа проверенных коробок). Вероятность недовеса для каждой коробки составляет
0,1. Построить ряд распределения СВ X – числа коробок, осмотренных
при проверке; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что было осмотрено не более четырех коробок.
198
4. В подгруппе для занятий английским языком 4 мальчика и 6 девочек.
На олимпиаду отобраны 4 ученика. СВ X – число мальчиков среди отобранных учеников. Построить ряд распределения СВ X ; записать F ( x) и
построить график; найти числовые характеристики M ( X ) и D( X ) ; найти
P( X ≤ 2) .
5. Трамваи определенного маршрута идут с интервалом в 7 мин. СВ X –
время ожидания пассажира, пришедшего на остановку. Построить закон
распределения СВ X ; записать f ( x) и F ( x) , построить графики; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что пассажир будет ждать не более 3 минут.
6. Среднее время безотказной работы двигателя автомобиля равно 5 годам. Найти закон распределения СВ X – времени безотказной работы
двигателя; записать f ( x) и F ( x) ; найти числовые характеристики M ( X ) и
D( X ) ; найти вероятность того, что двигатель работал безотказно более
трех лет.
7. В результате медицинского осмотра призывников установлено, что их
средний вес составляет 70 кг. СВ X – вес призывника – подчинена нормальному закону со средним квадратичным отклонением, равным 8 кг. Записать f ( x) . Найти вероятность того, что вес призывника будет находиться в пределах от 60 до 80 кг; сформулировать «правило трех сигм».
Вариант 4
1. Вероятность сдачи экзамена для каждого из пяти студентов равна 0,8.
Построить ряд распределения СВ X – числа студентов, сдавших экзамен;
записать F ( x) и построить график; найти числовые характеристики M ( X )
и D( X ) ; найти P(3 ≤ X ≤ 5) .
2. Вероятность выпуска сверла повышенной хрупкости (бракованного)
равна 0,02. Сверла упаковываются в коробки по 100 штук. Построить ряд
распределения СВ X – числа бракованных сверл, где X принимает значения от 0, 1, …, k, …; найти числовые характеристики M ( X ) и D( X ) ; найти
вероятность того, что в коробке будет обнаружено менее двух бракованных
сверл.
199
3. Студент ищет подработку, причем по новому объявлению он звонит
лишь в том случае, если по предыдущему получил отказ. Вероятность того, что студент найдет подработку по отдельно взятому объявлению, составляет 0,2. Построить ряд распределения СВ X – числа обращений студента по объявлениям; найти числовые характеристики M ( X ) и D( X ) ;
найти вероятность того, что пришлось позвонить не более, чем по трем
объявлениям.
4. В коробке 12 фишек, среди которых 6 – красного цвета. Наугад извлекают 4 фишки. СВ X – число красных фишек среди извлеченных. Построить ряд распределения СВ X ; записать F ( x) и построить график;
найти числовые характеристики M ( X ) и D( X ) ; найти P( X ≥ 3) .
5. Минутная стрелка часов перемещается скачком в конце каждой минуты. СВ X – ошибка при определении точного времени. Найти закон распределения СВ X ; записать f ( x) и F ( x) , построить графики; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что ошибка не превысит 10 секунд.
6. Среднее время ожидания получения нового паспорта в паспортном
столе для каждого гражданина равно 18 дням. СВ X – время ожидания
получения нового паспорта. Найти закон распределения СВ X ; записать
f ( x) и F ( x) ; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что гражданин будет ждать не более 12 дней.
7. Средняя продолжительность эксплуатации электрических лампочек
равна 700 часам. СВ X – время эксплуатации лампочки – подчинена нормальному закону со средним квадратичным отклонением, равным 80 часам. Записать f ( x) . Найти вероятность того, что лампочка будет гореть от
580 до 720 часов; сформулировать «правило трех сигм».
Вариант 5
1. Вероятность того, что покупателю потребуется обувь 40-го размера,
равна 0,4. В обувной отдел вошли 5 покупателей. Построить ряд распределения СВ X – числа покупателей, которым потребовалась обувь 40-го размера; записать F ( x) и построить график; найти числовые характеристики
M ( X ) и D( X ) ; найти P(2 ≤ X < 5) .
200
2. Книга в 1000 страниц имеет 100 опечаток. Построить ряд распределения СВ X – числа опечаток на одной странице, где X принимает значения 0, 1, …, k, …; найти числовые характеристики M ( X ) и D( X ) ; найти
вероятность того, что на случайно выбранной странице окажется не менее
4-х опечаток.
3. Ученику токаря поручено обработать заготовку до получения стандартной детали (без ограничения числа выданных заготовок). Вероятность
изготовить стандартную деталь из выданной заготовки составляет 0,2. Построить ряд распределения СВ X – числа выданных заготовок; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что было
выдано не более трех заготовок.
4. На сборку поступило 9 моторов с двух конвейеров (с первого
конвейера поступило 4 мотора). Наудачу берут 5 моторов. СВ X – число
моторов с первого конвейера, попавших в выборку. Построить ряд распределения СВ X ; записать F ( x) и построить график; найти числовые
характеристики M ( X ) и D( X ) ; найти P( X < 3) .
5. Электропоезда в определенном направлении уходят с вокзала с интервалом в 30 минут. Пассажир пришел на вокзал в случайный момент времени. Найти закон распределения СВ X – времени ожидания пассажира; записать f ( x) и F ( x) , построить графики; найти числовые характеристики
M ( X ) и D( X ) ; найти вероятность того, что пассажир будет ждать не более
15 минут.
6. Среднее время ожидания выполнения заявки на ремонт телевизора в
телеателье равно 8 часам. СВ X – время ожидания клиентом выполнения
заявки. Найти закон распределения СВ X ; записать f ( x) и F ( x) ; найти
числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что
клиент ждал не более трех часов.
7. СВ X – размер выручки торгового киоска за 1 день – подчинена нормальному закону распределения с M ( X ) = 500 ден. ед. и D( X ) = 400 . Записать f ( x) . Найти вероятность того, что дневная выручка будет находиться в пределах от 450 до 530 ден. ед.; сформулировать «правило трех
сигм».
201
Вариант 6
1. В некотором цехе брак составляет 20 % всех изделий. Построить ряд
распределения СВ X – числа бракованных среди 6 взятых наугад изделий;
записать F ( x) и построить график; найти числовые характеристики M ( X )
и D( X ) ; найти P(3 ≤ X ≤ 5) .
2. Завод отправил на оптовую базу 5000 телевизоров. Вероятность повреждения изделия в пути равна 0,002. Построить ряд распределения СВ
X – числа телевизоров, поврежденных в пути, где X принимает значения
0, 1, …, k, …; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что в пути будет повреждено менее 3 телевизоров.
3. Пациент звонит в консультацию для заказа талона к врачу, причем
каждый последующий вызов производится лишь в том случае, если предыдущий вызов не принят. Вероятность того, что пациенту ответят, равна
0,6. Построить ряд распределения СВ X – числа вызовов консультации
пациентом; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что было выполнено более двух вызовов.
4. Для художественной выставки отбирается 4 картины. В наличии
имеется 5 картин одного художника и 7 – другого. СВ X – число картин
первого художника, попавших на выставку. Построить ряд распределения
СВ X ; записать F ( x) и построить график; найти числовые характеристики M ( X ) и D( X ) ; найти P( X ≥ 2) .
5. Цена деления шкалы термометра для измерения температуры в аквариуме равна 0,1. Показания округляют до ближайшего целого деления.
Найти закон распределения СВ X – ошибки округления; записать f ( x) и
F ( x) , построить графики; найти числовые характеристики M ( X ) и D( X ) ;
найти вероятность того, что ошибка округления не превысит 0,01.
6. Среднее время ожидания покупателя у кассы супермаркета равно трем
минутам. Найти закон распределения СВ X – времени ожидания; записать
f ( x) и F ( x) ; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что покупатель ждал не более одной минуты.
7. СВ X – объем продаж стирального порошка в магазине хозтоваров за
день – подчинена нормальному закону со средним значением, равным 140
упаковок, и дисперсией, равной 25. Записать f ( x) . Найти вероятность того, что за день будет продано от 130 до 150 упаковок; сформулировать
«правило трех сигм».
202
Вариант 7
1. По каналу связи передают 5 сообщений. Каждое из них с вероятностью 0,1 искажается помехами. Построить ряд распределения СВ X – числа сообщений, искаженных помехами; записать F ( x) и построить график;
найти числовые характеристики M ( X ) и D( X ) ; найти P(2 < X < 4) .
2. Среднее число инкассаторов, прибывающих утром на автомобилях в
банк в 15-минутный интервал, равно 3. Прибытие инкассаторов происходит случайно и независимо друг от друга. Записать ряд распределения
СВ X – числа инкассаторов, прибывших утром в течение 15 минут в банк,
где X принимает значения 0, 1, …, k, …; найти числовые характеристики
M ( X ) и D( X ) ; найти вероятность того, что в течение 15 минут в банк
прибудут хотя бы два инкассатора.
3. Выпускник института хочет найти работу по специальности и обращается в различные учреждения по профилю. Вероятность получения работы составляет 0,3 при каждом обращении, причем в следующее учреждение он будет обращаться только при получении отказа. Построить ряд
распределения СВ X – числа обращений в учреждения для получения работы; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность
того, что для получения работы придется обратиться не менее чем в три
учреждения.
4. Из спортсменов двух классов для соревнований составляется сборная
команда в количестве 5 человек. В классе «А» 6 спортсменов, в классе
«Б» – 5. СВ X – число учащихся класса «А», попавших в сборную. Построить ряд распределения СВ X ; записать F ( x) и построить график;
найти числовые характеристики M ( X ) и D( X ) ; найти P( X < 3).
5. Корреспонденция из почтового ящика в отделении связи с круглосуточным обслуживанием вынимается 4 раза в сутки через равные интервалы
времени. Человек опустил письмо в ящик в случайный момент времени.
Найти закон распределения СВ X – времени до изъятия корреспонденции;
записать f ( x) и F ( x) , построить графики; найти числовые характеристики
M ( X ) и D( X ) ; найти вероятность того, что письмо будет в ящике не более
двух часов.
203
6. Среднее время безотказной работы телевизора равно 10 годам. СВ X –
время безотказной работы телевизора. Найти закон распределения СВ X ;
записать f ( x) и F ( x) ; найти числовые характеристики M ( X ) и D( X ) ;
найти вероятность того, что телевизор проработал без ремонта более
10 лет.
7. СВ X – урожай картофеля по различным участкам – подчинена нормальному закону со средним значением, равным 70 ц/га, дисперсией, равной 100. Записать f ( x) . Найти вероятность того, что урожайность на случайно выбранном участке будет находиться в пределах от 60 ц/га до 85 ц/га;
сформулировать «правило трех сигм».
Вариант 8
1. Для водителя автомобиля вероятность нарушить правила дорожного
движения при пересечении перекрестка равна 0,4. Построить ряд распределения СВ X – числа нарушений правил при проезде 6 перекрестков; записать F ( x) и построить график; найти числовые характеристики M ( X ) и
D( X ) ; найти P( X ≤ 2) .
2. Среднее число вызовов, поступающих на АТС в минуту, равно 120.
Построить ряд распределения СВ X – числа вызовов, поступающих на
АТС за 2 секунды ( X принимает значения 0, 1, …, k, …); найти числовые
характеристики M ( X ) и D( X ) ; найти вероятность того, что в течение
2 секунд на АТС поступит более 4 вызовов.
3. Студент ищет необходимую формулу в справочнике, причем новый
справочник он берет только в случае, если в предыдущем не оказалось необходимой информации. Вероятность того, что формула находится в
справочнике, составляет 0,8. Построить ряд распределения СВ X – числа
просмотренных справочников; найти числовые характеристики M ( X ) и
D( X ) ; найти вероятность того, что понадобилось не более двух справочников.
4. В коробке лежат 10 авторучек, из них 4 с черной пастой, остальные –
с синей. Наудачу берут 5 авторучек. СВ X – число авторучек, оказавшихся с синей пастой. Построить ряд распределения СВ X ; записать F ( x) и
построить график; найти числовые характеристики M ( X ) и D( X ) ; найти
P( X > 2) .
204
5. Цена деления весов в овощном магазине равна 5 г. Показания округляют до ближайшего целого деления. Найти закон распределения СВ X –
ошибки округления; записать f ( x) и F ( x) , построить графики; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что ошибка округления не превысит 1 г.
6. Среднее время обслуживания пассажира в кассе автовокзала равно
2 мин. Найти закон распределения СВ X – времени работы кассира с одним пассажиром; записать f ( x) и F ( x) ; найти числовые характеристики
M ( X ) и D( X ) ; найти вероятность того, что пассажира обслуживали более
одной минуты.
7. СВ X – привес в стаде молодняка в сутки – распределена нормально
с математическим ожиданием 400 г и дисперсией 225. Записать f ( x) .
Найти вероятность того, что привес выбранного теленка будет находиться
в пределах от 375 до 420 г; сформулировать «правило трех сигм».
Вариант 9
1. Вероятность пройти контроль качества на ОТК для изделия, изготовленного рабочим, равна 0,9. Построить ряд распределения СВ X – числа
изделий, прошедших ОТК, из 5-ти проверяемых; записать F ( x) и построить график; найти числовые характеристики M ( X ) и D( X ) ; найти
P(3 ≤ X ≤ 5) .
2. Прибытие посетителей в банк подчиняется одному из теоретических
законов распределения. Предполагая, что в среднем в банк каждые три минуты входит один посетитель, составить ряд распределения СВ X – возможного числа посетителей банка в течение 15 минут ( X принимает значения 0, 1, …, k, …); найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что в течение 15 минут в банк войдут по крайней мере
три посетителя.
3. Чтобы поздравить бабушку, внучка набирает телефонный номер радиопередачи по заявкам, причем каждый последующий вызов производится лишь в том случае, если предыдущий вызов не принят. Вероятность того, что оператор радиостудии ответит, равна 0,7. Построить ряд распределения СВ X – числа выполненных вызовов радиостудии; найти числовые
характеристики M ( X ) и D( X ) ; найти вероятность того, что было выполнено не более двух вызовов.
205
4. В корзине лежат 12 груш, из них 7 южного сорта. Наугад берут пять
груш. СВ X – число груш южного сорта среди взятых. Построить ряд
распределения СВ X ; записать F ( x) и построить график; найти числовые
характеристики M ( X ) и D( X ) ; найти P( X > 4) .
5. Завоз горячего хлеба в магазин происходит с интервалом в два часа,
хлеб раскупается в течение получаса. Покупатель пришел в магазин в случайный момент времени с целью покупки именно горячего хлеба. Найти
закон распределения СВ X – времени ожидания покупателя; записать
f ( x) и F ( x) , построить графики; найти числовые характеристики M ( X ) и
D( X ) ; найти вероятность того, что покупатель будет ждать не больше
20 минут.
6. Среднее время ожидания у бензоколонки автозаправочной станции
равно 10 мин. Найти закон распределения СВ X – времени ожидания; записать f ( x) и F ( x) ; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что время ожидания не превысило 8 минут.
7. При определении расстояния радиолокатором случайные ошибки
распределяются по нормальному закону. Какова вероятность того, что
ошибка при определении расстояния не превысит 20 м, если известно, что
систематических ошибок радиолокатор не допускает, а дисперсия ошибок
равна 1225? Записать f ( x) данной СВ; сформулировать «правило трех
сигм».
Вариант 10
1. Вероятность того, что покупатель совершит покупку в отделе бытовой
химии магазина, составляет 0,6. Построить ряд распределения СВ X –
числа покупателей, совершивших покупку в течение первого часа работы,
если магазин посетило 6 покупателей; записать F ( x) и построить график;
найти числовые характеристики M ( X ) и D( X ) ; найти P(1 ≤ X ≤ 3) .
2. На факультете 1460 студентов. Построить ряд распределения СВ X –
возможного числа студентов, днем рождения которых является 1 января
( X принимает значения 0, 1, …, k, …; високосный год принимать в расчет
не следует); найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что 1 января – день рождения по крайней мере трех студентов.
206
3. Продавец готовит телевизоры к отправке в торговый зал, причем каждый последующий телевизор осматривается только в том случае, если у
предыдущего не найден дефект. Вероятность того, что телевизор не имеет
дефект, равна 0,9. Построить ряд распределения СВ X – числа телевизоров,
осмотренных продавцом; найти числовые характеристики M ( X ) и D( X ) ;
найти вероятность того, что было осмотрено не более трех телевизоров.
4. В коробке с елочными игрушками лежат 6 шариков красного цвета и
4 – синего. Наугад берут 5 шариков. СВ X – число красных среди взятых.
Построить ряд распределения СВ X ; записать F ( x) и построить график;
найти числовые характеристики M ( X ) и D( X ) ; найти P( X < 5) .
5. Шкала рычажных весов, установленных в химической лаборатории,
имеет цену деления в 2 г. При измерении массы компонентов смеси отсчет
делается с точностью до целого деления с округлением в ближайшую сторону. СВ X – ошибка определения массы. Найти закон распределения СВ
X ; записать f ( x) и F ( x) , построить график; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что ошибка определения
массы не превысит 0,5 г.
6. Среднее время выполнения заказа в мастерской по ремонту обуви равно 4 дня. СВ X – время ожидания выполнения заказа. Найти закон распределения СВ X ; записать f ( x) и F ( x) ; найти числовые характеристики
M ( X ) и D( X ) ; найти вероятность того, что заказ был выполнен в течение
трех дней.
7. СВ X – расстояние между автобусными остановками – подчинена
нормальному закону со средним значением, равным 120 метрам, и средним
квадратичным отклонением, равным 8 метрам. Записать f ( x) . Найти вероятность того, что расстояние между остановками будет находиться в пределах 110 – 130 метров; сформулировать «правило трех сигм».
Вариант 11
1. Известно, что в определенном городе 30 % горожан предпочитают добираться на работу личным автотранспортом. Случайно выбраны 5 человек. Построить ряд распределения СВ X – числа людей в выборке, предпочитающих добираться на работу личным автотранспортом; записать
F ( x) и построить график; найдите числовые характеристики M ( X ) и
D( X ) ; найти P(2 ≤ X < 4) .
207
2. Промышленная телевизионная установка состоит из 1000 транзисторов. Вероятность выхода из строя каждого из них равна 0,001. Построить
ряд распределения СВ X – числа вышедших из строя транзисторов, где
X принимает значения 0, 1, …, k, …; найти числовые характеристики
M ( X ) и D( X ) ; найти вероятность выхода из строя хотя бы одного транзистора.
3. Проводится проверка поданных в приемную комиссию заявлений для
выявления нарушений при оформлении (без ограничения числа проверенных заявлений, до обнаружения нарушений). Вероятность нарушений в
оформлении для каждого заявления составляет 0,4. Построить ряд распределения СВ X – числа заявлений, осмотренных при проверке; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что было
проверено не более трех заявлений.
4. В группе спортсменов 5 лыжников и 4 конькобежца. Из нее случайным образом отобрано 3 спортсмена. СВ X – число лыжников среди отобранных. Построить ряд распределения СВ X ; записать F ( x) и построить
график; найти числовые характеристики M ( X ) и D( X ) ; найти P( X < 3) .
5. Маршрутные такси определенного номера отходят от автовокзала регулярно с интервалом 12 мин. Пассажир пришел на автовокзал в случайный
момент времени. Найти закон распределения СВ X – времени ожидания
пассажира; записать f ( x) и F ( x) , построить графики; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что пассажир будет
ждать не больше 5 минут.
6. Среднее время разговора абонента, ежедневно регистрируемое на
АТС, составляет 40 мин. Найти закон распределения СВ X – длительности разговора абонента в сутки; записать f ( x) и F ( x) ; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что абонент разговаривал от 5 до 15 минут.
7. Производят взвешивание вещества без систематических ошибок. Случайная величина результата взвешивания X распределена нормально с
математическим ожиданием 30 кг и средним квадратичным отклонением
3 кг. Записать f ( x) . Найти вероятность того, что следующее взвешивание
отличается от математического ожидания не более чем на 100 г; сформулировать «правило трех сигм».
208
Вариант 12
1. Телевизионный канал рекламирует новый вид стирального порошка.
Вероятность того, что телезритель увидит эту рекламу, оценивается в 0,6.
В случайном порядке выбраны 5 телезрителей. Построить ряд распределения СВ X – числа лиц, видевших рекламу; записать F ( x) и построить график; найти числовые характеристики M ( X ) и D( X ) ; найти P(3 ≤ X < 5) .
2. Среднее число заказов такси, поступающих на диспетчерский пункт в
одну минуту, равно шести. Построить ряд распределения СВ X – числа вызовов, поступивших за одну минуту, где X принимает значения 0, 1, …, k, …;
найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того,
что за минуту поступит 5 вызовов.
3. Фармацевту-стажеру поручено получить смесь определенных компонентов в заданной пропорции (без ограничения числа попыток). Вероятность изготовить требуемую смесь при каждой попытке составляет 0,8.
Построить ряд распределения СВ X – числа попыток; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что было сделано
не более двух попыток.
4. Из 10 книг, стоящих на полке, 6 художественных. Наугад берут 4
книги. СВ X – число художественных книг среди взятых. Построить ряд
распределения СВ X ; записать F ( x) и построить график; найти числовые
характеристики M ( X ) и D( X ) ; найти P( X > 2) .
5. Цена деления шкалы измерительного прибора равна 0,5. Показания
округляют до ближайшего целого деления. Найти закон распределения
СВ X – ошибки округления; записать f ( x) и F ( x) , построить графики;
найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того,
что ошибка округления не превысит 0,05.
6. Среднее время безотказной работы прибора равно 5 часов. Найти закон распределения СВ X – времени безотказной работы прибора; записать
f ( x) и F ( x) ; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что прибор работал безотказно от 5 до 8 часов.
209
7. Для исследования продуктивности определенной породы домашней
птицы измеряют диаметр яиц. Поперечный диаметр яиц представляет собой СВ X , распределенную по нормальному закону, со средним значением 6 см и средним квадратичным отклонением 0,3 см. Записать f ( x) . Найти вероятность того, что диаметр случайно взятого яйца будет находиться
в пределах от 5,7 до 6,2 см; сформулировать «правило трех сигм».
Вариант 13
1. В городе открылись 4 новых магазина. У владельца каждого из них
риск разорения в течение года составляет 0,4. Построить ряд распределения
СВ X – числа разорившихся владельцев магазинов; записать F ( x) и построить график; найти числовые характеристики M ( X ) и D( X ) ; найти
P(2 ≤ X < 4) .
2. Среди семян ржи 0,08 % семян сорняков. Построить ряд распределения
СВ X – числа обнаруженных семян сорняков среди 5000, где X принимает
значения 0, 1, …, k, …; найти числовые характеристики M ( X ) и D( X ) ;
найти вероятность того, что будет обнаружено ровно три семени сорняков.
3. Клиент звонит в парикмахерскую для записи на посещение, причем
каждый последующий вызов производится лишь в том случае, если предыдущий вызов не принят. Вероятность того, что клиенту ответят, равна
0,8. Построить ряд распределения СВ X – числа вызовов парикмахерской
клиентом; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что было выполнено не менее двух вызовов.
4. В подгруппе для занятий английским языком 6 мальчиков и 4 девочки. На конференцию отобраны 4 ученика. СВ X – число мальчиков среди
отобранных учеников. Найти ряд распределения СВ X ; записать F ( x) и
построить график; найти числовые характеристики M ( X ) и D ( X ) ; найти
P(X ≤ 2) .
5. Трамваи данного маршрута идут с интервалом в 6 мин. СВ X – время
ожидания пассажира, пришедшего на остановку. Найти закон распределения СВ X ; записать f ( x) и F ( x) , построить графики; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что пассажир будет
ждать не более 3 минут.
210
6. Среднее время безотказной работы двигателя автомобиля равно 6 годам. Найти закон распределения СВ X – времени безотказной работы двигателя; записать f ( x) и F ( x) ; найти числовые характеристики M ( X ) и
D( X ) ; найти вероятность того, что двигатель работал безотказно более
трех лет.
7. В результате медицинского осмотра призывников установлено, что их
средний вес составляет 70 кг. СВ X – вес призывника – подчинена нормальному закону со средним квадратичным отклонением, равным 8 кг. Записать f ( x) . Найти вероятность того, что вес призывника будет находиться в пределах от 65 до 75 кг; сформулировать «правило трех сигм».
Вариант 14
1. Вероятность сдачи экзамена для каждого из 6-ти студентов равна 0,8.
Построить ряд распределения СВ X – числа студентов, сдавших экзамен;
записать F ( x) и построить график; найти числовые характеристики M ( X )
и D( X ) ; найти P(3 ≤ X ≤ 5).
2. Вероятность выпуска сверла повышенной хрупкости (бракованного)
равна 0,03. Сверла упаковываются в коробки по 100 штук. Построить ряд
распределения СВ X – числа бракованных сверл, где X принимает значения 0, 1, …, k, …; найти числовые характеристики M ( X ) и D( X ) ; найти
вероятность того, что в коробке будет обнаружено менее двух бракованных
сверл.
3. На тренировке начинающий баскетболист пытается попасть мячом в
кольцо с определенного расстояния, причем каждая последующая попытка
производится лишь в том случае, если предыдущая оказалась неудачной.
Вероятность того, что баскетболист попадет в кольцо при одном броске,
равна 0,8. Построить ряд распределения СВ X – числа попыток; найти
числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что было выполнено не менее двух попыток.
4. В коробке 10 фишек, среди которых 6 – желтого цвета. Наугад извлекают 4 фишки. СВ X – число желтых фишек среди извлеченных. Построить ряд распределения СВ X ; записать F ( x) и построить график; найти
числовые характеристики M ( X ) и D( X ) ; найти P( X > 3) .
211
5. Минутная стрелка часов перемещается скачком в конце каждой минуты. СВ X – ошибка при определении точного времени. Найти закон распределения СВ X ; записать f ( x) и F ( x) , построить графики; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что ошибка не превысит 10 секунд.
6. Среднее время ожидания получения нового паспорта в паспортном
столе для каждого гражданина равно 14 дням. СВ X – время ожидания
получения нового паспорта. Найти закон распределения СВ X ; записать
f ( x) и F ( x) ; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того, что гражданин будет ждать не более 12 дней.
7. Средняя продолжительность эксплуатации электрических лампочек
равна 750 часам. СВ Х – время эксплуатации лампочки – подчинена нормальному закону со средним квадратичным отклонением, равным 80 часам. Записать f ( x) . Найти вероятность того, что лампочка будет гореть от
600 до 720 часов; сформулировать «правило трех сигм».
Вариант 15
1. Вероятность того, что покупателю потребуется шампунь данной марки, равна 0,8. В отдел парфюмерии вошли 4 покупателя. Построить ряд
распределения СВ X – числа покупателей, которым потребовался шампунь данной марки; записать F ( x) и построить график; найти числовые характеристики M ( X ) и D( X ) ; найти P(4 ≤ X < 6) .
2. Книга в 500 страниц имеет 100 опечаток. Построить ряд распределения СВ X – числа опечаток на одной странице, где X принимает значения 0, 1, …, k, …; найти числовые характеристики M ( X ) и D( X ) ; найти
вероятность того, что на случайно выбранной странице окажется не менее
трех опечаток.
3. Проводится повторная проверка выполненных абитуриентами работ
для выявления незафиксированных ошибок (без ограничения числа проверенных работ, до обнаружения ошибок). Вероятность выявления незафиксированных ошибок для каждой работы составляет 0,1. Построить ряд
распределения СВ X – числа работ, рассмотренных при повторной проверке; найти числовые характеристики M ( X ) и D( X ) ; найти вероятность
того, что было осмотрено не менее трех работ.
212
4. На сборку поступило 8 моторов с двух конвейеров (с первого
конвейера поступило 4 мотора). Наудачу берут 5 моторов. СВ X – число
моторов с первого конвейера, поступивших на сборку. Построить ряд распределения СВ X ; записать F ( x) и построить график; найти числовые
характеристики M ( X ) и D( X ) ; найти P( X < 3).
5. Электропоезда в определенном направлении уходят с вокзала с интервалов в 25 минут. Пассажир пришел на вокзал в случайный момент времени. Найти закон распределения СВ X – времени ожидания пассажира; записать f ( x) и F ( x) , построить графики; найти числовые характеристики
M ( X ) и D( X ) ; найти вероятность того, что пассажир будет ждать не более
15 минут.
6. Среднее время ожидания выполнения заявки на ремонт телевизора в
телеателье равно восьми дням. СВ X – время ожидания клиентом выполнения заявки. Найти закон распределения СВ X ; записать f ( x) и F ( x) ;
найти числовые характеристики M ( X ) и D( X ) ; найти вероятность того,
что клиент ждал не более пяти дней.
7. СВ X – размер выручки торгового киоска за 1 день – подчинена нормальному закону распределения с M ( X ) = 400 ден. ед. и D( X ) = 100 . Записать f ( x) . Найти вероятность того, что дневная выручка будет находиться в пределах от 390 до 420 ден. ед.; сформулировать «правило трех
сигм».
213
ЛИТЕРАТУРА
1.
Гмурман, В.Е. Руководство к решению задач по теории вероятностей и математической статистике: учеб. пособие для студентов вузов. – 5-е изд., стер. /
В.Е. Гмурман. – М.: Высш. шк., 1999.
2.
Гмурман, В.Е. Теория вероятностей и математическая статистика: учеб. пособие
для студентов вузов. 6-е изд., стер. / В.Е. Гмурман. – М.: Высш. шк., 1988.
3.
Гурский, Е.М. Сборник задач по теории вероятностей и математической статистике / Е.М. Гурский. – Минск: Выш. шк., 1984.
4.
Гусак, А.А. Теория вероятностей: справ. пособие к решению задач / А.А. Гусак,
Е.А. Бричикова. – 6-е изд. – Минск: ТетраСистемс, 2007.
5.
Калинина, В.Н. Математическая статистика: учебник для техникумов. – 2-е изд.,
стер. / В.Н. Калинина, В.Ф. Панкин. – М.: Высш. шк., 1998.
6.
Теория вероятностей в примерах и задачах: учеб. пособие / В.А. Колемаев [и др.];
ГГУ. – М., 2001.
7.
Кремер, Н.Ш. Теория вероятностей и математическая статистика: учебник для
вузов. – 2-е изд., перераб. и доп. / Н. Ш. Кремер – М.: ЮНИТИ-ДАНА, 2004.
8.
Рябушко, А.П. Индивидуальные задания по высшей математике. Операционное
исчисление. Элементы теории устойчивости. Теория вероятностей. Математическая статистика: учеб. пособие / А.П. Рябушко. – Минск: Выш. шк., 2006.
9.
Мацкевич, И.П. Высшая математика. Теория вероятностей и математическая
статистика / И.П. Мацкевич, Г.П. Свирид. – Минск: Выш. шк., 1993.
10. Основы статистики с элементами теории вероятностей для экономистов: руководство для решения задач / Л.И. Ниворожкина [и др.] – Ростов н/Д: Феникс,
1999.
11. Сборник задач и упражнений по высшей математике: Теория вероятностей и математическая статистика: учеб. пособие / под общ. ред. Г.П. Свирида. – Минск:
Выш. шк., 1996.
12. Эддоус, М. Методы принятия решений: пер. с англ. / М. Эддоус, Р. Стэнсфилд;
под ред. чл-корр. РАН И.И. Елисеевой. – М.: Аудит, ЮНИТИ, 1997.
13. Высшая математика: учеб.-метод. комплекс. В 3 ч. Ч. 1. / сост. А.В. Капусто. –
Новополоцк: ПГУ, 2007. – 260 с.
14. Высшая математика: учеб.-метод. комплекс. В 3 ч. Ч. 2. / сост. А.В. Капусто –
Новополоцк: ПГУ, 2008. – 240 с.
214
ПРИЛОЖЕНИЯ
Приложение 1
Таблица значений функции ϕ( x) =
0
1
2
3
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
0,3989
0,3970
0,3910
0,3814
0,3683
0,3521
0,3332
0,3123
0,2897
0,2661
0,3989
0,3965
0,3902
0,3802
0,3668
0,3503
0,3312
0,3101
0,2874
0,2637
0,3989
0,3961
0,3894
0,3790
0,3652
0,3485
0,3292
0,3079
0,2850
0,2613
0,3988
0,3956
0,3885
0,3778
0,3637
0,3467
0,3271
0,3056
0,2827
0,2589
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
0,2420
0,2179
0,1942
0,1714
0,1497
0,1295
0,1109
0,0940
0,0790
0,0656
0,2396
0,2155
0,1919
0,1691
0,1476
0,1276
0,1092
0,0925
0,0775
0,0644
0,2371
0,2131
0,1895
0,1669
0,1456
0,1257
0,1074
0,0909
0,0761
0,0632
0,2347
0,2107
0,1872
0,1647
0,1435
0,1238
0,1057
0,0893
0,0748
0,0620
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
0,0540
0,0440
0,0355
0,0283
0,0224
0,0175
0,0136
0,0104
0,0079
0,0060
0,0529
0,0431
0,0347
0,0277
0,0219
0,0171
0,0132
0,0101
0,0077
0,0058
0,0519
0,0422
0,0339
0,0270
0,0213
0,0167
0,0129
0,0099
0,0075
0,0056
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
0,0044
0,0033
0,0024
0,0017
0,0012
0,0009
0,0006
0,0004
0,0003
0,0002
0,0043
0,0032
0,0023
0,0017
0,0012
0,0008
0,0006
0,0004
0,0003
0,0002
0,0042
0,0031
0,0022
0,0016
0,0012
0,0008
0,0006
0,0004
0,0003
0,0002
4
6
7
8
9
0,3986 0,3984
0,3951 0,3945
0,3876 0,3867
0,3765 0,3752
0,3621 0,3605
0,3448 0,3429
0,3251 0,3230
0,3034 0,3011
0,2803 0,2780
0,2565 0,25414
0,3982
0,3939
0,3857
0,3739
0,3589
0,3410
0,3209
0,2989
0,2756
0,2516
0,3980
0,3932
0,3847
0,3726
0,3572
0,3391
0,3187
0,2966
0,2732
0,2492
0,3977
0,3925
0,3836
0,3712
0,3555
0,3372
0,3166
0,2943
0,2709
0,2468
0,3973
0,3918
0,3825
0,3697
0,3538
0,3352
0,3144
0,2920
0,2685
0,2444
0,2323
0,2083
0,1849
0,1629
0,1415
0,1219
0,1040
0,0878
0,0734
0,0608
0,2299
0,2059
0,1826
0,1604
0,1394
0,1200
0,1023
0,0863
0,0721
0,0596
0,2275
0,2036
0,1804
0,1582
0,1374
0,1182
0,1006
0,0848
0,0707
0,0584
0,2251
0,2012
0,1781
0,1561
0,1354
0,1163
0,0989
0,0833
0,0694
0,0573
0,2227
0,1989
0,1758
0,1539
0,1334
0,1145
0,0973
0,0818
0,0681
0,0562
0,2203
0,1965
0,1736
0,1518
0,1315
0,1127
0,0957
0,0804
0,0669
0,0551
0,0508
0,0413
0,0332
0,0264
0,0208
0,0163
0,0126
0,0096
0,0073
0,0055
0,0498
0,0404
0,0325
0,0258
0,0203
0,0158
0,0122
0,0093
0,0071
0,0053
0,0488
0,0396
0,0317
0,0252
0,0198
0,0154
0,0119
0,0091
0,0069
0,0051
0,0478
0,0387
0,0310
0,0246
0,0194
0,0151
0,0116
0,0088
0,0067
0,0050
0,0468
0,0379
0,0303
0,0241
0,0189
0,0147
0,0113
0,0086
0,0065
0,0048
0,0459
0,0371
0,0297
0,0235
0,0184
0,0143
0,0110
0,0084
0,0063
0,0047
0,0449
0363
0,0290
0,0229
0,0180
0,0139
0,0107
0,0081
0,0061
0,0043
0,0040
0,0030
0,0022
0,0016
0,0011
0,0008
0,0005
0,0004
0,0003
0,0002
0,0039
0,0029
0,0021
0,0015
0,0011
0,0008
0,0005
0,0004
0,0003
0,0002
0,0038
0,0028
0,0020
0,0015
0,0010
0,0007
0,0005
0,0004
0,0002
0,0002
0,0037
0,0027
0,0020
0,0014
0,0010
0,0007
0,0005
0,0003
0,0002
0,0002
0,0036
0,0026
0,0019
0,0014
0,0010
0,0007
0,0005
0,0003
0,0002
0,0002
0,0035
0,0025
0,0018
0,0013
0,0009
0,0007
0,0005
0,0003
0,0002
0,0001
0,0034
0,0025
0,0018
0,0013
0,0009
0,0006
0,0004
0,0003
0,0002
0,0001
215
5
1 − x 2 /2
e
2π
Приложение 2
Таблица значений функции Φ( x) =
x
2
2
∫ e−t /2 dt
2π 0
x
Φ( x)
x
Φ( x)
x
Φ( x)
x
Φ( x)
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,10
0,11
0,12
0,13
0,14
0,15
0,16
0,17
0,18
0,19
0,20
0,21
0,22
0,23
0,24
0,25
0,26
0,27
0,28
0,29
0,30
0,31
0,32
0,33
0,34
0,35
0,36
0,37
0,38
0,39
0,40
0,41
0,42
0,43
0,44
0,45
0,0000
0,0080
0,0160
0,0239
0,0319
0,0399
0,0478
0,0558
0,0638
0,0717
0,0797
0,0876
0,0955
0,1034
0,1113
0,1192
0,1271
0,1350
0,1428
0,1507
0,1585
0,1663
0,1741
0,1819
0,1897
0,1974
0,2051
0,2128
0,2205
0,2282
0,2358
0,2434
0,2510
0,2586
0,2661
0,2737
0,2812
0,2886
0,2961
0,3035
0,3108
0,3182
0,3255
0,3328
0,3401
0,3473
0,46
0,47
0,48
0,49
0,50
0,51
0,52
0,53
0,54
0,55
0,56
0,57
0,58
0,59
0,60
0,61
0,62
0,63
0,64
0,65
0,66
0,67
0,68
0,69
0,70
0,71
0,72
0,73
0,74
0,75
0,76
0,77
0,78
0,79
0,80
0,81
0,82
0,83
0,84
0,85
0,86
0,87
0,88
0,89
0,90
0,91
0, 3545
0,3616
0,3688
0,3759
0,3829
0,3899
0,3969
0,4039
0,4108
0,4177
0,4245
0,4313
0,4381
0,4448
0,4515
0,4581
0,4647
0,4713
0,4778
0,4843
0,4907
0,4971
0,5035
0,5098
0,5161
0,5223
0,5285
0,5346
0,5407
0,5467
0,5527
0,5587
0,5646
0,5705
0,5763
0,5821
0,5878
0,5935
0,5991
0,6047
0,6102
0,6157
0,6211
0,6265
0,6319
0,6372
0,92
0,93
0,94
0,95
0,96
0,97
0,98
0,99
1,00
1,01
1,02
1,03
1,04
1,05
1,06
1,07
1,08
1,09
1,10
1,11
1,12
1,13
1,14
1,15
1,16
1,17
1,18
1,19
1,20
1,21
1,22
1,23
1,24
1,25
1,26
1,27
1,28
1,29
1,30
1,31
1,32
1,33
1,34
1,35
1,36
1,37
0,6424
0,6476
0,6528
0,6579
0,6629
0,6680
0,6729
0,6778
0,6827
0,6875
0,6923
0,6970
0,7017
0,7063
0,7109
0,7154
0,7199
0,7243
0,7287
0,7330
0,7373
0,7415
0,7457
0,7499
0,7540
0,7580
0,7620
0,7660
0,7699
0,7737
0,7775
0,7813
0,7850
0,7887
0,7923
0,7959
0,7995
0,8029
0,8064
0,8098
0,8132
0,8165
0,8198
0,8230
0,8262
0,8293
1,38
1,39
1,40
1,41
1,42
1,43
1,44
1,45
1,46
1,47
1,48
1,49
1,50
1,51
1,52
1,53
1,54
1,55
1,56
1,57
1,58
1,59
1,60
1,61
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,71
1,72
1,73
1,74
1,75
1,76
1,77
1,78
1,79
1,80
1,81
1,82
1,83
0,8324
0,8355
0,8385
0,8415
0,8444
0,8473
0,8501
0,8529
0,8557
0,8584
0,8611
0,8638
0,8664
0,8690
0,8715
0,8740
0,8764
0,8789
0,8812
0,8836
0,8859
0,8882
0,8904
0,8926
0,8948
0,8969
0,8990
0,9011
0,9031
0,9051
0,9070
0,9090
0,9109
0,9127
0,9146
0,9164
0,9181
0,9199
0,9216
0,9233
0,9249
0,9265
0,9281
0,9297
0,9312
0,9328
216
Приложение 2 (окончание)
x
Φ( x)
x
Φ( x)
x
Φ( x)
1,84
1,85
1,86
1,87
1,88
1,89
1,90
1,91
1,92
1,93
1,94
1,95
0,9342
0,9357
0,9371
0,9385
0,9399
0,9412
0,9426
0,9439
0,9451
0,9464
0,9476
0,9488
1,96
1,97
1,98
1,99
2,00
2,05
2,10
2,15
2,20
2,25
2,30
2,35
0,9500
0,9512
0,9523
0,9534
0,9545
0,9596
0,9643
0,9684
0,9722
0,9756
0,9786
0,9812
2,40
2,45
2,50
2,55
2,60
2,65
2,70
2,75
2,80
2,85
2,90
2,95
0,9836
0,9857
0,9876
0,9892
0,9907
0,9920
0,9931
0,9940
0,9949
0,9956
0,9963
0,9968
x
Φ( x)
3,00
3,10
3,20
3,30
3,40
3,50
3,60
3,70
3,80
3,90
4,00
0,99730
0,99806
0,99863
0,99903
0,99933
0,99953
0,99968
0,99978
0,99986
0,99990
0,99994
Приложение 3
Таблица значений q = q ( γ , n)
γ
n
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
0,95
0,99
0,999
1,37
1,09
0,92
0,80
0,71
0,65
0,59
0,55
0,52
0,48
0,46
0,44
0,42
0,40
0,39
2,67
2,01
1,62
1,38
1,20
1,08
0,98
0,90
0,83
0,78
0,73
0,70
0,66
0,63
0,60
5,64
3,88
2,98
2,42
2,06
1,80
1,60
1,45
1,33
1,23
1,15
1,07
1,01
0,96
0,92
γ
n
20
25
30
35
40
45
50
60
70
80
90
100
150
200
250
217
0,95
0,99
0,999
0,37
0,32
0,28
0,26
0,24
0,22,
0,21
0,188
0,174
0,161
0,151
0,143
0,115
0,099
0,089
0,58
0,49
0,43
0,38
0,35
0,32
0,30
0,269
1,245
0,226
0,211
0,198
0,160
0,136
0,120
0,88
0,73
0,63
0,56
0,50
0,46
0,43
0,38
0,34
0,31
0,29
0,27
0,211
0,185
0,162
Приложение 4
Критические точки распределения Стьюдента
Число
степеней
свободы
Уровень значимости α (двусторонняя критическая область)
0,25
0,10
0,25
0,025
0,01
0,005
0,001
1
2
3
4
5
1,000
0,816
0,765
0,741
0,727
3,078
1,886
1,638
1,533
1,476
6,314
2,920
2,353
2,132
2,015
12,706
4,303
3,182
2,776
2,571
31,821
6,965
4,541
3,747
3,365
63,657
9,925
5,841
4,604
4,032
318
22,3
10,2
7,173
5,893
6
7
8
9
10
0,718
0,711
0,706
0,703
0,700
1,440
1,415
1,397
1,383
1,372
1,943
1,895
1,860
1,833
1,812
2,447
2,365
2,306
2,262
2,228
3,143
2,998
2,896
2,821
2,764
3,707
3,499
3,355
3,250
3,169
5,208
4,785
4,501
4,297
4,144
11
12
13
14
15
0,697
0,695
0,694
0,692
0,691
1,363
1,356
1,350
1,345
1,341
1,796
1,782
1,771
1,761
1,753
2,201
2,179
2,160
2,145
2,131
2,718
2,681
2,650
2,624
2,602
3,106
3,055
3,012
2,977
2,947
4,025
3,930
3,852
3,787
3,733
16
17
18
19
20
0,690
0,689
0,688
0,688
0,687
1,337
1,333
1,330
1,328
1,325
1,746
1,740
1,734
1,729
1,725
2,120
2,110
2,101
2,093
2,086
2,583
2,567
2.552
2,539
2,528
2,921
2,898
2,878
2,861
2,845
3,686
3,646
3,610
3,579
3,552
21
22
23
24
25
0,686
0,686
0,685
0,685
0,684
1,323
1,321
1,319
1,318
1,316
1,721
1,717
1,714
1,711
1,708
2,080
2,074
2,069
2,064
2,060
2,518
2,508
2,500
2,492
2,485
2,831
2,819
2,807
2,797
2,787
3,527
3,505
3,485
3,467
3,450
26
27
28
29
30
0,684
0,684
0,683
0,683
0,683
1,315
1,314
1,313
1,311
1,310
1,706
1,703
1,701
1,699
1,697
2,056
2,052
2,048
2,045
2,042
2,479
2,473
2,467
2,462
2,457
2,779
2,771
2,763
2,756
2,750
3,435
3,421
3,408
3,396
3,385
40
60
120
0,681
0,679
0,677
0,674
1,303
1,296
1,289
1,282
1,684
1,671
1,658
1,645
2,021
2,000
1,980
1,960
2,423
2,390
2,358
2,326
2,704
2,660
2,617
2,576
3,307
3,232
3,160
3,090
0,125
0,05
0,125
0,0125
0,025
0,0025
0,0005
k
∞
Уровень значимости α (односторонняя критическая область)
218
Приложение 5
Критические точки распределения Фишера Fα (k1, k2 )
α = 0, 05
k1
k2
1
2
3
4
5
6
7
8
9
1
2
3
4
5
161,4
18,51
10,13
7,71
6,61
199,5
19,00
9,55
6,94
5,79
215,7
19,16
9,28
6,59
5,41
224,6
19,25
9,12
6,39
5,19
230,2
19,30
9,01
6,26
5,05
234,0
19,33
8,94
6,16
4,95
236,8
19,35
8,89
6,09
4,88
238,9
19,37
8,85
6,04
4,82
240,5
19,38
8,81
6,00
4,77
6
7
8
9
10
5,99
5,59
5,32
5,12
4,96
5,14
4,74
4,46
4,26
4,10
4,76
4,35
4,07
3,86
3,71
4,53
4,12
3,84
3,63
3,48
4,39
3,97
3,69
3,48
3,33
4,28
3,87
3,58
3,37
3,22
4,21
3,79
3,50
3,29
3,14
4,15
3,73
3,44
3,23
3,07
4,10
3,68
3,39
3,18
3,02
11
12
13
14
15
4,84
4,75
4,67
4,60
4,54
3,98
3,89
3,81
3,74
3,68
3,59
3,49
3,41
3,34
3,29
3,36
3,26
3,18
3,11
3,06
3,20
3,11
3,03
2,96
2,90
3,09
3,00
2,92
2,85
2,79
3,01
2,91
2,83
2,76
2,71
2,95
2,85
2,77
2,70
2,64
2,90
2,80
2,71
2,65
2,59
16
17
18
19
20
4,49
4,45
4,41
4,38
4,35
3,63
3,59
3,55
3,52
3,49
3,24
3,20
3,16
3,13
3,10
3,01
2,96
2,93
2,90
2,87
2,85
2,81
2,77
2,74
2,71
2,74
2,70
2,66
2,63
2,60
2,66
2,61
2,58
2,54
2,51
2,59
2,55
2,51
2,48
2,45
2,54
2,49
2,46
2,42
2,39
21
22
23
24
25
4,32
4,30
4,28
4,26
4,24
3,47
3,44
3,42
3,40
3,39
3,07
3,05
3,03
3,01
2,99
2,84
2,82
2,80
2,78
2,76
2,68
2,66
2,64
2,62
2,60
2,57
2,55
2,53
2,51
2,49
2,49
2,46
2,44
2,42
2,40
2,42
2,40
2,37
2,36
2,34
2,37
2,34
2,32
2,30
2,28
26
27
28
29
30
4,23
4,21
4,20
4,18
4,17
3,37
3,35
3,34
3,33
3,32
2,98
2,96
2,95
2,93
2,92
2,74
2,73
2,71
2,70
2,69
2,59
2,57
2,56
2,55
2,53
2,47
2,46
2,45
2,43
2,42
2,39
2,37
2,36
2,35
2,33
2,32
2,31
2,29
2,28
2,27
2,27
2,25
2,24
2,22
2,21
40
60
120
4,08
4,00
3,92
3,84
3,23
3,15
3,07
3,00
2,84
2,76
2,68
2,60
2,61
2,53
2,45
2,37
2,45
2,37
2,29
2,21
2,34
2,25
2,17
2,10
2,25
2,17
2,09
2,01
2,18
2,10
2,02
1,94
2,12
2,04
1,96
1,88
∞
219
Приложение 5 (окончание)
Критические точки распределения Фишера Fα (k1, k2 )
α = 0, 05
k1
k2
10
12
15
20
24
30
40
60
120
1
2
3
4
5
241,9
19,40
8,79
5,96
4,74
243,9
19,41
8,74
5,91
4,68
245,9
19,43
8,70
5,86
4,62
248,0
19,45
8,66
5,80
4,56
249,1
19,45
8,64
5,77
4,53
250,1
19,46
8,62
5,75
4,50
251,1
19,47
6,59
5,72
4,46
252,2
19,48
6,57
5,69
4,43
253,3
19,49
8,55
5,66
4,40
6
7
8
9
10
4,06
3,64
3,35
3,14
2,98
4,00
3,57
3,28
3,07
3,01
3,04
3,51
3,22
3,01
2,85
3,87
3,44
3,15
2,94
2,77
3,84
3,41
3,12
2,90
2,74
3,81
3,38
3,08
2,86
2,70
3,77
3,34
3,04
2,83
2,66
3,74
3,30
3,01
2,79
2,62
3,30
3,27
2,97
2,75
2,58
11
12
13
14
15
2,85
2,75
2,67
2,60
2,54
2,79
2,69
2,60
2,53
2,48
2,72
2,62
2,53
2,46
2,40
2,65
2,54
2,46
2,39
2,33
2,61
2,51
2,42
2,35
2,29
2,57
2,47
2,38
2,31
2,25
2,53
2,43
2,34
2,27
2,20
2,49
2,38
2,30
2,22
2,16
2,45
2,34
2,25
2,18
2,11
16
17
18
19
20
2,49
2,45
2,41
2,38
2,35
2,42
2,38
2,34
2,31
2,28
2,35
2,31
2,27
2,23
2,20
2,28
2,23
2,19
2,16
2,12
2,24
2,19
2,15
2,11
2,08
2,19
2,15
2,11
2,07
2,04
2,15
2,10
2,06
2,03
1,99
2,11
2,06
2,02
1,98
1,95
2,06
2,01
1,97
1,93
1,90
21
22
23
24
25
2,32
2,30
2,27
2,25
2,24
2,25
2,23
2,20
2,18
2,16
2,18
2,15
2,13
2,11
2,09
2,10
2,07
2,05
2,03
2,01
2,05
2,03
2,01
1,98
1,96
2,01
1,98
1,96
1,94
1,92
1,96
1,94
1,91
1,89
1,87
1,92
1,89
1,86
1,84
1,82
1,87
1,84
1,81
1,79
1,77
26
27
28
29
30
2,22
2,20
2,19
2,18
2,16
2,15
2,13
2,12
2,10
2,09
2,07
2,06
2,04
2,03
2,01
1,99
1,97
1,96
1,94
1,93
1,95
1,93
1,91
1,90
1,89
1,90
1,88
1,87
1,85
1,84
1,85
1,84
1,82
1,81
1,79
1,80
1,79
1,77
1,75
1,74
1,75
1,73
1,71
1,70
1,68
40
60
120
2,08
1,99
1,91
1,83
2,00
1,92
1,83
1,75
1,92
1,84
1,75
1,67
1,84
1,75
1,66
1,57
1,79
1,70
1,61
1,52
1,74
1,65
1,55
1,46
1,69
1,59
1,50
1,39
1,64
1,53
1,43
1,32
1,58
1,47
1,35
1,22
∞
220
СОДЕРЖАНИЕ
Введение .................................................................................................................................... 3
Рабочая программа ................................................................................................................... 4
Теоретический материал ......................................................................................................... 7
Раздел 8. Теория вероятностей ............................................................................................... 8
1. Элементы комбинаторики .................................................................................................. 8
1.1. Перестановки ........................................................................................................... 9
1.2. Размещения ............................................................................................................ 11
1.3. Сочетания ............................................................................................................... 12
1.4. Задача о выборке ................................................................................................... 13
Вопросы для самоконтроля .......................................................................................... 14
2. События. Операции над событиями ................................................................................ 15
2.1. События. Виды событий. Пространство элементарных
событий .......................................................................................................................... 15
2.2. Операции над событиями и их свойства ............................................................. 16
Вопросы для самоконтроля .......................................................................................... 18
3. Различные определения вероятности. Свойства вероятности ...................................... 19
3.1. Статистическое определение вероятности ......................................................... 19
3.2. Классическое определение вероятности. Свойства вероятности ..................... 19
3.3. Геометрическое определение вероятности ......................................................... 22
3.4. Аксиоматическое построение теории вероятностей.......................................... 25
Вопросы для самоконтроля .......................................................................................... 26
4. Условная вероятность. Теорема умножения вероятностей. Полная вероятность ...... 27
Вопросы для самоконтроля .......................................................................................... 30
5. Формула Байеса ................................................................................................................. 31
Вопросы для самоконтроля .......................................................................................... 32
6. Последовательность независимых испытаний. Формула Бернулли. ........................... 33
6.1. Вероятность появления события некоторое число раз ...................................... 34
6.2. Наивероятнейшее число наступлений события ................................................. 36
6.3. Необходимое число опытов для наступления события ..................................... 37
6.4. Локальная и интегральная теоремы Лапласа ..................................................... 37
Вопросы для самоконтроля .......................................................................................... 40
7. Формула Пуассона. Простейший поток событий .......................................................... 41
Вопросы для самоконтроля.......................................................................................... 43
8. Понятие случайной величины.......................................................................................... 44
Вопросы для самоконтроля .......................................................................................... 45
9. Способы задания дискретной случайной величины ...................................................... 45
9.1. Ряд распределения................................................................................................. 45
9.2. Многоугольник распределения ............................................................................ 46
9.3. Функция распределения вероятностей................................................................ 57
9.4. Операции над ДСВ ................................................................................................ 49
Вопросы для самоконтроля .......................................................................................... 50
10. Системы случайных величин ......................................................................................... 51
Вопросы для самоконтроля .......................................................................................... 55
221
11. Числовые характеристики ДСВ ..................................................................................... 55
11.1. Математическое ожидание ................................................................................. 55
11.2. Дисперсия............................................................................................................. 57
11.3. Теоретические моменты ..................................................................................... 59
Вопросы для самоконтроля .......................................................................................... 60
12. Основные законы распределения ДСВ ......................................................................... 60
12.1. Биномиальный закон распределения ................................................................ 60
12.2. Закон распределения Пуассона .......................................................................... 62
12.3. Геометрический закон распределения .............................................................. 64
12.4. Гипергеометрический закон распределения .................................................... 67
Вопросы для самоконтроля .......................................................................................... 68
13. Непрерывные случайные величины .............................................................................. 69
Вопросы для самоконтроля .......................................................................................... 75
14. Числовые характеристики непрерывных случайных величин ................................... 76
14.1. Математическое ожидание ................................................................................. 76
14.2. Дисперсия............................................................................................................. 77
14.3. Теоретические моменты ..................................................................................... 77
Вопросы для самоконтроля .......................................................................................... 78
15. Числовые характеристики системы случайных величин ............................................ 78
Вопросы для самоконтроля .......................................................................................... 82
16. Основные законы распределения непрерывных случайных величин ....................... 83
16.1. Равномерный закон распределения ................................................................... 83
16.2. Показательный закон распределения ................................................................ 86
16.3. Нормальный закон распределения .................................................................... 88
16.4. Распределения, связанные с нормальным распределением ............................ 92
16.4.1. Распределение χ2 (хи-квадрат или распределение Пирсона)............ 92
16.4.2. Распределение Стьюдента ( t -распределение)..................................... 94
16.4.3. Распределение Фишера ( F -распределение) ....................................... 95
Вопросы для самоконтроля .......................................................................................... 96
17. Закон больших чисел и предельные теоремы .............................................................. 98
Вопросы для самоконтроля ........................................................................................ 107
Вопросы к экзамену .................................................................................................... 108
Раздел 9. Математическая статистика ............................................................................... 109
1. Генеральная совокупность и выборка ........................................................................... 109
Вопросы для самоконтроля ........................................................................................ 111
2. Вариационные ряды ........................................................................................................ 112
Вопросы для самоконтроля ........................................................................................ 117
3. Числовые характеристики выборочной совокупности ................................................ 118
3.1. Средние величины................................................................................................ 118
3.2. Дисперсия.............................................................................................................. 122
3.3. Начальные и центральные моменты вариационного ряда ............................... 124
Вопросы для самоконтроля ........................................................................................ 128
4. Основные характеристики генеральной совокупности и их связь
с характеристиками выборочной совокупности ............................................................... 128
Вопросы для самоконтроля ........................................................................................ 130
222
5. Точечные оценки параметров распределения генеральной совокупности ............... 130
Вопросы для самоконтроля ........................................................................................ 132
6. Методы нахождения точечных оценок ......................................................................... 132
6.1. Метод моментов ................................................................................................... 132
6.2. Метод наибольшего правдоподобия .................................................................. 135
Вопросы для самоконтроля ........................................................................................ 138
7. Интервальные оценки параметров нормального закона распределения .................. 139
Вопросы для самоконтроля ........................................................................................ 141
8. Проверка статистических гипотез ................................................................................. 142
Вопросы для самоконтроля ........................................................................................ 148
9. Дисперсионный анализ ................................................................................................... 149
Вопросы для самоконтроля ................................................................................................. 155
10. Корреляционно-регрессионный анализ ...................................................................... 155
10.1. Понятие функциональной, стохастической и корреляционной
зависимости ................................................................................................................. 155
10.2. Поле корреляции. Выборочный линейный коэффициент
корреляции ................................................................................................................... 156
10.3. Построение уравнения линейной регрессии методом
наименьших квадратов ............................................................................................... 160
Вопросы для самоконтроля ................................................................................................. 163
Вопросы к экзамену ............................................................................................................. 164
Задания для практических занятий и самостоятельного решения .................................. 165
1. Элементы комбинаторики ...............................................................................................................166
2. Классическое и геометрическое определения вероятности ........................................ 168
3. Теорема умножения вероятностей. Полная вероятность. Формула Байеса .............. 171
4. Формула Бернулли. Локальная и интегральная теоремы Лапласа.
Асимптотическая формула Пуассона................................................................................. 174
5. Построение законов распределения дискретных случайных величин.
Числовые характеристики дискретных случайных величин .......................................... 176
6. Непрерывные случайные величины. Числовые характеристики непрерывных
случайных величин .............................................................................................................. 181
7. Системы случайных величин. Числовые характеристики .......................................... 184
8. Закон больших чисел ...................................................................................................... 186
9. Ряд распределения. Числовые характеристики выборочной
совокупности ........................................................................................................................ 189
10. Точечные и интервальные оценки параметров распределения
генеральной совокупности .................................................................................................. 191
11. Метод дисперсионного анализа. Корреляционно-регрессионный
анализ .................................................................................................................................... 193
Индивидуальное домашнее задание «Основные законы распределения случайных
величин»............................................................................................................................................ 196
Литература ............................................................................................................................ 214
Приложения ........................................................................................................................... 215
223
Учебное издание
ВЫСШАЯ МАТЕМАТИКА
Учебно-методический комплекс
для студентов экономических специальностей
В трех частях
Часть 3
Теория вероятностей
Математическая статистика
КАПУСТО Анна Владимировна
Редактор Т. В. Булах
Дизайн обложки Л. И. Вайдашевич
________________________________________________________________________
Подписано в печать 12.12.2011. Формат 60×84 1/16. Бумага офсетная. Ризография.
Усл. печ. л. 12,99.
Уч.-изд. л. 11,8.
Тираж 150 экз.
Заказ 1930.
_________________________________________________________________________
Издатель и полиграфическое исполнение –
учреждение образования «Полоцкий государственный университет».
ЛИ № 02330/0548568 от 26.06.2009
ЛП № 02330/0494256 от 27.05.2009
Ул. Блохина, 29, 211440, г. Новополоцк.
224
Download