Законы распределения случайных величин ЛЕКЦИЯ 6

advertisement
ЛЕКЦИЯ 6
по курсу «Математические методы в инновационной и управленческой
деятельности»
Законы распределения случайных
величин
•
•
•
•
Пример. Закон Ома.
U = R*I
U – напряжение, R- сопротивление, I – сила тока
При постоянном значении R сопротивления, для
каждого значения I определенное значение U
(детерминированное явление).
U
U=R*I
I
• Пример. На токарном автомате изготавливаются валы привода, у
каждого из которых контролируется, например, наружный диаметр,
имеющий согласно конструкции и настройке станка номинальный
размер а (мм).
• Измерение последовательно выпускаемых валов дает величины,
колеблющиеся около номинального размера (различие в сырье,
вибрации станка, температурные колебания, уровень квалификации
обслуживающего персонала).
• Диаметр вала привода D невозможно установить заранее.
• Процесс обусловлен случаем (случайные являния).
D, мм
а+а1
а
а+а2
0 1 2 3 4
10
t, мин
Введение
• Случайный эксперимент теоретически можно
воспроизвести неограниченное число раз.
• Т.о. при рассмотрении случайных явлений имеем
дело с массовыми явлениями.
• В основе массовых явлений лежат некоторые
закономерности (хотя исход каждого конкретного
испытания предсказать невозможно).
• Теория вероятностей изучает эти закономерности.
Что означает слово «вероятность»?
• Вероятность (probability) — это возможность
наступления некоторого события.
• Можно говорить о вероятности того, что из колоды
карт будет вынута карта черной масти, что человек
предпочтет один продукт другому или что новый
продукт, появившийся на рынке, будет пользоваться
спросом.
• В каждом из этих вариантов вероятность является
числовой величиной, лежащей в интервале от 0 до 1
включительно.
• Вероятность события, которое никогда не может
произойти (невозможное событие), равна 0, а
вероятность события, которое происходит постоянно
(достоверное событие), равна 1.
В простейшем случае, когда все исходы испытаний
равновероятны, их вероятность определяется в соответствии
с формулой
Вероятность события =
X
T
• где X — количество испытаний, в которых произошло
событие, Т — общее количество испытаний.
• Что означает эта вероятность?
• Например, в стандартной колоде игральных карт есть 26
карт красной и 26 карт черной масти. Предположим, что
после извлечения карта возвращается в колоду. Означает
ли это, что из двух извлеченных карт одна обязательно
окажется черной масти? Нет, поскольку никто не может
предсказать исходы нескольких последовательных
испытаний. Однако, если продолжать испытания
достаточно долго, количество карт черной масти,
извлеченных из колоды, будет приблизительно равно 0,50.
О
Выборочное пространство и события
• Основным понятием теории вероятностей является
событие.
• Событие – это любой возможный результат
случайного эксперимента.
• Элементарное событие – событие, которое можно
описать одной характеристикой
• Совокупность всех элементарных событий
называется выборочным пространством или
пространством исходов
• Дополнением события А называются все события,
которые не являются частью события А (A’)
• Совместное событие – это событие которое имеет
несколько характеристик (состоит из одновременных
элементарных событий)
Вероятность совместных событий
• Совместное событие состоит из одновременных
элементарных событий.
• С помощью понятия вероятности совместного события
можно иначе определить безусловную вероятность
элементарного исхода.
• Безусловная вероятность элементарного события
Где события В1, В2,…, Вk являются взаимоисключающими
и исчерпывающими.
• Два события называются взаимоисключающими, если они не
могут происходить одновременно.
• Множество событий называется исчерпывающим, если
происходит хотя бы одно из них.
Например, события «человек является мужчиной» и «человек
является женщиной» являются взаимоисключающими и
исчерпывающими. Эти события никогда не происходят
одновременно, и в то же время человек всегда является либо
мужчиной, либо женщиной.
Общее правило сложения вероятностей
• Зная вероятности события А и события «А и В», можно вычислить
вероятность события «А или В»
• Вычисление вероятности события «А или В» подчиняется общей
формуле сложения вероятности
Правило сложения вероятностей
взаимоисключающих событий
Условная вероятность
• Как определить вероятность события, если известна некоторая
информация о событиях, происшедших до него?
• Вероятность события А, при вычислении которой учитывается
информация о событии В, называется условной и обозначается как
• Вероятность события А при условии, что наступило событие В, равна
вероятности события «А и В», деленной на вероятность события В
• Вероятность события В при условии, что наступило событие А, равна
вероятности события «А и В», деленной на вероятность события А
Статистическая независимость
• В противоположность этому, существуют статистически
независимые события, вероятности появления которых не зависят
друг от друга.
Правило умножения вероятностей
Теорема Байеса
• Условная вероятность события учитывает информацию о том, что
произошло некоторое другое событие.
• Этот подход можно использовать для уточнения вероятности с учетом
вновь поступившей информации и для вычисления вероятности того.
Что наблюдаемый эффект является следствием некоторой конкретной
причины.
• Процедура уточнения этих вероятностей называется теоремой Байеса.
Была разработана Томасом Байесом в 18 веке.
• Правило счета
• Бывают ситуации, когда порядок следования объектов не
важен, а учитывается лишь количество вариантов
извлечения Х объектов из совокупности, состоящей из n
объектов. Это правило называется сочетанием.
• Т.о. общее количество комбинаций 4 книг, извлеченных из
совокупности, состоящей из 6 книг:
Законы распределения
дискретных
случайных величин
• В теории вероятности и математической
статистике случайные события связывают с
числами.
• Возникает новое понятие – случайная величина
(случайная переменная)
Случайная величина
Дискретная
Непрерывная
Случайная величина
Дискретная СВ может принимать конечное или
счетное число различных значений х1, х2, х3 …xn.
Примеры
• При подсчете числа простоев станка за смену (0,
1, 2 ….)
• При подсчете количества дефектов на единицу
продукции
Случайная величина
Непрерывная СВ может принимать любые
значения в определенном интервале числовой оси.
Примеры
измерение размеров, физических свойств и др.
Распределение дискретной случайной
величины
это исчерпывающий список всех возможных
значений случайной переменной, где каждому
исходу поставлена в соответствие его вероятность
Распределение количества несоответствий
за неделю
Кол- Вероятность
во
0
0,10
1
0,10
2
0,20
3
0,30
4
0,15
5
0,10
6
0,05
Функция распределения
вероятность того, что случайная величина X
окажется меньше некоторого значения x:
F(x)=P(X<x)
Этот способ задания СВ м.б. использован как для
дискретной, так и для непрерывной СВ.
График функции распределения дискретной
случайной величины
F(Х )
1
р1  р2  р3
р1  р2
р1
0
Х1
Х2
Х3
Х4
Х
Свойства функции распределения
 Её значения лежат в промежутке от 0 до 1.
 F(-∞) = 0, F(∞)=1.
 Функция F(x) – монотонно неубывающая:
при x2>x1, F(x2)>=F(x1).
 Вероятность попадания случайной величины в
полуинтервал [x1,x2) определяется по формуле:
P(x1<=X<x2) = F(x2) – F(x1)
Математическое ожидание ДСВ
• Математическим ожиданием μ дискретной
случайной величины X называется среднее
значение ее распределения.
• Эта величина равна сумме произведений всех
значений случайной величины X на
соответствующие вероятности Р(Х).
где Xi – i-е значение дискретной случайной величины Х,
Р(Хi) – вероятность i-го значения дискретной случайной
величины Х
Дисперсия дискретной случайной величины
Закон распределения
Законом распределения случайной величины
называется всякое соответствие между
возможными значениями случайной величины и
соответствующими им вероятностями.
Закон распределения случайной величины может
быть задан в виде таблицы, функции распределения
и плотности распределения.
Задать СВ – это значит задать закон ее
распределения.
Биномиальное распределение
используется для оценки количества успехов в выборке,
состоящей из n наблюдений
𝒏!
𝑷 𝑿 =
𝒑𝑿 (𝟏 − 𝒑)𝒏−𝑿
𝑿! 𝒏 − 𝑿 !
где P(X) – вероятность Х успехов при заданном объеме
выборки n и вероятности успеха р, Х=0,1,2…n
При заданном количестве испытаний n и вероятности успеха
р вероятность последовательности, состоящей из X успехов,
равна:
Р(Х) = (количество возможных последовательностей) ×
(вероятность конкретной последовательности)
Свойства биномиального распределения
• Выборка состоит из фиксированного числа элементов n,
представляющих собой исходы некоего испытания.
• Каждый элемент выборки принадлежит одной из двух
взаимоисключающих категорий, исчерпывающих все
выборочное пространство (успех и неудача).
• Вероятность успеха р является постоянной, вероятность
неудачи равна 1-р.
• Исход (т.е. удача или неудача) любого испытания не
зависит от результата другого испытания.
• Элементы выборки извлекаются случайным образом из
бесконечной генеральной совокупности без возвращения
или из конечной генеральной совокупности с
возвращением.
Свойства биномиального распределения
• Биномиальное распределение зависит от
параметров n и р.
• Форма распределения
• Если р = 0,5, биномиальное распределение
является симметричным независимо от величины
параметра n.
• Если р ≠ 0,5, распределение становится
асимметричным.
• Чем ближе значение параметра р к 0,5 и чем
больше объем выборки n, тем слабее выражена
асимметрия распределения.
0.4
Гистограмма
биномиального
распределения
0.35
0.3
0.25
0.2
0.15
0.1
при n = 4 и р = 0,5
симметричное
0.05
0
0
1
2
3
4
0.7
0.6
0.5
0.4
0.3
при n = 4 и р = 0,1
смещено вправо
0.2
0.1
0
0
1
2
3
4
Биномиальные вероятности табулированы
• В таблице приведены вероятности того, что при заданных
параметрах n и р биномиальная случайная величина X
принимает значения 0, 1, 2, n.
• Например, чтобы получить вероятность, что X = 2 при n =
4 и р = 0,1, следует извлечь из таблицы число, стоящее на
пересечении строки Х = 2 и столбца р = 0,1.
Математическое ожидание
и стандартное отклонение
биномиального распределения
• Математическое ожидание:
𝜇 =𝑛∙𝑝
• Стандартное отклонение
Гипергеометрическое распределение
 А   N  A
 

Х  n X 

Р( Х ) 
N
 
n
где Р(Х) — вероятность X успехов при заданных n, N и А,
n — объем выборки, N —объем генеральной совокупности,
А — количество успешных исходов в генеральной совокупности,
N -А — количество неудачных исходов в генеральной совокупности,
X —количество успехов в выборке, n - X — количество неудачных исходов
в выборке.
Гипергеометрическое распределение
• позволяет оценить количество успехов в серии из n
испытаний.
• Данные извлекаются только из конечной генеральной
совокупности без возвращения.
• Каждый исход зависит от предыдущих исходов.
• Количество успехов X в выборке не может превосходить
количество успехов А в генеральной совокупности либо
объем выборки n.
• Диапазон значений ограничен либо объемом выборки (как
и диапазон биномиальной переменной), либо объемом
генеральной совокупности.
Математическое ожидание гипергеометрического
распределения вычисляется по формуле
Стандартное отклонение гипергеометрического
распределения вычисляется по формуле
𝜎=
Выражение
𝑛𝐴(𝑁 − 𝐴) 𝑁 − 𝑛
𝑁2
𝑁−1
𝑁−𝑛
𝑁−1
называется поправочным коэффициентом конечной генеральной
совокупности. Он необходим, поскольку элементы выборки извлекаются
из конечной генеральной совокупности.
Пример гипергеометрического распределения
•
•
•
•
•
Из партии объемом N=500 валов привода произвольно
отбирается n=50 валов, у которых контролируется диаметр.
Если диаметр укладывается в пределы заданного допуска, то
вал считается годным, в противном случае изделие
бракуется. Из предварительных исследований видно, что в
среднем 2% изготовленных валов представляют собой брак.
Какова вероятность того, что среди 50 отобранных валов не
окажется ни одного дефектного?
N=500 – объем партии;
n=50 – число отобранных изделий;
p=0,02=А/500 – доля брака;
А=10 – число бракованных изделий;
Х=0 – число дефектных изделий в выборке.
P( X
0) 
490 50 450
450 449...441
50 440 500
500 499...491
0 345
Распределение Пуассона
𝒆−𝝀 𝝀𝑿
𝑷 𝑿 =
𝑿!
где Р(Х) — вероятность X успешных испытаний, λ — ожидаемое
количество успехов, е— основание натурального логарифма, равное
2,71828, X— количество успехов в единицу времени.
• Распределение Пуассона имеет один параметр, обозначаемый символом
λ - среднее количество успешных испытаний в заданной области
возможных исходов.
• Дисперсия распределения Пуассона также равна λ, а его стандартное
отклонение равно λ
• Количество успешных испытаний X пуассоновской случайной величины
изменяется от 0 до бесконечности.
Распределение Пуассона
Пуассоновский процесс возникает в ситуациях, обладающих
следующими свойствами.
• Нас интересует, сколько раз происходит некое событие в
заданной области возможных исходов случайного
эксперимента. Область возможных исходов (area of
opportunity)может представлять собой интервал времени,
отрезок, поверхность и т.п.
• Вероятность данного события одинакова для всех областей
возможных исходов.
• Количество событий, происходящих в одной области
возможных исходов, не зависит от количества событий,
происходящих в других областях.
• Вероятность того, что в одной и той же области возможных
исходов данное событие происходит больше одного раза,
стремится к нулю по мере уменьшения области возможных
исходов.
Таблица распределения Пуассона
Вероятность находится в таблице на пересечении строки X = 2 и столбца
λ = 3. Таким образом, она равна 0,2240.
Аппроксимация биномиального распределения с
помощью распределения Пуассона
• Если число n велико, а число р — мало, биномиальное распределение
можно аппроксимировать с помощью распределения Пуассона. Чем
больше число n и меньше число р, тем выше точность
аппроксимации. Для аппроксимации биномиального распределения
используется следующая модель Пуассона.
• где Р(Х) — вероятность X успехов при заданных параметрах n и р, n
— объем выборки, р — истинная вероятность успеха, е — константа
Эйлера, приближенно равная 2,71828, X — количество успехов в
выборке (X = 0, 1, 2, n).
• Случайная величина, имеющая распределение Пуассона, принимает
значения от 0 до ∞ . Когда распределение Пуассона применяется для
приближения биномиального распределения, количество успехов
среди п наблюдений — не может превышать число п.
Приближение математического ожидания биномиального
распределения
𝜇 = λ = 𝑛𝑝
Аппроксимация стандартного отклонения биномиального
распределения
Пример
Предположим, что 8% шин, произведенных на некотором заводе,
являются бракованными. Чтобы проиллюстрировать применение
распределения Пуассона для аппроксимации биномиального
распределения, вычислим вероятность обнаружить одну дефектную
шину в выборке, состоящей из 20 шин. Применим формулу
Если бы мы могли вычислить истинное биномиальное распределение,
а не его приближение, то получили бы следующий результат
Дискретные
распределения
вероятностей
Фиксировано ли
количество
наблюдений n?
Нет
Распределение
Пуассона
Нет
Гипергеометрическое
распределение
Да
Биноминальное
распределение
Да
Вероятность = const
для всех испытаний
Нормальное распределение
Функция распределения и плотность распределения
вероятности непрерывной случайной величины
• Функция распределения непрерывной случайной величины
обладает теми же свойствами, кроме того она непрерывна и
дифференцируема
• Часто непрерывная случайная величина задается с помощью
производной от функции распределения, которая называется
плотностью распределения вероятности
Функция распределения и плотность распределения
вероятности непрерывной случайной величины
• Закон распределения непрерывной случайной величины
полностью определяется ее плотностью.
• Понятие плотности распределения справедливо только
для непрерывной величины.
• График функции f(x) называется кривой распределения.
• При известной плотности распределения функция
распределения вычисляется как интеграл
Основные свойства плотности распределения
• плотность распределения неотрицательна (кривая распределения
всегда лежит в верхней полуплоскости)
• площадь, ограниченная кривой распределения и осью абсцисс, равна
единице (условие нормировки)
• вероятность попадания случайной величины в промежуток [х1, х2)
равна:
(это площадь криволинейной трапеции, заключенной между точками х, и х2)
•
вероятность того, что непрерывная случайная величина примет
конкретное значение х0, равна нулю:
Математическое ожидание непрерывной случайной
величины
•математическое ожидание — это среднее значение, около
которого группируются все значения случайной величины.
Дисперсия непрерывной случайной величины
Нормальное распределение
• Одно из наиболее важных распределений в
статистике —нормальное распределение которое
иногда называют гауссовым.
• Распределение количественных данных, таких как
размеры, масса, влажность и т. д., собранных за
определенный период (например за месяц) при
достаточном числе наблюдений (порядка 100),
представленных графически гистограммой,
близко к нормальному (гауссову) распределению.
Нормальное распределение
•плотность распределения определяется по формуле
• Где m и σ - параметры распределения
• Для краткой записи нормального распределения с
параметрами m и σ используют обозначение N (m,σ)
• Можно доказать, что параметр m равен
математическому ожиданию, а параметр σ стандартному отклонению случайной величины X.
Нормальное распределение
•Количество возможных комбинаций параметров m и σ
бесконечно
•Если нормировать данные, все распределения можно
свести к одному.
•Любую нормально распределенную случайную
величину X можно преобразовать в нормированную
нормально распределенную случайную величину Z
Стандартное нормальное распределение
• В частном случае параметр m = 0, σ = 1, N(0,1)
• В этом случае плотность распределения
f(x) 0.4
Кривая распределения имеет
колоколообразный вид,
вертикальная ось является осью
симметрии,
горизонтальная — асимптотой.
Максимальное значение ординаты
равно
0.3
0.2
0.1
0
-3
-2
-1
0
1
значение Z
2
3
  134
2

Кривая стандартного нормального
распределения
Диапазон
µ±1σ
Частота
Частота
попадания попадания
в диапазон за пределы
%
диапазона
%
68,26
31,74
µ±2σ
95,44
4,56
µ±3σ
99,73
0,27
µ±4σ
99,994
0,006
Свойства нормального распределения
• Имеет колоколообразную (симметричную) форму
• Площадь под кривой равна 1
• Его математическое ожидание, медиана и мода
совпадают друг с другом
• Основная масса нормально распределенных
значений лежит в интервале, длина которого
равна 4/3 стандартного отклонения
• Значения нормально распределенной случайной
величины лежат на всей числовой оси
• (-∞ < X < +∞ )
• При изменении параметра т график сдвигается
вправо или влево так, что прямая х = т — ось
симметрии.
• При увеличении параметра σ максимум кривой распределения
снижается, при уменьшении σ кривая вытягивается вверх, при
этом по условию нормировки площадь под кривой
распределения остается постоянной (и равной единице).
Важность нормального распределения в
статистике обусловлена тремя причинами
• Оно описывает (точно или приблизительно)
распределение многих непрерывных случайных
величин.
• С помощью нормального распределения можно
аппроксимировать разнообразные дискретные
распределения
• Нормальное распределение тесно связано с
центральной предельной теоремой (central limit
theorem)
Центральная предельная теорема
• При достаточно большом объеме выборок
выборочное распределение средних можно
апроксимировать нормальным распределением.
Это свойство не зависит от вида распределения
генеральной совокупности.
• Какой объем выборки следует считать достаточно
большим?
• Для подавляющего большинства совокупностей
выборочное распределение средних становится
приблизительно нормальным при n = 30
Функция Лапласа
• Стандартное нормальное распределение N(0,1) называют
функцией Лапласа (функция распределения нормально
распределенной случайной величины).
Эта функция табулирована, например Ф (2,48) = 0,9934.
Ф(-х) = - Ф(х).
Функция Лапласа
• Можно установить связь между функцией распределения
F(x)для распределения N(m, σ) и функцией стандартного
нормального распределения:
Вероятность попадания нормально распределенной
случайной величины в интервал от х1 до х2 определяется по
формуле
Функция Лапласа
• Часто в расчетах надо найти вероятность того, что
случайная величина X не слишком сильно отклонится от
своего математического ожидания т
Пусть, например, е = 3σ. Используя таблицы функции
стандартного нормального распределения, найдем:
поэтому вероятность того, что случайная величина отклонится от
математического ожидания больше, чем на 3σ, ничтожно мала:
Пример
•На станке - автомате изготавливаются валики номинальным
диаметром 10 мм. Стандартное отклонение,
характеризующее точность станка, составляет σ = 0,03 мм.
Сколько в среднем валиков из ста удовлетворяют стандарту,
если для этого требуется, чтобы диаметр отклонялся от
номинального не более чем на 0,05 мм?
т.е. примерно 90 валиков из каждых 100 удовлетворяют
стандарту.
Спасибо за внимание!
Download