Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

РОССИЙСКАЯ ФЕДЕРАЦИЯ МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНСТИТУТ МАТЕМАТИКИ И КОМПЬЮТЕРНЫХ НАУК КАФЕДРА МАТЕМАТИЧЕСКОГО АНАЛИЗА И ТЕОРИИ ФУНКЦИЙ Г. В. РУБЛЕВА ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Учебно-методическое пособие для студентов направления «Прикладная информатика» очной формы обучения Тюмень Тюменский государственный университет 2014 УДК: 519.2 (075.8) ББК: В 172я73+В171я73 Р 824 Г. В. статистика. «Прикладная Рублева. Теория Учебно-методическое информатика» очной вероятностей пособие формы для и математическая студентов обучения. направления Тюмень: Тюменский государственный университет, 2014, 238 с. Представленный в пособии теоретический материал соответствует Федеральному Государственному образовательному стандарту по дисциплине «Теория вероятностей и математическая статистика» для студентов направления «Прикладная информатика». В учебно-методическом пособии в рамках программы односеместрового курса изучения дисциплины «Теория вероятностей и математическая статистика» содержится структурированный теоретический материал, большое количество разнообразных примеров и задачи для самостоятельного решения, сопровождающихся ответами. Рабочая программа дисциплины опубликована на сайте ТюмГУ: Теория вероятностей и математическая статистика [электронный ресурс] / Режим доступа: http://www.umk3.utmn.ru, свободный. Рекомендовано к изданию кафедрой математического анализа и теории функций. Утверждено первым проректором Тюменского государственного университета. Ответственный редактор: зав. кафедрой МА и ТФ Хохлов А.Г. © ФГБОУ ВПО Тюменский государственный университет, 2014. © Г.В.Рублева, 2014. Введение В окружающем нас мире каждому явлению присущи определенные закономерности и в то же время каждое явление зависит от множества случайностей. Иногда влияние случая настолько существенно, что без его исследования и количественной оценки невозможно изучение данного явления. Теория вероятностей – математическая наука, изучающая закономерности случайных явлений. В теории вероятностей для изучаемого явления строится математическая модель, в которой описывается закон распределения исследуемой случайной величины, т.е. указывается, какие возможные значения может принимать случайная величина, с какими вероятностями, как вычислить ее основные числовые характеристики. В теории вероятностей мы не проводим сами эксперименты на практике, а лишь рассуждаем о них и получаем выводы о законе распределения априори. В математической статистике, наоборот, - исходными являются экспериментальные данные, и требуется получить выводы о природе рассматриваемого явления. Математическую статистику можно охарактеризовать как науку принятия разумных решений в условиях неопределенности. Задачи математической статистики состоят в разработке методов сбора, систематизации и обработки статистических данных для удобного их представления, формирования научных и практических выводов. 3 интерпретации и ЧАСТЬ 1. ТЕОРИЯ ВЕРОЯТНОСТЕЙ Глава 1. Случайные события 1.1. Элементы теории множеств и комбинаторики Под множеством понимается совокупность (набор, собрание) каких-либо элементов. Например, набор предметов в чайном сервизе, собрание книг на полке, совокупность натуральных чисел и т.д. Каждое множество А определяется принадлежащими ему элементами a,b,c,…. Например, множество A четных чисел на гранях игральной кости состоит из трех элементов: A ={2,4,6}. Каждое множество, которому принадлежит ровно один элемент, называется элементарным. квадратного уравнения Например, x 2 - 6x  9  0 множество является решений элементарным множеством - {3}. Множества A и B равны, если каждый элемент множества A принадлежит множеству B и каждый элемент множества B принадлежит множеству A. Объединением множеств A и B называется множество AUB, образованное всеми элементами, которые принадлежат хотя бы одному из множеств A или B. Пересечением множеств A и B называется множество A∩B, образованное всеми элементами, которые принадлежат каждому из множеств A и B. Например, для множеств А={O, Δ, x, ◙}, В={z, ▼, ▲, Δ, x, O} и С={1, 5, 7} получаем: AUB={O, Δ, x, z, ▼, ▲, ◙} и A∩B={O, Δ, x}, A∩C=Ø. Произвольное множество A, каждый элемент которого принадлежит множеству B, называется частью множества B. Рассмотрим произвольное множество Ω и его __ Дополнение множества А до множества Ω обозначают A : 4 часть А. __ A  Ω  A. Теорема о дополнении. Для любого множества  __ __ А справедливы А  A =Ø, А  A  Ω , A  А . следующие равенства: Рассмотрим произвольное множество Ω и его части А и В. Связь между объединением, пересечением и дополнением выражает: ____ __ __ ____ __ __ Теорема де Моргана. A  B  A  B , A  B  A  B . Множество A  B  A  B - A  B называется суммой множеств A и B. Множество A·B  A  B называется произведением множеств А и В. Декартовым произведением множества А на множество В называется множество A  B , образованное всеми упорядоченными парами, первые элементы которых принадлежат множеству А, а вторые – множеству В. Если множества А и В – различны, то A  B ≠ B  A. Раздел математики, в котором изучаются способы подсчета числа элементов различных комбинаторикой. конечных Теоретическое множеств, исследование называется вопросов комбинаторики предприняли в XVII веке французские учѐные Б.Паскаль и П. Ферма. Обозначим |A| - количество элементов множества А. Число элементов пустого множества равно нулю: |Ø|=0. Число элементов множества, образованного единственным элементом, равно единице: |A|=1. Важную роль в комбинаторике играют следующие правила: Правило сложения: Для любых конечных непересекающихся множеств А и В число |A+B| элементов суммы А+В равно сумме чисел |A| и |B| элементов этих множеств: |A+B|=|A|+|B|. 5 Правило умножения: Для любых конечных множеств А и В число |A  B| элементов декартова произведения А  В равно произведению чисел |A| и |B| элементов этих множеств: |A  B|=|A|·|B|. На практике это означает, что если первый элемент а выбирается из n возможных, а второй элемент b - из k возможных, то число упорядоченных пар вида (a,b) равно произведению n·k. Правило вычитания: Для каждой части А конечного множества В верно: |A-B|=|A|-|B|. Правило объединения: Для любых конечных множеств А и В верно: |A  B|=|A|+|B|-|A  B|. Запишем правило объединения для трех множеств: |A  B  C|=|A|+|B|+|C|-|A  B|-|B  C|-|A  C|+|A  B  C|. Пример 1.1 Заданы множества: A  1, 2, 3, 4, 5, a, b, c, B  a, b, c, C  1, 2, 3, 4, 5, D  a, b, c. Найти: а) B  C ; б) B  C ; в) A  B ; г) A  B ; д) B  D ; е) С  D ; ж) B  D . Для каждого из полученных множеств определить количество элементов. Решение: а) B  C  Ø, число элементов пустого множества равно нулю: |Ø|=0; б) B  C   a, b, c, 1, 2, 3, 4, 5  A , |B  C|=|B|+|C|-|B  C|=3+5-0=8; в) A  B   1, 2, 3, 4, 5  C , |A-B|=|A|-|B|=8-3=5; г) A  B  A  B - A  B  A - B  C , |A+B|=|C|=5; д) так как B  D , то B  D  B  D - B  D  B - B  Ø, |Ø|=0; е) для нахождения элементов множества С  D составим таблицу: C D 1 2 3 4 5 a (1,a) (2,a) (3,a) (4,a) (5,a) b (1,b) (2,b) (3,b) (4,b) (5,b) c (1,c) (2,c) (3,c) (4,c) (5,c) 6 В таблице в скобках перечислены элементы множества С  D упорядоченные пары, первые элементы которых являются элементами множества C, а вторые – элементами множества D. По правилу произведения количество элементов полученного множества равно |C  D|=|C|·|D|=5·3=15; ж) множества B и D – равны, поэтому B  D  B  B  B2 , элементы которого перечислены в таблице: В B a b c a (a,a) (b,a) (c,a) b (a,b) (b,b) (c,b) c (a,c) (b,c) (c,c) Число элементов в полученном множестве равно | B 2 |=3·3=9. ■ Пример 1.2 На вершину горы ведут пять дорог. Сколькими способами турист может подняться на гору и спуститься с нее? То же самое при условии, что спуск и подъем происходят по разным путям. Решение: Для того чтобы подняться на гору у туриста имеется 5 вариантов, для спуска с горы – тоже 5 способов. Следовательно, по правилу произведения получаем: 5·5=25. Если же подъем и спуск должны проходить по разным путям, то для спуска будет 4 варианта (один вариант уже использован при подъеме): 5·4=20. ■ Пример 1.3 На экзамене по математике было предложено 3 задачи: по алгебре, геометрии и тригонометрии. Из 100 абитуриентов задачу по алгебре решили 80 человек, по геометрии – 70, по тригонометрии – 60. При этом задачи по алгебре и геометрии решили 60 абитуриентов; по алгебре и тригонометрии – 50; по геометрии и тригонометрии – 40; 30 7 человек решили все задачи. Сколько абитуриентов не решили ни одной задачи? Решение: Обозначим: Ω – множество всех абитуриентов; A – множество абитуриентов, решивших задачу по алгебре; T – абитуриентов, решивших задачу по тригонометрии; Г – тех, кто решил задачу по геометрии Их количество определяется по правилу объединения для трех множеств: |A  T  Г|=|A|+|Т|+|Г|-|A  Т|-|Т  Г|-|A  Г|+|A  Т  Г|= =80+60+70-50-60-40+30=90. Ω - А  Т  Г  - множество абитуриентов, не решивших ни одной задачи. По правилу вычитания их количество равно: |Ω-(А  Т  Г )|=|Ω|-|А  Т  Г|=100-90=10. ■ Классической задачей комбинаторики является задача о числе перестановок: сколькими способами можно переставить n различных предметов, расположенных на n различных местах? Пример 1.4 Сколькими способами можно разместить трех гостей, сидящих соответственно на трех местах 1, 2, 3? Решение: Перечислим варианты размещения гостей, обозначая в верхней строке номер места, а в нижней строке – соответствующего  1 2 3  1 2 3  1 2 3  ,   ,   , гостя:  А В С А С В В А С        1 2 3   , В С А    1 2 3   , С А В    1 2 3   . С В А   Всего, таким образом, получается 2·3=6 способов. ■ Перестановками из n элементов называют всевозможные n – расстановки, каждая из которых содержит все эти элементы по одному разу и которые отличаются друг от друга лишь порядком элементов. Число n – перестановок обозначают через Pn . Чтобы узнать, сколько перестановок можно составить 8 из n элементов, надо перемножить все натуральные числа от 1 до n. Это произведение обозначают n! (читается n-факториал): Pn = 1·2·3· ...· n  n ! В частности, если n=0, то полагают 0!=1. Пример 1.5 Сколькими способами можно рассадить 5 человек вокруг круглого стола? (Способы считаются различными, если различается взаимное расположение людей). Решение: Если бы эти 5 человек стояли в ряд, то получилось бы 5!=120 способов. Но так как стол круглый, то важно их взаимное расположение. Поэтому мы должны исключить варианты, полученные путем вращения, значит, 120 надо разделить на 5. Таким образом, получается 120:5=24 способа. ■ Пусть конечное множество А содержит n элементов. Часть множества А, составленную из m элементов, будем В называть выборкой (без возвращения) m из n элементов множества А. Число всех таких выборок определяется числами m, n и обозначается символом Cnm . Вместо слова выборка говорят также сочетание: mсочетаниями из n элементов называют всевозможные m- расстановки, составленные из этих элементов и отличающиеся друг от друга составом, но не порядком элементов. Число таких сочетаний вычисляется по формуле: Cnm  n! . m !·n - m ! Числа Cnm обладают следующими свойствами: 1) Cnm  Cnn -m ; 1 2) Cn0  Cn  Cn2  ...  Cnn  2n ; 3) для любого m, удовлетворяющего условию 1≤m≤n, справедливо равенство: Cnm  Cnm-1  Cnm-1-1. 9 Cn0 , Cn1 ,…, Cnn -1, Cnn Числа называют также биномиальными коэффициентами. 1 4) Cnn  Cnn1  Cnn 2  ...  Cnn m -1  Cnnm . Пример 1.6 В коробке 7 шариков разного цвета. Сколькими способами можно выбрать 3 шарика? Решение: Выбор 3 шариков из коробки – это выборка без возвращения из совокупности 7 шариков. Число всех таких выборок – это число 3 сочетаний из 7 элементов: C73  7! 7! 4 !· 5 · 6 · 7    35 . 3 !·7 - 3! 3 !· 4 ! 1· 2· 3· 4 ! ■ Пример 1.7 Сколько существует вариантов опроса 20 студентов на одном занятии, если каждого из них спрашивают только по одному разу и на занятии может быть опрошено любое количество студентов, причем порядок опроса безразличен? Решение: Преподаватель может не спросить ни одного из 20 студентов, 0 что является одним из вариантов. Этому случаю соответствует C20 . Преподаватель может опросить только одного из студентов, таких 1 вариантов С20 . Если преподаватель будет опрашивать двух студентов, 2 то число вариантов опроса равно С20 . Для опроса трех студентов 3 существует С20 и т.д. Наконец, могут быть опрошены все студенты. 20 Число вариантов в этом случае равно С20 . Тогда по правилу сложения число всех возможных вариантов опроса равно: 0 1 2 20 С20  С20  С20  ...  С20  220 . Можно было бы рассуждать иначе: для каждого из студентов существует две возможности – либо он будет опрошен на данном 10 занятии, либо нет. Другими словами, каждую из 20 операций, заключающихся в том, что каждый студент будет либо опрошен, либо нет, можно выполнить по правилу умножения 2· 2· ...· 2  220 способами. ■ Пример 1.8 В ящике 6 белых, 4 красных и 8 зеленых шаров. Сколькими способами можно извлечь из ящика 6 шаров, из которых 2 белых, 2 красных и 2 зеленых? Решение: Разобьем перебор на три этапа: на первом выбираем 2 белых шара, на втором – 2 красных шара, на третьем – 2 зеленых. Всего шариков 18 штук. Выбрать 2 белых шара – значит выбрать 2элементное подмножество из множества 6-ти шаров, т.е. сочетание из 6 по 2. Количество способов сделать это равно: C62  6!  15 . 2 !4 ! ■ Классической задачей комбинаторики является также задача о числе размещений: сколько существует способов, чтобы выбрать m из n различных элементов и разместить их по m различным местам? Число размещений m элементов из n обозначается Anm . Так как сначала мы выбираем m из n элементов, а затем упорядочиваем их, то для определения числа размещений надо перемножить число сочетаний Cnm на число перестановок Pm : Anm  Cnm ·Pm  n! n! ·m !  . n - m ! m !· n - m ! Пример 1.9 Сколькими способами можно выбрать 2 человек из 4 и разместить их по 2 местам? Решение: Число способов выбрать 2 элемента из 4 – это число выборок объемом 2 из совокупности, содержащей 4 элемента: С42 ; число 11 способов упорядочить их – это число размещений P2 ; следовательно, по правилу произведения получаем: 4! 4! A42  C42  P2    12 . 4  2! 2 ! ■ Если из конечного множества A, содержащего n элементов, m раз выбирать по одному элементу, каждый раз возвращая его обратно, то получим множество из m элементов, которое называют выборкой с повторениями или размещением с повторениями. Число всех размещений с повторениями из n элементов по m зависит, очевидно, только от n и m (а не от природы множества A). __ Обозначим это число A m . Из правила произведения следует, что это n __ · n · ...· n  n m . Anm  n  число равно: m раз Пример 1.10 Сколькими способами k пассажиров могут распределиться по n вагонам, если для каждого пассажира существенным является только номер вагона, а не занимаемое им в вагоне место? Решение: Перенумеруем всех пассажиров (т.е. условимся, кого из них мы считаем первым, кого вторым и т.д.). Пусть x 1 - номер вагона, выбранного первым пассажиром, x 2 - номер вагона второго пассажира и т.д. Строка x1, x 2 ,..., x k  полностью характеризует распределение пассажиров по вагонам. Каждое из чисел x 1 , x 2 ,…, x k может принимать любое целое значение от 1 до n. Таким образом, различных распределений по вагонам будет столько, сколько строк длиной k можно составить из элементов множества X   1, 2, ..., n . Следовательно, их __ будет Ak  n k . n ■ 12 Если в перестановках из общего числа n элементов есть k различных элементов, при этом 1-й элемент повторяется n1 раз, 2-й элемент - n2 раз, k-й элемент - nk раз, причем n1  n2  ...  nk  n , то такие перестановки называют перестановками с повторениями из n элементов. Число перестановок с повторениями из n элементов равно: __ Pn  n! . n1!· n2 !· ...· nk ! Пример 1.11 Даны n различных предметов и k ящиков. Надо положить в первый ящик n1 предметов, во второй - n2 предметов, …, в k-й - nk предметов, где n1  n2  ...  nk  n . Сколькими способами можно сделать такое распределение? Решение: Условие задачи можно переформулировать следующим образом: имеются элементы k различных типов; сколько перестановок можно сделать из n1 элементов первого типа, n2 элементов второго типа, … , nk элементов k-го типа? Если бы все элементы были различны, то число перестановок равнялось бы n !. Но из-за того, что некоторые элементы совпадают, получится меньшее число перестановок. Элементы первого типа можно переставить друг с другом n1! способами. Но так как все эти элементы одинаковы, то такие перестановки ничего не меняют. Точно также ничего не меняют n2 ! перестановок элементов второго типа, …, nk ! перестановок элементов k-го типа. Перестановки элементов первого типа, второго типа и т.д. можно делать независимо друг от друга. Поэтому (по правилу умножения) элементы можно переставлять друг с другом n1! n2 !...nk ! способами так, что она останется неизменной. То же самое верно и для любого другого расположения элементов. Поэтому множество всех n! перестановок распадается на части, состоящие 13 из n1! n2 !...nk ! одинаковых перестановок каждая. Значит, число различных перестановок с повторениями, которые можно сделать из данных элементов, равно: __ Pn  n! . n1!n2 !...  nk ! ■ Пусть множество A содержит n·m элементов, среди которых по m одинаковых элементов каждого из n различных типов. Число способов выбрать m элементов из множества A называется выборкой с повторениями (или сочетаниями с повторениями) и вычисляется по формуле: __ n  m  1! Cnm  m !n  1! . Пример 1.12 «Индейское гадание»: имеется 12 лоскутков разного цвета (синий, красный, белый, жѐлтый, зелѐный и чѐрный – по 2 штуки каждого). Девушка, желающая узнать свою судьбу, наудачу извлекает 2 лоскутка. В зависимости от сочетания цветов в полученной паре индейская гадалка даѐт различные предсказания. Сколько существует способов извлечь 2 лоскутка (т.е. сколько существует различных цветовых сочетаний)? Решение: В данном случае количество различных типов предметов (количество цветовых окрасок у лоскутков) равно n=6, число одинаковых предметов (число лоскутков одного цвета): m=2. Число различных цветовых сочетаний для двух наудачу выбранных лоскутков – это число выборок с повторениями: __ C62  6  2  1! 7 !   21 . 2 !6  1! 2 !5 ! ■ Вычислять биномиальные коэффициенты Cnm можно с помощью математической функции EXCEL – ЧИСЛКОМБ(число, 14 выбранное число), которая возвращает количество комбинаций для заданного числа объектов. Аргументами данной функции являются: число – n (объем совокупности), выбранное число – m (объем выборки). Для определения количества перестановок Pn  n! используют математическую функцию EXCEL – ФАКТР(число), которая возвращает факториал числа, равный 1·2·...· число . Определить число размещений Anm  n! можно, используя n - m ! равенство Anm  Pm · Cnm , где сомножители вычисляются с помощью соответствующих функций EXCEL. __ Число размещений с повторениями m Anm  n можно вычислить с помощью математической функции СТЕПЕНЬ(число, степень числа), которая возвращает результат возведения в степень. Для __ Pn  нахождения числа перестановок с повторениями n! вычисляем сомножители знаменателя и числитель n1!·n2 !·...·nk ! отдельно с помощью математической функции ФАКТР(число). Задачи для самостоятельного решения: 1.1 Найти геометрическую интерпретацию следующих множеств: a, b  c, d , где a, b и c,d  - отрезки действительной прямой a, b  a, b ; в) a, b  a, b  a, b . __ __ A53 ; д) C52 . 1.2 Найти а) A53 ; б) C74 ; в) P8 ; г) 1.3 Найти AUB, A∩B, A-B, B-A, A+B, AxB, BxA, если: а) A   2,1,0,1,3,5 , B   1,1,3; б) A  0;4  , B  2;5 . 15 R; а) б) 1.4 Занятия по аэробике посещают 20 человек, в бассейн ходит 10 человек. Сколько человек посещают занятия по аэробике или по плаванию, если: а) эти занятия проходят в одно и то же время; б) занятия проходят в различное время и 8 человек посещают и бассейн и занятия по аэробике? 1.5 В спортивном магазине за месяц было продано 1000 пар лыж, 500 пар ботинок и 500 пар палок. При этом 400 пар лыж было куплено вместе с ботинками, 300 пар лыж – вместе с палками, 200 пар ботинок – вместе с палками, а 100 пар лыж – вместе с ботинками и палками. Сколько было покупателей (тех, кто сделал покупки)? 1.6 Сколькими способами можно переставить буквы в слове: а) «учебник»; б)* «математика»? 1.7 Сколько существует вариантов выбора четырех букв из слова «учебник»? 1.8 Имеется 7 карточек, на которых написаны цифры: 1, 2, 4, 6, 7, 8, 9. Сколько из них можно составить трехзначных чисел? 1.9 Сколькими способами из колоды в 36 карт можно выбрать 6 карт так, чтобы среди них были 2 туза, дама, валет и 2 шестерки? 1.10 На предприятии имеется 3 вакансии для мужчин, 2 – для женщин и 4 вакансии, которые могут быть заняты как мужчинами, так и женщинами. Сколькими способами могут выбрать место работы трое мужчин и две женщины? 1.11 Из пункта А в пункт В можно добраться самолетом, поездом, автобусом, а из него в пункт С – пешком, на тракторе, на лошади, на лодке. Сколькими способами можно выбрать дорогу от пункта А до пункта С через В? 1.12 Пять авторов должны написать задачник по математике, состоящий из 14 глав. Два автора пишут по две главы, два других – по 3 и еще один – 4 главы книги. Сколькими способами может быть распределен материал между авторами? 16 1.13 Каждого из 6 студентов можно направить для прохождения практики на одно из трѐх предприятий. Сколькими различными способами это можно осуществить? 1.14 Сколько существует пятизначных чисел, состоящих из цифр 1, 2 и 9, в которых цифра 1 повторяется 1 раз, а цифры 2 и 9 – по 2 раза? 1.15 Сколько всего существует возможных результатов опыта с подбрасываниями: а) 10 раз монеты; б) 3 раза «кости»? Ответы: 1.1 а) прямоугольник; б) квадрат; в) куб. 1.2 а) 60; б) 35; в) 40320; г) 125; д) 15. 1.4 а) 30; б) 22. 1.5 1200. 1.6 а) 5040; б) 151200; 1.7 35. 1.2. Действия над событиями Каждая наука при изучении явлений материального мира оперирует теми или иными понятиями, среди которых обязательно имеются основополагающие. В теории вероятностей таковыми являются: Опыт – действие, результат которого заранее неизвестен. Предполагается, что опыт можно неограниченное число раз повторять. Например, результат бросания монеты или игральной кости. Эксперимент – один или несколько опытов. Например, бросание монеты 3 раза или стрельба по мишени 5 раз. Исход – возможный результат опыта. Исход называется элементарным, если его нельзя разложить на более простые исходы. Например, при бросании монеты элементарными исходами будут: решка или герб. Событие – один или несколько исходов эксперимента. События бывают:  невозможные – те, которые не могут произойти в результате данного опыта; 17  достоверные – обязательно наступающие в результате данного испытания;  случайные – происходящие или не происходящие в результате данного опыта. Например, бросается монета один раз. В этом опыте нам неважно, какая монета: медная или серебряная, 5 рублей или 10 рублей, а важно лишь, что это диск, изготовленный из однородного материала, симметричный, у которого две стороны отличаются друг от друга. Заранее предугадать, как именно упадет монета, мы не можем. «Монета упала гербом вверх», «монета упала решкой вверх» случайные события; «монета упала, полежала, а потом подпрыгнула» или «монета зависла в воздухе» - такие события невозможны; «монета выпала вверх гербом или решкой» - событие достоверное. События называются несовместными, если в результате данного испытания появление одного из них исключает появление другого. Например, при стрельбе по мишени события «попадание» и «непопадание» - несовместны. События называются совместными, если в результате данного испытания появление одного из них не исключает появления другого. Например, при подбрасывании игральной кости события «на верхней грани выпала 3» и «на верхней грани выпало нечетное число очков» совместные события. События называются равновозможными, если в результате испытания по условиям симметрии ни одно из этих событий не является объективно более возможным. Несколько событий называются единственно возможными, когда в результате эксперимента должно произойти хотя бы одно из них. Несколько событий образуют полную группу, если они являются единственно возможными и несовместными 18 результатами эксперимента. Это означает, что в результате испытания обязательно должно произойти одно и только одно из этих событий. Два несовместных события, из которых одно обязательно должно произойти, называются противоположными. Случайное событие, __ противоположное к A, обозначается A . Результат действия над случайными событиями – это тоже случайное событие. Пусть с некоторым опытом связаны события A и B. Их суммой называется третье событие A+B, состоящее в наступлении хотя бы одного из данных событий. Если A и B – совместные события, то их сумма A+B обозначает наступление или события A, или события B, или обоих событий вместе. Если A и B – несовместные события, то их сумма A+B обозначает наступление или события A, или события B. Произведением событий A и B называется третье событие AB, состоящее в совместном наступлении этих событий. Если A и B – совместные события, то их произведение AB означает наступление и события A, и события B. Если A и B – несовместные события, то их произведение является невозможным событием. Формирование навыков работы со случайными событиями является необходимым условием для дальнейшего успешного решения задач по теории вероятностей, так как решение любой задачи на вычисление вероятности случайного события начинается с ответа на вопрос: «Что считать элементарным исходом в данном эксперименте, и как исследуемое событие может быть представлено с помощью элементарных исходов?» 19 Пример 2.1 Двое рабочих сделали по детали. Обозначим: 1 – событие, _ состоящее в том, что первый рабочий изготовил годную деталь; 1 _ бракованную деталь; 2 – второй рабочий изготовил годную деталь; 2 бракованную деталь. Используя принятые обозначения, запишите с их помощью следующие события: А – обе детали годные; В – обе детали дефектные; С – ровно одна деталь бракованная; Е – годная только вторая деталь; D – хотя бы одна деталь дефектна. Решение: _ __ _ _ А= 1·2 ; B  1·2 ; C  1·2  1·2 ; E  1·2 ; _ _ __ _ _ D  1·2  1·2 1·2  1 2 . ■ Если событие A наступает всегда, когда наступает B, то говорят, что событие B влечет событие A (обозначают B A ). Разностью двух событий A и B называется событие A-B (обозначается также A\B),которое состоится, если событие A произойдет, а событие B не произойдет. Пример 2.2 Из таблицы случайных чисел наудачу взято одно число. Пусть событие А означает, что выбранное число кратно 5; событие В – данное число оканчивается нулем. _ Что означают события: а) A-B; б) А·B ? Решение: а) Число кратно 5, если оно оканчивается цифрами 5 или 0. В данном случае событие В влечет событие А ( B A ), следовательно, событие А-В означает, что выбранное случайным образом число оканчивается цифрой 5, но при этом не заканчивается нулем. 20 б) Событие B означает, что выбранное число не оканчивается нулем. Так как B A , то B  A - B , следовательно, A  B  A  A - B  A - B . ■ Пример 2.3 При каких событиях A и B возможно равенство: а) A  B  A ; б) A·B  A ? Решение: а) Сумма A  B представляет собой событие, состоящее в наступлении хотя бы одного из событий A и B. Если A  B  A , то событие B влечет событие A ( B A ). б) Произведение событий A и B означает наступление обоих событий одновременно и, по условию, это есть событие A. Значит, событие A влечет событие B ( A B ). ■ Пример 2.4 Пусть А – событие, состоящее в том, что студент владеет английским языком, F – французским, I – итальянским. Что означают события: A , AFI , AF , A  I ? Решение: A - студент не знает английского языка; AFI - студент владеет тремя языками; AF - студент знает английский, но не владеет французским языком; A  I - владеет, по крайней мере, одним из двух языков. ■ Пример 2.5 Пусть Ai означает, что в серии из 5-ти бросков монеты на iм броске выпал орѐл. Запишите следующие события: а) орѐл не выпал ни разу; б) орѐл выпал ровно один раз; в) орѐл выпал не менее одного раза; Решение: Событие Ai означает, что орѐл при i-м броске не выпал. а) A1·A2 ·A3 ·A4 ·A5 - орѐл не выпал ни разу; б) орѐл выпал ровно один раз: 21 A A A3 A4 A5  A1A2 A3 A4 A5  A1A2 A3 A4 A5  A1A2 A3 A4 A5  A1A2 A3 A4 A5 12    НЕСОВМ ЕСТН ЫЕ СОБЫТИЯ в) орѐл выпал не менее одного раза: Ω  A1A2 A3 A4 A5 ; ■ Пример 2.6 Какие из тождеств верны: ____ _ _ a) A  B  A B ; б) A·A  Ø; в) A  A  Ω ; г) A·B  A·B  Ω ; д) A·B·A  Ø? Решение: Событие A  B означает, что происходит либо A, либо B, либо оба события одновременно. Следовательно, событие ____ AB означает, что не происходит событие A и не происходит событие B, т.е. _ _ наблюдается A B . Значит, – a) верно. По определению _ противоположное событие A является несовместным с исходным, т.е. одновременно с ним наблюдаться не может. Поэтому б) – верно. Справедливость тождества в) также следует из определения противоположных событий. Что касается тождества г), то оно не верно: левая часть описывает не все исходы эксперимента – сюда надо еще _ _ добавить события A·B  A·B . д) _ _ A  B  A  A  A B  Ø·B=Ø – верное тождество. ■ Задачи для самостоятельного решения: 2.1 Что означают события: а) A  A ; б) A· A ? 2.2 Эксперимент состоит в проверке трѐх приборов. Событие A – «хотя бы один из проверяемых приборов бракованный», событие B – «брака нет». Что означают события: а) A  B ; б) A·B ? 2.3 Монета бросается четыре раза. Обозначим Ai - событие, состоящее в том, что «герб» появился I раз. Что означают события: 22 а) A0  A1  A2 ; б) A1  A2  A3  A4 ? 2.4 Бросается игральный кубик. Обозначим Ai - событие, состоящее в том, что выпало на верхней грани I очков. Выразите через Ai следующие события: B – «число выпавших очков меньше 4»; C – «число выпавших очков больше 2»; D – «число выпавших очков чѐтно». 2.5 Два шахматиста играют одну партию. Событие А – «выиграет первый игрок», событие В – «выиграет второй игрок». Какое событие следует добавить к указанной совокупности, чтобы получилась полная группа событий? 2.6 Банк выдал три кредита по 1 млн. руб. Обозначим Ai - событие, состоящее в том, что i-й заѐмщик своевременно вернѐт кредит. Выразите через Ai следующие события: B – «все вернут кредиты вовре-мя», C – «вернут хоть что-нибудь», D – «вернут не менее 2 млн. руб.» 2.7 Пять человек надевают шляпы. Обозначим Ai - событие, состоящее в том, что i-й человек надел свою шляпу. Выразите через Ai следующие события: B – «все одели свои шляпы», C – «ни один не одел свою шляпу», D – «хотя бы один надел свою шляпу». 2.8 Двое поочередно бросают монету, выигрывает тот, кто раньше выбросит герб. Опишите следующие события: «выигрывает первый», «выигрывает второй». Какое событие будет в данном случае невозможным? 2.9 Три студента независимо друг от друга решают одну и ту же задачу. Обозначим событие «первый студент решил задачу» через A1, «второй студент решил задачу» - A2 , «третий студент решил задачу» A3 . Выразить через события Ai i  1, 2, 3 следующие события: а) A – «все студенты решили задачу»; б) B – «задачу решил только первый студент»; в) C – «задачу решил хотя бы один студент»; г) D – «задачу решил только один студент». 23 2.10 Пусть A, B, C – три произвольных события. Выразить через A, B, C и их отрицания следующие события: а) произошло только событие C; б) произошли все три события; в) произошло по крайней мере одно из этих событий; г) произошло по крайней мере два события; д) произошло только два события; е) ни одно событие не произошло; ж) произошло не более двух событий. ___ 2.11 Совместны ли события A и A  B ? 2.12 Являются ли несовместными следующие события: а) опыт – бросание двух монет. События: A1 - «появление двух гербов», A2 - «появление двух цифр»; б) опыт – три выстрела по мишени. События: B1 - «хотя бы одно попадание», B2 - «хотя бы один промах»; в) опыт – бросание двух игральных костей. События: C1 - «хотя бы на одной кости появилось три очка», C2 - «появление чѐтного числа очков на каждой кости»; г) опыт – извлечение двух шаров из урны, содержащей белые и черные шары. События: D1 - «взято два белых шара», D2 - «оба изв-лечѐнных шара одного цвета»; д) опыт – покупка двух лотерейных билетов. События: E1 - «выиграют два билета», E 2 - «выиграет хотя бы один билет», E 3 - «выиграет только один лотерейный билет»? 2.13 Образуют ли полную группу следующие события: а) опыт – два выстрела по мишени. События: A1 - «два попадания в мишень», A2 - «хотя бы один промах по мишени»; 24 б) опыт – бросание двух игральных костей. События: B1 - «сумма очков на верхних гранях больше 3», B2 - «сумма очков на верхних гранях равна 3»; в) опыт – выдано четыре кредита. События: C1 - «возвращен один кредит», C2 - «возвращены два кредита»; C3 - «возвращены три кредита», C4 - «возвращены четыре кредита»; г) опыт – покупатель посещает три магазина. События: D1 - «покупатель купит товар хотя бы в одном магазине», D2 - «покупатель не купит товар ни в одном магазине»? 2.14 В экзаменационном билете три вопроса. Рассматриваются события: A1 - «дан правильный ответ на первый вопрос», A2 - «дан правильный ответ на второй вопрос», A3 - «дан правильный ответ на третий вопрос». Что означают события: а) A1  A2  A3 ; б) A1  A2  A3 ; _ _ _ __________ в) A1 A2  A3 ; г) A1  A2  A3 ; _ _ _________ _ _ _ д) A1 A2  A3 ; е) A1 A2  A3 ? Ответы: 2.1 а) А; б) А. 2.2 а) Ω; б) Ø. 2.5 ничья. 2.6 B  A1  A2  A3 , _ _ _ С  A1  A2  A3 , В  A1  A2  A3  A1  A2  A3  A1  A2  A3  A1 A2  A3 . 2.8 «выигрывает первый»= Г  Р  Р  Г  Р  Р  Р  Р  Г  Р  Р  Р  Р  Р  Р  Г  ... ; «выигрывает второй»= = Р  Г  Р  Р  Р  Г  Р  Р  Р  Р  Р  Г  Р  Р  Р  Р  Р  Р  Р  Г  ... ; ничья. 2.11 нет. 2.12 а) да; б) нет; в) да; г) нет; д) нет. 2.13 а) да; б) нет; в) нет; г) да. 25 1.3. Аксиомы теории вероятностей. Вероятностные модели Теория вероятностей изучает математические модели случайных явлений, но не всех, а только таких, которые обладают свойством статистической устойчивости вероятностной модели относительных считаются частот. известными все В любой возможные неразложимые исходы эксперимента. Однако множество таких исходов может быть конечным или бесконечным. В зависимости от этого строят различные вероятностные модели. Пусть Ω - множество всех возможных исходов некоторого эксперимента. Каждый элемент ω множества Ω называют элементарным событием или элементарным исходом, а само множество Ω - пространством элементарных событий. Любое событие А рассматривается как некоторое подмножество (часть) множества Ω, т.е. A Ω. Под операциями над событиями понимаются операции над соответствующими множествами. Сформулируем аксиомы, задающие само понятие вероятности: А.1 Каждому событию А поставлено в соответствие неотрицательное число P(А), называемое вероятностью события А: P A ≥0. Так как любое событие есть множество, то вероятность события есть функция, заданная на множестве. А.2 Вероятность достоверного события равна 1: А.3 Вероятность суммы несовместных P Ω   1. событий равна вероятностей этих событий, т.е. если Ai A j =Ø ( I ≠ j ), то n  n  P Ai  . P  Ai  =  i 1  i 1 Из аксиом А.1–А.3 следуют основные свойства вероятности: 1) Если Ø – невозможное событие, то P (Ø)=0. 2) P A   1 - P A . 26 сумме 3) При A  B справедливо неравенство: P A ≤ P B . 4) Для любых двух событий А и В: P A  B  P A  P B - P A  B . (это свойство называется расширенной формулой сложения).  k 5) Для любых событий A1, A2 ,…, Ak : P  Ai   i 1 Теорема.  k  ≤ P Ai  .   i 1 Сумма вероятностей событий A1, A2 ,…, Ak , образующих полную группу, равна единице: k P Ai   1. i 1 Классическое использование термина вероятность связано с экспериментами, в которых число равновозможных результатов – конечно. Вероятностная схема таких опытов была описана элементарных исходов французским математиком П. Лапласом. Множество всех равновозможных эксперимента с конечным числом результатов обозначается Ω , а его элементы – маленькими буквами ωi : Ω   ω1, ω2 ,...,ωn . Случайное событие А представляется в виде множества элементарных исходов. Возможность наступления какого-либо элементарного исхода оценивается числом вероятностью: ω которое p, называется элементарной Ω p  pω . При этом: 1) 0 ≤ pω ≤ 1; pω   1 . 2) ω Ω Мера реализуемости случайного вероятностью события А: P A  события pω   ω A Эта формула вероятность дает классическое случайного события А называется A . Ω определение вероятности: А вычисляется как отношение числа элементарных исходов, благоприятствующих появлению А, к общему числу возможных элементарных исходов. 27 Обычная схема подсчета вероятности случайного события А для описанной выше модели выглядит так: 1) выбирается (с Ω обоснованием равновозможности элементарных исходов); 2) подсчитывается количество элементов в Ω ; 3) подсчитывается количество элементов в А; 4) вычисляется вероятность P  A  A . Ω Именно около числа P(A) группируются относительные частоты события А. Заметим, что определение вероятности не требует, чтобы испытания производились относительной частоты в действительности; предполагает, чтобы определение испытания были произведены фактически. Пример 3.1 Монета брошена 3 раза. Какова вероятность выпадения двух гербов и одной решки? Решение: Опишем множество всех возможных исходов: Ω={ГГГ, ГГР, ГРГ, РГГ, РРГ, ГРР, РГР, РРР} => |Ω|=8. Случайное событие А – два герба и одна решка – описывается следующими исходами: А={ГГР, ГРГ, РГГ} => |А|=3. Таким образом, искомая вероятность Р  А  3  0,375 . 8 ■ Пример 3.2 Из колоды в 52 карты извлекают наудачу 3 карты. Вычислить вероятность того, что это будут «тройка, семерка, туз». Решение: Пространство возможных элементарных исходов Ω представляет собой множество троек карт, причем перечислять все его элементы не нужно – их достаточно много. Эксперимент состоит в том, что из совокупности, содержащей 52 элемента, извлекается выборка (без возвращения) из 3-х элементов. Количество таких выборок равно числу сочетаний из 52 по 3. 28 Следовательно, общее число возможных элементарных исходов равно: 52 ! 3 Ω  C52  . 3 !· 49 ! Обозначим через А – событие, состоящее в том, что три извлеченные наудачу карты будут «тройка, семерка, туз». Так как «троек» в колоде 4 штуки, то количество способов извлечь одну «тройку» из четырех равно C41 . Такое же количество способов соответствует извлечению одной «семерки» из четырех «семерок», одного «туза» из четырех «тузов». Значит, по правилу произведения число исходов, благоприятствующих появлению события А равно: |А|  C41 · C41 · C41 . P A  Тогда C 41 · C41 · C41 3 C52  искомая вероятность: 4· 4· 4· 3 !· 49 ! ≈0,0029. 52 ! ■ Пример 3.3 Будущих бухгалтеров учат проверять правильность накладной. В качестве проверки преподаватель предлагает студентам проверить 10 накладных, 4 из которых содержат ошибки. Он берет наугад 2 накладные и просит проверить. Какова вероятность того, что они окажутся: а) обе ошибочные; б) одна ошибочная, а другая нет; в) обе правильные? Решение: Эксперимент состоит в случайном выборе 2 элементов из имеющихся 10. Значит, количество элементарных исходов будет равно числу сочетаний из 10 по 2: а) Пусть событие 10 ! 2   45 . |Ω|  C10 2 !·8 ! А – «обе накладные ошибочные». Число способов 4! 6 извлечь 2 накладные с ошибками из 4-х ошибочных равно C42  2 !·2 ! . Следовательно, вероятность равна: 29 P  A  A 6   0,133. Ω 45 б) Обозначим событие «одна ошибочная, другая нет» через В. Количество способов извлечь 1 неправильную накладную из 4 равно 4, количество способов взять 1 правильную накладную из 6-ти правильных равно 6. По правилу умножения число исходов, благоприятствующих появлению события В равно 4·6  24 . Значит, P B   B 24   0,533. Ω 45 в) Пусть событие С – «обе правильные», тогда события А, В и С образуют полную группу – они несовместны и в результате испытания может произойти только одно из них: A  B  C  Ω . По теореме о сумме вероятностей событий, образующих полную группу: P A  P B   P C   1. Отсюда: P C   1 - 0,133 - 0,533  0,334 . ■ Пример 3.4 Магазин получает товар партиями по 100 штук. Если 5, взятых наугад, образцов соответствуют стандартам, партия товара поступает на реализацию. В очередной партии 8 единиц товара с дефектами. Какова вероятность того, что партия поступит на элементов из реализацию? Решение: Эксперимент состоит в извлечении 5 множества, содержащего 100 элементов, следовательно, число всех 5 возможных элементарных исходов равно: |Ω|  C100 . В данной партии 8 единиц товара с дефектами, значит, 92 изделия – качественных. Для того чтобы партия поступила на реализацию необходимо, чтобы среди проверяемых 5-ти образцов брака не было. Следовательно, число исходов, благоприятствующих появлению данного события равно: |А| 5 5 .  C80 ·C92  C92 Искомая вероятность 0 5 A C8 ·C92 92! 5!·95! P A    ·  0,653. 5 Ω 5 ! · 87 ! 100 ! C100 30 равна: ■ Пример 3.5 Определить вероятность того, что в группе из 20-ти человек имеются совпадающие дни рождения. Решение: Обозначим через А искомое событие, тогда противоположное ему событие A означает, что совпадающих дней рождения нет. Число всех элементарных исходов опыта равно 365 20 , а число исходов, 20 благоприятствующих событию A , равно A365 . Следовательно, P A   20 A365 365 20  365·364·...·365 - 19  365 20 ≈0,589. Тогда P A  1 - P A   1 - 0,589  0,411 . ■ Одним из недостатков модели Лапласа (классического определения вероятности) является предположение о конечном числе возможных исходов испытания. Но часто встречаются такие испытания, для которых число возможных исходов бесконечно. В таких рассматривается случаях строится пространство Ω геометрическая с бесконечным модель: числом равновозможных исходов. Элементарные исходы интерпретируются как выбор наудачу точки из некоторого множества в Rm . Предполагается, что множество имеет некоторую геометрическую форму, которую можно каким-либо образом измерить (определить длину – в R 1, либо вычислить площадь – в R 2 , объем – в R 3 и т.п.). Событием называется следующее: выбранная точка принадлежит заданной части фигуры. Вероятность такого события определяется как отношение меры (обозначение mes) части фигуры А к мере всей фигуры Ω: P  A  mes  A . mes Ω  В описанной геометрической модели остаются в силе все аксиомы А.1 – А.3, соответственно выполняются все свойства 1 – 5. 31 Пример 3.6 Пусть отрезок l составляет часть отрезка L. Определить вероятность попадания точки, поставленной наугад, на отрезок l. Решение: В результате данного опыта (бросания наугад точки) возможно бесчисленное множество исходов: при этом нет оснований считать неравновозможными хотя бы два каких-либо исхода из всего множества исходов. Понятно, что брошенная точка может оказаться на отрезке l (l L), а может там и не оказаться. Поэтому возможно говорить о вероятности попадания точки на отрезок l. В данном случае мерой рассматриваемых множеств является длина: mes( l )=длина l, mes( L )=длина L. Тогда: P  A  l . L ■ Пример 3.7 Перед окопами вдоль прямой линии через каждые 10 метров установлены противотанковые мины. Перпендикулярно этой линии движется танк, ширина которого 3 метра. Какова вероятность того, что танк пересечет линию установки мин невредимым? Решение: Ось симметрии танка может пересечь линию установки мин в любой ее точке, т.е. исходы испытания (пересечения линии) образуют бесконечное множество, поэтому здесь классическое определение вероятности неприменимо. Пусть отрезок прямой, расположенный между двумя соседними минами, изображен на рис.2. Танк при своем движении может попасть на один из таких отрезков. 10м А 1,5м С D Рис. 2 32 1,5м В Расстояние АВ  10 м, АС  DB  1,5 м. Если ось симметрии танка попадет на отрезок АС или DB, то произойдет взрыв, а если ось симметрии попадет на отрезок CD, то его не будет. Таким образом, областью, благоприятствующей наступлению события А, заключающегося в беспрепятственном пересечении линии установки мин, является отрезок CD, а множеству всех исходов соответствует отрезок АВ. Тогда вероятность благополучного продвижения танка через линию установки мин равна: P  A  CD 7   0,7 . AB 10 ■ Пример 3.8 Пассажир может добраться до места на любом из двух автобусов, интервалы движения которых соответственно равны 5 и 10 мин. Определить вероятность того, что пассажиру, подошедшему в случайный момент времени на остановку, ждать придется не более 2 мин. Решение: Пусть x – время ожидания, например, первого автобуса; y – время ожидания второго автобуса. Тогда пару  x; y  чисел можно рассматривать как координаты точки на плоскости. Все пространство возможных элементарных исходов можно описать как множество Ω={(x;y): 0≤x≤5, 0≤y≤10}, а искомое событие А как часть этого множества (на рис.3 прямоугольник изображает множество Ω, а заштрихованная фигура – множество А): у А={(x;y): 0≤x≤5, 0≤y≤10, либо 0≤x≤2, либо 0≤y≤2}. 10 Ω В данном случае будет естественным связать вероятность с площадями фигур: mes Ω   SΩ  5·10  50 ; mes A  SA  SΩ - SA  26. 2 0 2 5 рис. 3 P  A  х S A 26   0,52 SΩ 50 ■ ■ 33 Пример 3.9 Пассажир может добраться до места с пересадкой на двух автобусах, интервалы движения которых соответственно равны 5 и 10 мин. Вычислить вероятность того, что на ожидание автобусов пассажиру потребуется не более 2 мин. Решение: Условие данной задачи отличается от предыдущей тем, что теперь пассажир должен ждать и первый автобус (на одной остановке), и второй автобус (на следующей остановке), т.е. речь идѐт уже о суммарном времени ожидания. Поэтому все множество элементарных исходов останется прежним, а множество, задающее искомое событие, будет другим: A={(x;y): 0≤x≤5, 0≤y≤10, 0≤x+y≤2 }. На рис.4 фигура А – это y 10 заштрихованный треугольник. Следовательно, 1 mes  A  S Δ  · 2· 2  2 , поэтому: 2 Ω P  A  2 SΔ 2   0,04 SΩ 50 А 0 2 5 х рис.4 ■ Пример 3.10 (задача о встрече). Два лица (А и В) имеют одинаковую вероятность прийти к указанному месту в любой момент промежутка времени T. Определить вероятность того, что время ожидания одним другого будет не больше t. Решение: Обозначим моменты прихода к указанному месту лиц А и В соответственно через x и y. По условию 0 ≤ x ≤ T, 0 ≤ y ≤ T. Этим неравенствам удовлетворяют координаты любой точки, принадлежащей квадрату со стороной, равной T. Событие А – встреча двух лиц – произойдет, если разность между x и y не будет превышать величины t, 34 т.е. будет выполняться неравенство |x-y|≤t. Этому неравенству удовлетворяют все точки, лежащие в полосе x-t ≤ y ≤ x+t, которая на рис. 5 – заштрихована и является частью фигуры Ω. Тогда вероятность встречи в течение промежутка времени t равна: S A T 2 - T - t 2 P  A   . 2 SΩ T y T А Ω t t T x рис. 5 ■ Принцип практической уверенности: В статистике все события подразделяют на «маловероятные», «высоковероятные» и «типичные». Интуитивно понятно: если известно, что данное событие имеет вероятность, близкую к нулю, то, скорее всего, в единичном испытании оно не произойдет. Если же вероятность события близка к единице, то практически можно считать, что в единичном испытании это событие наступит. Естественно возникает вопрос о значении порогового уровня для слишком малой и слишком большой вероятности. Экономисты традиционно в качестве порогового значения, отделяющего «малые» вероятности используют α  0,05 (пятипроцентный уровень значимости). Для «больших» вероятностей такое значение равно 35 1  α  0,95. Соответственно, если вероятность случайного события А удовлетворяет условию: 0,05 ≤ P  A ≤ 0,95 , то такое событие считается «типичным», следовательно, его наступление в эксперименте можно объяснить случайностью. Если вероятность случайного события А меньше 0,05, но, тем не менее, событие произошло, то это можно считать подозрительным фактом; аналогично подозрительным будет и ненаступление «высоковероятного» события. Задачи для самостоятельного решения: 3.1 Имеются карточки, на каждой из которых – цифра (от 0 до 9). Чему равна вероятность, извлекая наудачу 3 карточки, получить число 129? а) выборка без возвращения; б) с возвращением. 3.2 Куб, все грани которого окрашены, распилен на тысячу кубиков одинакового размера. Полученные кубики тщательно перемешаны. Определить вероятность того, что кубик, извлеченный наудачу, будет иметь: а) все грани неокрашенные; б) одну окрашенную грань; в) две окрашенные грани; г) три окрашенные грани; д) четыре окрашенные грани. 3.3 В коробке лежат одинаковые по внешнему виду конфеты: 2 с орешками и 2 с мармеладом. Возьмем наудачу 2 конфетки. Вероятность какого из событий больше: того, что обе конфеты с одинаковой начинкой или что с разной? 3.4 Бросаются два игральных кубика. Какова вероятность того, что: а) сумма выпавших очков равна 7; б) сумма выпавших очков меньше 4; в) сумма равна 7, а произведение не превосходит 10? 3.5 Можно ли объяснить случайностью, что в наудачу составленной стопке из 10-ти дисков оказались рядом: а) два определенных диска; б) три определенных диска? 36 3.6 Можно ли объяснить случайностью, что в группе из 5 человек, у всех совпадают дни рождения? 3.7 Из колоды карт (52 шт.) вынимаются наудачу 4 карты. Какова вероятность того, что они: а) одной масти; б) одного значения; в) все разных значений; г) все разных мастей? 3.8 В ящике 5 красных и 8 белых шаров. Наудачу извлекается 3 шара. Какова вероятность того, что среди них: а) ровно 1 белый шар; б) ни одного белого; в) все шары – белые; г) красных больше, чем белых? 3.9 Светофор горит 60 сек. зеленым светом и по 30 сек. – красным и желтым. Какова вероятность того, что случайной машине: а) не придется ждать у светофора; б) придется ждать более 20 сек.? (ехать можно только на зеленый свет). 3.10 Два парохода должны подойти к одному и тому же причалу. Время прихода обоих пароходов независимо и равновозможно в течение данных суток. Определить вероятность того, что одному из пароходов придется ожидать освобождения причала, если время стоянки первого парохода один час, а второго – два часа. 3.11 Два приятеля договорились встретиться между 17 и 18 часами. Каждый приходит наугад и ждет 10 минут. Какова вероятность встречи? 3.12 Считают, что дневная выручка магазина X принимает значения от 20 тыс. руб. до 80 тыс. руб. Найти вероятности событий: А – выручка магазина за один день больше 40 тыс. руб.; B – выручка магазина за два дня больше 80 тыс. руб.; C – выручка магазина за три дня больше 120 тыс. руб. 3.13 На дно колодца квадратного сечения поставим ведро, стенки которого касаются стенок колодца. Какова вероятность того, что, бросая наугад камешек, мы попадем в ведро? 3.14 В сигнализатор поступают сигналы от двух устройств, причем поступление каждого из сигналов равновозможно в любой момент промежутка времени длительностью T. Моменты поступления сигналов независимы один от другого. Сигнализатор срабатывает, если разность 37 между моментами поступления сигналов меньше t (t<T). Найти вероятность того, что сигнализатор сработает за время T, если каждое из устройств пошлет по одному сигналу. 3.15 Какова вероятность того, что сумма двух взятых наугад положительных чисел, каждое из которых меньше либо равно единицы, не превзойдѐт 1, а их произведение будет меньше либо равно 2 ? 9 3.16 Наудачу взяты два положительных числа x и y, каждое из которых не превышает двух. Найти вероятность того, что произведение xy будет не больше единицы, а частное x/y не больше двух. 3.17 Наудачу взяты два положительных числа x и y, каждое из которых не превышает единицы. Найти вероятность того, что сумма x+y не превышает единицы, а произведение xy не меньше 0,09. 3.18 Код домофона состоит из восьми цифр, которые могут повторяться. Какова вероятность того, что, случайно набирая цифры, можно угадать нужный код? 3.19 Двое друзей, Алексей и Вадим, стоят в очереди из 8 человек. Найти вероятность того, что: а) Алексей и Вадим стоят рядом; б) между Алексеем и Вадимом стоят два человека. 3.20 Из колоды в 36 карт извлекаются наудачу 4 карты. Какова вероятность событий: A – все извлеченные карты пиковой масти, B – среди этих четырех карт окажется хотя бы один король? 3.21 Из 40 вопросов, входящих в экзаменационные билеты, студент знает 30. Найти вероятность того, что среди трѐх наугад выбранных вопросов студент знает: а) 3 вопроса; б) 2 вопроса; в) 1 вопрос. 3.22 Сколько раз нужно бросить игральную кость, чтобы с вероятностью 0,6 хотя бы один раз выпало 6 очков? 3.23 В лотерее разыгрывается 100 билетов. Выигрыши выпали на 20 билетов. Некто приобрел 5 билетов. Найти вероятности следующих событий: а) выигрыш выпадет на все 5 билетов; б) выигрыш выпадет хотя бы на один билет; в) выигрыш выпадет на два билета. 38 3.24 В ящике 20 деталей, 4 из них – нестандартные. Какова вероятность того, что среди 6 наугад взятых деталей нестандартных не окажется? 3.25 Найти вероятность того, что 30 студентов одной группы родились: а) в разные дни года (в году 365 дней); б) в один день года; в) 8 марта; г) в разные месяцы года; д) в сентябре; е) в разные дни сентября. 3.26 Какова вероятность того, что произвольно взятое трѐхзначное число делится на 3? 3.27 Какова вероятность, что два определенных студента будут направлены на практику в город C, если в наличие имеется 5 мест в город A, 8 – в город B и 7 – в город C? 3.28 В круг радиуса r наудачу брошена точка. Какова вероятность того, что эта точка окажется внутри вписанного в круг правильного треугольника? 3.29 На отрезке вероятность 0; 3 того, наудачу выбраны два числа x и y . Найти что эти числа удовлетворяют неравенствам x 2  3y  3 x . 3.30 Наудачу выбирают два числа из промежутка вероятность того, что их сумма заключена между 0 ; 1 . Какова 1 и 1? 4 3.31 Дано шесть карточек с буквами Н, М, И, Я, Л, О. Найти вероятность того, что: а) получится слово ЛОМ, если наугад одна за другой выбираются три карточки; б) получится слово МОЛНИЯ, если наугад одна за другой выбираются шесть карточек и располагаются в ряд в порядке появления. Ответы: 3.1 а) 0,0014; б) 0,001. 3.2 а) 0,512; б) 0,384; в) 0,096; г) 0,008; д) 0. 3.3 с разной – больше. 3.4 а) ≈0,167; б) 0,083; в) 0,111. 3.5 а) p=0,2; да; б) p=0,067; нет. 3.6 нет. 3.7 а) 0,01; б) 0,000048; в) 0,676; г) 0,315. 3.8 а) 39 0,28; б) 0,035; в) 0,196; г) 0,315. 3.9 а) 0,5; б) 0,33. 3.10 0,121. 3.11 0,306. 3.12 P A  0,667 ; P B   0,78 ; P C   0,83 . 3.13 0,785.   3.14 T 2  T  t 2 /T 2 . 3.15 0,487. 3.16 ≈0,38. 3.17 ≈0,2. 3.18 1/ 10 8 . 3.19 а) 0,25; б) 0,012. 3.20 P A  0,0021 ; P B   0,39 . 3.21 а) ≈0,41; б) ≈0,44; в) ≈0,14. 3.22 5. 3.23 а) ≈0,0002; б)≈0,69; в)≈0,21. ≈0,21. 3.25 а) 3.24 30 ! 365 30 . 3.26 365! 365 30  335! ; б) 1 365 29 1 ; в) 365 30 ; г) 0; д) 1 12 30 ; е) 21 1 1 15 . 3.27 . 3.28 ≈0,41. 3.29 . 3.30 . 3 190 6 32 3.31 а) 1/120; б) 1/720. 1.4. Условная вероятность, зависимость и независимость событий. Формула Байеса При совместном рассмотрении двух случайных событий A и B часто возникает вопрос: насколько связаны эти события друг с другом, в какой мере наступление одного из них влияет на возможность наступления другого? Для характеристики зависимости одних событий от понятие отношение P  AB  называется условной вероятностью события В P A условии наступления вероятности. события Пусть P A ≠0, вводится при условной других А. Такая тогда вероятность обозначается P(B/A). По определению имеем следующее равенство: P (B/A) = P  AB  . P A Теорема 1 (умножения вероятностей). Вероятность совместного наступления двух событий равна вероятности одного из этих событий при условии другого, умноженной на вероятность самого условия: P AB  P A  P B / A. 40 Утверждение теоремы непосредственно следует из определения условной вероятности и допускает распространение на случай большего числа сомножителей: P( A1 A2 A3 ...Ak )= P A1 ·P A2 /A1 ·P A3 /A2 A1 ·...·P Ak /Ak -1...A3 A2 A1 . Пример 4.1 Вероятность дожить человеку до 20 лет равна 0,96; вероятность дожить человеку до 60 лет равна 0,69. Какова вероятность дожить до 60 лет человеку 20 – летнего возраста? Решение: Обозначим через «0–20» - событие, состоящее в том, что родившийся человек доживет до 20-ти лет; «0–60» - родившийся человек доживет до 60-ти лет; «20–60» - двадцатилетний доживет до 60 лет (разумеется, при условии, что до 20-ти лет он дожил). По условию: 0,96=P(«0–20»); 0,69=P(«0–60»)=P(«0–20»  «20–60»). Тогда вероятность дожить до 60 лет человеку 20 – летнего возраста определяется как условная вероятность: P(«20–60»/«0–20»)= P «0 - 60»  0,69  =0,719. P «0 - 20»  0,96 ■ Пример 4.2 Слово «лотос», составленное из букв – кубиков, рассыпано на отдельные буквы, которые затем сложены в коробке. Из коробки наудачу извлекаются одна за другой три буквы. Какова вероятность того, что при этом появится слово «сто»? Решение: Введем обозначения для событий: A1 - первой извлечена буква «с»; A2 - второй извлечена буква «т»; A3 - третьей извлечена буква «о»; А – получилось слово «сто». Очевидно, A  A1 A2 A3 . Тогда: P  A  P A1  ·P A2 /A1  ·P A3 /A2 A1   1 1 2 1 · ·  . 5 4 3 30 ■ Если появление события А не зависит от того, произошло или нет событие В, то условная вероятность А в предположении, что событие В 41 наступило, будет равна вероятности А, т.е. P(A/B)=P(A). Подставляя в формулу умножения вероятностей вместо P(A/B) вероятность P(A), получим: P(AB)=P(A)·P(B). Если это соотношение выполняется, то события А и В называются независимыми. Утверждение 1. Пусть события А и В – независимы. Тогда независимы также события A и В, А и B , A и B . Пример 4.3 Известно, что P(A)=0,6; P( A  B )=0,8; P( A  B )=0,5. Найти P(B), P(A/B), P(B/A) и выяснить, зависимы ли события A и B? Решение: Используя расширенную формулу сложения: P( A  B )=P(A)+ P(B) - P( A  B ), можно найти вероятность события B: P(B)= P( A  B )+P( A  B ) - P(A)=0,8+0,5-0,6=0,7. Далее по формуле для условной вероятности имеем: P(A/B)= P  A  B  0,5 5 P  A  B  0,5 5   ≈0,714; P(B/A)=   ≈0,833. P B  0,7 7 P  A 0,6 6 Поскольку P( A  B )=0,5 и P(A)·P(B)=0,6·0,7=0,42, то P( A  B )≠P(A)·P(B); следовательно, события A и B – зависимы. ■ Несколько событий называют попарно независимыми, если каждые два из них независимы. Несколько событий называют независимыми в совокупности, если независимы каждые два из них и независимы каждое событие и все возможные произведения остальных. Отметим, что требование независимости событий в совокупности сильнее требования их попарной независимости. Утверждение 2. Вероятность совместного появления нескольких событий, независимых в совокупности, равна вероятностей этих событий: P A1 A2 ...Ak   P A1 ·P A2  · ...· P Ak . 42 произведению Если события A1 , A2 ,…, Ak - независимы в совокупности, то и противоположные им события A1 , A2 ,…, Ak также независимы в совокупности. Теорема 2. Вероятность появления хотя бы одного из событий A1 , A2 ,…, Ak , независимых в совокупности, равна разности между единицей и произведением вероятностей противоположных событий: P A  1 - P A1 ·P A2  ·...· P Ak . Следствие. Если события A1 , A2 ,…, Ak имеют одинаковую вероятность, равную p, то вероятность появления хотя бы одного из этих событий P A =1- q k , где q=1-p. Пример 4.4 По одной и той же мишени стреляют одновременно двое. Вероятность попадания для первого стрелка равна 0,7; для второго – 0,6. Определить вероятность поражения цели. Решение: Данную задачу можно решить тремя способами, приведем каждый из них. Введем обозначения: A1 - событие, состоящее в том, что первый стрелок попал в цель; A2 - второй попал; А – цель поражена. 1) P A  P ( A1 A2  A1A2  A1A2 ) = P A1 A2   P A1A2   P A1A2     несовместн ые события = P A1P A2   P A1P A2   P A1P A2   0,7·0,6+0,3·0,6+0,7·0,4= =0,42+0,18+0,28=0,88.     2) P  A  P  A1  A2  = P A1   P A2  - P A1A2  =0,7+0,6-0,7·0,6=       совместные  =1,3-0,42=0,88. 3) P  A  1- P A1P A2   1-0,3·0,4=1-0,12=0,88. ■ Пример 4.5 На связке 5 ключей. К замку подходит только один ключ. Найти вероятность того, что: а) потребуется не более двух попыток 43 открыть замок, если опробованный ключ в дальнейших испытаниях не участвует; б) нужный ключ окажется последним. Решение: а) Обозначим через: A событие - «потребуется не более двух попыток»; 1 – «первая попытка успешна»; 1 ·2 – «с первой попытки замок не открылся, а со второй – открылся». Тогда: P(A)= P(1+ 1 ·2)=P(1)+ P( 1 ·2)= P(1)+ P( 1 )·P( 2 / 1 )= 1 4 1 2  · = =0,4. 5 5 4 5 б) Событие «нужный ключ окажется последним» означает, что первый ключ не подошел, и второй ключ замок не открыл, …, четвертый ключ не подошел, а пятому - «уже деваться некуда» ( 1 · 2 · 3 · 4 ·5). Представляя данное событие в виде произведения зависимых событий, получим: P( 1 · 2 · 3 · 4 ·5)= P ( 1 )·P( 2 / 1 )·P( 3 / 1 2 )·P( 4 / 1 2 3 )·P(5/ 1 2 3 4 )= = 4 3 2 1 1 · · · ·1= =0,2. 5 5 4 3 2 ■ Пример 4.6 Для разрушения моста достаточно попадания одной авиационной бомбы. Найти вероятность того, что мост будет разрушен, если на него сбросить четыре бомбы, вероятности попадания которых соответственно равны: 0,3; 0,4; 0,6; 0,8. Решение: Обозначим через Аi - событие, состоящее в том, что i–ая бомба достигла цели; соответственно через Ai - противоположное событие (бомба пролетела мимо). Разрушение моста означает, что хотя бы одна бомба достигнет цели. События A1 , A2 , A3 , A4 - независимы, следовательно, независимыми будут и противоположные им события. Поэтому искомая вероятность равна: P A  1 - P A1P A2 P A3 P A4   1-(1-0,3)(1-0,4)(1-0,6)(1-0,8)=0,9664. ■ Теорема 3. Если событие A может произойти только при условии появления одного из событий (гипотез) B1 , B2 , …, Bn , образующих полную группу, то вероятность события A равна сумме произведений 44 вероятностей каждого из этих событий (гипотез) на соответствующие условные вероятности события A: P(A)  n i 1 P (Bi )  P ( A / Bi ) . Указанная формула называется формулой полной вероятности. Пример 4.7 В коробку побросали n шариков, закрыли ее и хорошенько потрясли. Затем добавили один белый шар, перемешали все шары и наудачу извлекли один шар. Определить вероятность того, что извлеченный шар – белый, если все гипотезы о первоначальном составе шаров – равновероятны? Решение: Обозначим через Bi - гипотезу, состоящую в том, что первоначально в коробке было i P B0   P B1   ...  P Bn   белых шаров, по условию: 1 . Так как все события B0 , B1 , …, Bn n1 попарно несовместны, то, после добавления одного белого шара, вероятность извлечения белого шара определяем по формуле полной вероятности: P  A  P B0 P A / B0   ...  P Bn P A / Bn    1 1 2 (   ...  1)  n1 n1 n1 1 1 n  1 n2 · · (n  1)  . n  1 2(n  1) 2(n  1) ■ В тесной связи с формулой полной вероятности находится так называемая формула Байеса. Она относится к той же ситуации, что и формула полной вероятности (событие A может наступить только вместе с одним из n попарно несовместных событий B1 , B2 , …, Bn ). Допустим, что опыт уже произведен, и нам известно, что событие A наступило. Сам по себе этот факт еще не позволяет сказать, какое из событий B1 , B2 , …, Bn имело место в проделанном опыте. Можно, 45 однако, поставить такую задачу: найти вероятности P B1 / A , …, P Bn / A каждой из гипотез в предположении, что наступило событие A (такие вероятности называются апостериорными в отличие от вероятностей P(B1 ) , …, P (Bn ) , вычисляемых до опыта и называемых априорными). С одной стороны, вероятность совмещения двух зависимых событий определяется по формуле: P(ABi )  P ( A / Bi )  P (Bi ) , а с другой стороны, имеем: P(B i A)  P (Bi / A)  P ( A) . Приравнивая правые части, получим: P (Bi / A)  P ( A)  P ( A / Bi )  P (Bi ) , откуда следует: P(B i / A)  P ( A / Bi )  P (Bi ) , P  A где знаменатель рассчитывается по формуле полной вероятности. Таким образом, апостериорная вероятность определяется по формуле: P ( A / Bi )  P (Bi ) P(B i / A)  n ,  P ( A / Bi )  P (Bi ) i 1 которая называется формулой Байеса. Запомнить ее нетрудно: в знаменателе стоит выражение для полной вероятности события A, а в числителе – одно из слагаемых этого выражения. Формула Байеса дает возможность «пересмотреть» вероятности гипотез с учетом наблюдавшегося результата опыта. Пример 4.8 Известно, что 5% мужчин и 0,2% женщин – дальтоники. Какова доля мужчин среди дальтоников? Решение: Обозначим событие, состоящее в том, что выбранный наудачу человек оказался: дальтоником через D; женщиной – F; мужчиной – M. По условию: P(D/M)=0,05 и P(D/F)=0,002. Требуется найти вероятность того, что выбранный наудачу дальтоник оказался мужчиной P(M/D). По формуле Байеса: P(M/D)= 46 P M ·P D/M  , P D  где знаменатель вычисляется по формуле полной вероятности: 1 1 P D   P M ·P D/M   P F ·P D/F  = ·0,05+ ·0,002=0,026. 2 2 Тогда искомая вероятность будет равна: 1 ·0,05 2 P(M/D)= =0,96, т.е. 0,026 среди дальтоников 96% мужчин. ■ Пример 4.9 Страховая компания разделяет застрахованных по группам риска: малый риск, средний риск и высокий риск. Среди этих клиентов 50% относятся к группе малого риска, 30% - к группе среднего риска и 20% - к группе высокого риска. Вероятность необходимости выплачивать страховую выплату для клиентов первой группы равна 0,01; для второй группы – 0,04 и для третьей – 0,09. Какова вероятность того, что: а) клиент получит страховую выплату за период страхования; б) получивший страховую выплату клиент относится к группе малого риска? Решение: Обозначим событие, состоящее в том, что клиент относится к i–ой группе риска через Bi ; событие, состоящее в том, что клиент получит страховую выплату за период страхования – А. По условию: P B1   0,5 ; P B2   0,3 ; P B3   0,2 . Вероятности страховых выплат для клиентов каждой группы – это апостериорные вероятности гипотез B1 , B2 и B3 : P(A/ B1 )=0,01; P(A/ B2 )=0,04 и P(A/ B3 )=0,09. а) Вероятность получения клиентом страховой выплаты за период страхования вычисляется по формуле полной вероятности: P A  P B1  P A/B1  P B2   P A/B2   P B3   P A/B3  . P A =0,5·0,01+0,3·0,04+0,2·0,09=0,035. 47 б) Так как клиент уже получил страховую выплату, значит, речь идет об апостериорной вероятности, которую вычисляют по формуле Байеса: P B1 /A  P B1   P A/B1  0,5·0,01  ≈0,143. P  A 0,035 ■ Пример 4.10 При обследовании больного имеется подозрение на одно из двух заболеваний B1 и B2 . Их вероятности в данных условиях: P B1  0,6 и P B2   0,4 . Для уточнения диагноза назначается анализ, результатом которого является положительная или отрицательная реакция. В случае болезни B1 вероятность положительной реакции равна 0,9, отрицательной – 0,1; в случае B2 положительная и отрицательная реакции равновероятны. Анализ произвели дважды, и оба раза реакция оказалась отрицательной (событие A). Найдите вероятность каждого заболевания после проделанных анализов. Решение: В случае заболевания B1 событие A происходит с вероятностью 0,1·0,1=0,01, а в случае заболевания B2 - с вероятностью 0,5·0,5=0,25. Следовательно, по формуле Байеса имеем: P B1 / A  P A / B1   P B1  0,01  0,6  ≈0,06; P A / B1 P B1   P A / B2 P B2  0,01  0,6  0,25  0,4 P B2 / A  0,25·0,4 ≈0,94. 0,01  0,6  0,25  0,4 ■ Задачи для самостоятельного решения: 4.1 Известно, что P(A)>0,5; P(B)>0,8. Могут ли такие события A и B: а) быть несовместными; б) быть противоположными; в) верно ли неравенство P( A  B )>0,2? 4.2 Вероятность для человека, поступившего в университет, закончить первый курс равна P; вероятность проучиться успешно до пятого курса и 48 закончить его равна Q. Какова вероятность для второкурсника успешно закончить пятый курс? 4.3 При включении зажигания двигатель начинает работать с вероятностью 0,6. Найти вероятность того, что: а) двигатель начнет работать при третьем включении зажигания; б) для запуска двигателя придется включать зажигание не более трѐх раз. 4.4 Два охотника стреляют по летящей утке. Шансы попадания оцениваются для первого охотника как 90%, а для второго – 80%. Найти вероятность того, что птичке не спастись. 4.5 6 шаров (4 белых и 2 чѐрных) случайным образом раскидали в два ящика по три шара в каждый. а) Какова вероятность того, что ровно один чѐрный шар попал в первый ящик? б) Из первого ящика достали шар, он оказался белым. Какова вероятность того, что ровно один чѐрный шар попал в первый ящик? 4.6 Из ящика, содержащего чѐрные и белые шары, 100 раз подряд извлекли чѐрный шар. Какова вероятность того, что и в 101-й раз будет извлечен чѐрный шар? Рассмотреть два случая: выбор шаров производился без возвращения; выборка была с возвращением. 4.7 При обследовании на СПИД вероятность обнаружить ВИЧ у инфицированного человека равна 0,9. Вероятность принять здорового человека за больного равна 0,01. Пусть доля инфицированных по отношению ко всему населению равна 0,0001. Найдите условную вероятность того, что человек не инфицирован, если при обследовании у него обнаружен ВИЧ. 4.8 Страховая компания разделяет застрахованных водителей на три группы по вероятности попадания в дорожную аварию. Среди застрахованных водители группы с низкой вероятностью составили 49 25%, со средней – 60% и с высокой – 15%. Ниже приведена таблица вероятностей попадания водителей каждой группы в аварию: Вероятность попадания в аварию Риск водителя низкая средняя высокая 1 авария в год 0,01 0,03 0,10 2 аварии в год 0 0,01 0,05 3 аварии в год 0 0 0,01 4 аварии в год 0 0 0 Требуется найти: а) если случайно выбранный водитель не попадал в аварию в течение года, какова вероятность того, что он принадлежит к группе водителей с высокой вероятностью попадания в дорожную аварию? б) если случайно выбранный водитель не попадал в аварию в течение четырех лет, какова вероятность того, что он принадлежит к группе водителей с низкой вероятностью попадания в дорожную аварию? 4.9 Институт дистанционного обучения отправил учебники в три своих филиала. Вероятность своевременной доставки в первый филиал равна 0,9; во второй – 0,95; в третий – 0,8. Найти вероятности следующих событий: а) только один филиал получит учебники вовремя; б) хотя бы один филиал получит учебники с опозданием. 4.10 Фирма имеет три источника поставки комплектующих – заводы А, В и С. На долю завода А приходится 50% общего объема поставок; В – 30% и С – 20%. Из практики известно, что 10% поставляемых заводом А деталей бракованных, заводом В – 5% и заводом С – 6%. Определите вероятности следующих событий: а) взятая наугад деталь была получена от завода А; б) взятая наугад и оказавшаяся бракованной деталь, была получена от завода А. 50 4.11 Каждое изделие с вероятностью 0,01 дефектно. Контроль может пропустить дефектное изделие с вероятностью 0,10, и забраковать годное с вероятностью 0,05. Определить: а) вероятность приемки наудачу взятого изделия; б) процент годных изделий среди принятых. 4.12 В начале года капитал фирмы составлял 1 млн.руб. Каждый месяц капитал равновероятно увеличивается или уменьшается на 200 тыс. руб. Найти риск разорения фирмы за полгода. 4.13 Студент разыскивает нужную ему формулу в трех справочниках. Вероятность того, что формула содержится в 1, 2 и 3 справочнике соответственно равна 0,6; 0,7; 0,8. Найти вероятность того, что формула содержится: а) только в одном справочнике; б) только в двух справочниках; в) во всех трех справочниках; г) хотя бы в одном справочнике; д) ни в одном справочнике. 4.14 В районе 24 человека обучаются на заочном отделении университета, из них 6 – на юридическом факультете, 12 – на географическом и 6 – на экономическом. Вероятность успешно сдать все экзамены на предстоящей сессии для студентов юридического факультета равна 0,6, географического – 0,76 и экономического – 0,8. Найти вероятность того, что наудачу взятый студент, сдавший успешно все экзамены, окажется студентом экономического факультета. 4.15 В трех параллельных группах была проведена одна и та же контрольная работа. В первой группе обучаются 30 студентов, во второй – 28, в третьей – 27. Выполненных на «отлично» в первой группе оказалось 8 работ, во второй – 6, в третьей – 9. Найти вероятность того, что первая взятая наудачу при повторной проверке работа, из работ, принадлежащих группе, которая также выбрана наудачу, окажется выполненной на «отлично». 51 4.16 Дано P(A)=0,8; P(A∩B)=0,5; P(A/B)=0,9. Найти P(B), P(B/A), P(AUB) и выяснить, зависимы ли события A и B . 4.17 Вероятность попадания в цель равна 0,3, а вероятность ее уничтожения равна 0,05. Найти вероятность того, что при попадании в цель она будет уничтожена. 4.18 В произвольном порядке выписываются две буквы И и две буквы С. Найти вероятность того, что обе буквы С стоят рядом, при условии, что последняя по порядку буква есть буква И. 4.19 Из колоды в 36 карт берется наудачу одна карта. Зависимы ли события А – «выбран валет» и В – «выбрана карта черной масти»? 4.20 Радист трижды вызывает корреспондента. Вероятность того, что будет принят первый вызов, равна 0,3, второй – 0,4, третий – 0,5. По условиям приема события, состоящие в том, что данный вызов будет услышан, независимы. Найти вероятность того, что корреспондент вообще услышит вызов. 4.21 Монета бросается до первого появления герба. Какова вероятность того, что понадобится четное число бросков? 4.22 Из букв А, А, И, Л, М, Н разрезной азбуки выбирают наудачу по одной и ставят в ряд. Найти вероятность того, что получится слово: а) МИНА; б) НАЛИМ; в) МАЛИНА? Ответы: 4.1 а) нет; б) нет; в) да. 4.2 Q/P. 4.3 а) 0,096; б) 0,936. 4.4 0,98. 4.5 а) 0,6; б) 0,6. 4.6 m m 1 m  101   ...  ; n n1 n  101 m   n 101 . 4.7 0,991. 4.8 а) 0,1327; б) 0,2954. 4.9 а) 0,032; б) 0,316. 4.10 а) 0,5; б) 0,65. 4.11 а) 0,942; б) 0,998. 4.12 0,03125. 4.13 а) 0,188; б) 0,452; в) 0,336; г) 0,976; д) 0,024. 4.14 0,27. 4.15 19/70. 4.16 5/9; 5/8; 0,8(5). 4.17 1/6. 4.18 2/3. 4.19 нет. 4.20 0,79. 4.21 1/3 4.22 а) 1/180; б) 1/360; в) 1/360. 52 1.5. Коэффициенты регрессии и корреляции случайных событий Характер влияния одного случайного события на другое может быть различным, поэтому и степень такой зависимости будет разной. Коэффициентом регрессии события A относительно события B называется разность между условной вероятностью события A при условии B и условной вероятностью события A при условии B : R( A, B)  P ( A / B)  P ( A / B ) . Коэффициент регрессии R ( A, B) учитывает реализуемость явления, описываемого событием A, как при условии, что явление, описываемое событием B, реализуется, так и при условии, что это явление не реализуется. Утверждение 1. Коэффициент регрессии события A относительно события B можно вычислить по формуле: R ( A, B)  P ( AB)  P(A)P(B) . P(B)(1 - P(B)) Заметим, что коэффициент регрессии R ( A, B) - несимметричен: он может быть не равен коэффициенту регрессии R (B, A)  P (B / A) - P(B/ A )  P(AB) - P(A)P(B) , P(A)(1 - P(A)) измеряющему зависимость события B от события A. Свойства коэффициента регрессии: 1) события A и B – независимы <=> R( A, B)  0 ; 2) R( A, B) ≤ 1 ; 3) R( A, B)  1 <=> P ( A)  P (B)  P ( AB) , т.е. событие A достоверно при условии B и невозможно при B ; 4) R( A, B)  -R(A, B) . Используя коэффициенты регрессии, можно определить симметричную меру зависимости событий – коэффициент корреляции. Будем рассматривать случайные события A и B, удовлетворяющие следующим условиям: 53 P ( A)  0 ; 1 - P ( A)  P ( A )  0 ; P (B)  0 ; 1 - P(B)  P( B )  0 . В силу определения коэффициенты регрессии для событий A и B имеют одинаковые знаки: R( A, B)R(B, A)  0 . Следовательно, для них можно определить среднее геометрическое:  R( A, B)R(B, A) , выбирая знак перед корнем равным знаку коэффициентов регрессии R ( A, B) и R (B, A) . Коэффициентом корреляции событий A и B называется число K ( A, B)   R( A, B)R(B, A) . Утверждение 2. Коэффициент корреляции событий A и B может быть вычислен по формуле: K ( A, B)  P ( AB) - P(A)P(B) . P(A)(1 - P(A))P(B)( 1 - P(B)) Коэффициент корреляции может принимать значения от -1 до +1. Если K ( A, B)  0 , то говорят, что события A и B – отрицательно коррелированы, т.е. событие B уменьшает вероятность события A. Если K ( A, B)  0 , то события A и B – положительно коррелированы: P ( A / B)  P ( A) . Заметим, что из определения коэффициента корреляции следует его симметричность: K ( A, B)  K (B, A) . Свойства коэффициента корреляции: 1) события A и B – независимы <=> K ( A, B)  0 ; 2) K ( A, B)  1; 3) K ( A, B)  1 <=> P ( A)  P (B)  P ( AB) ; 4) K ( A, B)  -K(A, B) . Пример 5.1 По данным переписи 1951 года, в Англии среди отцов, имеющих сыновей, оказалось 13% темноглазых и 87% светлоглазых. У темноглазых отцов оказалось 39% темноглазых и 61% светлоглазых сыновей. У светлоглазых отцов оказалось 10% темноглазых и 90% светлоглазых сыновей. Какова вероятность того, что выбранные наугад 54 среди этого населения отец и сын имеют глаза одинакового цвета? Какова зависимость между цветом глаз отца и сына? Решение: Введем обозначения для рассматриваемых явлений: ОТ - отец темноглазый; Осв - отец светлоглазый; СТ - сын темноглазый; Ссв - сын светлоглазый. По условию известны вероятности: P (OТ )  0,13 ; P (Oсв )  0,87 ; P (CT / OT )  0,39 ; P (Cсв / ОТ )  0,61; P (CT / Oсв )  0,10 ; P (Cсв / Осв )  0,90 . Вероятность того, что сын и отец имеют глаза одинакового цвета равна: P (ОТ СТ  ОсвСсв )  P (ОТ )P (СТ / ОТ )  P (Осв )P (Cсв / Осв )   0,13·0,39  0,87·0,90  0,8337 . Для определения зависимости между цветом глаз отца и сына вычислим коэффициенты корреляции K (СТ , ОТ ) , K (Ссв , Осв ) . По формуле полной вероятности получаем: P (CT )  P (OT )P (CT / OT )  P (Осв )P (CТ / Осв )  0,13·0,39  0,87·0,10   0,1377 . Тогда K (CT , OT )   P (CT OT ) - P(CT )·P(OT )  P (CT )(1 - P(CT ))P (OT )(1 - P(OT )) 0,13·0,39 - 0,1377·0,1 3  0,283 . 0,1377·0,8 623·0,13·0 ,87 Коэффициент корреляции положительный, следовательно, темный цвет глаз отца увеличивает вероятность того, что и у сына глаза будут темного цвета, но корреляция этих событий слабая. Так как события Осв и Ссв - противоположны событиям ОТ и СТ , то К (СТ , ОТ )  К (Ссв , Осв )  - К (Ссв , ОТ )  - К (СТ , Осв ) . ■ Пример 5.2 Проверяется эффективность нового медицинского препарата. Из имеющихся 60 зараженных животных 30-ти вводится и 30-ти не вводится этот препарат. Среди животных, которым был введен 55 препарат, 29 выздоравливают и 1 – нет. Среди животных, которым не введен препарат, 26 выздоравливают и 4 – нет. Какова корреляция между введением препарата и выздоровлением? Решение: Пусть П – событие, состоящее в том, что животному вводится _ _ препарат; П - препарат не вводится; В - животное не выздоравливает; В – животное выздоравливает. По условию заданы вероятности: P (П )  0,5 ; P (В / П )  29 / 30 ; _ _ _ _ _ P (П )  0,5 ; P (В/ П )  1 / 30 ; P (В / П )  26 / 30 ; P (В/ П )  4 / 30 . Тогда P (ВП )  P (П )P (В / П )  0,5· 29 29  ; 30 60 По формуле полной вероятности: _ _ P (В)  P (П )P (В / П )  P (П )P (В / П )  0,5· 29 26 55  0,5·  . 30 30 60 Следовательно, коэффициент корреляции равен: K (В, П )   P (ВП ) - P( В )P(П)  P( В)(1 - P( В ))P(П)(1 - P(П)) 29 / 60 - (55/60)·(1 /2)  (55/60)·(5 /60)·(1/2) ·(1/2) 3  0,2 . 5 11 Интерпретация препарата повышает полученного шансы результата животного на такова: введение выздоровление, но незначительно. ■ Пример 5.3 В Т-образный лабиринт запустили голодных мышек, из которых 50% бегут в левый конец и 50% - в правый. Среди мышек, побывавших в левом конце с пищей и вновь помещенных в лабиринт, (50+100·ε)% бегут опять налево, а (50-100·ε)% - направо. Среди мышек, побывавших в правом конце без пищи и вновь помещенных в лабиринт 50% бегут налево и 50% - направо. 1) Какова вероятность, что вновь помещенная в лабиринт мышка побежит в левый конец? 56 2) Какова условная вероятность того, что мышка бегала к пище в первый раз при условии, что она побежала к пище во второй раз? 3) Какова зависимость между получением пищи и поведением мышки при повторном помещении в лабиринт? Решение: Обозначим через 1л - событие, состоящее в том, что мышка бегала в первый раз налево; 1пр - при первичном помещении мышки в лабиринт она побежала в правый конец; 2 л - при повторном помещении в лабиринт мышь побежала в левый конец; 2 пр - мышка побежала направо во второй раз. 1) По условию при первичном помещении в лабиринт (когда мышь еще не знает, что ее ожидает в правом и в левом концах лабиринта) варианты «сходить налево» и «направо» - равновероятны: P (1л )  0,5 и P (1пр )  0,5 . При повторном помещении в лабиринт для тех мышей, которые первый раз бегали в правый конец и остались голодными, ситуация ничем не отличается от предыдущей: P (2 л / 1пр )  0,5 и P (2пр / 1пр )  0,5 . Для мышей, сбегавших в первый раз налево и оставшихся довольными (сытыми), вероятности для второго забега изменятся: P (2 л / 1л )  0,5  ε ; P (2пр / 1л )  0,5 - ε . Вероятность побежать при повторном помещении в лабиринт в левый конец с пищей по формуле полной вероятности равна: P (2 л )  P (1л )P (2 л / 1л )  P (1пр )P (2 л / 1пр )  0,5(0,5  ε )  0,5·0,5   0,5·(0,5  ε  0,5)  0,5·(1  ε ) . 2) Апостериорная вероятность того, что мышь бегала к пище в первый раз при условии, что она побежала к пище во второй раз, вычисляется по формуле Байеса: P (1л / 2 л )  P (1л )P (2 л / 1л ) 0,5·(0,5  ε ) 0,5  ε .   P (2 л ) 0,5·(1  ε ) 1 ε 57 3) Меру зависимости между получением пищи при первичном «забеге» и поведением мышки при повторном помещении в лабиринт определим с помощью коэффициента корреляции: K (1л ,2 л )  0,5·ε  0,5· 1 - ε 2 P (1л ·2 л ) - P(1 л )·P(2 л ) 0,5·(0,5  ε ) - 0,5·0,5·(1  ε )   P (1л )P (1пр )P (2 л )P (2пр ) 0,5·0,5·0, 5·(1  ε )·0,5·(1 - ε )  ε 1- ε 2 . Если ε=0, то K (1л ,2 л )  0 , т.е. зависимости между получением пищи в первый раз и поведением мышки при повторном помещении в лабиринт нет. Если ε ≠ 0, то K (1л ,2 л )  0 , т.е. зависимость между получением пищи в первый раз и поведением мышки при повторном помещении в лабиринт есть. Например, если ε=1/2, то K (1л ,2 л )  1 1   0,577 . 3 1,732 ■ Задачи для самостоятельного решения: 5.1 В продукции завода брак вследствие дефекта А составляет 6,1%, а вследствие дефекта В – 2,8%. Общий брак по одному из этих дефектов – 5,8% всей продукции завода. Какова корреляция между дефектами А и В? 5.2 Статистика показывает, что среди двоен 32% оба близнеца мальчики и 28% - девочки. Какова корреляция пола близнецов? 5.3 По линии связи посылаются сигналы 0 и 1. Проходя по линии связи, переданный сигнал может исказиться и превратиться в другой сигнал. Приемник улавливает сигнал, пришедший по линии связи. Таким образом, может быть принят не тот сигнал, который был передан. Известны вероятности: P (1)  0,6 - вероятность того, что посылается сигнал 1; P (0)  0,4 - посылается сигнал 0; 58 P (1 / 1)  0,9 - принят сигнал 1, при условии, что и послан был сигнал 1; P (0 / 1)  0,1 - принят сигнал 0, а послан был сигнал 1; P (1 / 0)  0,3 - принят сигнал 1, при условии, что отправлен был 0; P (0 / 0)  0,7 - принят сигнал 0 и отправлен сигнал 0. Какова вероятность, что принимается сигнал 1? Какова корреляция между посланным и принятым сигналами? Ответы: 5.1 K A, B   0,742 . 5.2 K A, B   0,2 . P A1  =0,66; 5.3 K A1, B1  0,6 . 1.6. Модель повторных независимых испытаний: формула Бернулли и еѐ асимптотические приближения На практике некоторые ситуации можно представить в виде многократно повторяющихся испытаний при данном комплексе условий, в которых представляет интерес оценить шансы числа k появлений некоторого события A в n испытаниях. Например, необходимо определить вероятность изготовления некачественных изделий в партии изделий, изготовленных на определенном оборудовании при постоянстве технологических и организационных условий; или определить вероятность определенного числа попаданий в мишень при нескольких выстрелах; или оценить шансы появления определенного числа гербов при неоднократном подбрасывании монеты. Если вероятность наступления события A в каждом испытании не меняется в зависимости от исходов других, то такие испытания называются независимыми относительно события A. Если независимые повторные испытания проводятся при одном и том же комплексе условий, то вероятность наступления события A в каждом испытании одна и та же. Описанная последовательность независимых испытаний называется схемой Бернулли. 59 Пусть производится n независимых опытов, в каждом из которых с одной и той же вероятностью p может наступить некоторое событие A. Требуется для заданного числа k найти вероятность следующего события: в n опытах событие A наступит ровно k раз. Если в результате испытаний событие A произошло k раз (неважно в каком порядке), то это означает, что совместно наступили k событий A и n-k событий A , вероятности которых в каждом отдельном опыте равны и q p соответственно. Так как все n событий независимы, то вероятность появления k раз события A в определенной последовательности равна pk q n - k . Однако событие A может появиться k раз в n опытах в совершенно другой последовательности: AA ... A  A A ... A  AA A...A A  ...  A A ... A AA...A          . k раз n - k раз n - k раз k раз Каждый вариант записывается в виде строки длиной n, в которой k компонент – это события A и n-k компонент – события A . Число всех таких вариантов (слагаемых в указанной сумме) равно числу способов выбора k элементов из n, т.е. числу сочетаний Cnk ; так как все эти варианты между собой несовместны, то искомая вероятность будет равна сумме вероятностей всех указанных несовместных событий, т.е. произведению Cnk p k q n - k . Чтобы подчеркнуть зависимость полученного выражения от n и k, обозначим его через Pn k  . Итак, вероятность появления события A в n независимых испытаниях ровно k раз равна: Pn k   Cnk p k q n - k  n! pk q n-k . k ! n - k ! Полученная формула называется формулой Бернулли. Пример 6.1 Игральная кость подбрасывается 10 раз. Какова вероятность того, что «пятерка» выпадает при этом ровно 3 раза? 60 Решение: В данном случае событие A – выпадение «пятерки» в одном испытании, вероятность этого события равна p  1 ; событие A 6 непоявление «пятерки», вероятность такого события равна q  5 . 6 Следовательно, вероятность появления «пятерки» в серии из 10 бросков ровно 3 раза по формуле Бернулли будет: 3 7 10 ! 3 1 5 P10 3  C10      · 0,00463 ·0,27908 ≈0,155. 3 !7 ! 6   6 ■ Схема Бернулли описывает закономерности, характерные для экспериментов, удовлетворяющих следующим условиям: 1) вероятность появления события в одном испытании p – постоянна; 2) число испытаний n – фиксировано; 3) испытания проводятся последовательно, и результат каждого из них не зависит от результатов предыдущих испытаний. Значение Pn k  можно находить с помощью статистической функции БИНОМРАСП(k, n, p, L), которая возвращает отдельное значение биномиального распределения. Параметр L – это логическое значение, которое принимает значения «ложь» (0) или «истина» (1). Для определения вероятности того, что интересующее нас событие появится ровно k раз в n опытах, параметру L присваивают значение 0. В ряде случаев требуется определить вероятности появления события А менее k раз (X<k), более k раз (X>k), не менее k раз (X≥k), не более k раз (X≤k). В этих случаях могут быть использованы формулы: Pn  X  k   Pn 0  Pn 1  ...Pn k - 1 , Pn  X  k   Pn k  1  Pn k  2  ...  Pn n  , Pn  X  k   Pn k   Pn k  1  ...  Pn n  , Pn  X  k   Pn 0  Pn 1  ...Pn k  . 61 Пример 6.2 Каждый пятый клиент банка приходит в банк брать проценты вклада. с Сейчас в банке ожидают своей очереди обслуживания шесть человек. Найти вероятность того, что из них будут брать проценты не более двух человек. Решение: Условие задачи можно переформулировать следующим образом: производится 6 независимых испытаний (будем считать, что каждый клиент берет или не берет проценты с вклада независимо от других вкладчиков), вероятность появления события в одном опыте p 1  0,2 . Требуется найти вероятность того, что событие появится не 5 более двух раз, т.е. вероятность: P6  X  2  P6 0  P6 1  P6 2  0,86  6·0,2·0,85  15·0,22 ·0,84 = =0,262+0,393+0,246=0,901. ■ Наивероятнейшее число появлений события в n независимых испытаниях определяют по формуле: np - q  k0  np  p . Отметим, что если число: 1) np-q – дробное, то существует одно наивероятнейшее число k0 ; 2) np-q – целое, то существует два наивероятнейших числа, а именно: k0 и k0 +1; 3) np – целое, то наивероятнейшее число k0 = np. Пример 6.3 Товаровед осматривает 24 образца товаров. Вероятность того, что каждый из образцов будет признан годным к продаже, равна 0,6. Найти наивероятнейшее число образцов, которые товаровед признает годными к продаже. Решение: По условию n=24, p=0,6 и q=0,4. Подставляя исходные данные в двойное неравенство для определения наивероятнейшего числа, получим: 62 24·0,6-0,4≤ k0 ≤24·0,6+0,6 или 14≤ k0 ≤15, т.е. наивероятнейших чисел два: 14 и 15. ■ Пример 6.4 Сколько надо произвести независимых испытаний с вероятностью появления события в каждом испытании, равной 0,4, чтобы наивероятнейшее число появлений события в этих испытаниях было равно 25? Решение: По условию k0 =25, p=0,4, q=0,6. Тогда np=0,4n, получим следующее неравенство для определения числа испытаний: 0,4n - 0,6  25  0,4n  0,4 . Решением левого неравенства будет: n  64 , решением правого неравенства: n  61,5 . Так как n, по условию, целое, то искомое число испытаний должно удовлетворять неравенству: 62  n  64 . ■ Пример 6.5 Два равносильных противника играют в шахматы. 1) Что вероятнее: а) выиграть 3 партии из 4 или 5 из 8? б) не менее 3 партий из 4 или не менее 5 из 8? Ничейный исход партии исключен. 2) Найти наивероятнейшее число выигрышей для любого шахматиста, если будет сыграно 2N результативных партий. Решение: Так как противники равносильные, то вероятность выигрыша и проигрыша каждой партии одинаковы и равны p=q=0,5.  1 1). а) вероятность выиграть 3 партии из 4 равна: P4 3  C43   2    1 вероятность выиграть 5 партий из 8: P8 5   C85   2   8  б) вероятность выиграть не менее трех партий из четырех: 1 1 5   =0,3125, 4 16 16 а вероятность выиграть не менее пяти из восьми: 63  0,25 , 7  0,21875. Так 32 как 0,25>0,21875, то вероятнее выиграть три партии из четырех. P4  X  3   P4 3   P4 4   4 P8  X  5   P8 5   P8 6   P8 7  P8 8  93  0,36328 . 256 Следовательно, вероятнее выиграть не менее пяти из восьми, так как P4  X  3  0,3125  0,36328  P8  X  5  . 2). В данном случае число испытаний n=2N, тогда np=2N·1/2=N – целое число, поэтому наивероятнейшее число k0 выигранных партий будет равно N. ■ Пример 6.6 Отрезок АВ разделен точкой С в отношении 2:1. На этот отрезок наудачу брошены 4 точки. Найти вероятность того, что две из них окажутся левее точки С и две – правее. Предполагается, что вероятность попадания точки на отрезок пропорциональна длине отрезка и не зависит от его расположения. Решение: Каждая точка попадает на какую-либо часть отрезка (АС или СВ) независимо от того, куда попали другие точки. Поэтому задачу можно переформулировать следующим образом: производится 4 независимых испытания, в каждом из которых событие (например, попадание точки на отрезок АС) появляется с вероятностью p=2/3 и не появляется с вероятностью q=1/3. Тогда вероятность того, что ровно 2 2 2 8 2 2   1 точки попали на отрезок АС равна: P4 2  C4      ≈0,296. 27 3 3 ■ Количество n опытов, которые нужно произвести для того, чтобы с вероятностью не меньше P можно было утверждать, что данное событие произойдѐт по крайней мере один раз, находится по формуле: n ln1 - P  , ln1 - p  где p – вероятность появления этого события в каждом опыте. 64 Пример 6.7 Большая партия изделий содержит 1% брака. Каков должен быть объем случайной выборки, чтобы вероятность обнаружить в ней хотя бы одно бракованное изделие была не меньше 0,95? Решение: n≥ В данном случае P=0,95, Поэтому p=0,01. ln1 - 0,95  ln 0,05  ≈ 298 . ln1 - 0,01  ln 0,99 ■ Пример 6.8 Аппаратура содержит 2000 одинаково надежных элементов, вероятность отказа для каждого из которых равна p=0,0005. Какова вероятность отказа аппаратуры, если он наступает при отказе хотя бы одного из элементов? Решение: Обозначим через А – искомое событие (отказ аппаратуры означает отказ хотя бы одного из элементов: либо откажет один элемент, либо два, … , либо откажут все элементы). Тогда A - все элементы исправны вероятность события (аппаратура А проще противоположного события: работает). В данном вычислить через случае вероятность P A  1 - P A  . Так как работу всей системы можно рассматривать как эксперимент, состоящий из 2000 независимых испытаний, то вероятность безотказной работы аппаратуры равна: 0 P A   P20000  C2000 ·0,0005 0 ·0,9995 2000  0,9995 2000≈0,368. Следовательно, искомая вероятность P A  1 - P A =1-0,368=0,632. ■ Понятно, что пользоваться формулой Бернулли при достаточно больших значениях n и малых значениях p при выполнении расчетов «вручную» трудоемко, поэтому возникает желание иметь более простые приближенные формулы для вычисления Pn k  при больших n. Такие формулы, называемые определяются теоремой асимптотическими, Пуассона, теоремами Муавра-Лапласа. 65 локальной существуют и и интегральной Теорема. Если вероятность события p наступления события А в каждом испытании очень мала: p  0 при неограниченном увеличении числа n  испытаний (такие события называются редкими), причем произведение np стремится к постоянному числу λ, то вероятность Pn k  того, что событие А появится k раз в n независимых испытаниях, удовлетворяет предельному равенству: λk e - λ . lim Pn k   Pk λ   k! n Эта формула называется формулой Пуассона. Обычно формулой Пуассона пользуются тогда, когда выполняются следующие условия: p  0,1 ; np  20 ; npq  9 . Для примера 6.8 имеем: p=0,0005<0,1; np=2000·0,0005=1<20; npq=20·0,9995<9; λ=1 и по формуле Пуассона вероятность безотказной работы аппаратуры равна: P A   10 e -1 1   0,368 . 0! e Значения функции Пуассона Pk λ  приведены в Приложении 3. Приведѐм значения функции Пуассона для небольших значений λ: λ k 0,1 0,2 0,3 0,4 0,6 0,7 0,8 0,9 0 0,9048 0,8187 0,7408 0,6703 0,5488 0,4966 0,4493 0,4066 1 0,0905 0,1637 0,2222 0,2681 0,3293 0,3476 0,3595 0,3659 2 0,0045 0,0164 0,0333 0,0536 0,0988 0,1217 0,1438 0,1647 3 0,0002 0,0011 0,0033 0,0072 0,0198 0,0284 0,0383 0,0494 4 0,0001 0,0003 0,0007 0,0030 0,0050 0,0077 0,0111 5 0,0001 0,0004 0,0007 0,0012 0,0020 6 0,0001 0,0002 0,0003 66 Пример 6.9 При изготовлении 1000 метров ткани было отмечено 50 обрывов нити. Какова вероятность того, что в наугад отмеряемом метре ткани окажется менее двух обрывов нити? Решение: Обрыв нити может с равной вероятностью находиться в любом месте произведенной ткани, т.е. вероятность обрыва нити на данном метре ткани равна 0,001. Задачу можно переформулировать следующим образом: производится 50 независимых испытаний, в каждом из которых вероятность появления события постоянна и равна p=0,001, требуется найти вероятность того, что событие произойдет менее двух раз: P50  X  2  P50 0  P50 1 . Так как n – велико, а p – мало, то вероятности будем рассчитывать по формуле Пуассона (λ= 50·0,001 =0,05): 0,05 0 - 0,05 0,05 - 0,05 P50  X  2 ≈ e  e  1,05 · 0,951  0,9988 . 0! 1! ■ Пример 6.10 В тесто засыпают некоторое количество изюма, затем всю массу тщательно перемешивают, разрезают на равные доли и выпекают из них булочки с изюмом. Пусть N – число всех булочек, а n – количество всех изюминок. Требуется оценить вероятность того, что в случайно выбранной булке окажется ровно k изюминок. Решение: Рассматривая попадание каждой изюминки в тесто как отдельный опыт, можно утверждать, что производится n опытов. Тогда вероятность попадания одной изюминки в одну выбранную булочку будет равна: p=1/N перемешивается, (условие, означает что для тесто с каждой изюмом изюминки тщательно одинаковую вероятность попадания в любую из булочек). Если считать, что булочек выпекается достаточно много, то можно считать p весьма малым числом. Тогда λ  np  n , следовательно вероятность того, что в N 67 выбранной булке окажется ровно k изюминок можно вычислить по λk e - λ формуле Пуассона: Pn k   . Например, для λ=8 находим: k! k 0 1 2 3 4 5 6 7 Pn k  0,000 0,003 0,011 0,029 0,057 0,092 0,122 0,139 Это означает, что из общего числа N булочек приблизительно 0,3% содержат по одной изюмине, 1,1% содержат по две изюмины и т.д. ■ Локальная теорема Муавра-Лапласа. Если вероятность p наступления события А в каждом испытании постоянна и отлична от 0 и 1, то вероятность Pn k  того, что событие А произойдет k раз в n независимых испытаниях при достаточно большом числе n, приближенно равна: Pn k  ≈ 1 φ(x), где φ  x   npq 2 1 k - np . e- x / 2 и x  2π npq Чем больше n, тем точнее указанная приближенная формула, называемая локальной формулой Муавра-Лапласа. Обычно этой формулой пользуются тогда, когда np  20 . Значения функции φ(x) приведены в Приложении 1. Отметим свойства функции φ(x): 1) φ(-x)=φ(x), т.е. функция является четной; 2) функция φ(x) является монотонно убывающей при положительных значениях x, причем lim φ(x)=0. x Пример 6.11 По результатам проверок налоговыми инспекциями установлено, что в среднем каждое второе малое предприятие региона имеет нарушение финансовой дисциплины. Найти вероятность того, что из 1000 зарегистрированных в регионе малых предприятий 480 имеют нарушения финансовой дисциплины. Решение: По условию p=0,5; q=0,5; n=1000; npq=250>20. Следовательно, можно для расчета искомой вероятности использовать 68 формулу Муавра-Лапласа. Для этого сначала определим аргумент функции x φ(x): Приложения №1 φ(1,26)=0,1804; k - np 480 - 500 =  npq 250 найдем -1,265. соответствующее По таблице значение из функции: φ(1,27)=0,1781; 1 φ(1,265)= (φ(1,26)+ φ(1,27)); 2 φ(-1,265)=φ(1,265)=0,1792, P1000 480   тогда: 0,1792  0,0113 . 250 ■ Пример 6.12 На некотором предприятии вероятность брака равна 0,02. Готовая продукция в количестве 500 штук подвергается проверке. Найти вероятность того, что среди них окажется ровно 10 бракованных. Решение: Рассматривая проверку каждого изделия как отдельный опыт, можно сказать, что производится 500 независимых испытаний, в каждом из которых событие (изделие оказалось бракованным) наступает с вероятностью p=0,02<0,1, Следовательно, в данном np=10<20, случае искомую npq=10·0,98=9,8>9. вероятность лучше рассчитывать по формуле Муавра-Лапласа. Для этого определим аргумент x= 10 - 10  0 , по таблице значений функции φ(x) находим ее 9,8 значение для данного аргумента: φ(0)=0,3989. Тогда вероятность равна: P500 10   0,3989  0,127 . 9,8 ■ Задачи для самостоятельного решения: 6.1 Найти вероятности числа выпадений гербов при бросании трѐх монет. 6.2 Найти вероятность числа появлений «шестерки» при бросании трѐх костей. 69 6.3 В ящике находятся 6 белых и 9 красных шаров. Из ящика извлекают шар, фиксируют его цвет, после чего возвращают шар обратно в ящик. Указанный опыт повторяют трижды. Какова вероятность того, что из трех извлеченных при этом шаров ровно два окажутся белыми? 6.4 В среднем 20% пакетов акций на аукционах продаются по первоначально заявленной цене. Найти вероятность того, что из 9 пакетов акций в результате торгов по первоначально заявленной цене: 1) не будут проданы 5 пакетов; 2) будет продано: а) менее 2 пакетов; б) не более 2; в) хотя бы 2; г) наивероятнейшее число пакетов. 6.5 Отрезок разделен на 4 равные части. На отрезок брошено наудачу 8 точек. Найти вероятность того, что на каждую из четырех частей отрезка попадет по две точки. Предполагается, что вероятность попадания точки на отрезок пропорциональна длине отрезка и не зависит от его расположения. 6.6 Проблема Джона Смита. Одинаковы ли шансы на успех у трех человек: для первого – получить хотя бы одну «6» при 6 бросках игральной кости; для второго – получить хотя бы две «6» при 12 бросках; для третьего – хотя бы три «6» при 18 бросках? 6.7 (Задача Банаха) Некто носит с собой две коробки спичек. Время от времени он вынимает спичку из наугад выбранной коробки. В очередной раз выбранная коробка оказывается пустой. Чему равна вероятность того, что в другой коробке в этот момент осталось k спичек? 6.8 Два человека подбросили по 3 монеты каждый. Какова вероятность того, что у них будет одинаковое количество гербов? 6.9 Вероятность выигрыша по одному лотерейному билету равна 0,01. Сколько нужно купить билетов, чтобы выиграть хотя бы по одному из них с вероятностью, не меньшей 0,95? 70 6.10 Обувной магазин продал 200 пар обуви. Вероятность того, что в магазин будет возвращена бракованная пара равна 0,01. Найти вероятность того, что из проданных пар обуви будет возвращено: а) ровно 4 пары; б) ровно 5 пар. 6.11 Игра состоит в набрасывании колец на колышек. Игрок получает 6 колец и бросает кольца до первого попадания. Найти вероятность того, что хотя бы одно кольцо останется неизрасходованным, если вероятность попадания при каждом броске равна 0,1. 6.12 Изделия некоторого производства содержат 0,1% брака. Какова вероятность, что из 5000 изделий: а) хотя бы одно бракованное; б) не менее 3 бракованных? 6.13 Завод отправил на базу 10000 стандартных изделий. Среднее число изделий, повреждаемых при транспортировке, составляет 0,02%. Найти вероятность того, что из этой партии изделий: 1) будет повреждено: а) 3; б) по крайней мере 3; 2) не будет повреждено: а) 9997; б) хотя бы 9997. 6.14 На экономическом факультете на первом курсе учится 1825 студентов. Найти вероятность того, что 15 октября является днем рождения одновременно четырѐх студентов. 6.15 Для данного баскетболиста вероятность забросить мяч в корзину при броске равна 0,4. Произведено 10 бросков. Найти наивероятнейшее число попаданий и соответствующую вероятность. 6.16 Стрелок сделал 80 выстрелов; вероятность попадания при каждом выстреле равна 0,7. Найти вероятность того что: а) стрелок попадает 56 раз; б) число попаданий будет заключено между 50 и 60. 6.17 Контрольную работу по теории вероятностей успешно выполняют в среднем 70% студентов. Какова вероятность того, что из 200 студентов работу успешно выполнят: а) 150 студентов; б) не менее 100 студентов; в) не более 150 студентов? 71 6.18 Какое число n раз нужно подбросить симметричную монету, чтобы вероятность хотя бы одного появления герба была больше 1  α =0,99? 6.19 При каждом выстреле с вероятностью α  0,7 поражается цель, а с вероятностью 1  α  0,3 – нет. Какое число n выстрелов нужно произвести для того, чтобы вероятность хотя бы одного поражения цели была больше 0,99? 6.20 Какое число n раз нужно наугад выбрать одно из 10000 изделий (каждый раз возвращая его на место), чтобы вероятность хотя бы один раз выбрать некачественное изделие была больше 0,999? 6.21 В задаче на схему Бернулли найти значение p , при котором вероятность P3 2 достигает максимума, и вычислить этот максимум. Ответы: 6.1 P  X  0  1/ 8 ; P  X  1  3 / 8 ; P  X  2  3 / 8 ; P  X  3  1/ 8 . 3 75 15 1 5 6.2 P3 0    ; P3 1  ; P3 2   ; P3 3   . 6.3 0,288. 6 63 63 63 6.4 1) 0,066; 2) а) ≈0,436; б) 0,738; в) 0,564; г) 1 и 2. 6.5 0,038. 6.6 0,665; 0,6187; 0,40265. 6.7 C2nn  k 2 2n  k . 6.8 0,31. 6.9 298. 6.10 а) 0,09; б) 0,036. 6.11 0,41. 6.12 а) 0,993; б) 0,875. 6.13 1) а) 0,1804; б) 0,3233; 2) а) 0,1804; б) 0,8572. 6.14 ≈0,1755. 6.15 4; 0,251. 6.16 а) ≈0,097; б) ≈0,76. 6.17 а) ≈0,019; б) ≈1; в) ≈0,938. 6.18 >6. 6.19 > 3. 6.20  7500. 6.21 p =2/3, max P3 2 =4/9. 1.7. Производящая функция Пусть производится n независимых испытаний, причѐм в первом испытании вероятность появления события A равна p1, во втором - p2 , … , в n -ом испытании - pn ; вероятности непоявления события A 72 соответственно равны q1 , q2 , … , q n . Обозначим Pn k  - вероятность появления события A в n независимых испытаниях ровно k раз. Производящей функцией вероятностей Pn k  называют функцию, определяемую равенством: φn z   p1z  q1p2 z  q2 ...pn z  qn  . Вероятность Pn k  того, что в n независимых испытаниях, в первом из которых вероятность появления события A равна p1, во втором - p2 и т.д., событие коэффициенту при zk появится ровно k A раз, равна в разложении производящей функции по степеням z . Например, если n  2 , то φ2 z   p1z  q1p2z  q2   p1p2z 2  p1q2  p2q1z  q1q2 . Здесь коэффициент p1p2 при z 2 равен вероятности P2 2 того, что событие A появится ровно два раза в двух испытаниях; коэффициент p1q2  p2q1 при z 1 равен вероятности P2 1 того, что событие A появится ровно один раз в двух испытаниях; коэффициент при z 0 , т.е. свободный член q1q2 равен вероятности P2 0 того, что событие A не появится ни одного раза. Производящую функцию можно применять и для определения вероятностей Pn k  в схеме Бернулли. Кроме того, производящая функция используется и для определения вероятностей в случае когда в различных испытаниях появляются различные события: в первом испытании событие A1, во втором – событие A2 и т.д. Изменяется лишь толкование коэффициентов при различных степенях z . Например, в приведѐнном выше разложении коэффициент p1p2 определяет вероятность появления двух событий A1 и A2 . Пример 7.1 Рабочий обслуживает три станка. Вероятность того, что в течение часа станок не потребует внимания рабочего, для первого станка равна 0,9, для второго – 0,8 и для третьего – 0,7. Найти 73 вероятность того, что в течение часа не потребуют внимания рабочего: а) все три станка; б) два станка; в) один станок; г) ни один из станков. Решение: Известные вероятности обозначим: p1  0,9 , p2  0,8 и p3  0,7 . Тогда вероятности того, что в течение часа станок потребует внимания рабочего соответственно равны: q1  0,1, q2  0,2 и q3  0,3 . Составим производящую функцию: φ3 z   0,9z  0,10,8z  0,20,7z  0,3  0.504 z 3  0.398 z 2  0.092 z  0.006 а) P3 3  0,504 ; б) P3 2  0,398 ; в) P3 1  0,092 ; г) P3 0  0,006 . ■ Задачи для самостоятельного решения: 7.1 Из двух орудий произведѐн залп по цели. Вероятность попадания в цель для первого орудия равна 0,8, для второго – 0,9. Найти вероятности следующих событий: а) два попадания в цель; б) одно попадание; в) ни одного попадания; г) не менее одного попадания. 7.2 Четыре элемента вычислительного устройства работают неза- висимо. Вероятность отказа первого элемента за время t равна 0,2, второго – 0,25, третьего – 0,3 и четвѐртого – 0,4. Найти вероятность того, что за время t откажут: а) 4 элемента; б) 3 элемента; в) ни один элемент; г) не более двух элементов. 7.3 Две батареи по 3 орудия каждая производят залп по цели. Цель будет поражена, если каждая из батарей даст не менее двух попаданий. Вероятности попадания в цель орудиями первой батареи равны 0,4; 0,5; 0,6, второй – 0,5; 0,6 и 0,7. Найти вероятность поражения цели при одном залпе из двух батарей. Ответы: 7.1 а) 0,72; б) 0,26; в) 0,02; г) 0,26+0,72=0,98. 7.2 а) 0,006; б) 0,065; в) 0,252; г) 0,252+0,423+0,254=0,929. 7.3 0,325. 74 Глава 2. Случайные величины 2.1. Дискретные случайные величины: способы задания, числовые характеристики и их свойства Случайной величиной называется числовая функция X  X( ω ) , заданная на пространстве элементарных событий, для которой при любом действительном x множество {ω: X(ω)≤x} является событием. Случайные величины обозначают большими латинскими буквами X, Y, Z, … , а возможные значения случайных величин обозначают малыми латинскими буквами x, y, z, … . Чтобы знать все о случайной величине, надо для любого x знать вероятность P({ω: X(ω)<x})=P(X<x), т.е. совокупность всех таких вероятностей концентрирует все знания о распределении вероятностей по значениям случайной величины. Значит, в зависимости от природы множества возможных значений случайной величины, все модели случайных величин можно разделить на два класса – для счетных и несчетных множеств. Величина X называется дискретной случайной величиной, если множество ее возможных значений представляет собой конечную или бесконечную последовательность чисел x1 , x 2 ,…, x n , … и если каждое событие X ωi   x i имеет определенную вероятность pi . Любое правило, позволяющее находить все вероятности P  X ωi   x i   pi называется законом распределения дискретной случайной величины X. Если составить таблицу, в верхней строке которой поместить возможные значения дискретной случайной величины, а в нижней – соответствующие им вероятности, то такая таблица называется таблицей распределения или рядом распределения дискретной случайной величины: 75 xi x1 x2 …. xn … pi p1 p2 …. pn … События X  x1 , X  x 2 , …, X  x n , …- несовместны и образуют  полную группу. Следовательно,  pi  1. i 1 Ряд распределения можно задать графически, если по оси абсцисс отложить возможные значения случайной величины, а по оси ординат – вероятности этих значений. Соединив последовательно точки  x i ; pi  отрезками, получим ломаную, которая называется многоугольником распределения вероятностей. Для описания закона распределения случайной величины X возможен и другой подход: рассматривать не вероятности событий X  x для разных x, а вероятности события X  x , где x – текущая переменная. Вероятность P  X  x  , очевидно, зависит от x, т.е. является некоторой функцией от x. Функция Fx   P  X  x  , выражающая для каждого x вероятность того, что случайная величина X примет значение, не превосходящее x, называется функцией распределения случайной величины X. Для дискретной случайной величины X функцию распределения получают по правилу: Fx    P  X  x i  - как «накопленную» i: xi  x вероятность. Свойства функции распределения: 1) 0  F  x   1. 2) Px1  X  x 2   F  x 2  - Fx1 . 3) F  x  - неубывающая функция. 4) P X  x   1 - F x  . 5) lim F  x   1; x  lim F x   0 . x -  76 6) F  x  - непрерывна слева, т.е. lim F  x  Δx   F  x  . Δx 0 Пример 1.1 Постройте ряд распределения и функцию распределения случайного числа попаданий мячом в корзину при одном броске, если вероятность попадания мячом в корзину при одном броске равна 0,3. Решение: Обозначим через X - число попаданий мячом в корзину при одном броске. По условию вероятность попадания мячом в корзину при одном броске равна 0,3, следовательно, вероятность непопадания равна 1-0,3=0,7. Ряд распределения: 0 0,7 xi pi 1 0,3 Для x  0 функция распределения Fx   P  X  x   0 ; если 0  x  1, то F  x   0,7 , если x  1, то F  x   0,7  0,3  1. F(x) 1 0,7 0 1 x Рис. 6 ■ Две случайные величины X и Y называются независимыми, если закон распределения одной из них не меняется от того, какие возможные значения приняла другая величина. Рассмотрим две дискретные случайные величины X и Y: xi x1 x2 … xn pi p1 p2 … pn 77 yj y1 y2 … yk pj p1 p2 … pk Независимость этих случайных величин означает независимость событий X  x i и Y  y j , т.е. должно выполняться равенство:     P X  x i ;Y  y j  P  X  x i  · P Y  y j . Произведением kX случайной величины X на постоянную величину k называется случайная величина, которая принимает значения kx i с теми же вероятностями pi (i=1, 2, …, n). m-й степенью случайной величины X, т.е. X m , называется случайная величина, которая принимает значения x im с теми же вероятностями pi (i=1, 2, …, n). Суммой (разностью или произведением) независимых случайных величин X и Y называется случайная величина, которая принимает все возможные значения вида x i  y j ( x i - y j или x i ·y j ) где i=1, 2, …, n; j=1, 2, …, n с вероятностями:   pij  P  X  x i  · P Y  y j . Пример 1.2 Пусть заданы распределения вероятностей независимых случайных величин X, Y и W. Случайная величина W имеет такой же закон распределения, что и Y. xi -1 0 1 2 yj -1 1 pi 0,3 0,4 0,2 0,1 pj 0,6 0,4 Составьте таблицы распределения для следующих случайных величин: а) Z=X+Y; б) T=Y+W; в) R=2·Y; г) S=X·Y. Решение: а) Для того, чтобы получить закон распределения случайной величины Z=X+Y составим вспомогательную таблицу, в каждой клетке которой в правом верхнем углу указывается возможное значение 78 случайной величины, а после наклонной черты - соответствующая ему вероятность: X zi -1 0 0,3 0,4 -1 Y -1 0,18 0,24 1 0 1 0,12 0,1 1 0,12 0 0,4 2 0,2 -2 0,6 1 0,06 2 0,16 3 0,08 0,04 Теперь составим таблицу распределения для случайной величины Z: zi -2 -1 0 1 2 3 pi 0,18 0,24 0,24 0,22 0,08 0,04 Для проверки найдем сумму вероятностей: 6  pi  0,18  0,24  0,24  0,22  0,08  0,04  1. i 1 б) Закон распределения случайной величины T=Y+W получается аналогично: сначала составим вспомогательную таблицу, а затем итоговую: Y ti -1 0,6 0,4 -1 0,6 W -2 0,36 0 0,24 1 0,4 1 0 0,24 2 0,16 79 ti -2 0 2 pi 0,36 0,48 0,16 Для проверки найдем сумму вероятностей: 0,36+0,48+0,16=1. в) Закон распределения пользуясь случайной определением величины произведения R=2·Y константы на составим, случайную величину: ri -2 2 pi 0,6 0,4 Очевидно, что случайные величины T=Y+W=Y+Y и R=2·Y имеют различные законы распределения. г) Закон распределения для случайной величины S=X·Y получаем также составляя вспомогательную таблицу, а затем итоговую: si -2 -1 0 1 2 pi 0,06 0,24 0,4 0,26 0,04 Сумма вероятностей: 0,06+0,24+0,4+0,26+0,04=1. ■ Закон распределения дает исчерпывающую характеристику случайной величины, но в ряде случаев не требуется знать весь закон распределения, а достаточно описать его в общих чертах – несколькими числами, отражающими распределения. Такого характеристиками наиболее рода случайной важные числа величины особенности называют (или закона числовыми соответствующего закона распределения). Многие задачи удается решить, оставляя в стороне законы распределения и характеристиками. 80 оперируя только числовыми Наиболее употребительной числовой характеристикой центра группирования значений дискретной случайной величины является математической ожидание, обозначаемое большой латинской буквой M, после которой в скобках указывается название случайной величины: M(X) – математическое ожидание случайной величины X. Математическим ожиданием дискретной случайной величины X, принимающей возможные значения x1 , x 2 ,…, x n , … вероятностями p1 , p2 , … , pn , … , называется сумма ряда с  x i pi x i Ω (при условии абсолютной сходимости этого ряда). Если число возможных значений случайной величины X - конечно, n то M  X    x i pi , где n  Ω . i 1 Пример 1.3 Вероятность попадания в мишень при одном выстреле для Анри равна 0,3. Его друг Пьер заключает пари: «Ставлю $10 против $3, что Анри не попадет в мишень!». Анри принимает пари. Прав ли он? Решение: Выигрыши игроков – случайные величины. Обозначим через X – выигрыш Анри, Y – выигрыш Пьера, составим таблицы распределения для каждой случайной величины: xi -3 10 yj -10 3 pi 0,7 0,3 pj 0,3 0,7 Вычислим средний ожидаемый выигрыш для каждого игрока: M  X   -3·0,7  10·0,3  0,9 ; M Y   -10·0,3  3·0,7  -0,9 . Мы видим, что средний ожидаемый выигрыш Анри больше, чем средний ожидаемый выигрыш Пьера, значит, Анри прав, принимая пари. ■ Свойства математического ожидания случайной величины: 1) Математическое ожидание постоянной постоянной: M C   C . 81 равно самой этой 2) Константа выносится за знак математического ожидания: n n i 1 i 1 M C·X    C·x i ·pi  C·  x i ·pi  C·M  X  . 3) Математическое ожидание суммы (разности) случайных величин равно сумме (разности) их математических ожиданий: M  X  Y   M  X   M Y  . 4) Математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий: M  X·Y   M  X ·M Y  . Замечание 1. Свойства 3, 4 по индукции распространяются на произвольное число случайных величин. 5) Если для любого исхода две случайные величины X и Y связаны соотношением X≤Y, то их математические ожидания связаны тем же соотношением: M  X   M Y  . 6) Математическое ожидание находится между возможными значениями случайной величины: если каждое значение удовлетворяет неравенству xi A  x i  B , то и математическое ожидание удовлетворяет тому же неравенству A  M  X   B . 7) Для любой функции f  X  , определенной на множестве значений  дискретной случайной величины, верно: M f  X    f  x i pi . i 1 Пример 1.4 Пусть случайная распределения: величина задана X xi -5 1 3 pi 0,5 0,4 0,1 таблицей Случайная величина Y имеет такой же закон распределения.   Найдите M  XY , M X 2 и сравните их. Решение: Построим вспомогательную таблицу для Z=XY: 82 X -5 zi 1 0,5 pi 0,4 -5 -5 0,25 Y 0,1 25 0,5 1 0,2 1 0,2 0,16 3 3 0,04 -15 0,1 -15 0,05 -5 0,4 3 3 0,05 0,04 9 0,01 В таблице, внутри выделенного жирной линией квадрата, в правом верхнем углу указано возможное значение случайной величины z i , а в левом нижнем углу – соответствующая ему вероятность pi . Тогда ряд распределения случайной величины Z имеет вид: zi -15 -5 1 3 9 25 pi 0,1 0,4 0,16 0,08 0,01 0,25 Найдѐм сумму вероятностей: 6  pi  0,1  0,4  0,16  0,08  0,01  0,25  1. i 1 Вычислим математическое ожидание: M  XY   M Z   6 i 1 zi pi  -1,5 - 2  0,16  0,24  0,09  6,25  3,24 . Проверим, будет ли выполняться равенство M  XY   M  X M Y  ? Для этого вычислим M  X  (так как по условию Y имеет такой же закон распределения что и X, то M  X   M Y  ): M  X   -2,5  0,4  0,3  -1,8 ; M  X M Y   -1,8 - 1,8   3,24=M(XY). ti 25 1 9 pi 0,5 0,4 0,1 83 Теперь построим ряд распределения случайной величины T  X 2 :   M T   M X 2  12,5  0,4  0,9  13,8 .   Следовательно, мы получили, что M  XY   M X 2 . Кроме того, очевидно, что случайные величины X·X и X 2 имеют различное распределение (сравните таблицы распределения для Z и для T). ■ Для характеристики степени вариации значений случайной величины вокруг центра группирования используются дисперсия и среднеквадратическое отклонение. Дисперсией случайной величины называется математическое ожидание квадрата отклонения случайной величины от своего математического ожидания: D X   M  X - M  X 2 . Утверждение. Если случайная величина X имеет дисперсию D X  , то она может быть определена по формуле:   D X   M X 2 - M 2  X  . Свойства дисперсии случайной величины: 1) Дисперсия постоянной равна нулю: DC   0 . 2) Постоянная выносится за знак дисперсии с возведением в квадрат: DCX   C 2D X  . 3) Дисперсия суммы (разности) независимых случайных величин равна сумме дисперсий: 4) D X  Y   D X   DY  . Дисперсия произведения независимых случайных величин X и Y равна разности произведения математических ожиданий квадратов случайных величин и произведения квадратов математических ожиданий случайных величин:     D XY   M X 2  M Y 2 - M 2  X   M 2 Y  . 84 Ковариацией случайных величин X и Y называется математическое ожидание произведения их отклонений от своих математических ожиданий: cov  X, Y   M  X - M  X   Y - M Y   M  XY  - M  X   M Y  . Замечание 2. Ковариация является характеристикой зависимости случайных величин X и Y. Если cov  X, Y   0 , то случайные величины X и Y – независимы. Следовательно, M  X, Y   M  X ·M Y  . Замечание 3. Дисперсия – это частный случай ковариации случайной   величины X: cov  X, X   M X 2 - M 2  X   D X  . 5) Дисперсия суммы (разности) зависимых случайных величин X и Y равна сумме их дисперсий плюс (минус) удвоенная ковариация этих случайных величин: D X  Y   D X   DY   2 cov  X ,Y  . Размерность дисперсии есть квадрат размерности самой случайной величины, что не всегда удобно. Иногда предпочтительнее иметь характеристику разброса значений случайной величины такой же размерности как и она сама. Квадратный корень из дисперсии случайной величины называется ее средним квадратическим отклонением или стандартным отклонением: σ  X   D X  . Замечание 4. Числовые характеристики случайной величины X (ее математическое ожидание, дисперсия, стандартное отклонение) являются величинами неслучайными, постоянными. Свойства стандартного отклонения случайной величины: 1) Стандартное отклонение постоянной равно нулю: σ C   0 ; 2) Если для случайной величины X стандартное отклонение σ  X   0 , то эта величина с вероятностью 1 постоянна. 85 3) Стандартное отклонение не меняется при сдвиге на любую постоянную: σ  X - C   σ  X  . 4) Константа выносится за знак стандартного отклонения под знаком модуля: σ С·X   C ·σ  X  . 5) Для независимых случайных величин X и Y стандартное отклонение их суммы равно квадратному корню из суммы квадратов их стандартных отклонений: σ  X  Y   σ 2  X   σ 2 Y  . Пример 1.5 Фирма предложила клиенту два варианта инвестиций (возможная чистая прибыль и соответствующие ей вероятности для двух вариантов вложений капитала приведены ниже в таблице). прибыль -3 -2 -1 0 1 2 3 4 вероятность 1 0 0 0 0,2 0,3 0,2 0,2 0,1 вероятность 2 0,1 0,1 0,1 0,1 0,1 0,1 0,2 0,2 Произведите расчеты и выясните - какой вариант выгоднее для клиента? Решение: В условиях рыночной экономики, как правило, выигрывает тот, кто умеет лучше считать, планировать, анализировать имеющуюся информацию для принятия обоснованного решения. Принимая решение в условиях неопределенности можно использовать числовые характеристики случайных величин. В данном случае можно рассчитать для каждого варианта вложения капитала ожидаемую среднюю прибыль и выбрать решение с максимальным значением ожидаемой прибыли. Исходные значения возможной чистой прибыли можно рассматривать как значения некоторой дискретной случайной величины, а потому ожидаемая средняя прибыль – это математическое ожидание случайной величины X для первого варианта инвестиций и математическое ожидание случайной величины Y для второго варианта инвестиций. Произведем расчеты для каждого варианта: 86 M(X)=-3·0+(-2)·0+(-1)·0+0·0,2+1·0,3+2·0,2+3·0,2+4·0,1=1,7; M(Y)=(-3)0,1+(-2)·0,1+(-1)·0,1+0·0,1+1·0,1+2·0,1+3·0,2+4·0,2=1,1. Если принимать во внимание только ожидаемую прибыль, то первый вариант вложения капитала выгоднее. Если бы решение об инвестициях принималось много раз при одних и тех же условиях, то прибыль в среднем составила бы 1,7 денежных единиц. Однако пока не учитывался риск, связанный с инвестициями, т. е. «разброс» возможных исходов. Этот риск может быть учтен с помощью стандартного отклонения прибыли. Для первого варианта получаем: σ  X   D(X ); D( X )  M( X 2 )  M 2 ( X ). M ( X 2 )  1·0+0·0,2+1·0,3+4·0,2+9·0,2+16·0,1=4,5; D X   4,5 - 1,72  1,61 => σ  X   1,61  1,27 . Для второго варианта:   M Y 2  6,9 => DY   6,9 - 1,12  5,69 => σ Y   5,69  2,385 . Риск для инвестиций по первому варианту меньше (1,27), чем по второму (2,385), а средняя ожидаемая прибыль – больше, поэтому первый вариант предпочтительнее второго. ■ Пример 1.6 Предположим, что Вы – владелец кондитерской. В начале каждого дня Вам нужно решить вопрос, сколько пирожных следует иметь, чтобы удовлетворить спрос. Затраты на каждое пирожное составляют 7 руб., а доход от продажи – 10 руб. Невостребованный остаток продать на следующий день нельзя (пострадает престиж), поэтому его распродают в конце дня по 3 руб. Спрос (штук в день) 20 30 35 40 Частота 20 30 40 10 Определите оптимальный объѐм предложения пирожных. Сколько пирожных в среднем за день приходится распродавать? 87 Решение: При выборе оптимального объѐма предложения будем руководствоваться правилом максимизации ожидаемой прибыли. Прибыль будем определять как разницу между доходом и затратами, не учитывая налоги. Обозначим через Y – спрос. Тогда таблица распределения этой случайной величины получается на основе исходной таблицы для частот: yi 20 30 35 40 pi 0,2 0,3 0,4 0,1 Пусть X – объѐм предложения (также величина случайная), тогда прибыль представляет собой функцию от случайных величин X и Y: (10 - 7) X , если X ≤ Y  π  X, Y    10Y - 7 X  3 X - Y , если X  Y 3 X , если X ≤ Y π  X, Y     7Y - 4 X , X  Y При этом целевая функция – средняя ожидаемая прибыль – вычисляется как математическое ожидание от функции случайной величины: Π(X)=M(π(X;Y))=π(X;20)·0,2+π(X;30)·0,3+π(X;35)·0,4+π(X;40)·0,1 Вычислим значения Π(X): Π(20)=M(π(20;Y))=3·20=60; Π(30)=M(π(30;Y))=(7·20-4·30)·0,2+3·30·0,8=76; Π(35)=M(π(35;Y))=(7·20-4·35)·0,2+(7·30-4·35)·0,3+3·35·0,5=73,5; Π(40)=M(π(40;Y))=57. Отсюда видно, соответствующий что оптимальный максимальному значению объѐм предложения, средней ожидаемой прибыли, X * - это 30 пирожных в день. Средний ожидаемый спрос на пирожные: M(Y)=20·0,2+30·0,3+35·0,3+40·0,1=31 (штука). Так как X * =30<M(Y)=31, то распродавать пирожные не придется. ■ 88 Задачи для самостоятельного решения: 1.1 Случайная величина X определяется как разность между большим и меньшим числами, выпавшими при бросании двух игральных костей. Если они равны между собой, то переменная X считается равной нулю. Найдите распределение вероятностей для X и ее математическое ожидание. Постройте график F  x  . 1.2 Продавец проездных билетов покупает их у фирмы по $3 за штуку, а продает покупателю по $4. Обработав статистику спроса, он выяснил, что спрос (X, в десятках) имеет следующее распределение: xi 3 4 5 6 7 8 9 pi 0,01 0,1 0,3 0,4 0,1 0,06 0,03 Сколько же нужно закупить билетов, чтобы средняя ожидаемая выручка была максимальной? 1.3 В лотерее имеется m1 выигрышей стоимостью k1 , m2 - стоимостью k 2 , … , m n - стоимостью k n . Всего билетов N. Какую стоимость билета следует установить, чтобы средний ожидаемый выигрыш на один билет был равен половине его стоимости? 1.4 Первый игрок бросает 3, а второй – 2 одинаковых монеты. Выигрывает и получает все пять монет тот, у которого выпадает большее число гербов. В случае ничьей игра повторяется до получения определенного результата. Каким будет средний ожидаемый выигрыш каждого игрока? 1.5 Два баскетболиста поочередно забрасывают мяч в корзину до тех пор, пока один из них не попадет. Построить ряд распределения случайной величины X - числа бросков, производимых каждым из баскетболистов, если вероятность попадания для первого равна 0,4, а для второго – 0,6. 1.6 (Из опыта второй мировой войны: алгоритм Дофмана). Большому числу N людей срочно требуется сделать анализ крови. 89 Стоимость одного анализа $5. Дофман предложил смешивать кровь k человек и анализировать смесь. В случае положительного результата для смеси проверяют каждого в отдельности. Было решено выплатить Дофману 20% от сэкономленной суммы. Каков размер премии, если: а) N=100000, k=10, p=0,01; б) N=100000, k=10, p=0,001? 1.7 В партии из 10 изделий 2 дефектных. Для контроля выбирают 2 изделия. Если среди них имеется хотя бы одно бракованное, то проверяют еще 4. Стоимость проверки одного изделия 20 руб. Составьте таблицу распределения, постройте график функции распределения, вычислите математическое ожидание и стандартное отклонение для случайных величин: T – число проверенных изделий, R – расходы на контроль. 1.8 Игроки A и B начинают со стартовым капиталом 4 и 2 руб. Подбрасывается монета и в случае герба игрок B выплачивает игроку A 1 руб. В случае решки – наоборот. Найдите ожидаемый доход игроков при условии, что общее число бросаний ограничено пятью. 1.9 В шестизарядном револьвере один патрон. Составьте таблицу распределения X - числа испытаний «русской рулетки», найдите функцию распределения F  x  и математическое ожидание M  X  . 1.10 Марья Потаповна решила стать businesswoman: если она откроет ресторан, то, возможно, получит через год прибыль в размере 20%, но вероятность разорения равна 0,3; если тетя Маша займется «цветочным» бизнесом, то вероятная прибыль через год – 10%, шансы разориться – 0,1. Найдите среднюю ожидаемую прибыль через год для каждого варианта вложения денег, если для этой цели Марья Потаповна располагает суммой в $20 тыс. 1.11 Производятся независимые последовательные испытания четырех приборов на надежность. Каждый следующий прибор испытывается только в том случае, если предыдущий оказался надежным. Вероятность выдержать испытание для каждого прибора равна 0,8. 90 Постройте ряд распределения X - случайного числа испытанных приборов, график ее функции распределения и вычислите математическое ожидание и дисперсию. 1.12 Пусть X – выручка фирмы в $. Найдите распределение выручки в рублях Z=X·Y в пересчете по курсу доллара Y, если выручка не зависит от курса, а распределения X и Y имеют вид: xi 20000 30000 yj 29 30 pi 0,7 0,3 pj 0,6 0,4 Найдите среднюю ожидаемую выручку и стандартное отклонение. 1.13 Пусть X – выручка фирмы (в тыс.$), Y – затраты (в тыс.$), Z=X-Y прибыль. Постройте функцию распределения F z  и найдите среднюю ожидаемую прибыль, если выручка и затраты независимы, а их распределения вероятностей заданы таблицами: xi 10 15 20 yj 10 15 pi 0,3 0,6 0,1 pj 0,6 0,4 1.14 Распределение дискретной случайной величины X определяется формулой P X  k   a 3 k , k=0, 1, 2, … Найдите параметр a и вероятность P  X  2  . 1.15 Найти математическое ожидание и дисперсию случайных величин: а) Z  4 X  2Y ; M ( X )  5, M (Y )  3, б) Z  2 X  4Y ; D( X )  4, в) Z  3 X  5Y , если D(Y )  6 . Случайные величины X и Y независимы. 1.16 Дискретная случайная величина X принимает три возможных значения: x 1  1 с вероятностью p1  0,2 ; x 3  5 с вероятностью p3  0,3 и x 2 с вероятностью p2 . Найти x 2 и p2 , если известно, что M(X )  3 . 91 1.17 Дискретная случайная величина задана X законом распределения: Найти x 2 , x3 , xi 1 x2 x3 8 pi 0,1 p2 0,5 0,1 p2 , если известно, что M ( X )  4, M( X 2 )  20,2 . Ответы: 1.1 35/18. 1.2 5 десятков (при этом средняя выручка равна $45,2); 1.3 p  2 n  mi k i . 1.4 N i 1 M(X)=7/16, M(Y)=-7/16. 1  1.6 П  0,2  Δ  N   Pk 0   ; а) 80480; б) 89004,46. 1.7 M(T)≈3,51, k  M(R)≈70,22. 1.8 M(X)=0, M(Y)=0. 1.9 равномерное. 1.10 цветочный бизнес выгоднее: M(X)=-3200, M(Y)=-200. 1.11 M(X)=1,248. 1.12 M(Z)=29,4. 1.13 M(Z)=2. 1.14 a=2/3, P(X≤2)=26/27. 1.15 а) 14 и 88; б) -2 и 112; в) 30 и 186. 1.16 x 2  2,6 . 1.17 x 2  2, x 3  5, p2  0,3 . 2.2. Основные законы распределения дискретных случайных величин РАВНОМЕРНОЕ РАСПРЕДЕЛЕНИЕ НА МНОЖЕСТВЕ Пусть дискретная случайная величина X принимает целочисленные значения от 1 до n с одинаковыми вероятностями P X  m   1 , где m=1, 2, …, n. Составим ряд распределения n случайной величины X: xi 1 2 3 … n pi 1/n 1/n 1/n … 1/n 92 Графически представим данное распределение в виде многоугольника распределения вероятностей: pi 1/n 0 1 2 3 ……………… n xi Рис. 7 Так как вероятность равномерно «размазана» на высоте 1/n для каждого возможного значения случайной величины X, то распределение называют равномерным. Числовые характеристики равномерно распределенной случайной величины на множестве 1,2, …, n: M X     D X   M X 2   n  12n  1 n1 ; M X2  ; 2 6 n2 - 1 1 n2 - 1 ; σ  X   D X   . - M X   12 2 3 2 ГЕОМЕТРИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ Пусть ведется стрельба по некоторой цели до первого попадания, причем вероятность попадания при каждом выстреле не зависит от результатов предыдущих выстрелов и сохраняет постоянное значение p (0<p<1). Число X произведенных выстрелов – случайная величина, возможными значениями которой являются: 1) все натуральные числа (если количество патронов не ограничено); 2) все числа: 1, 2, …, n (если всего n патронов). Составим ряд распределения и получим числовые характеристики для каждого случая. 1) xi 1 2 3 … m … pi p pq pq 2 … pq m -1 … Числовые характеристики этой случайной величины: 93 M X       q 2- p q 1 ; M X2  ; D X   M X 2 - M 2  X   ; σ X   . 2 2 p p p p 2) В случае, когда стрельба по цели ведется с конечным запасом снарядов n, ряд распределения будет конечным: xi 1 2 3 … pi p pq pq 2 … n q n -1 ГИПЕРГЕОМЕТРИЧЕСКИЙ ЗАКОН РАСПРЕДЕЛЕНИЯ Пусть имеется совокупность из N элементов, среди которых M элементов определенного типа (например, множество деталей, среди которых есть бракованные; или множество лотерейных билетов, среди которых есть с выигрышем). Производится выборка без возвращения объемом n. Обозначим через X – число элементов определенного типа, попавших в выборку. Дискретная случайная величина X имеет гипергеометрическое распределение, если она принимает значения 1, 2, …, min(n,M) с m nm CM  CN M . вероятностями P  X  m   n CN Математическое ожидание такой случайной величины равно: M  X   n· M M  p - доля элементов определенного или, учитывая, что N N типа в исходной совокупности, получаем: M  X   np . Дисперсия: D  X   n· M M n N-n ·(1 - )·(1 - ) или D X   npq· . N -1 N N N -1 БИНОМИАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ Пусть производится n независимых испытаний, в каждом из которых случайное событие может произойти с одной и той же вероятностью p. Случайная величина X – это число появлений случайного события A при проведении указанных испытаний. Тогда эта 94 дискретная случайная величина будет иметь следующий ряд распределения: xi 0 1 … m … n pi qn npq n - 1 … Cnm p mq n - m … pn величина X Случайная имеет биномиальный закон распределения, если она принимает значения 0, 1, …,m, …, n с вероятностями P  X  m   Cnm pmq n - m . Биномиальное распределение описывает последовательность независимых испытаний по схеме повторной выборки. Числовые характеристики случайной величины X, распре- делѐнной по биномиальному закону: M  X   np , D X   npq . ЗАКОН РАСПРЕДЕЛЕНИЯ ПУАССОНА Дискретная случайная величина X, которая может принимать только целые неотрицательные значения с вероятностями λk e - λ называется распределенной по закону Пуассона с P X  k   k! параметром λ. В отличие от биномиального распределения здесь случайная величина может принимать бесконечное множество значений, представляющее собой бесконечную последовательность целых чисел 0, 1, 2, …. Закон Пуассона описывает число событий k, происходящих за одинаковые промежутки времени. При этом полагается, что события появляются независимо друг от друга с постоянной средней интенсивностью, которая характеризуется параметром λ  np . Так как для распределения Пуассона вероятность p появления события в каждом испытании мала, то это распределение называют законом распределения редких явлений. 95 Случайная величина X, подчиненная закону распределения Пуассона, имеет следующий ряд распределения: xi 0 1 2 … k … pi e- λ λe - λ 1! λ2e - λ 2! … λk e - λ k! … Числовые характеристики: M  X   λ  np , D X   λ  np . Примерами ситуаций, в которых возникает распределение Пуассона, могут служить распределения числа определенных микробов в единицу объема, числа вылетевших электронов с накаленного катода за ед. времени, числа вызовов, поступающих на телефонную станцию за определенное время суток и т.п. Рассмотрим примеры на определение типа распределения. Пример 2.1 Из ящика с красными и белыми шариками (всего шариков n) с долей белых шариков p=0,2 производят выборку с возвращением до появления первого белого шарика. Получите ряд распределения случайной величины X – числа извлеченных красных шариков. Решение: Так как количество шариков в ящике не меняется, то распределение - геометрическое: xi 0 pi 0,2 1 2 3 4 0,16 0,128 0,1024 0,0819 … … n-1 n 0,2  0,8n 1 0,8 n -1 З дес ь вероятность определяется по формуле: P  X  k   pq k -1 , где p  0,2 и q  1 - 0,2  0,8 . ■ Пример 2.2 Монету бросают 5 раз. Пусть X – число выпадений герба. Составьте ряд распределения случайной величины X и определите ожидаемое среднее число появлений герба. Решение: Так как производится 5 независимых испытаний, в каждом из которых случайное событие (появление герба) может произойти с 96 одинаковой подчиняется p  0,5 , вероятностью биномиальному то случайная закону величина распределения. X Значит, вероятность определяется по формуле: P  X  m   Cnm pmq n - m . Ряд распределения имеет вид: xi pi 0 1 2 3 4 5 0,03125 0,15625 0,3125 0,3125 0,15625 0,03125 Сумма вероятностей: 5 i 0 pi  20,03125  0,15625  0,3125   2·0,5  1. Среднее ожидаемое число появлений герба: M  X   np  5·0,5  2,5 . ■ Пример 2.3 Вероятность попадания в цель при одном выстреле равна 0,015. Сделано 600 выстрелов. Какова вероятность того, что число попаданий в цель не меньше 7 и не больше 10? Решение: Так как вероятность «успеха» одинаковая и не меняется, испытания независимы и их количество достаточно велико, то случайная величина X (число попаданий) распределена по закону Пуассона. Следовательно, вероятности определяются по формуле: λk e - λ , где параметр λ  np  600·0,015  9 . По условию P X  k   k! следует найти вероятность того, что значение случайной величины X попадает в интервал [7,10], т.е. найти вероятность: P 7 ≤ X ≤ 10   P  X  7   P  X  8  P  X  9  P  X  10    0,1171  0,1318  0,1318  0,1186  0,4993 . ■ Значения вероятностей можно найти по таблице распределения Пуассона при заданных значениях λ и k (в Приложении №3) или с помощью статистической функции: ПУАССОН(x, среднее, интегральный), где x=k; среднее=λ; интегральный – логическое значение, определяющее вид функции: 97 ИСТИНА – для вычисления значений функции распределения F  x  и ЛОЖЬ – для вычисления вероятности P  X  k  . Пример 2.4 Из партии, содержащей 100 изделий, среди которых имеется 10 дефектных, выбраны случайным образом 5 изделий для проверки их качества. Построить ряд распределения случайного числа X дефектных изделий, содержащихся в выборке и определить среднее ожидаемое число брака в выборке и дисперсию. Решение: Так как изделия выбираются без возвращения, то в данном случае X распределено по гипергеометрическому закону. Значит, вероятности определяются по формуле: P  X  m   m n-m CM ·CN - M n CN . Ряд распределения имеет вид: 0 xi pi 1 2 3 4 5 0,583 0,340 0,070 0,007 0,0002 0,000003 Среднее ожидаемое число бракованных изделий в выборке: M  X   n· D  X   n· M 10  5·  0,5 ; дисперсия равна: N 100 M M n 10 ·(1 - )·(1 - )  5· ·(1 - 0,1)·(1 - 0,95)  0,43182 . N -1 N N 99 ■ Вычислять вероятности P X  m   m n-m CM ·CN - M n CN  P m , n, M , N  можно в EXCEL с помощью функции ГИПЕРГЕОМЕТ(m,n,M,N). Пример 2.5 Стороны прямоугольного участка X и Y в результате погрешностей измерения оказываются случайными величинами с такими распределениями: xi pi 19,5 0,20 19,7 0,05 20,0 0,70 98 20,2 0,05 yi pi 29,5 0,15 29,8 0,15 30,0 0,65 30,1 0,05 Найдите математическое ожидание площади участка, если известно, что измерения проводились независимыми способами. Решение: Площадь прямоугольника определяется по формуле S  X·Y и так как случайные величины X и Y – независимы, по условию, то M  X·Y   M  X ·M Y  . Найдем математическое ожидание каждой случайной величины: M  X   19,5·0,2  19,7·0,05  20·0,7  20,2·0,05  19,895 ; M Y   29,5·0,15  29,8·0,15  30·0,65  30,1·0,05  29,9 . Тогда среднее ожидаемое значение площади равно: M S   19,895·29,9  594,8605 . ■ Задачи для самостоятельного решения: 2.1 Из 10 ключей к двери подходит только один. Ключи испытываются последовательно, без возвращения. Составьте таблицу распределения, вычислите математическое ожидание и дисперсию для случайной величины X – числа испытаний. 2.2 Монету бросают до появления герба, но не свыше 4-х раз. Найдите распределение числа бросаний, математическое ожидание и дисперсию. 2.3 В рекламных целях торговая фирма вкладывает в каждую десятую единицу товара денежный приз размером 1 тыс. руб. Составьте закон распределения случайной величины – размера выигрыша при пяти сделанных покупках. Найдите средний ожидаемый выигрыш и стандартное отклонение. 2.4 Вероятность того, что аудитор допустит ошибку при проверке бухгалтерского баланса, равна 0,1. 99 Аудитору на заключение представлено 4 баланса. Составьте закон распределения случайной величины X – числа правильных заключений на проверяемые балансы. 2.5 В среднем по 3% договоров страховая компания выплачивает страховую сумму. Найдите вероятность того, что из 100 заключенных договоров с наступлением страхового случая будет связано не более 5ти договоров. Опишите закон распределения случайной величины X – числа выплат страховой суммы. 2.6 Клиенты банка, не связанные друг с другом, не возвращают кредиты в срок с вероятностью 0,1. Составьте закон распределения случайной величины X – числа возвращѐнных в срок кредитов из пяти выданных, постройте график функции распределения, вычислите M  X  и σ X  . 2.7 Разыгрывается лотерея. Выигрыши: машина стоимостью 200 тыс. руб., телевизор стоимостью 50 тыс. руб., пылесос стоимостью 5 тыс. руб. Всего выпущено 10 тыс. билетов, цена одного билета 20 руб. а) Какой будет средняя прибыль человека, купившего один билет? б) Сколько должен стоить билет, чтобы организатор игры получил прибыль в размере 20% от своих затрат? (* Учитываются только затраты на приобретение выигрышей). 2.8 Вероятность успешной сдачи экзамена для студента, посещавшего все занятия и выполнявшего все домашние задания по данной дисциплине, равна 0,7; для нерадивого студента – 0,1. Составьте закон распределения числа студентов, успешно сдавших экзамен для четырех человек, выбранных наудачу из совокупности: а) прилежных студентов; б) прогульщиков. Найдите среднее число успешно сдавших экзамен для каждой группы студентов. 2.9 Задано распределение дискретной случайной величины X: xi -1 0 1 pi 0,2 0,6 0,2 100 Случайная величина Y имеет биномиальный закон распределения с параметрами n=2, p=0,7. Составьте закон распределения их суммы и найдите еѐ среднее ожидаемое значение. 2.10 Случайная величина X распределена равномерно на множестве {1, 5, 7} с вероятностью p=1/3, а случайная величина Y имеет геометрическое распределение с параметрами n=3, p=0,7. Найдите математическое ожидание величины Z  2X - и стандартное отклонение случайной 1 Y  5. 3 2.11 Экзаменатор задает студенту вопросы, пока тот правильно отвечает. Как только число правильных ответов достигнет четырех, либо студент ответит неправильно, экзаменатор прекращает задавать вопросы. Вероятность правильного ответа на один вопрос равна 2/3. Составьте ряд распределения числа заданных студенту вопросов, вычислите M(X). Ответы: 2.1 распределение равномерное, M(X)=5,5. 2.2 геометрическое, n=4, M(X)=15/8, D(X)=71/64. 2.3 распределение распределение биномиальное, M(X)=0,5 (тыс. руб.), σ(X)=0,67 (тыс. руб.). 2.4 ределение биномиальное. 2.5 распределение Пуассона, P(X≤5)=0,91608. 2.6 M(X)=4,5; σ(X)=0,67. 2.7 а) 5,5 руб.; б) доход=1,2·затраты => 10a=1,2·255000 => a=30,6 руб. 2.8 а) 2,8; б) 0,4. 2.9 M(X+Y)=11,4. 2.11 M(X)=65/27. 101 расп- 2.3. Непрерывные случайные величины: способы задания, числовые характеристики и их свойства Множество значений непрерывной случайной величины представляет собой некоторый промежуток: конечный или бесконечный, т.е. является несчетным множеством. Для непрерывной случайной величины X реальный смысл имеет только такое событие, как попадание в интервал, а не попадание в отдельную точку. Поэтому закон распределения вероятностей величины X должен позволять находить вероятности P  x1  X  x 2  попадания ее значений в любой интервал (x1 , x 2 ) . Случайная величина X называется абсолютно непрерывной (далее для краткости будем называть их просто непрерывными), если p x   0 , что для любого возможного существует такая функция значения случайной величины ее функция распределения может быть x представлена в виде: F  x   p x dx . - p x  Функция называется плотностью распределения вероятностей и определяет закон распределения для непрерывной случайной величины. График функции плотности распределения называется кривой распределения. Свойства плотности распределения: 1) Вероятность попадания непрерывной случайной величины интервал равна определенному интегралу от ее плотности: x2 Px1  X  x 2    p x dx . x1 2) Суммарная площадь под кривой распределения равна единице:   p x dx  1. - 102 в 3) В точках непрерывности: p x   F (x ) . 4) P X  x   0 . Следствие. Для непрерывной случайной величины X: P  x1  X  x 2   P  x1  X  x 2   P  x1  X  x 2   P  x1  X  x 2 . Понятие математического ожидания M  X  и дисперсии D X  , определенные для дискретной случайной величины, можно распространить на непрерывные случайные величины. Для получения формул математического ожидания и дисперсии непрерывной случайной величины достаточно в соответствующих формулах для дискретной случайной величины X заменить знак суммирования   по всем ее значениям знаком интеграла с i 1 бесконечными пределами   , «скачущий» элемент x i - непрерывно - меняющимся x, а вероятность pi - элементом вероятности p x dx . В результате получим следующие формулы:  M  X    xp  x dx , если интеграл абсолютно сходится, -  D X    ( x - M  X ) p x dx 2 или - Все свойства  D X    x 2 p x dx - M 2  X  . - математического ожидания и дисперсии, рассмотренные выше для дискретных случайных величин, справедливы и для непрерывных случайных величин. Начальным моментом k-го порядка, который обозначается как γ k , называется математическое ожидание k-ой степени случайной   величины: γ k  M X k . 103 Например, первый начальный момент – это математическое ожидание: γ1  M  X  , а дисперсия равна D X   γ 2 - γ12 . Центральным моментом k-го порядка, который обозначается как μk , называется математическое ожидание k-ой степени отклонения случайной величины от своего математического ожидания: μk  M  X  M  X k . Например, второй центральный момент – это дисперсия:   μ2  M  X  M  X 2  M X 2  M 2  X   D X  Любой центральный момент можно выразить через начальный. Например, третий центральный момент:   μ3  M  X - M  X 3  M  X - γ1 3  M X 3 - 3γ1 X 2  3γ12 X - γ13   γ3 - 3γ1γ2  2γ13 . Точка локального максимума функции плотности вероятности p x  называется модой. Мода случайной величины X обозначается Mo  X  . Для дискретной случайной величины X модой является возможное значение xi , которому соответствует наибольшая вероятность pi . Распределения, имеющие одну моду, называются одномодальными. Встречаются и многомодальные распределения. Функция распределения случайной величины X любой точке x p ставит в соответствие вероятность     p  F x p  P X  x p . Иногда возникает обратная задача: по заданному значению p найти такое x p ,   чтобы F x p  p . Такая точка x p называется квантилью уровня p . Квантиль уровня p  1/2 называется медианой распределения. Медиана случайной величины X обозначается Me  X  . Для непрерывных случайных величин медиана – это граница, которая делит 104 площадь криволинейной трапеции под кривой распределения на две равные части. Пример 3.1 Кривая распределения случайной величины X на отрезке [ 0; 4 ] имеет вид равнобедренного треугольника, вне этого отрезка p x   0 . Найдите для данной случайной величины: а) функцию плотности распределения p x  ; б) математическое ожидание и стандартное отклонение; в) функцию распределения F  x  ; г) вероятности событий P  X  1 , P 1  X  3 и P  X  3 ; д) моду, медиану и квантили x0,1 , x 0,9 . Решение: а) Сначала найдем высоту равнобедренного треугольника h. По свойству 2 функции плотности площадь криволинейной трапеции (в данном SΔ  случае треугольника) должна быть равна единице: 1 (4 - 0)h 4 1 ah   h  2h  1. Отсюда h  . 2 2 2 2 px  h 0 2 4 x Рис. 8 Так как распределение симметрично относительно прямой x  2 и на каждом из отрезков [ 0; 2] и [ 2; 4] функция плотности распределения представляет собой прямые p1  x   kx  b и p2  x   cx  d , то имеем: p1 0   b  0 p12   2k  b  p1  x   1 2 и p2 2   4c  d  0 1 p2 4   2c  d  2 Отсюда получим: x x - плотность на отрезке [ 0; 2] и p2  x   -  1 - плотность на 4 4 отрезке [ 2; 4]. б) Найдем математическое ожидание: 105  2 4 2 - 0 2 0 M  X    xp  x dx  0   xp1 x dx   xp2  x dx  0   x x x3   x (1 - )dx  4 12 2 4 2 0 x2  2 4 2 x3 12 4  62 x dx  4 12  2. 3 Этот же результат можно было получить иначе: достаточно посмотреть на график функции плотности распределения – понятно, что среднее значение лежит посередине (в силу симметрии кривой) отрезка [ 0; 4], т.е. равно сначала  M X 2   04  2 . Для нахождения стандартного отклонения 2 вычислим 2 x 0 2 x 4 dx  4 второй x 2 (1 - 2 начальный момент γ2 x 14 . )dx  4 3 D(X)  γ 2  X  - γ12  X   Тогда дисперсия равна: 14 2 -4  . 3 3 Стандартное отклонение: σ  X   D X   2 / 3  0,817 . в) Функция распределения для непрерывной случайной величины x определяется по функции плотности: F  x    pt dt . Найдем ее для - каждого интервала в отдельности: x  если x  0 , то p x   0 , следовательно F  x    0dt  0 ; - x t x x2  если 0  x  2 , то p x   . => F  x   0  ; dt  4 4 8 0  если 2  x  4 , то p x   1 - x . => 4 t x2 F x   0   dt   (1 - )dt  0   x -1; 4 4 8 0 2 2 t x 2 t  если x ≥ 4 , то F  x   0   0 4 4 dt   (1 2 106 t )dt  0  1. 4 Построим график функции распределения: F(x) 1,2 1 0,8 0,6 0,4 0,2 0 -1 -0,2 0 1 2 3 4 5 х Рис. 9 г) x2 P  X  1  F 1  8  x 1 1  0,125 ; 8 P 1  X  3  F 3 - F 1  0,75 ; P  X  3  1 - P  X  3   1 - F 3   1 - 7/8  1/8  0,125 , т.е. вероятности событий P  X  1  P  X  3 - в силу симметрии кривой распределения. д) Мода и медиана данной случайной величины совпадают и равны математическому ожиданию: M  X   Mo  X   Me  X   2 . Квантиль уровня 0,1 удовлетворяет   условию: F x 0,1  0,1. Такое значение функция распределения принимает на отрезке [ 0; 2], где она x2 x2 задается как . Получаем уравнение:  0,1. Отсюда x0,1  0,894 . 8 8 Квантиль уровня 0,9 в силу симметричности распределения находится на таком же расстоянии от правой точки x  4 , на каком расстоянии находится квантиль уровня 0,1 от левой точки x  0 , значит получим: x 0,9  4 - 0,894  3,106 . ■ Пример 3.2 Какие из перечисленных функций могут быть функциями плотности распределения вероятности? 107 при 0  x  0,25 ; 0 иначе а) p x   4 б) p x   0,5·sin x при - π/2  x  π/2 0 иначе Решение: Для того чтобы выяснить, может ли данная функция являться функцией плотности, необходимо проверить удовлетворяет ли  рассматриваемая функция условиям: p x   0 и  p x dx  1. - а) Данная функция на всей области определения неотрицательна и площадь криволинейной трапеции (в данном случае прямоугольника) равна 4·0,25=1. Значит, данная функция является плотностью. б) На интервалах (-π/2; 0) и (0; π/2) функция имеет разные знаки и поэтому не может быть плотностью. ■ Пример 3.3 Задана функция распределения случайной величины X: F x   0 при x  -π/4 a·sin(x - π/4)  1/2 при -π/4 ≤ x  3π/4 1 при x ≥ 3π/4 Найдите: а) плотность распределения p x  ; б) коэффициент a; в) вероятность попадания значения случайной величины X в интервал ( π/4; 3π/4). Решение: а) По свойству 3 для функции плотности получим: p x   F  x   б) 0 при x  - π/4 π π 3π a·cos( x - ) при - ≤ x  4 4 4 0 при x ≥ 3π / 4 По свойству 2 функции плотности имеем:   p x dx  1, значит: - 3π/4 π π 3π / 4  a·cos(x - π/4)dx  a·sin (x - π/4) -π/4  a·(sin 2 - sin(- 2 ))  2a  1. -π/4 108 Отсюда a  1 / 2 . в) Вероятность попадания значения случайной величины в заданный интервал (по свойству 2 функции распределения) равна: P π/4  X  3π/4   F ( 3π π 1 1 1 ) - F( )  1 - sin 0 -  . 4 4 2 2 2 ■ Задачи для самостоятельного решения: 3.1 Кривая распределения случайной величины X на отрезке [ 0; 4] имеет вид перевернутого равнобедренного треугольника, вне этого отрезка p x   0 . Найдите для данной случайной величины: а) функцию плотности распределения p x  ; б) математическое ожидание и стандартное отклонение; в) функцию распределения F  x  ; г) вероятности событий P  X  1 , P 1  X  3 и P  X  3 ; д) моду, медиану и квантили x0,1 , x 0,9 . 3.2 Какие из перечисленных ниже функций являются функциями распределения: а) F  x   в) F  x   д) F  x   3.3 0 при x  0 x при 0  x  1 1 при x  1 π  arctg x ; 2 0 при 1 при x 0 x 0 б) F  x   г) F  x   е) F  x   0 при x  0 x при 0  x  1 1 при x  1 2 1 1  arctgx ; 2 π 0 при x  0 1 при x  0 Какие из перечисленных ниже функций являются функциями плотности распределения вероятностей: а) p x   0 при x  0 или x  1 1 при 0  x  1 109 б) p x   x 1 x 2 ; 0 при в) p x   sin x при 0 при Для тех x 0 0  x π x π функций, 0 при x  0 г) p x   x(1 - x) при 0  x  1 0 при x  1 которые являются плотностью, найдите соответствующую функцию распределения. 3.4 Функция распределения годового дохода лица, облагаемого налогом, имеет вид (распределение Парето): F x   x 1-  0  x 0 a  при x  x 0 .   при x  x 0 Для a  4 и x 0  80 тыс. руб. найдите средний ожидаемый доход и доход, гарантированный на 90%. 3.5 Случайная величина X имеет плотность p x   c 1 x2 (закон Коши). Найдите: а) коэффициент c и функцию распределения F  x  ; б) вероятность P  X  1 ; в) математическое ожидание, моду и медиану данной случайной величины. 3.6 Случайная величина X при x  0 характеризуется функцией - распределения x2 2 F  x   1 - e 2σ (распределение Рэлея). Найдите плотность p x  . 3.7 Случайная (распределение величина Лапласа) X задана 1 -x p  x   ·e . 2 плотностью Найдите вероятности математическое ожидание величины X. Ответы: 3.1 p(x)=-x/4+1/2 при 0≤x≤2, p(x)=x/4-1/2 при 2<x≤4, M(X)=2. 110 3.2 а) да; б) да; в) нет; г) да; д) нет; е) нет. 3.3 а) да; б) нет; в) нет; г) M  X   1 0,76; 142,26. 3.5 нет. 3.4 P  X  1  c 1 ; π F x    1 arctg x  ; 2 π x2 1 2 x  e 2σ . ; M  X   Mo  Me  0 . 3.6 p x   2 σ2 3.7 M(X)=0. 2.4. Основные законы распределения непрерывных случайных величин РАВНОМЕРНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ Непрерывная случайная величина X распределена равномерно на отрезке [ a; b], если все ее возможные значения сосредоточены на этом отрезке и ее плотность распределения на этом интервале постоянна: p x   c, 0, axb x  a, x  b px  1 b-a 0 a x Рис. 10 b Найдем постоянную c из условия нормировки:  a b  b - - a b a  p x dx  1   p x dx   p x dx   p x dx  0   p x dx  0  b   b  c·  dx  c· x a  c·b - a  => c  a Если  x1 ; x 2  1 . b-a a; b , то: x2 x 2 x -x 1 P  x1  X  x 2    p x dx  ·  dx  2 1 , b-a x b-a x 1 1 111 т.е. вероятность попадания в интервал x1 ; x 2  равна отношению длины этого интервала к длине всего отрезка [ a; b]. Тогда функция распределения имеет вид: xa 0, при x-a , при b-a 1, при F x   a≤xb x ≥b F x  11 0 a b x Рис. 11 Математическое ожидание равномерно распределенной величины X:  dx 1 b 1 x2 M  X    xp  x dx   x   xdx  b - a ( 2 b a b a -  a a b M X   b a b2 - a2 ) 2(b - a ) ab . 2 Итак, математическое ожидание случайной величины X совпадает с серединой отрезка [ a; b]. Так как распределение симметричное, то медиана также находится в середине отрезка. Дисперсия равна: b 1 b ab 2 1 ab 3 (b - a) 2   DX   ( x - 2 ) dx  3(b - a) ( x - 2 )  12 . b-aa a Стандартное отклонение: σ  X   b-a . 2 3 Равномерный закон распределения используется при анализе ошибок округления при проведении числовых расчетов, в ряде задач массового обслуживания, при статистическом наблюдений, подчиненных заданному распределению. 112 моделировании ПОКАЗАТЕЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ Непрерывная случайная величина X имеет показательный (экспоненциальный) закон распределения с параметром λ, если ее плотность вероятности равна: p x   0 при x  0 . λ·e при x ≥ 0 - λx Кривая распределения имеет вид: p(x) λ 0 Рис. 12 x Функция распределения при x  0 равна нулю: F  x   0 , а для x  0 получаем: F  X   1  e  λx . График функции распределения имеет вид: F(x) 1 0 x Рис. 13 Математическое ожидание равно:  b - b   0 M  X    xp  x dx  lim  xλe - λx b dx  lim (-  xde - λx )  b   0 b b 1 1 - λx b  lim (-x e  e - λx dx )  lim (-be - λb - e - λx )  . λ λ 0 0 0 b  b    Дисперсию определим по формуле: D X   M X 2 - M 2  X  . 113 Для этого сначала найдем начальный момент второго порядка:   MX 2  b  x p x dx  lim  x λe 2  lim (-x 2 e - λx   M X2  0 - λx b   0 - b  2 b 0 b dx  lim (-  x 2de - λx )  b   0  2  bxe - λx dx )  lim (-b 2 e - λb )  b  0 21 2  . λ λ λ2 Отсюда D  X   2 λ2 - 1 λ2  1 λ2 b 2 x lim  dx λ b    0 e λx . Стандартное отклонение равно: σ  X   D X   1/ λ и совпадает с математическим ожиданием. Показательный закон распределения играет большую роль в теории массового обслуживания и теории надежности. Так, например, интервал времени T между двумя соседними событиями в простейшем потоке имеет показательное распределение с параметром λ – интенсивностью потока. При этом, если промежуток времени T уже длился некоторое время t , то это никак не влияет на закон распределения оставшейся части T1  T - t промежутка. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Непрерывная случайная величина X подчиняется нормальному закону распределения (закону Гаусса) с параметрами a и σ , если ее плотность вероятности имеет вид: 1 x -a - ( )2 1 . p(x)  e 2 σ σ 2π Нормальное распределение является одним из наиболее часто встречающихся распределений: рост, вес человека, ошибки измерения, параметры технологических процессов и т.д. подчиняются нормальному закону. Если случайная величина X имеет нормальное распределение вероятностей с параметрами a и σ, то коротко это записывают так: X~N(a,σ). 114 Нормальный закон распределения является предельным законом, к которому приближаются другие законы распределения при часто встречающихся аналогичных условиях. Кривую нормального закона распределения называют нормальной или кривой Гаусса. На рисунке ниже приведено семейство нормальных кривых в зависимости от параметров a и σ: px  a<0 0 x Рис.14 a>0 С геометрической точки зрения параметр a – точка максимума плотности, а также центр симметрии. При увеличении a график смещается вправо, при уменьшении a – влево. При уменьшении σ максимум плотности p x  увеличивается, при этом «хвосты» нормальной кривой «прижимаются» ближе к оси абсцисс. Выясним теоретико-вероятностный смысл параметров. Математическое ожидание случайной величины X: x -a 2 x-a -( )   a  σ 2t 2 t x σ 2 M X    e dx  e - t σ 2dt  σ 2   -  σ 2π dx  σ 2 dt -  σ 2π   σ 2   -t 2 a   -t 2 a te dt  π a   e dt  0  π - π - π (первый интеграл равен нулю как интеграл от нечетной функции по симметричному относительно начала координат промежутку, а второй интеграл – это интеграл Эйлера –Пуассона, он равен 115 π. Найдем теперь дисперсию нормальной случайной величины, снова применяя замену t  (x - a)/ σ и интегрируя по частям: 1 x -a 2  - ( ) 1 2 2 σ 2 D  X   M  X - M  X   dx   ( x - a) e σ 2π -   σ2  2π - 1 x -a 2 t2 2  ( ) x-a 2 2 σ x-a σ ( ) e d( ) t 2e 2 dt  σ σ 2π - t2 t2   σ  - e 2 t -    e 2 dt  σ 2 .  2π - 2 - Таким образом, σ 2 - это дисперсия, σ - стандартное отклонение. Случайная величина называется центрированной, если ее математическое ожидание равно нулю. Для того чтобы центрировать случайную величину, надо вычесть из нее математическое ожидание: M  X - M  X   M  X  - M  X   0 . Случайная величина называется нормированной, если ее дисперсия равна единице. Для того чтобы нормировать случайную величину, надо поделить ее на стандартное отклонение: 1 σ2 X   D   D X   1. 2 2 σ   σ σ Центрированная и нормированная случайная величина называется стандартной (или стандартизированной). Для того чтобы стандартизировать случайную величину, надо вычесть из нее математическое ожидание и поделить на среднее квадратическое отклонение. Стандартные случайные величины обозначаются большой латинской буквой Z: Z X -a . σ Так как для нормального распределения M  X   a и σ  X   σ , то 116 стандартная случайная величина Z  имеет вид: φ z   1 σ 2π X -a ~ N(0; 1), т.е. плотность σ z2 e 2 . Функция φ z  - четная, ее значения для положительных аргументов приведены в Приложении 1. Функция распределения стандартной случайной величины Фz  равна площади фигуры, ограниченной сверху графиком функции φ z  , снизу - осью абсцисс, а справа - прямой, проходящей через точку z: Ф z   z t2 e 2 dt 1  2π -  называется функцией Лапласа. φ z  0 Для вычисления формула: z Рис.15 z отрицательного аргумента используется Ф- z   1 - Фz  . Функцию распределения случайной величины X~N(a,σ) можно выразить через Фz  , значения которой можно найти в таблицах (в данном пособии они приводятся в Приложении 2): x - 1 ( t - a )2 1 F x    e 2 σ dt  σ 2π -  x -a y2 σ 1   e 2 σdy  σ 2π -  t-a  y  dy  dt / σ σ dt  σdy = x -a y2 σ 1 x-a  e 2 dy  Ф ( σ )  Ф z  . 2π -  Иногда табулируются значения функции: 117 z 1  2π 0 t2 e 2 dt  Ф0 z  , - у которой нижний предел интеграла равен нулю. Эта функция является нечетной: Ф0 - z   -Ф0 z  и связана с функцией Фz  соотношением: Ф z   1  Ф 0 z  . 2 В некоторых учебниках приводятся таблицы значений функции z 2 2π 0 t2 e 2 dt  2Ф0 z  . - В практических приложениях теории вероятностей часто требуется найти вероятность того, что случайная величина X~N(a,σ) примет значение из заданного интервала x1 ; x 2  : x -a x -a x -a 1 P  x1  X  x 2   F  x 2  - F  x1   Ф ( 2 ) - Ф( 1 )  Ф0 ( 2 ) σ σ σ 2 x -a x -a x -a 1 - ( Ф0 ( 1 )  ))  Ф0 ( 2 ) - Ф0 ( 1 ). σ 2 σ σ Правило «трѐх сигм»: Теоретически нормальная плотность вероятности отлична от нуля в любой, даже очень отдаленной от a точке x, однако практически почти вся вероятность сосредоточена на отрезке a  3σ (отсюда и название). Нормальное распределение является симметричным распределением. Однако на практике часто встречаются распределения несимметричные (например, биномиальное распределение при p=0,7). Коэффициентом асимметрии распределения называется отношение центрального момента третьего порядка к кубу стандартного отклонения: As  μ3 σ3 . Для симметричных распределений μ3  0 , поэтому As  0 . Если As  0 , то это говорит о большем влиянии на величину μ3 отрицательных отклонений. В этом случае кривая распределения более 118 полога слева от M  X  и более крутая справа. Если As  0 , то преобладает влияние положительных отклонений: кривая распределения более полога справа и круче слева. μ4 Для нормального распределения используют для характеристики σ 4  3 , поэтому эту величину меры сглаженности кривой распределения (вблизи центра распределения) по отношению к нормальной кривой. Коэффициентом эксцесса называется величина: E x  μ4 σ 4 - 3. Если для данного распределения E x  0 , то соответствующая кривая распределения нормальной кривой. более островершинна Распределения с по Ex  0 сравнению имеют с более плосковершинные кривые по сравнению с нормальным. Пример 4.1 Поезда метрополитена идут регулярно с интервалом 2 мин. Пассажир выходит на платформу в случайный момент времени. Какова вероятность того, что ждать пассажиру придется не больше полминуты. Найти среднее время ожидания и среднеквадратическое отклонение случайной величины X – времени ожидания поезда. Решение: Случайная величина X – время ожидания поезда на временном (в минутах) отрезке [0; 2] имеет равномерный закон распределения p x   c  1 1 1   . b-a 2-0 2 Поэтому вероятность того, что пассажиру придется ждать не более 0,5 1 1 0,5 1 dx  x 0   0,25 . 2 4 0 2 полминуты, равна: P  X  0,5    119 Среднее время ожидания: стандартное отклонение: σ  X   M X   ab 02  1 2 2 (мин.), b-a 2-0 1    0,58 (мин.). 2 3 2 3 3 ■ Пример 4.2 Среднее время безотказной работы прибора равно 80 часов. Полагая, что время безотказной работы прибора имеет показательный закон распределения, найдите: а) функцию плотности вероятности и функцию распределения; б) вероятность того, что в течение 100 часов прибор не выйдет из строя. Решение: а) Среднее время работы прибора – это математическое ожидание случайной величины X – времени работы прибора. По условию: M  X   80 . Для показательного распределения M  X   параметр показательного распределения равен λ  1 => λ 1 80 Тогда функция плотности имеет вид: 0 p x   при x 0 1 1 - 80 x λ e - λx  e 80 при x 0 Функция распределения для x  0 равна F  x   0 , а при x  0 имеет x вид: F  x   1 - e - λx  1 - e 80 . - б) Вероятность того, что в течение 100 часов прибор не выйдет из строя: P  X  100   1 - P 0  X  100   1 - F 100  - F 0   1 - ((1 - e -100/80 ) - (1 - e0 ))  e 5 / 4  0,286 . ■ Пример 4.3 В некоторой совокупности мужчин средний рост 175 см и стандартное отклонение 10 см. Какая доля мужчин носит одежду II роста (167-173), III роста (173-179) и IV роста (179-185)? 120 Решение: Обозначим через X – рост случайно выбранного мужчины. По условию случайная величина X~N(175;10). Доля мужчин II роста в данной совокупности равна вероятности: P 167  X  173   F 173  - F 167   Ф ( 173 - 175 167 - 175 ) - Ф( ) 10 10  Ф- 0,2  - Ф- 0,8   1 - Ф0,2  - 1 - Ф0,8   Ф0,8 - Ф0,2    0,7881 - 0,5793  0,2088 , т.е. составляет около 20,9%. Доля мужчин III роста равна: P 173 ≤ X ≤ 179   F 179  - F 173   Ф ( 179 - 175 173 - 175 ) - Ф( ) 10 10  Ф0,4 - 1 - Ф0,2   0,6554  0,5793 - 1  0,2347 , т.е. около 23,5%. Доля мужчин IV роста составляет: P 179 ≤ X ≤ 185   F 185  - F 179   Ф ( 185 - 175 179 - 175 ) - Ф( ) 10 10  Ф1 - Ф0,4   0,8413 - 0,6554  0,1859 , т.е. около 18,6%. Доля тех, кто ниже 167 см., в данном обществе примерно равна: P  X  167   F 167   Ф ( 167 - 175 )  Ф - 0,8   1 - Ф 0,8   0,2119 , 10 т.е. около 21,2%. Доля мужчин ростом выше 185 см. равна: P  X  185   1 - P  X  185   1 - F 185   1 - Ф ( 185 - 175 )  1 - Ф 1  10  1 - 0,8413  0,1587 , т.е. около 16%. ■ Пример 4.4 Пусть доход семьи X в некоторой совокупности имеет равномерное распределение на отрезке от 10 тыс. руб. до 30 тыс. руб. Определите: а) 20% семей с высокими доходами; б) 30% малообеспеченных семей; в) 80% типичных семей со средним уровнем дохода. Решение: Так как по условию распределение равномерное, то функция плотности распределения вероятностей имеет вид: 121 p(x)  0 при x  10, x  30 . 1 / 20 при 10  x  30 Функция распределения для 10  x  30 равна: F(x)  (x - 10)/20 . Задача сводится к отысканию квантиля заданного уровня: F(x p )  x p - 10 20  p. Для определения 20% семей с высокими доходами надо найти 80% семей с доходами невысокими: x0,8  10  20·0,8  10  16  26 (тыс. руб.), т.е. семьи с доходом выше 26 тыс. руб. относятся к 20% обеспеченных семей. 30% малообеспеченных семей – это семьи с доходом не выше x0,3  10  20·0,3  16 (тыс. руб.). Типичные 80% семей – это семьи с доходом от x0,1  10  20·0,1  12 (тыс. руб.) до x 0,9  10  20·0,9  28 (тыс. руб.) ■ Задачи для самостоятельного решения: 4.1 Цена деления шкалы измерительного прибора равна 0,2. Показания прибора округляют до ближайшего целого числа. Полагая, что ошибка округления распределена по равномерному закону, найдите: а) математическое ожидание и стандартное отклонение этой случайной величины; б) вероятность того, что ошибка округления меньше 0,4. 4.2 Манометр показывает давление в колонне. Давление колеблется от 10,0 до 10,2 атм., и в этих пределах любое давление равновозможно. Вследствие повреждения манометра его стрелка отклоняется не больше, чем на 10,16 атм. Какое давление в среднем показывает манометр? 4.3 Вероятность случайной величины X на отрезке [ 2; 6] распределена с постоянной плотностью p x   c для 2  x  6 и 122 p x   0 для остальных x. Найдите: а) постоянную c; б) матема- тическое ожидание и стандартное отклонение данной случайной величины; в) функцию распределения; г) вероятности событий P  X  1 , P 3  X  5  и P  X  5  . 4.4 Стержень ломают в случайной точке. Какова средняя длина наименьшего куска? 4.5 Случайная величина X задана функцией распределения: 0 при x 0 - 0,4x 1-e при x  0 F x   Найдите математическое ожидание и стандартное отклонение случайной величины, вероятность P 2  X  5  . 4.6 p x   4.7 Плотность вероятности случайной величины X имеет вид: при x  0 . Найдите параметр c. c·e - 0,1x при x  0 0 На предприятии утреннее совещание обычно продолжается около часа. Однако в этот раз часа не хватило. Какова вероятность, что совещание продлится еще не меньше 15 мин.? 4.8 Установлено, что время ремонта электроплит есть случайная величина X, распределенная по показательному закону. Определите вероятность того, что на ремонт электроплиты потребуется не менее 20 дней, если среднее время ремонта составляет 15 дней. Найдите функцию плотности, функцию распределения и стандартное отклонение величины X. 4.9 Для функции плотности распределения случайной величины, подчиняющейся нормальному закону с параметрами a и σ, найдите: асимптоты, промежутки возрастания и убывания, экстремум функции, промежутки выпуклости и точки перегиба. Нарисуйте эскиз графика – кривую Гаусса. 4.10 Средняя дневная выручка магазина равна 100 тыс. руб., стандартное отклонение 20 тыс. руб. Следует ли считать значение 123 дневной выручки x1  50 тыс. руб. подозрительно малым, а значение x 2  170 тыс. руб. подозрительно большим? 4.11 Среднее суточное потребление хлеба в некоторой совокупности, объем которой 100 тыс. человек, составляет 300 гр., стандартное отклонение 50 гр. Определите запас хлеба, который покрывает суточную потребность с вероятностью 0,95. 4.12 Предположим, что средний суточный спрос на мясо в городе составляет 20 т., стандартное отклонение – 3 т. Среднее предложение равно 22 т., стандартное отклонение предложения равно 4 т. Какова вероятность того, что спрос превысит предложение? Как следует изменить среднее предложение, чтобы спрос удовлетворялся с вероятностью 0,99? 4.13 Средний срок службы прибора равен 100 часов, стандартное отклонение 20 часов. Фирма платит штраф 300 тыс. руб., если прибор проработает менее 50 часов. Найдите ожидаемый размер штрафа для партии 200 приборов. Ответы: 4.1 M(X)=0,5; σ  2/ 3; σ  0,295 ; P(X≤1)=0; P  0,4 . P(X>5)=1/4; 4.2 10,8. 4.3 P(3<X≤5)=1/2. c=1/4; M(X)=4; 4.4 M(X)=2,5; σ  2,5 ; P(2<X<5)≈0,314. 4.6 c=-0,1. 4.7 λ  L . 4 1 1 . 4.8 λ  ; 60 15 σ  15 ; P  X  20   0,28 . 4.12 P  0,3446 ; a  31,65 . 4.13 372000. 124 4.5 2.5. Многомерные случайные величины На одном и том же пространстве элементарных событий может быть определена не одна, а несколько случайных величин. Необходимость в этом возникает, например, при моделировании ситуации, когда объект характеризуется несколькими случайными параметрами. Например, предприятие можно описать с помощью нескольких случайных величин: X 1 - объѐм продукции, выпускаемой за день; X 2 - количество работающих на предприятии; X 3 - ассортимент продукции; X 4 - рентабельность производства и т.д. Пусть X 1, X 2 , ... , X n - случайные величины, определенные на множестве элементарных событий Ω . Удобно рассматривать их как координаты n-мерного случайного вектора X  X 1, X 2 , ... , X n  . Под n-мерной случайной величиной, или случайным вектором, понимается упорядоченный набор n случайных величин X  X 1, X 2 , ... , X n  . Случайные величины X 1, X 2 , ... , X n могут быть как дискретными, так и непрерывными. На многомерные случайные величины распространяются почти без изменений основные определения, относящиеся к одномерным случайным величинам. Функция распределения F X  n-мерной случайной величины X  X 1, X 2 , ... , X n  определяется формулой: F  X 1, X 2 , ... , X n   P  ω : Функция X 1ω  x1, X 2 ω  x 2 , ... , X n ω  x n  F X  - неубывающая функция каждого аргумента и определяет закон распределения случайной величины X . Рассмотрим двумерные случайные величины. Для случайной величины X , Y  функция распределения следующим образом: F  x , y   P  X  x , Y  y  . 125 F  x , y  определяется Свойства функции распределения двумерной случайной величины: 1. Функция распределения FXY  x , y  есть неотрицательная функция, заключѐнная между нулѐм и единицей: 0  FXY  x , y   1 . 2. Функция распределения FXY  x , y  есть неубывающая функция по каждому из аргументов: при x 2  x1 FXY  x 2 , y   FXY  x1, y  , при y 2  y 1 FXY  x , y 2   FXY  x , y 1 . 3. FXY  x ,  FXY  , y   FXY  ,  0 , где, например, FXY  x ,  lim FXY  x , y  . y   4.   , то функция Если один из аргументов стремится к распределения FXY  x , y  становится равной функции распределения случайной величины, соответствующей другому аргументу: FXY  x ,     FX  x   P  X  x  , FXY  , y   FY y   P Y  y  . 5. Если оба аргумента стремятся  , к то функция распределения FXY  x , y  равна единице: F  ,     1 . Геометрически функция распределения есть некоторая поверхность, обладающая указанными свойствами. Для дискретной случайной двумерной величины X , Y  еѐ функция распределения представляет собой некоторую ступенчатую поверхность, ступени которой соответствуют скачкам функции FXY  x , y . Зная функцию распределения, можно найти вероятность попадания случайной точки  X , Y  в пределы прямоугольника: P x1  X  x 2 , y 1  Y  y 2   F  x 2 ,y 2   F x1 ,y 2   F  x 2 ,y 1   F x1 ,y 1  Условным законом распределения одной из одномерных составляющих двумерной случайной величины 126 X , Y  называется еѐ закон распределения, вычисленный при условии, что другая составляющая приняла определѐнное значение (или попала в какой-то интервал). Рассмотрим дискретную случайную величину X , Y , закон распределения которой задан таблицей: x1 x2 … xn y1 p11 p12 … p1n y2 p21 p22 … p2n : : : : : ym pm 1 pm2 … pmn X Y Условные распределения определяются следующим образом:   P X  xi / Y  y j    P Y  y j / X  xi    P X  xi , Y  y j pij ,  n PY yj  pij     i 1 P X  xi , Y  y j pij ,  m P X  x i   pij j 1 при этом:  P X  x i / Y  y j   1 n  P Y  y j / X  x i   1. m и i 1 j 1 Важной характеристикой условного распределения вероятностей является условное математическое ожидание. Условным математическим ожиданием дискретной случайной величины X при Y  y j называют произведение возможных значений X на их условные вероятности:   n   M X / Y  y j   xi  P X  xi / Y  y j . i 1 127 Аналогично определяется условное математическое ожидание Y при  m  M Y / X  x i    y j  P Y  y j / X  x i . X  xi : j 1  функцией регрессии X  на Y,   M X /Y  y j Условное математическое ожидание соответственно называют условное математическое ожидание M X / Y  y j - функцией регрессии Y на X. Теорема. Для того чтобы случайные величины независимыми, необходимо и достаточно, распределения двумерной случайной величины X и Y чтобы X , Y  были функция была равна произведению функций распределения составляющих: FXY  x , y   FX  x   FY y  . Это значит, что P  X  x , Y  y   P  X  x   P Y  y  . Если же случайные величины X и Y зависимы, то для оценки тесноты взаимосвязи используют коэффициент корреляции, который вычисляют по формуле: r XY  cov  X , Y  M  X  Y   M  X   M Y   , σ  X   σ Y  σ  X   σ Y  где математическое ожидание произведения вычисляется по формуле: n m M  X  Y     x i  y j  pij . i 1j 1 Свойства коэффициента аналогичны свойствам корреляции случайных величин коэффициента корреляции для случайных событий (см. стр. 60). Чем ближе значение rXY к 1, тем сильнее взаимосвязь между случайными величинами X и Y ; чем ближе rXY к 0, тем слабее взаимосвязь. Для независимых случайных величин X и Y : rXY  0 и такие случайные величины называются некоррелированными. X называют коррелированными, если rXY  0 . 128 и Y Коэффициент корреляции характеризует тесноту линейной зависимости. Следовательно, для зависимых случайных величин X и Y может быть rXY  0 , но может и равняться нулю: rXY  0 . Итак, из коррелированности двух случайных величин следует их зависимость, но из зависимости ещѐ не вытекает коррелированность. Из независимости двух величин следует их некоррелированность, но из некоррелированности ещѐ нельзя заключить независимость этих величин. Однако для нормально распределѐнных случайных величин из некоррелированности вытекает их независимость. Пример 5.1 Задана таблица распределения дискретной двумерной случайной величины: 1 2 3 -1 0,12 0,12 0,08 1 0,28 0,13 0,27 X Y а) найти законы распределения случайных величин X и Y ; б) найти условный закон распределения Y при условии, что X  2 ; в) найти условный закон распределения X при условии, что Y  1; г) вычислить числовые характеристики для X и Y (математические ожидания и стандартные отклонения); д) установить, зависимы или нет X и Y . Решение: а) случайная величина Y принимает два значения: y 1  1 и y 2  1. Вероятности этих значений соответственно равны: p1  p11  p12  p13  0,12  0,12  0,08  0,32 , p2  p21  p22  p23  0,28  0,13  0,27  0,68 . Аналогично получаем вероятности значений для случайной величины X : p1  0,4 , p2  0,25 и p3  0,35 . Следовательно, законы распределения случайных величин 129 (т.е. безусловные законы распределения X и Y ) можно представить в виде: xi 1 2 3 yi -1 1 pi 0,4 0,25 0,35 pi 0,32 0,68 б) Найдѐм условные вероятности Y при условии, что X  2 : P Y  1 / X  2  0,12 12 0,13 13   0,48 ; P Y  1 / X  2    0,52 . 0,25 25 0,25 25 Проверка: 0,48  0,52  1 . в) Условные вероятности X при условии, что Y  1: P  X  1 / Y  1  0,28 28  ; 0,68 68 P  X  3 / Y  1  0,27 27 28 13 27    1.  . Проверка: 68 68 68 0,68 68 P  X  2 / Y  1  0,13 13  ; 0,68 68 г) M  X   1 0,4  2  0,25  3  0,35  1,95 ;   M X 2  0,4  1  3,15  4,55 ; D X   4,55  3,8025  0,7475 ; σ  X   0,865 .   M Y   1 0,32  1 0,68  0,36 ; M Y 2  0,32  0,68  1; DY   1  0,1296  0,8704 ; σ Y   0,933 . д) Выясним, зависимы или нет рассматриваемые случайные величины (см. теорему о независимости). Проверим, например, будет ли выполняться равенство: FXY 2,5; 0  FX 2,5  FY 0 , т.е. будет ли верно следующее равенство P  X  2,5; Y  0  P  X  2,5   P Y  0 ? FXY 2,5; 0  P  X  2,5; Y  0  0,12  0,12  0,24 . FX 2,5   P  X  2,5   0,4  0,25  0,65 ; FY 0  P Y  0  0,32 . FX 2,5   FY 0  0,208 . Получили: 0,24  0,208 => случайные величины X и Y - зависимы. *Замечание. Можно было проверить выполняется ли равенство:   pij  P  X  x i   P Y  y j ? 130 => Например, p22  P  X  2  P Y  1 ? p22  0,13 ; P  X  2  0,25 ; P Y  1  0,68 ; => P  X  2  P Y  1  0,17 . => 0,13  0,17 => зависимы X и Y . ■ Пример 5.2 Для случайных величин из примера 12.1: а) найти условное математическое ожидание M  X / Y  1 ; б) определить тесноту связи между случайными величинами X и Y . Решение: а) Найдѐм условное математическое ожидание: M  X / Y  1  1  P  X  1 / Y  1  2  P  X  2 / Y  1  3  P  X  3 / Y  1   1 б) 0,28 0,23 0,27 1,35  2  3   1,96 . 0,68 0,68 0,68 0,68 Для определения тесноты связи между случайными величинами X и Y вычислим коэффициент корреляции. По исходной таблице найдѐм cov  X , Y   M  X  Y   M  X   M Y  . M  X  Y   1  1  0,12  2   1  0,12  3   1  0,08  1 1 0,28  2  1 0.13   3  1 0,27  0,12  0,24  0,24  0,28  0,26  0,81  0,75 . M  X   M Y   0,702 . Тогда cov  X , Y   0,75  0,702  0,048 , следовательно, корреляции равен: r XY  коэффициент 0,048  0,059 . 0,865  0,933 Так как коэффициент взаимосвязи близок к нулю, то зависимость между рассматриваемыми случайными величинами слабая. ■ Задачи для самостоятельного решения: 5.1 Распределение вероятностей дискретной случайной двумерной величины  X , Y  задано таблицей: 131 X -1 0 1 1 0,15 0,30 0,35 2 0,05 0,05 b Y а) найти неизвестный параметр b из таблицы распределения; б) найти законы распределения случайных величин X и Y ; в) найти условный закон распределения Y при условии, что X  0 ; г) найти условный закон распределения X при условии, что Y  1 ; д) вычислить числовые характеристики для X и Y ; е) найти условное математическое ожидание M  X / Y  1 ; ж) установить, зависимы или нет X и Y ; з) если случайные величины X и Y - зависимы, то определить тесноту связи между ними. 5.2 Доказать, что если X и Y связаны линейной зависимостью Y  a  X  b , то абсолютная величина коэффициента корреляции равна единице. Ответы: 5.1 а) b =0,1; б) P(X=-1)=0,2; P(X=0)=0,35; P(X=1)=0,45; P(Y=1)=0,8; P(Y=2)=0,2; в) P(Y=1/X=0)=6/ 7; P(Y=2/X=0)=1/ 7; г) P(X= -1/Y=1)=3/16; P(X=0/Y=1)=6/16; P(X=1/Y=1)=7/16; д) M(X)=0,25; σ(X)≈0,766; M(Y)=1,2; σ(Y)=0,4; е) M(X/Y=1)=1/ 4. 132 2.6. Закон больших чисел и предельные теоремы Под законом больших чисел в широком смысле понимается общий принцип, согласно которому при большом числе случайных величин их средний результат перестает быть случайным и может быть предсказан с большой степенью определенности, т.е. совокупное действие большого числа случайных факторов почти не зависит от случая. В узком смысле под законом больших чисел понимается ряд математических теорем, из которых следует, что при неограниченном увеличении числа испытаний средние величины стремятся к некоторым постоянным. Неравенство Маркова. Если случайная величина X принимает только положительные значения и имеет математическое ожидание, то для любого положительного числа ε верно неравенство: P X  ε   Неравенство Чебышева. Если M X  . ε случайная величина X имеет математическое ожидание и дисперсию, то для любого ε >0 верно: P  X - M X   ε   Учитывая, что события D X  ε2 . X - M X   ε и X - M X   ε - противоположны, неравенство Чебышева можно записать и в другой форме: P  X - M X   ε   1 - D X  ε 2 . Для случайной величины X=m, подчиненной биномиальному закону распределения с математическим ожиданием M  X   np и дисперсией D X   npq неравенство Чебышева имеет вид: P  m - np  ε   1 - 133 npq ε2 . Относительная частота события m/n в n независимых испытаниях, в каждом из которых оно может произойти с одной и той же вероятностью p, и имеющей дисперсию pq/n , удовлетворяет pq m  P  p  ε   1.  n  nε 2 неравенству: Теоретическую основу законов больших чисел составляет понятие сходимости случайных величин по вероятности. Последовательность случайных величин X 1 , X 2 , …, Xn, … сходится по вероятности к случайной величине X , если для любого ε  0 : lim P  X n - X  ε   1 или lim P  X n - X  ε   0 . n  n  P Коротко это записывается так: X n  X . n Теорема Чебышева. Если дисперсии n независимых случайных величин X 1 , X 2 , …, X n ограничены одной и той же постоянной, то при неограниченном увеличении случайных величин X  средней M X   числа n средняя арифметическая X 1  X 2  ...  X n сходится по вероятности к n арифметической их математических ожиданий M  X 1   M  X 2   ...  M  X n  , т.е. n   P lim P X - M  X   ε  1 или X  M  X  . n n Это означает, что при большом числе n случайных величин X 1 , X 2 , …, X n практически достоверно, что их средняя X - величина случайная, как угодно мало отличается от неслучайной величины M  X  , т.е. практически перестает быть случайной. Интуитивно мы отождествляем вероятность появления случайного события с относительной частотой этого события (статистической вероятностью),полученной в n повторных независимых испытаниях, 134 проводимых при одном и том же комплексе условий. Теоретическим обоснованием этого является следующая теорема. Теорема Бернулли. Относительная частота события в n повторных независимых испытаниях, в каждом из которых оно может произойти с одной и той же вероятностью p, при неограниченном увеличении числа n сходится по вероятности к вероятности p этого события в отдельном испытании: lim P ( n m m P - p  ε )  1 или  p. n n n Теорема Бернулли может рассматриваться как следствие теоремы Чебышева (относительная частота – это средняя арифметическая n независимых альтернативных случайных величин, имеющих один и тот же закон распределения), но исторически эта теорема была доказана намного раньше теоремы Чебышева. Если вероятности события в каждом испытании различны, то применяют следующую теорему: Теорема Пуассона. Относительная частота события в n повторных испытаниях, в каждом из которых оно может произойти соответственно с вероятностями p1 , p2 , …, pn , при неограниченном увеличении числа n сходится по вероятности к средней арифметической вероятностей события в отдельных испытаниях p  p2  ...  pn p 1 , n т.е. m m P lim P ( - p  ε )  1 или  p. n n n n Перечисленные теоремы (закон больших чисел) устанавливают факт приближения средней большого числа случайных величин к определенным постоянным. Однако, закономерности, возникающие в результате суммарного действия случайных величин, этим не ограничиваются. Оказывается, что при некоторых условиях совокупное действие случайных величин приводит к определенному закону распределения – к нормальному закону. 135 Теорема Ляпунова. Если X 1 , X 2 , …, X n - независимые случайные величины, у каждой из которых существует математическое ожидание M X i , дисперсия DX i   σ i2 , абсолютный центральный момент n третьего порядка M( X i - M X i  )  mi и lim 3 n  mi i 1 n  0 , то закон (  σ i2 )3 / 2 i 1 распределения суммы Yn  X 1  X 2  ...  X n при n   неограниченно n приближается к нормальному с математическим ожиданием  M  X i  и i 1 n n n дисперсией  σ i2 , т.е. Yn ~ N (  M  X i ;  σ i2 ) . n   i 1 i 1 i 1 Теорема Ляпунова имеет большое практическое применение. Опытным путем было установлено, что распределение суммы независимых случайных величин, у которых дисперсии не отличаются резко друг от друга, довольно быстро приближаются к нормальному. Уже при числе слагаемых, большем 10, распределение суммы можно заменить нормальным. Отметим, что теорема Ляпунова справедлива не только для непрерывных, но и для дискретных случайных величин. Интегральная теорема Муавра-Лапласа. Функция распределения центрированной и нормированной биномиальной случайной величины при n стремится к функции распределения стандартной нормальной случайной величины: m - np 1 z -t 2 / 2 P(  z)  dt .  e npq n   2π -  Это означает, что если вероятность наступления события в каждом испытании постоянна и отлична от 0 и 1, то вероятность того, что число k наступления события в n независимых испытаниях 136 заключено в пределах от k1 до k 2 при достаточно большом числе n приближенно равна: P k1  k  k2   Фz2  - Фz1 , где Ф z   1 z -t 2 / 2 dt - функция Лапласа,  e 2π -  k - np z1  1 npq и k - np . z2  2 npq Пример 6.1 Сумма всех вкладов в отделение банка составляет 5 млн. руб., а вероятность того, что случайно взятый вклад менее 10 тыс. руб., равна 0,6. Оцените количество вкладчиков. Решение: Обозначим через X – размер случайно взятого вклада, а через n – число всех вкладов. Тогда средний размер вклада равен: M X   5000 n руб. Неравенство данного будет выглядеть так: Маркова P X  ε  ≥ 1 - P  X  10  ≥ 1 - 5000 . 10·n M X  ε для Учитывая, что вероятность того, что случайно взятый вклад менее указанной суммы, задана P  X  10   0,6 , получим: 0,6 ≥ 1 - 500 . Отсюда n  1250 , т.е. n число вкладчиков не более 1250. ■ Пример 6.2 Средний расход воды на животноводческой ферме составляет 1000 л в день, а стандартное отклонение этой случайной величины не превышает 200 л. Оцените вероятность того, что расход воды на ферме в любой выбранный день будет менее 2000 л, используя: а) неравенство Маркова; б) неравенство Чебышева. Решение: а) Обозначим через X – расход воды на животноводческой ферме (л). Тогда средний расход воды – это M  X   1000 . Используя неравенство Маркова, получим: P  X  2000   1 - 1000  0,5 . 2000 б) Теперь найдем оценку этой вероятности, используя неравенство 137 Чебышева: P  X - M  X   ε   1 - D X  ε2 . В данном случае дисперсия, по условию, ограничена D X   σ 2  200 2 . Так как границы интервала 0  X  2000 симметричны относительно математического ожидания, то вероятность: P  X  2000   P 0  X  2000   P  X - 1000  1000   1 - 200 2 1000 2  0,96 . Более точной является оценка вероятности, полученная с помощью неравенства Чебышева. ■ Пример 6.3 Станок-автомат изготавливает детали. Вероятность изготовления стандартной детали равна 0,96. Оцените вероятность того, что из 2000 деталей число бракованных будет находиться в пределах от 60 до 100: а) с помощью неравенства Чебышева; б) с помощью интегральной теоремы Муавра-Лапласа. Решение: а) Вероятность изготовления бракованной детали равна p  1 - 0,96  0,04 . Случайная величина X – число бракованных деталей имеет биномиальный закон распределения, а ее границы 60 и 100 симметричны относительно математического ожидания M  X   np  80 . Следовательно, для оценки вероятности можно воспользоваться формулой: P  m - np  ε   1 - npq ε2 . Таким образом, оценка вероятности искомого события: P(60  m  100)  P(-20  m  20)  P( m - 80  20)   1 2000  0,04  0,96 20 2  1- 76,8  0,808 . 400 Оценка вероятности этого же события по интегральной теореме Муавра-Лапласа: P(60  m  100)  Ф0 ( 100 - 80 60 - 80 ) - Ф0 ( )  0,978 . 76,8 76,8 138 Полученный результат P  0,978 не противоречит оценке, найденной с помощью неравенства Чебышева P  0,808 . Различие результатов объясняется тем, что неравенство Чебышева дает лишь нижнюю границу оценки вероятности искомого события для любой случайной величины, а интегральная теорема Муавра-Лапласа дает достаточно точное значение самой вероятности случайной величины, распределенной по биномиальному закону распределения. ■ Пример 6.4 Для определения среднего времени горения электроламп в партии из 200 одинаковых ящиков было отобрано случайным образом по одной лампе из каждого ящика. Оцените вероятность того, что средняя продолжительность горения отобранных 200 электроламп отличается от средней продолжительности горения ламп во всей партии менее чем на 5 часов (по абсолютной величине), если известно, что стандартное отклонение продолжительности горения ламп в каждом ящике менее 7 часов. Решение: Пусть X i - продолжительность горения электролампы, взятой из i -го ящика. По условию дисперсия DX i   72  49 . Очевидно, что средняя продолжительность горения отобранных ламп равна X 1  X 2  ...  X 200 , а средняя продолжительность горения ламп во 200 всей партии (M ( X 1)  M ( X 2 )  ...  M ( X 200 )) / 200 . Тогда вероятность искомого события можно оценить по формуле: X 1  X 2  ...  X 200 M(X1 )  M ( X 2 )  ...  M ( X 200 ) D(X)  5) ≥ 1 200 200 200·5 2 X  X 2  ...  X 200 49  0,9902 . где X  1 . Получим: P  1 200 200·5 2 P( ■ 139 Пример 6.5 Сколько надо произвести измерений данной величины, чтобы с вероятностью не менее 0,95 гарантировать отклонение средней арифметической этих измерений от истинного значения величины не более, чем на 1 (по абсолютной величине), если стандартное отклонение каждого из измерений не превосходит 5? Решение: Пусть результат i -го измерения, Xi - X - их среднее арифметическое, M (X) - истинное значение величины. Необходимо найти n, при котором P( X - M (X)  1)  0,95 . Данное неравенство будет выполняться, если 1 откуда C n·ε 2  1- 52 2 n·1  0,95 , 25 25  0,05 . => n   500 , т.е. потребуется не менее 500 n 0,05 измерений. ■ Пример 6.6 В страховой компании 10000 клиентов. Страховой взнос каждого клиента составляет 500 руб. При наступлении страхового случая, вероятность которого по имеющимся данным и оценкам экспертов можно считать равной 0,005, страховая компания обязана выплатить клиенту страховую сумму размером 50000 руб. На какую прибыль может рассчитывать страховая компания с надежностью 0,95? Решение: Прибыль страховой компании (доход минус затраты) составит: π  500·10000 - 50000 ·n0  50000 ·100 - n0  , где n0 - число страховых случаев. Переформулируем условие задачи: производится n=10000 независимых испытаний, вероятность появления интересующего нас события в каждом испытании одинакова и равна p=0,005, q=0,995. Следовательно, мы находимся в рамках модели повторных независимых испытаний. Так как n – достаточно велико, а 140 p – достаточно мало и при этом n∙p=50>10, то для оценки вероятности можно использовать интегральную теорему Муавра – Лапласа: 1 k - np k - np Pn k1 ≤ m ≤ k 2   ·Ф  x 2  - Ф  x 1  , где x 1  1 , x2  2 2 npq npq Учитывая заданную надежность имеем: P10000 0 ≤ m ≤ n0   Ф x 2  - Ф x1  0,95 Здесь m – число клиентов, которым будет выплачена страховая сумма; x1  0 - np  npq n - np 50 .  -7,09 ; x 2  0 npq 10000 ·0,005 ·0,995 Отсюда: n0  np  x 2 · npq  50  x 2 ·7,053 , x 2 определим из соот- ношения: Ф x 2   0,95  Фx1  0,95  Ф- 7,09  ≈ 0,95 По таблице значений функции Лапласа определяем аргумент: x 2  1,645 . Следовательно, n0  50  1,645·7,053  61,6 , тогда компания может рассчитывать с надежностью 0,95 на прибыль в размере: π=50000·(100-61,6)=1920000 руб. ■ Задачи для самостоятельного решения: 6.1 Среднее количество вызовов, поступающих в отделения милиции города в течение суток, равно 300. Оцените вероятность того, что в течение следующих суток число вызовов: а) превысит 400; б) будет не более 500. 6.2 Среднее изменение курса акции компании в течение одних биржевых торгов составляет 0,3%. Оцените вероятность того, что на ближайших торгах курс изменится более, чем на 3%. 6.3 При изготовлении отливок получается 20% дефектных. Сколько необходимо запланировать отливок к изготовлению, вероятностью 0,95 получилось не менее 50 качественных? 141 чтобы с 6.4 В течение времени t эксплуатируются 500 приборов. Каждый прибор имеет надежность 0,98 и выходит из строя независимо от других. Оцените с помощью неравенства Чебышева вероятность того, что доля надежных приборов отличается от 0,98 менее чем на 0,1 (по абсолютной величине). 6.5 Банкомат выдает стандартные суммы в 100 руб., 500 руб. и 1000 руб., причем, первые составляют 50%, последние 10% всех выдач. В сутки банкомат осуществляет примерно 100 выдач. Сколько рублей надо заложить в банкомат утром, чтобы до следующего утра их хватило с вероятностью, не меньшей 0,9? 6.6 Бензоколонка заправляет легковые и грузовые автомобили. Вероятность того, что проезжающий легковой автомобиль подъедет на заправку, равна 0,3. С помощью неравенства Чебышева найдите границы, в которых с вероятностью, не меньшей 0,79, находится доля заправившихся в течение 2 часов легковых автомобилей, если за это время всего заправилось 100 автомобилей. 6.7 В районе 10 магазинов, примерно одинаковых. Суммарная суточная выручка в них равна в среднем 10 млн. руб. и в 90% всех случаев отличается от 10 млн. руб. не более чем на 1 млн. руб. Найдите вероятности того, что очередная суточная суммарная выручка: а) превысит 12 млн. руб.; б) окажется меньше 9 млн. руб.; в) окажется в пределах от 8 до 12 млн. руб. 6.8 Станок для изготовления ДСП разрегулирован и выпускает плиты, толщина которых нормально распределена N(22; 1) вместо N(20; 1). Каков процент перерасхода сырья? 6.9 Инвестор покупает ценные бумаги за счѐт займа, взятого с процентной ставкой r под залог недвижимости. Процентная ставка на ценные бумаги X - случайная величина с математическим ожиданием a>0 и дисперсией σ 2 . Какова вероятность того, что инвестор не сможет вернуть долг и лишится своей недвижимости? 142 (*Оцените с помощью неравенства Чебышева вероятность события X  r ). Ответы: 6.1 а)  0,75 ; б)  0,4 . 6.2  0,1. 6.3  70 . 6.4  0,996 . 6.5 55 шт. по 100 руб., 44 шт. по 500 руб. и 11 шт. по 1000 руб. 6.6 0,2  p  0,4 . Лабораторный практикум по теме: «Нормальное распределение» Ниже X ~ N a, σ  означает, что случайная величина X имеет нормальное распределение с математическим ожиданием a и стандартным отклонением σ. Будем рассматривать продукцию двух предприятий – цыплят, выращенных на птицефабриках Каскаринской и Боровской. Обозначим через X - вес цыпленка, «изготовленного» на Каскаринской птицефабрике, через Y - вес цыпленка с Боровской птицефабрики. Предположим, что X ~ N 1,8;0,5  , Y ~ N 1,5;0,3 . 1. Для каждой птицефабрики найдите вероятности событий: А – «вес цыпленка равен 1,7 кг.»; В – «вес цыпленка менее 1,7 кг.»; С – «вес цыпленка более 2 кг.»; D – «вес цыпленка от 1 кг до 2 кг». 2. Считается, что идеальный вес цыпленка совпадает с ожидаемым средним a. Для каждой птицефабрики найдите вероятности того, что фактический вес отклонится по абсолютной величине от a: А – «более чем на 0,3 кг.»; В – «более чем на 0,7 кг.»; С – «менее, чем на 0,2 кг.»; D – «менее, чем на 1 кг.». 3. Будем считать дефектными цыплят, вес которых менее 0,5 кг. Какова доля брака на каждой птицефабрике? Как, не вычисляя долю брака, сравнить какое из двух распределений N a1,σ1 или N a2 ,σ 2  «лучше» в указанном смысле? 143 4. Каждая птицефабрика приняла решение снизить долю брака до 1%. Как это сделать: а) за счет математического ожидания a, сохраняя стандарт σ; б) за счет стандартного отклонения σ, сохраняя a? 5. Для повышения однородности продукции каждая птицефабрика приняла решение сортировать цыплят на три равные в среднем по численности группы: «маленькие» цыплята, «средние», «большие». Определите правило сортировки для каждой птицефабрики. 6. Рассмотрим цыпленка №1 весом 0,5 кг и цыпленка №2 весом 3 кг. Определите для каждой птицефабрики: а) является ли цыпленок №1 «недоростком»? б) является ли цыпленок №2 «переростком»? в) какой из двух цыплят более аномален для каждой птицефабрики и во сколько раз? г) какая из птицефабрик более аномальна для цыпленка №1 и цыпленка №2 и во сколько раз? 7. с Говорят, что цыплята Каскаринской птицефабрики крупнее цыплят Боровской птицефабрики. На сколько процентов верно это утверждение? 8. Цыплят отгружают большими партиями. Дефектной считают продукцию весом менее 0,5 кг. От партии проверяют 5 цыплят и партию принимают, если среди них не более одного дефектного. Будем считать хорошей обычную продукцию, т. е. X ~ N 1,8; 0,5  , Y ~ N 1,5; 0,3 . Для плохой продукции математическое ожидание a уменьшено на 0,4 кг. Для каждой птицефабрики определите вероятность α забраковать хорошую продукцию (риск изготовителя) и вероятность β приемки плохой продукции (риск потребителя). 9. Выход цыплят в инкубаторе составляет в среднем 70% числа заложенных яиц. Сколько нужно заложить яиц, чтобы с вероятностью, не меньшей 0,95, ожидать, что отклонение числа вылупившихся цыплят 144 от среднего ожидаемого их числа не превысит 50 (по абсолютной величине)? Решите задачу с помощью неравенства Чебышева и с помощью интегральной теоремы Муавра-Лапласа. 10. Случайная величина X имеет нормальное распределение со средним 25. Вероятность попадания X в интервал 10; 15  равна 0,09. Чему равна вероятность попадания X в интервал 35; 40  ? 11. Случайная величина вероятностей p x   A  e  задана плотностью распределения  x  2 2 8 . Требуется: 1) найти параметр A ; 2) построить кривую распределения; 3) найти математическое ожидание и дисперсию; 4) вычислить вероятность попадания в интервал  2; 4  . 12. Две независимые случайные величины распределены нормально: X ~ N 4; 1 и Y ~ N 5; 2 . Найти вероятность того, что обе случайные величины попадут в интервал 3; 6 . 145 ЧАСТЬ 2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Глава 1. Выборочные исследования 1.1. Основные понятия теории выборок Термин «выборочные исследования» применяют, когда невозможно или экономически нецелесообразно изучить все единицы представляющей интерес совокупности. Приходится знакомиться с частью совокупности – с выборкой, а затем с помощью статистических методов и моделей переносить выводы с выборки на всю совокупность. В учебных курсах по теории вероятностей и математической статистике рассматривают различные параметрические семейства распределений числовых случайных величин. А именно, изучают семейства нормальных распределений, логарифмически нормальных, экспоненциальных, гамма-распределений, распределений ВейбуллаГнеденко и др. Все они зависят от одного, двух или трех параметров. Поэтому для полного описания распределения достаточно знать или оценить одно, два или три числа, что очень удобно. Поэтому широко развита параметрическая теория математической статистики, в которой предполагается, что распределения результатов наблюдений принадлежат тем или иным параметрическим семействам. Если же распределение результатов наблюдений неизвестно, то использует непараметрические методы. Формулы для получения доверительных интервалов аналогичны тем, что используются при параметрическом подходе, но вместо квантилей распределения Стьюдента стоят квантили нормального распределения. Как известно, при росте объема выборки квантили распределения Стьюдента сходятся к соответствующим квантилям стандартного нормального распределения, так что при больших объемах выборок оба подхода дают близкие результаты. 146 Пусть требуется изучить совокупность однородных объектов относительно некоторого количественного или качественного признака, характеризующего эти объекты. Обозначим для изучаемого признака i всех ( i  1, N ). Допустим, что подлежащих обследованию объектов N каждому объекту количество X соответствует наблюдаемое значение xi . Совокупность всех возможных значений подлежащих обследованию совокупностью, а N объектов называется генеральной – объѐмом генеральной совокупности. Генеральная совокупность может быть конечной или бесконечной. Совокупность случайно отобранных (реально наблюдаемых) объектов называется выборочной совокупностью или просто выборкой, а еѐ объѐм обозначается n . Выборка должна обладать следующими свойствами:  каждый элемент xi выбран случайно;  все xi имеют одинаковую вероятность попасть в выборку;  n должно быть настолько велико, насколько это позволяет решать задачу с требуемым качеством (выборка должна быть репрезентативной, представительной). В зависимости от способа отбора объектов выборки подразделяют на повторные и бесповторные. Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность. Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается. На практике применяются различные способы отбора, которые принципиально можно подразделить на два вида: 147 1) отбор, не требующий разделения генеральной совокупности на части: а) простой случайный бесповторный отбор; б) простой случайный повторный отбор; 2) отбор, при котором генеральная совокупность разбивается на части: а) типический отбор; б) механический отбор; в) серийный. Простым случайным называют такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности (лотерея, с помощью таблицы случайных чисел). Типическим называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой еѐ «типической» части. Механическим называют отбор, при котором генеральную совокупность «механически» делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект. Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию. Часто применяется комбинированный отбор, при котором сочетаются указанные способы. Расположение выборочных наблюдѐнных значений изучаемого признака X в порядке неубывания называется ранжированием. Значение X , соответствующее отдельной группе сгруппированного ряда наблюдаемых данных, называется вариантой, а изменение этого значения – варьированием. Численность отдельной группы сгруппированного ряда наблюдаемых данных называется частотой и обозначается mi , отношение mi / n называется относительной частотой и обозначается ωi . Дискретным вариационным рядом распределения называется ранжированная совокупность вариант xi с соответствующими им частотами или относительными частотами. Если наблюдаемый случайный признак представляет собой реализацию непрерывной случайной 148 величины или дискретной случайной величины с большим количеством возможных значений, то для построения вариационного ряда используют интервальный ряд распределения. В этом случае весь возможный интервал варьирования разбивают на конечное число частичных интервалов и подсчитывают частоту попадания значений величины в каждый частичный интервал. Интервальным упорядоченная случайного вариационным последовательность признака с рядом интервалов соответствующими называется варьирования частотами или относительными частотами попаданий в каждый из них. Пример 1.1. В супермаркете фиксировали, сколько покупателей обслуживали в кассе за один час (с 10 часов до 11 в рабочие дни). Наблюдения в течение 30 часов дали следующие результаты: 70, 75, 100, 120, 75, 60, 100, 120, 70, 60, 65, 100, 65, 100, 70, 75, 60, 100, 100, 120, 70, 75, 70, 120, 65, 70, 75, 70, 100, 100. Обработайте результаты наблюдений и постройте вариационный ряд. Решение: Число покупателей, обслуживаемых в кассе за час, представляет собой реализацию дискретной случайной величины, обозначим еѐ X. Полученные данные являются выборкой из 30 наблюдений. Составим ранжированный ряд распределения: 60, 60, 60, 65, 65, 65, 70, 70, 70, 70, 70, 70, 70, 75, 75, 75, 75, 75, 100, 100, 100, 100, 100, 100, 100, 100, 120, 120, 120, 120. Для каждой группы подсчитаем частоту значений варианты и соответствующую относительную частоту. Результаты запишем в таблицу, которая называется дискретным вариационным рядом. xi 60 65 70 75 100 120 mi 3 3 7 5 8 4 ωi 3/30 3/30 7/30 5/30 8/30 4/30 ■ 149 Выборочной функцией распределения или эмпирической называется функция F *  x   mx , задающая для каждого значения x n относительную частоту события X  x . Свойство статистической устойчивости частоты, обоснованное теоремой Бернулли, оправдывает целесообразность использования функции F * x  при больших n в качестве приближѐнного значения неизвестной теоретической функции распределения F  x  . Функции F *  x  и F  x  обладают одинаковыми свойствами. Наблюдаемые данные, представленные в виде вариационного ряда, можно изобразить графически, используя либо график функции F *  x  , либо полигон или гистограмму относительных частот. Полигоном относительных частот называют ломанную, отрезки которой соединяют точки Гистограммой  x1 , 1 ,  x2 , 2  , …,  xk , k . относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h , а высоты равны отношению i h . Площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице. 1.2. Оценивание параметров Статистической оценкой  * неизвестного параметра  f  X1 , X 2 , ..., X n  от генеральной совокупности называют функцию наблюдаемых случайных величин X1 , X 2 ,..., X n . Если статистическая оценка характеризуется одним числом, она называется точечной. Способ оценивания - это общее правило (функция f  X1 , X 2 ,..., X n  ), а значение оценки – это конкретное число, 150 которое меняется от выборки к выборке (значение функции f  X1 , X 2 , ..., X n  ), т. е. значения оценок 1* ,  2* ,..., k* представляют собой наблюдаемые значения случайной величины  * . Значение оценки лишь по случайному совпадению может совпасть с оцениваемой характеристикой генеральной совокупности, обычно присутствует определѐнная ошибка. Для того чтобы оценка была «наилучшей», желательно, чтобы она удовлетворяла требованиям несмещѐнности, состоятельности и эффективности. Оценка  * неизвестного параметра  генеральной совокупности называется несмещѐнной, если еѐ математическое ожидание равно   оцениваемому параметру: M     . В противном случае оценка называется смещѐнной. Требование несмещѐнности гарантирует отсутствие систематических ошибок при оценивании. Оценка Оценка  * неизвестного параметра  называется состоятельной, если она удовлетворяет закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру: P * * lim P (  n     )  1 или  n   . n  n  В случае использования состоятельных оценок оправдывается увеличение объѐма выборки, так как при этом становятся маловероятными значительные ошибки при оценивании. Несмещѐнная оценка  * параметра  называется эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещѐнных оценок параметра  , вычисленных по выборкам одного и того же объѐма. Для параметры генеральной совокупности распределения как обычно вероятность оценивают p такие биномиального распределения, математическое ожидание количественного признака 151 (генеральную среднюю), дисперсию. Оценки различаются в зависимости от способа отбора объектов в выборку, от вида распределения количественного признака. Утверждение 1. Несмещѐнной и состоятельной оценкой вероятности p биномиального распределения (генеральной доли) является выборочная доля: где ω  p , m , причѐм еѐ дисперсия для повторной выборки равна n  2  pq , где q  1  p , а для бесповторной выборки равна n  2  pq  N  n  pq  n   1   . n  N 1 n  N Утверждение 2. Несмещѐнной и состоятельной оценкой математического ожидания количественного признака является выборочная средняя: MX   x , k  x i  mi где x  i 1 n Утверждение 3. Выборочная дисперсия σ в2 повторной и бесповторной выборок является смещѐнной и состоятельной оценкой генеральной дисперсии σ 2 . Несмещѐнной оценкой генеральной дисперсии служит исправленная выборочная дисперсия: s2  2 где σ в n  σв2 , n1 2 _   x i  x   mi   x 2   x 2 . n Выборочную среднюю и дисперсию признака можно вычислить с помощью статистических функций в EXCEL: 152 СРЗНАЧ(число1; число2; …) – возвращает среднее арифметическое своих аргументов; ДИСП(число1; число2; …) – оценивает дисперсию по выборке.  * является лишь приближѐнным значением неизвестного параметра  даже в том случае, если она Однако точечная оценка несмещѐнная, состоятельная и эффективная и для выборки малого объѐма может существенно отличаться  . Чтобы получить от представление о точности и надѐжности оценки  * параметра  , используют интервальное оценивание. Интервальной называют оценку, которая определяется двумя θ1* и θ2* числами – концами интервала, который с заданной надѐжностью γ покрывает заданный параметр. Интервальной оценкой математического ожидания (генеральной средней) нормально распределѐнного количественного признака X:  при известном среднем квадратическом отклонении генеральной совокупности σ служит доверительный интервал: xв  t  σ σ  x  xв  t  , n n где n – объѐм выборки, t – значение аргумента функции Лапласа Ф t  , при котором Ф t   (1+ γ)/2 (см. Приложение 2);  при неизвестном σ служит доверительный интервал: xв  t γ  где s - исправленное s s  x  xв  t γ  , n n выборочное среднее квадратическое отклонение, t γ - находят по таблице: Таблица значений t γ  t n  при уровне значимости γ  0,95 : 153 n 5 6 7 8 9 10 11 t 2,78 2,57 2,45 2,37 2,31 2,26 2,23 n 12 13 14 15 16 17 18 t 2,20 2,18 2,16 2,15 2,13 2,12 2,11 n 19 20 25 30 35 40 45 t 2,10 2,093 2,064 2,045 2,032 2,023 2,016 n 50 60 70 80 90 100 120 t 2,009 2,001 1,996 1,991 1,987 1,984 1,980 При n>120 значения t γ  t n  можно вычислять по формуле: t γ  t    100 n   t 100   t  , где t    1,96 . Интервальной оценкой неизвестной вероятности p биномиального распределения с надѐжностью γ служит доверительный интервал: p1  p  p2 , где 2  2 ω1  ω  t    2 t p1    ,  ω  2n  t  n  2n   t 2  n   n 2  2 ω1  ω  t    2 t p2    ,  ω  2n  t  2 n  2n   t n  n здесь n – объѐм выборки, t – значение аргумента функции Лапласа Ф t  , при котором Ф t   1 γ (см. Приложение 2), ω - относительная 2 частота. При больших значениях n (порядка сотен) можно принять в качестве приближѐнных границ доверительного интервала: p1  ω  t ω1  ω ω1  ω ; p2  ω  t . n n 154 Пример 1.2. Изготовлен экспериментальный игровой автомат, который должен обеспечить появление выигрыша в одном случае из 100 бросаний монеты в автомат. Для проверки пригодности автомата произведено 400 испытаний, причѐм выигрыш появился 5 раз. Найдите доверительный интервал, покрывающий неизвестную вероятность появления выигрыша с надѐжностью γ  0,95 . Решение: Найдѐм относительную частоту выигрыша:   0,0125. p1    t  1    n p2    t =-0,0016;  1    n =0,0234. Итак, искомый доверительный интервал: 0  p  0,0234. ■ 155 Глава 2. Проверка гипотез 2.1. Основные понятия задачи проверки гипотез Методы математической статистики широко используются при анализе различных процессов и явлений. Если по результатам проведѐнных экспериментов требуется проверить некоторое предположение относительно генеральной совокупности и сделать обоснованный вывод, то используется статистическая проверка гипотез. Например, если сравниваются различные способы лечения, или разные варианты инвестиций, измерений, технологических процессов, рассматриваются вопросы об эффективности нового метода обучения, управления, о значимости математической модели и т.д. Практической реализации эксперимента исследователь должен предшествует чѐтко этап, сформулировать на котором предположение, подлежащее проверке. Предположительное совокупности, проверяемое статистической фактического утверждение гипотезой. соответствия предполагаемой по гипотезе. относительно выборочным Далее реальных генеральной данным, называется осуществляется результатов Различают простую проверка экспериментов и сложную статистические гипотезы. Простой называют гипотезу, содержащую только одно предположение. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез. Простая гипотеза, в отличие от сложной, полностью определяет теоретическую функцию распределения случайной величины. Например, гипотезы «вероятность появления события в схеме Бернулли равна 1/2», «закон распределения случайной величины – нормальный с параметрами a  0 , σ  1» являются простыми, а гипотезы «вероятность появления события в схеме Бернулли заключена между 0,3 и 0,6», «закон распределения не является нормальным» - сложными. 156 Проверяемую гипотезу обычно называют нулевой или основной и обозначают H 0 . Наряду с нулевой гипотезой H 0 рассматривают альтернативную, или конкурирующую, гипотезу H 1 , являющуюся логическим отрицанием H 0 . Нулевая и альтернативная гипотезы представляют собой две возможности выбора, осуществляемого в задачах проверки статистических гипотез. Например, для простой нулевой гипотезы H 0 : p  1/ 2 сложная альтернативная гипотеза может выглядеть таким образом H 1 : p  1/ 2 или так H 1 : p  1/ 2 или H 1 : p  1/ 2 . Правило, по которому принимается решение об отклонении или принятии основной гипотезы H 0 , называется критерием. Суть проверки статистической гипотезы заключается в том, что всѐ выборочное пространство делится на две взаимодополняющие области: критическую область S кр (область неправдоподобно малых и/или неправдоподобно больших значений) и область допустимых значений S кр (область правдоподобных значений). В зависимости от вида альтернативной гипотезы H 1 различают односторонние (критическая область с одной стороны) и двухсторонние критерии (критических области две – «два хвоста распределения»). Затем по выборке x1 ,..., xn определяется специально составленная выборочная характеристика – критическая статистика θкр  x1 , x2 , ..., xn  , точное или приближенное распределение которой известно. Для этого известного распределения по специальным таблицам находятся точки θкр.н и θкр.в (в случае двухсторонней критической области) или точка θкр (в случае односторонней критической области), разделяющие критическую область S кр и область допустимых значений S кр . Для одностороннего критерия область принятия основной гипотезы имеет 157 ограничение только с одной стороны (сверху или снизу), соответственно требуется найти квантиль уровня 1 α , либо квантиль уровня α . Для двухстороннего критерия область принятия нулевой гипотезы имеет два ограничения – сверху (квантиль уровня 1 α / 2 ) и снизу (квантиль уровня α / 2 ). Рассчитывается эмпирическое значение статистики θ эмп подстановкой в θ кр конкретных выборочных значений. Если θэмп  Sкр , то нулевая гипотеза отклоняется и принимается альтернативная гипотеза. Если же θэмп  Sкр , то делается вывод о том, что нет оснований для отклонения нулевой гипотезы. Так как исследователь работает с выборочными данными, которые попадают из генеральной совокупности случайным образом, то можно совершить ошибки (табл.1). Таблица 1. отвергается гипотеза H 0 не отвергается верна правильное решение ошибка 1-го рода не верна ошибка 2-го рода правильное решение Если на самом деле верной является нулевая гипотеза, а будет принята альтернативная гипотеза, то такая ошибка называется ошибкой первого рода. Вероятность P  H1 / H 0   α допустить ошибку 1-го рода называется уровнем значимости критерия. Ошибка второго рода – это принятие нулевой гипотезы в то время, когда на самом деле верной является альтернативная гипотеза. Вероятность допустить ошибку 2-го рода: P  H 0 / H1   β . При построении процедур проверки гипотез желательно минимизировать значения ошибок обоих родов, но на практике это невозможно: при фиксированном объѐме выборки можно минимизировать лишь одну из величин α или β , другая при этом будет увеличиваться. Поэтому поступают таким образом: фиксируют вероятность ошибки первого рода на определѐнном уровне (обычно для 158 α используют стандартные значения, например, равные 0,05 ; 0,01), а вероятность ошибки второго рода – минимизируют. Мощностью критерия называется вероятность не допустить ошибку 2-го рода P  H1 / H1  1 P  H0 / H1  1 β . Оптимальным критерием считается такой, у которого при заданном уровне значимости α достигается максимальное значение функции мощности критерия 1  β (задача Неймана-Пирсона). Если использовать терминологию статистического контроля качества продукции, то вероятность α можно интерпретировать как «риск поставщика», т.е. вероятность по результатам выборочного контроля забраковать всю партию, удовлетворяющую стандарту; а вероятность β - «риск потребителя» - вероятность приѐмки плохой продукции. Процедура обоснованного сопоставления сформулированной гипотезы с имеющимися выборочными данными, осуществляемая с помощью статистического критерия, называется статистической проверкой гипотезы. Разработаны различные статистические критерии проверки гипотез, но последовательность шагов действий укладывается в единую логическую схему: 1. Выдвигается основная гипотеза H 0 (в качестве нулевой гипотезы обычно используют то предположение, которое противоречит наблюдаемым фактам и, скорее всего, будет отклонено). Формулируется альтернативная гипотеза H 1 . 2. Задается уровень значимости критерия α . Логическим обоснованием величины α является вес потерь от ошибочного отклонения гипотезы H 0 (чем больше потери, тем меньшее значение α необходимо выбирать). 159 3. Определяется некоторая функция результатов наблюдений – критическая статистика - случайная величина, подчиняющаяся определенному закону распределения вероятностей. Вычисляется еѐ значение для выборочных данных - θэмп  x1 , x2 , ..., xn . 4. Из статистических таблиц распределения этой случайной величины находим нижнюю критическую точку для неправдоподобно малых значений случайной величины или верхнюю критическую точку для неправдоподобно больших значений случайной величины. Для одностороннего критерия область принятия основной гипотезы ограничена с одной стороны (и при этом площадь «хвоста» распределения равна α ), для двухстороннего критерия область принятия основной гипотезы имеет два ограничения – снизу и сверху (при этом площадь каждого хвоста равна α / 2 ). 5. Найденное по таблицам критическое значение θкр сравнивается с расчетным θэмп  x1 , x2 , ..., xn . Если расчетное значение принадлежит области правдоподобных значений, то делается вывод «основная гипотеза H0 не противоречит выборочным данным». В противном случае вывод такой «основная гипотеза H 0 отклоняется с ошибкой первого рода α ». По своему прикладному содержанию статистические гипотезы можно подразделить на несколько основных типов:  о числовых значениях параметров;  о равенстве числовых характеристик генеральных совокупностей;  об однородности выборок;  о согласии эмпирического распределения и выбранной модели;  о стохастической независимости элементов выборки; 160 2.2. Проверка гипотез о числовых значениях параметров Статистическая проверка гипотез о числовых значениях параметров осуществляется по схеме, изложенной выше. В таблице 2 приведены параметров критерии проверки нормального гипотез о распределения, числовых значениях вероятности успеха в единичном испытании и коэффициента корреляции. Рассмотрим алгоритм проверки одной из гипотез. Пусть случайная величина X ~ N a , σ  , причѐм числовое значение математического ожидания a не известно, а числовое значение дисперсии σ Сформулируем основную гипотезу H 0 : a  a0 . известно. a  a0 и альтернативную в виде H1: Z эмп  x  a0 ~ N 0, 1 , поэтому область отклонения нулевой гипотезы σ/ n будет Статистика 2  критерия   (случайная Z эмп    ,  zkp  zkp ,   такой: zкр критическая область, где число   Приложение 2) из условия Ф zкр  1   - величина) двухсторонняя находят по таблице (см. α (при α  0,05 значение zкр  2 1,96, т.е. квантиль уровня 0,975). Для альтернативной гипотезы H 1 : a  a0 критическая область значений  статистики  Z будет правосторонней: если Z эмп  zкр ,   , то основная гипотеза H 0 отклоняется, где число z кр находят по таблице (см. Приложение 2) из условия   Ф zкр  1 α (если α  0,05 значение zкр  1,645, т.е. квантиль уровня 0,95). При альтернативной гипотезе H 1 : критическая  область  значений Z будет левосторонней: Z эмп    ,  zкр , то основная гипотеза H 0 - отклоняется. 161 a  a0 если Таблица 2. нулевая гипотеза H0 альтернативная гипотеза H 1 статистика критерия Z эмп  zкр α  a  a0 a  a0 , 2 σ известно a  a0 , σ2 неизвестно σ 2  σ 02 , a неизвестно a  a0 Z эмп  x  a0 σ/ n Z эмп   zкр α  a  a0 Z эмп  zкр α / 2 a  a0 Tэмп  t кр α , n  1 a  a0 Tэмп  x  a0 s/ n Tэмп  t кр α , n  1 a  a0 Tэмп  t кр α / 2 , n  1 σ 2  σ 02 2 2 α , n  1 χ эмп  χ кр σ 2  σ 02 2 χ эмп  n  1 s 2 σ 02 n порядка нескольких десятков и np0  5 , n1  p0   5 r 0 p  p0 p  p0 p̂  p0 Z эмп  p0 q0 / n m p̂  , n n2 1 r Z эмп  zкр α  Z эмп   zкр α  Z эмп  zкр α / 2 p  p0 Tэмп  r кр кр 2 2 1  α / 2, n  1 χ эмп  χ кр q0  1  p0 r 0 2 χ эмп  χ 2 1  α , n  1 2 χ эмп  χ 2 α / 2, n  1 , σ 2  σ 02 p  p0 , критическая область 2 Tэмп  t кр α / 2 , n  2 Примечание*) В таблице 2: случайная величина Z имеет стандартизированное 2 нормальное распределение, T подчиняется распределению Стьюдента, χ распределению «хи-квадрат», s - несмещѐнная оценка ср. квадр. отклонения. 162 2.3. Проверка гипотез о равенстве числовых характеристик генеральных совокупностей Гипотезы о равенстве числовых характеристик генеральных совокупностей – это, например, предположения о равенстве средних двух выборок (при известных или неизвестных дисперсиях), о равенстве дисперсий при неизвестных средних значениях, о равенстве вероятностей успеха в единичном испытании. Статистики критериев и критические области для проверки перечисленных гипотез приведены в таблице 3. Гипотеза о равенстве средних при известных дисперсиях. Пусть случайные величины подчиняются нормальному закону распределения: X ~ N a1 , σ1  и Y ~ N a2 , σ2 , при этом a1 и a2 не известны, а σ1 и σ2 - известны. Пусть имеются результаты независимых выборочных наблюдений: и x1 , x2 , ... , xn1 y1 , y2 , ... , yn2 . Тогда средние  выборочные также будут распределены нормально: x ~ N a1 , σ1 / и   y ~ N a2 , σ2 / n2 . Для основной гипотезы n1  a1  a2 H0 : конкурирующую гипотезу рассмотрим в виде H 1 : a1  a2 . Статистика критерия Z эмп  x  y σ12 n2 n1n2  σ 22 n1  ~ N 0, 1 , поэтому основная гипотеза  отвергается, если z кр  zкр ,   , где z кр находят по таблице (см. Приложение 2) как квантиль уровня p  1  α . При альтернативной гипотезе H1: a  a0 критическая  область значений  Z будет левосторонней: если Z эмп    ,  zкр , то основная гипотеза H 0 отклоняется. Для  H1: a  a0   критическая  область двухсторонняя: Z эмп    ,  zkp  zkp ,   , где число zкр находят по таблице (см. Приложение 2) как квантиль уровня p  1  α / 2 . 163 Таблица 3. нулевая гипотеза H 0 альтернативная гипотеза H 1 a1  a 2 , a1  a 2 σ12 и σ 22 известны a1  a 2 статистика критерия Z эмп  a1  a 2 Tэмп  a1  a 2 a1  a 2 , σ12 и σ 22 не известны, но равны a1  a 2 σ12  σ 22 , a1 и a 2 не известны σ12  σ 22 p1  p2 , n порядка нескольких десятков 2 a1  a 2 s  Z эмп   zкр α  σ12 σ 22  n1 n2 Z эмп  zкр α / 2 x y 1 1 s  n1 n2 Tэмп  t кр α , n1  n2  2 Tэмп  t кр α , n1  n2  2 n1  n2  2 Fэмп  Z эмп  p̂  m1  m 2 n1  n2 164 Fэмп  Fкр α / 2 , n1  1, n2  1 s22 p̂1  p̂ n1  n2  Tэмп  t кр α / 2 , n1  n2  2 Fэмп  Fкр α , n1  1, n2  1 s12 n1 n2  p̂1  p̂2  p1  p2 p1  p2 Z эмп  zкр α  x y n1  1 s12  n2  1 s22 σ12  σ 22 p1  p2 критическая область , Z эмп  zкр α  Z эмп   zкр α  Z эмп  zкр α / 2 2.4. Проверка гипотез об однородности выборок Иногда при работе с различными наборами данных требуется сравнить их характеристиках и выяснить этих групп вызвано ли различие систематическими в или числовых случайными причинами. Для решения подобных задач в математической статистике существуют 2 подхода – параметрические и непараметрические методы. Методы обработки, основанные на предположении, что результаты наблюдений имеют закон распределения, принадлежащий тому или иному параметрическому семейству – нормальному, показательному или какому-либо другому, называются параметрическими. Проверка гипотез о равенстве числовых характеристик генеральных совокупностей (см. табл.3) – это, по сути, параметрические методы проверки гипотез об однородности выборок. Методы обработки, в которых не предполагается использование какого-то параметрического семейства, называют непараметрическими. Их применяют тогда, когда приходится иметь дело с обработкой данных, распределение которых неизвестно или не подчиняется какому-либо из известных законов распределения. Если вывод необходимо делать по малым выборкам, и закон распределения неизвестен, то невозможно применение критериев, связанных с параметрами распределения. Непараметрические критерии обладают некоторыми преимуществами: более широкая область применения, меньшая чувствительность к «шуму» в статистических данных и к влиянию ошибок, попавших в практические данные. Однако параметрические критерии обладают большей мощностью. По этой причине, в случаях, когда выборки имеют нормальное распределение, нужно отдавать предпочтение именно параметрическим критериям. 165 2.4.1. Параметрические критерии При решении вопроса о наличии различий между выборками проводят проверку статистических гипотез о принадлежности обеих выборок одной генеральной совокупности или о равенстве средних. В случае, когда вид распределения или функция распределения нам известны, задачу оценки различий двух групп независимых наблюдений можно решить с использованием параметрических критериев (см. табл.3): критерия Стьюдента (если сравниваются средние значения выборок); критерия Фишера (если сравниваются дисперсии выборок). Критерий Стьюдента. Английский математик Вильям Госсет, печатавшийся под псевдонимом «Стьюдент», нашѐл закон xa , где генеральный s/ n параметр σ заменен на его выборочную оценку s . Этот закон, имеющий распределения непрерывную случайной функцию  t 2   f ( t )  C1 n  1   n 1 2 величины T распределения, для описывается t    ;    , где C формулой: - константа, зависящая только от числа степеней свободы n  1. Закон Стьюдента положил начало созданию теории «малой выборки». При большом объѐме выборки особенность распределения в генеральной совокупности не имеет значения, так как распределение отклонений выборочного показателя от генеральной характеристики при большой выборке всегда оказывается нормальным. В выборках небольшого объѐма ( n  30 ) на распределении ошибок выборки будет сказываться характер распределения генеральной совокупности. Распределение Стьюдента зависит от двух величин: значения t и числа степеней свободы k  n  1. С увеличением n , т.е. числа наблюдений, это распределение быстро приближается к стандартизированному 166 нормальному (с параметрами a0 и σ  1). Уже при n  30 распределение Стьюдента не отличается от стандартизированного нормального распределения. Для практического использования распределения Стьюдента существуют специальные таблицы (см. Приложение 4), в которых содержатся критические значения t для разных уровней значимости α и чисел степеней свободы k . Пусть сравниваются средние арифметические x и y двух независимых выборок объемов n1 и n2 , взятых из нормально распределенных совокупностей с параметрами a1 , σ1 и a2 , σ2 . Предполагается, что σ1 и σ 2 не известны и разница между средними d  x  y возникла случайно. В качестве основной гипотезы выдвигается следующее предположение H 0 : a1  a2 . Для проверки нулевой гипотезы используется случайная величина T  x  y   a1  a2  sd , подчиняющаяся распределению Стьюдента с числом степеней свободы k  n1  n2  2 . Здесь sd - ошибка разности между выборочными средними. Эта величина вычисляется по следующим формулам:  для выборок одинакового объѐма ( n1  n2  n ): sd   sd  2 2 2 s 2x s y   xi  x    yi  y     ; n1 n2 n( n  1 ) n( n  1 ) для неравновеликих выборок ( n1  n2 ): n1  1s 2x  n2  1s 2y  n1  n2  n1  n2  2   n1n2 2 2   x i  x     y i  y   n1  n2      n  n  2 n n   1 2  1 2 167 При a1  a2 разность a1  a2  0 , поэтому критерий будет иметь вид: Tэмп  x y . sd При конкурирующей гипотезе H 1 : a1  a2 верхняя критическая точка находится по таблице (см. Приложение 4) как квантиль уровня 1  α / 2 , а нижняя критическая точка расположена симметрично верхней относительно оси ординат: Tкр.н  Tкр.в . Если Tэмп  Tкр.н или Tэмп  Tкр.в , то основная гипотеза отклоняется с вероятностью ошибки первого рода α . Если сравниваемые выборки являются попарно связанными друг с другом значениями варьирующего признака, то при оценке различий между сопряженных ними вариант. используется В этом метод случае парных оценкой сравнений разности между генеральными средними D  a1  a2 и дисперсией этой разности σ 2D будет выборочная средняя из суммы разностей между попарно связанными y1 , y2 , ..., yn : вариантами сравниваемых d групп x1 , x2 , ..., xn   x i  yi   d i ,  n n где n - число парных наблюдений. Тогда выборочная дисперсия будет  d i  d  , а ошибка средней разности вычисляется как:  n1 2 равна sd2  d i  d  . nn  1 2 sd  168 и Если варианты генеральной совокупности распределены нормально, то и разность между ними будет подчиняться нормальному закону распределения. Поэтому случайная величина T  d D sd будет иметь распределение Стьюдента с k  n  1 степенями свободы. Для основной гипотезы H 0 : D  0 и конкурирующей H 1 : D  0 статистика критерия: Tэмп  d . sd Если Tэмп  Tкр α , n  1, то основная гипотеза отклоняется с вероятностью ошибки первого рода α (для нахождения критического значения см. Приложение 4). Замечание*). Если гипотеза о нормальности распределения попарных разностей окажется отвергнутой, то критерий Стьюдента применять не следует. В таких случаях нужно использовать непараметрические критерии. Замечание**). Критерий Стьюдента можно применять также и тогда, когда сравниваются не средние величины выборок, а их относительные частоты. Критерий Фишера. Пусть имеются две выборки из нормальных генеральных совокупностей. Если сравниваются дисперсии выборок, то вместо разности s1  s2 Р. Э. Фишер предложил рассматривать разность их натуральных логарифмов z  ln s1  ln s2 (при этом предполагается, что s1  s2 ), которая имеет нормальное распределение, как для больших выборок, так и для выборок среднего объема. Д. Снедекор заменил 169 s12 разность логарифмов отношением выборочных дисперсий: F  . 2 s2 Рассмотрим 2 случая: 1) Пусть для каждой генеральной совокупности математические ожидания a1 и a2 - известны. Для нулевой гипотезы H 0 : σ12  σ22 рассмотрим альтернативную в виде α заданном уровне значимости H 1 : σ12  σ22 . Тогда при критическая область будет двухсторонней и поэтому требуется определить две критические границы: θкр .н  квантилю уровня ( 1  α α ) и θкр .в  квантилю уровня . При 2 2 этом числа степеней свободы будут равны n1 и n2 . Если же альтернативная гипотеза имеет вид H 1 : σ12  σ22 , то критическая область будет правосторонней и надо будет определять только одну критическую точку – квантиль уровня p  1  α (см. Приложение 5) для чисел степеней свободы n1 и n2 . 2) Пусть для каждой генеральной совокупности математические ожидания a1 и a2 - неизвестны. Дальше всѐ аналогично предыдущему случаю с той лишь разницей, что здесь числа степеней свободы равны n1  1 и n2  1 (см. табл.3). Замечание*). Следует отметить, что критерий Фишера весьма чувствителен к отклонениям от нормальности изучаемого признака в рассматриваемых выборках 170 2.4.2. Непараметрические критерии При анализе статистических данных не всегда изучаемый признак подчиняется нормальному закону распределения, часто о законе распределения сравниваемых групп мало что известно. Поэтому в этих случаях применяют непараметрические критерии. Одна из возможных формулировок гипотезы об однородности выборок – это предположение о совпадении законов распределения, описывающих разные выборки. При ограниченном объѐме статистического материала возможным путѐм повышения достоверности является объединение имеющихся выборок в одну совокупность. Но для этого следует убедиться в правомерности таких действий, т.е. доказать однородность выборок. Для независимых распределений можно применять критерий знаков или T -критерий Вилкоксона. Для независимых распределений: T критерий Уайта, критерий Ван-дер0Вардена, U -критерий Манна-Уитни, T -критерий Манна-Уитни, критерий однородности Пирсона, критерий Колмогорова-Смирнова. Рассмотрим алгоритмы применения непараметрических критериев для связанных выборок. T - критерий Вилкоксона. Этот критерий применяется для сравнения результатов, измеренных в двух разных условиях на одной и той же выборке (группе испытуемых): x1 , x2 , ..., xn и y1 , y2 , ..., yn . Рекомендуется для выборок умеренной численности (численность каждой выборки от 12 до 40). Он позволяет установить не только направленность изменений, но и их выраженность. С его помощью определяют, является ли сдвиг показателей направлении более интенсивным, чем в другом. 171 в каком-то одном Для основной гипотезы H 0 : a1  a2 альтернативную запишем в виде H 1 : a1  a2 , т.е. критерий – двухсторонний. Далее вычисляют разности между индивидуальными значениями во втором и первом замерах («после» - «до»): xi  yi . Не обращая внимания на знак каждой разности, ранжируют их по порядку от наименьшей к наибольшей. В случае, когда две парные отметки совпадают, разность равна нулю. Эта нулевая разность не учитывается в присваивании рангов. Затем суммируются отдельно положительные и отрицательные ранги. Эмпирическое значение критерия равно меньшей по абсолютной величине сумме рангов. Далее эмпирическое значение сравнивают с критическим (см. Приложение 4), при этом в таблице при нахождении критического значения имеется в виду, что N равно числу только ненулевых разностей между отметками. При заданном уровне значимости α основная гипотеза отклоняется, если Tэмп  Tкр . Критерий знаков. Сравнивая выборки с попарно связанными вариантами x1 , x2 , ..., xn и y1 , y2 , ..., yn , иногда удобно (а бывает и необходимо) наблюдаемые между ними различия yi  xi обозначать знаками плюс (положительный эффект воздействующий на признак фактора) и минус (отрицательный эффект воздействующий на признак фактора). Необходимо заметить, что количество измерений должно быть не менее пяти, но и не более трехсот. В этом случае, как и в случае других выборочных показателей, значение z - критерия знаков есть величина случайная. Она служит для проверки основной гипотезы H 0 : совокупность или совокупности, из которых взяты сравниваемые выборки, имеют одну и ту же или одинаковые функции распределения. 172 Если попарно сравниваемые выборки не различаются, то число плюсовых и минусовых разностей должно быть одинаковым. Если же налицо заметное преобладание плюсов или минусов, то это может быть следствием воздействия на признак учитываемого фактора. Практически величина критерия знаков определяется большим числом однозначных разностей: z эмп  max , . При этом нулевые разности т.е. случаи, не давшие ни положительного, ни отрицательного результата в расчет не принимаются и число парных наблюдений уменьшается. Т.к. значение критерия величина случайная, то значимость приходится проверять по таблицам (см. Приложение 7), в которых содержатся критические точки этого критерия zкр α  для n , взятых без нулевых разностей. Гипотеза H 0 отвергается, если z эмп  zкр для принятого уровня значимости α . Теперь перейдѐм непараметрических к рассмотрению критериев для алгоритмов выборок применения с попарно несвязанными вариантами. Уайта. T -критерий Данный критерий применяется для установления достоверности различий, наблюдаемых при сравнении двух независимых результатов, полученных по шкале порядка. Алгоритм применения критерия: 1. результаты экспериментальной и контрольной групп объединяют в общий вариационный ряд и располагают в порядке неубывания, затем присваивают им ранги (порядковый номер того места, которое варианта занимает в упорядоченном ряду); 2. затем эти ранги суммируют отдельно для каждой группы; 3. если сравниваемые результаты контрольной и экспериментальной групп совершенно не отличаются друг от друга, то суммы их рангов должны быть равны между собой, и наоборот, 173 чем значительнее расхождение между полученными результатами, тем больше разница между суммами их рангов; 4. достоверность различий между суммами рангов оценивается с помощью T - критерия Уайта по специальным таблицам (см. Приложение 8): в качестве эмпирического значения берѐтся меньшая из сумм рангов и сравнивается с табличным значением критерия. Если Tэмп  Tкр , то это указывает на недостоверность различий между группами. Критерий Ван-дер-Вардена. Этот критерий также как и предыдущий относится к группе ранговых критериев и применим для сравнения выборок равновеликого и неравновеликого объема. Алгоритм применения критерия: 1. обе сравниваемые выборки ранжируют в один общий ряд по возрастающим значениям признака. Затем каждой варианте присваивается ранг; 2. далее для одной из выборок (для неравновеликих выборок Ri n1 выбирают выборку меньшего объѐма) вычисляют отношения , где Ri - ранг i  ой варианты, n  n1  n2  1 - сумма всех членов сравниваемых групп; 3. далее по специальным таблицам (см. Приложение 9.1) находят  Ri   для каждого аргумента и суммируют n  1   значения функции ψ   Ri  .  n  1 результаты, определяя величину критерия: X эмп   ψ  4. найденное критическим эмпирическое значением значение X кр α , n 174 для сравнивают принятого с еѐ уровня значимости α и числа степеней свободы n  n1  n2 (см. Приложение 9.2). Нулевая гипотеза или предположение о том, что сравниваемые выборки извлечены из генеральных совокупностей с одинаковыми функциями распределения, опровергается, если X эмп  X кр U - критерий Манна-Уитни. Данный критерий использует всю информацию, присущую порядковым шкалам и является одним из наиболее мощных статистических критериев, применяемых для оценки различий между центральными параметрами. Выдвигается основная гипотеза H 0 : не существует различия между медианами двух рассматриваемых выборок против альтернативной H 1 : различие между медианами существует. Схема проверки гипотезы: 1. объединяем вместе обе выборки и располагаем варианты в порядке убывания. Присваиваем ранги каждому наблюдению; 2. находим сумму рангов для каждой группы: R1 - сумма рангов, относящихся к группе с объемом выборки n1 , R2 - сумма рангов, относящихся к группе с объемом выборки n2 ; 3. вычисляем эмпирическое значение по формуле: n1n1  1 n n  1  R1 или U эмп  n1n2  2 2  R2 ; 2 2 при принятом уровне значимости α для данных объемов выборок U эмп  n1n2  n1 и n2 по специальной таблице (см. Приложение10) находим интервал, в который должно попадать эмпирическое значение. Если 175 эмпирическое значение не попадает в указанный интервал, то основная гипотеза отклоняется. T -критерий Манна-Уитни (непараметрический аналог критерия Стьюдента, другое его название - W - критерий Вилкоксона). Этот критерий является ранговым и применяется для проверки однородности двух выборок независимых случайных величин, распределения которых неизвестны. Критерий находит применение при объеме выборки меньше 60, так как Статистические при больших данные возрастает n должны быть трудоемкость метода. представлены в несгруппированном виде. Пусть имеются две выборки независимых непрерывных случайных x i , i  1, ...,n1 и величин: y j , j  1,...,n2 . Алгоритм применения критерия: 1) Сформулировать альтернативную ей основную гипотезу H0 : F  x  F  y и H1 : F  x   F  y  , где F  x  и F  y  - неизвестные непрерывные функции распределения случайных величин X и Y . 2) Задать уровень значимости α. 3) Формирование критической статистики. Статистика критерия имеет вид: Tэмп  меньшего n1  n2 объема n  Ri 1 , где Rin1 - ранги элементов выборки i 1 ( n1  n2 ). Для вычисления эмпирического значения статистики надо из двух выборок составить общий вариационный ряд с обозначением рангов вариант. Если в обеих 176 выборках есть одинаковые варианты, то в общем вариационном ряду первыми записываются варианты меньшей по объему (первой) выборки. Суммирование рангов осуществляется по элементам меньшей выборки. Предельное распределение статистики Tэмп стремится к распределению Вилкоксона – Манна-Уитни. 4) По статистическим таблицам критических точек распределения Вилкоксона – Манна-Уитни для уровня значимости α находим нижнюю критическую точку: Tкр.н  ωα / 2 n1 , n2  , где ωα / 2 n1 , n2  - квантиль распределения Вилкоксона. Верхняя критическая точка находится из выражения: Tкр .в  n1  n2  1 n1  Tкр .н или в виде Tкр.в  2 MW  Tкр.н , где 2MW находят по таблице (см. Приложение 11) для n1 и n2 . 5) Далее эмпирическое значение статистики сравнивается с критическими нижними и верхними значениями. Если выполняется условие Tкр .н  Tэмп  Tкр .в , то нет оснований отклонить основную гипотезу, в противном случае основная гипотеза отвергается. Замечание*). Если нужной численности групп в таблице критических значений нет, то можно воспользоваться тем, что при численности групп превышающей нормальному 8, со отклонением σT  распределение средним aT  величины T n1n1  n2  1 2 приближается и к стандартным n1n2 n1  n2  1 , где n1 и n2 - объемы меньшей и 12 большей выборок. В таком случае величина 177 ZT  T  aT σT имеет стандартное нормальное распределение. Это позволяет сравнить ее с критическими значениями нормального распределения. Эмпирическое значение стандартизированной статистики Вилкоксона рассчитывается по формуле: n n  n  1   Tэмп   R  1 1 2 / 2   При уровне n1n2 n1  n2  1 12 α =0,05 значимости гипотеза однородности отклоняется, если Tэмп  1,96. χ 2 - критерий однородности (критерий Пирсона). Пусть имеются две выборки объемами n1 и n2 . Элементы каждой выборки независимы, непрерывны и сгруппированы в проверки однородности этих выборок L интервалов. Для сравниваются функции распределения. Данный критерий однородности применим при n  60 (ещѐ лучше, если выполняется условие n  200 ) и данные представлены в группированном виде. H0 : FX  x   FY  y  против Критическая статистика: ψ кр Основная гипотеза где m j и k j - количество попаданий в 2 j  ый интервал группирования соответственно первой и второй выборок. Если n1  n2  n , то L m j  k j 2 j 1 mj  kj ψ кр   178 вид H1 : FX  x   FY  y  конкурирующей  mj kj     L  n n2   n1n2   1 j 1 m j  k j имеет . Далее определяется верхняя критическая точка статистического критерия ψкр .в  χ 2 α , L  1 как квантиль для χ 2 -распределения с помощью таблицы (см. Приложение 6). Данный критерий является односторонним. Области неправдоподобно малых значений статистики χ 2 нет. Чем меньше расчетное значение критической статистики, тем более благоприятные условия складываются для принятия гипотезы об однородности двух выборок. Далее вычисляется эмпирическое значение статистики подстановкой в формулу критической статистики исходных данных. ψ эмп не может быть меньше нуля. Если ψ эмп  ψкр .в , то гипотеза H 0 отклоняется. Критерий Колмогорова-Смирнова. Пусть имеются две независимые выборки, извлеченные из генеральных совокупностей с неизвестными теоретическими функциями распределения F X  x  и FY  y . Проверяемая нулевая гипотеза имеет вид H 0 : FX  x   FY  y  против функции конкурирующей H1 : FX  x   FY  y  . распределения непрерывны. Предполагается, Статистика что Колмогорова- Смирнова вычисляется по формуле: n1n2 max FX*  x   FY*  y  , n1  n2   λэмп где FX*  x  и FY*  y  - эмпирические функции распределения, построенные по двум выборкам объемов n1 и n2 . Гипотеза H 0   λкр  . При малых объемах выборок n1 , n2  20  отвергается, если λэмп критические значения статистики Колмогорова-Смирнова для заданных уровней значимости критерия можно найти в специальных таблицах. При 179 n1 , n2   (практически при n1 , n2  50 ) распределение указанной статистики сходится к распределению Колмогорова. Поэтому гипотеза   λα . В таблице 4 H 0 отвергается на уровне значимости α , если λэмп приводятся критические λα значения критерия Колмогорова для различных значений α . Таблица 4. уровень значимости α 0,10 0,05 0,025 0,01 0,005 0,001 1,22 1,36 1,48 1,63 1,73 1,95 критическое значение λα 2.5. Проверка гипотез о согласии эмпирического распределения и выбранной модели 2.5.1. Параметрические критерии Если проверка основной гипотезы состоит в выяснении, согласуется ли высказанное в ней предположение с выборочными наблюдениями x , x2 , ..., xn , то соответствующие критерии называются критериями согласия. 2 Критерий согласия χ относительно закона распределения. Случай 1. Основная гипотеза H 0 : выборка извлечена из совокупности, имеющей распределение F  x , θ  , значения параметров θ  θ1 , ,... , θl  которой известны. Алгоритм проверки гипотезы: 1. Весь диапазон значений наблюдаемого случайного признака X разбивают на группы (интервалы) Δ1 , Δ2 , ..., Δ k без общих точек и подсчитывают числа mi - частоты попадания наблюдаемых 180 значений признака в i -ый интервал. Сумма всех частот должна k совпасть с объѐмом выборки:  m i  n . i 1 Подсчитываются вероятности 2. pi  P  X  Δi , i  1, 2 , ..., k , k  pi  1. i 1 3. Для каждого интервала подсчитываются ожидаемые частоты np i (если для каких-либо интервалов npi  5 , то их объединяют с соседними так, чтобы в итоге для каждого интервала ожидаемая частота была больше 5). Полученное таким образом число интервалов обозначим k * . 4. Эмпирическое 2 формуле: χ эмп k*   значение статистики рассчитывается по mi  npi 2  k* i 1 mi2 n  i 1 npi npi 2 2 α , k * 1, то гипотезу H 0 отклоняют. χ эмп  χ кр Если Случай 2. Основная гипотеза H 0 : выборка извлечена из совокупности, имеющей распределение F  x , θ  с некоторыми заранее не известными значениями параметров θ1 , θ2 , ..., θr , где r  l . Ввиду того, что некоторые значения параметров неизвестны, то вероятности pi  P  X  Δi  распределения mi2 и числа ψ0   n i 1 np i k будут не числами, а некоторыми функциями неизвестных параметров. Оценками этих параметров θ1* , θ2* , ..., θ*r заменяют неизвестные параметры в функции распределения. Далее действуют по описанной выше схеме с той лишь разницей, что число степеней свободы будет равно k * r  1. 181 2.5.2. Непараметрические критерии Критерий Колмогорова. Для проверки гипотезы о законе распределения используется эмпирическая функция распределения F *  x  . Основная гипотеза H 0 : F *  x   F  x  , где F  x  - теоретическая функция распределения. Случайная величина D  max F  x   F * x x стремится к нулю при достаточно большом объеме выборки. На практике эту случайную величину удобно рассчитывать по формуле: i  1 i Dn  max   F  xi , F  xi   , n n  i 1, ...,n  где x1 , x2 , ..., xn - ранжированная последовательность членов выборки. Схема применения критерия Колмогорова следующая: 1. строится эмпирическая функция распределения F* x по вариационному ряду распределения исследуемого признака и предполагаемая теоретическая функция распределения F  x  ; 2. определяется мера Dn расхождения между теоретическим и эмпирическим распределением, а затем вычисляется величина λ  Dn n ; 3. если выполняется неравенство λ  λкр , то нулевая гипотеза о том, что признак X имеет заданный закон распределения отклоняется. В таблице ниже приводятся критические значения λкр для некоторых α . уровень значимости λкр α 0,1 0,05 0,025 1,22 1,36 1,48 182 – 2 Критерий ω . Для проверки гипотезы о законе распределения используется оценка плотности распределения p̂ x  . Основная гипотеза H 0 : p̂ x   p x  , где p x  - плотность заданного закона распределения.   2 Случайная величина ωn2   F  x   F *  x  dF  x  стремится к нулю  при достаточно большом объеме выборки. На практике эту случайную величину удобно рассчитывать по формуле: ωn2 2 1 n  2i  1      F x     , i 2 n 2 n  12 n i 1 1 где x1 , x2 , ..., xn - ранжированная последовательность членов выборки. Схема применения критерия Колмогорова следующая: 1. строится эмпирическая функция распределения F * x по вариационному ряду распределения исследуемого признака; 2. определяется величина W  nωn ; 2 неравенство W  Wкр , то нулевая гипотеза о том, что признак X имеет заданный закон 3. если выполняется распределения – отклоняется. В таблице ниже приводятся критические значения W кр некоторых α . уровень значимости Wкр α 0,1 0,05 0,025 0,345 0,465 0,58 183 для 2.5.3. Проверка соответствия эмпирического распределения нормальному закону распределения Проверка соответствия распределения случайной признака нормальному закону распределения может быть X произведена приближенно с помощью исследования показателей асимметрии As и эксцесса E x . При нормальном распределении показатели асимметрии As и эксцесса E x некоторой генеральной совокупности равны нулю. Предположим, что наблюдаемые значения признака X представляют собой выборку из генеральной совокупности, поэтому можно определить только выборочные характеристики асимметрии и эксцесса и их ошибки:  As  1 n 3  xi 6( n  2 ) n i 1 , σ A  s ( n  1 )( n  3 ) 1 n 2 3 (  xi ) n i 1 , 1 n 4  xi  24 n ( n  2 )( n  3 ) n i 1   Ex   3 , , σ Ex 2 1 n 2 2 ( n  1 ) ( n  3 )( n  5 ) (  xi ) n i 1   где As - выборочная характеристика асимметрии, E s - выборочная характеристика эксцесса, σ A s и σ E - соответствующие средние x квадратические ошибки. Если одновременно выполняются следующие неравенства:   6  1,5  σ E , As  1,5  σ A и E x  x s n1 то нет оснований для отклонения основной гипотезы о нормальном характере распределения случайного признака X . Если выполняется хотя бы одно из неравенств: 184   6  E   2  σ E , либо As  2  σ A x x s n1 то гипотеза о нормальном характере распределения отвергается. R / S - критерий: по наибольшему xmax и наименьшему xmin значениям признака и среднеквадратическому отклонению вычисляется эмпирическое значение статистики R / S эмп  sx xmax  xmin . sx Если R / S эмп  R / Smin , R / Smax , то гипотеза H 0 о нормальном распределении отклоняется. Границы критического значения статистики при уровне значимости α =0,05 приводятся ниже в таблице. n R/ S R/ S min max n R / Smin R / Smax 10 2,67 3,57 35 3,58 4,84 20 3,18 4,32 40 3,67 4,96 30 3,47 4,7 50 3,83 5,14 2.6. Проверка гипотез о стохастической независимости элементов выборки Основное требование при проведении выборочного исследования – это случайность попадания элементов генеральной совокупности в выборку. Поэтому перед тем как приступить к статистической обработке результатов наблюдений, необходимо убедиться в том, что элементы выборки образуют случайную последовательность. Рассмотрим критерии для проверки случайности и независимости элементов выборки. Критерий серий, основанный на медиане. Этот критерий является ранговым критерием. Пусть имеются выборочные результаты наблюдений: x1 , x2 , ..., xn из некоторой генеральной совокупности. 185 Основная гипотеза H 0 : элементы выборки являются стохастически независимыми. Альтернативная гипотеза H 1 : элементы выборки не являются стохастически независимыми. Далее необходимо составить вариационный ряд из элементов выборки и найти оценку медианы M̂ e . В исходной выборке под каждым наблюдаемым значением признака xi ставится знак «+», если xi  M̂ e и знак «-», если xi  M̂ e . В случае равенства xi  M̂ e знак не ставится (если исходные данные записаны в столбец, то рядом с ним формируется столбец из знаков). Последовательность подряд идущих одинаковых знаков называется серией. Количество серий обозначим ν , а протяжѐнность самой длинной серии - K max . Если одновременно выполнены неравенства:   ν  0 ,5 n  1  zкр n  1 ,   K max  3 ,3 lg n  1 то нет оснований при заданном уровне значимости α отклонить основную гипотезу. В противном случае элементы выборки нельзя считать стохастически независимыми. Здесь z кр находится по таблице Приложения 2 как квантиль уровня 1  α / 2 (при α  0,05 zкр  1,96). Замечание*). Критерий серий, основанный на медиане, улавливает только монотонное изменение среднего. Критерий «восходящих» и «нисходящих» серий. Как и предыдущий, этот критерий является ранговым. Пусть из некоторой генеральной совокупности извлечена выборка, x1 , x2 , ..., xn - результаты наблюдений Основная гипотеза H 0 : элементы выборки 186 являются стохастически независимыми. Альтернативная гипотеза элементы выборки не являются стохастически H1: независимыми. В исходной выборке под каждым наблюдаемым значением признака xi ставится знак «+», если xi  xi  1 и знак «-», если xi  xi  1 . В случае равенства xi  xi  1 знак не ставится (если исходные данные записаны в столбец, то рядом с ним формируется столбец из знаков). Затем подсчитывается количество серий ν и протяжѐнность самой длинной серии K max . Если выполнены оба неравенства:  1 16 n  29    ν  2 n  1  z  кр   90  ,  3  K max  K кр n   то при заданном уровне значимости α нет оснований отклонить основную гипотезу. В противном случае элементы выборки нельзя считать стохастически независимыми. Здесь z кр находится по таблице Приложения 2 как квантиль уровня 1  α / 2 (при α  0,05 zкр  1,96). Верхняя граница определяется в зависимости от объѐма выборки: K кр n =5, если n  26; K кр n =6 для 26  n  153; K кр n =7, если 153  n  1170. Замечание**). Критерий «восходящих» и «нисходящих» серий улавливает смещение оценки математического ожидания монотонного и периодического характера и является более мощным, по сравнению с критерием серий, основанном на медиане. Критерий стохастической независимости Аббе (критерий квадратов последовательных разностей). 187 Данный критерий применяется в тех случаях, когда изучаемый признак имеет нормальное распределение. Пусть основная гипотеза H 0 : элементы выборки являются стохастически независимыми. Конкурирующая гипотеза элементы выборки не являются стохастически H1: независимыми. n 1 2   xi  1  xi  Статистика критерия γ эмп  i 1 2n  1 s 2 , где s 2 - несмещѐнная оценка дисперсии выборки. При n  60 критическое значение γ кр α , n находится по таблице (см. Приложение 12). Если n  60, то нижняя критическая точка находится по формуле: γ кр  1  z кр  n  0 ,5 1  2 z кр  , где z кр находится по таблице Приложения 2 как квантиль уровня 1  α / 2 (при α  0,05 zкр  1,96). Если γ эмп  γ кр , то при заданном уровне значимости α нет оснований отклонить гипотезу о стохастической независимости элементов выборки. Замечание***). Критерий Аббе позволяет обнаружить систематическое смещение среднего в ходе выборочного обследования. Задачи для самостоятельного решения 2.1. Расход Сравниваются сырья две на изготовление технологии одного производства: изделия старая случаен. и новая. Выборочные характеристики соответственно равны: x  307,11 и s12  2 2,378; y  304,77 и s2  1,685. Предполагая, что расход сырья имеет 188 нормальное распределение, выясните, влияет ли технология на средний расход сырья на одно изделие ( α  0,05). 2.2 Проведено исследование розничного товарооборота продовольственных магазинов в двух районах области (по 50 магазинов в каждом). Априори известны средние значения товарооборота – 78,9 и 78,68 тыс. руб. Полученные в результате оценки среднеквадратичных отклонений в первом и втором районах области соответственно равны 7,22 и 7,79 тыс. руб. Можно ли считать, что разброс розничного товарооборота магазинов в районах неодинаков при уровне значимости 0,05? Можно ли сделать вывод о разной покупательной способности населения районов? 2.3. Исследование пропусков по болезни детей в двух группах детского сада в течение года (по 16 детей в каждой группе) дало следующие 2 2 результаты: x  32 дня, y  41 день, s12  9 дней и s22  17 дней . При α  0,1 можно ли считать, что среднее количество дней пропусков по болезни в обеих группах одинаковым? 2.4. Данные о производительности выпуска стиральных машин на двух предприятиях представлены в таблице: xi 82 74 64 72 84 68 76 88 70 60 yi 52 63 72 64 48 70 78 68 70 54 Можно ли считать распределение производительности на обоих предприятиях считать различным при α  0,05? 2.5. Для определения качества технологической операции регулярно осуществляются проверки, которые состоят в измерении одного параметра изделия, прошедшего данную операцию. Имеются данные за два дня: 189 xi 82 74 64 72 84 68 76 88 70 60 yi 52 63 72 64 48 70 78 68 70 54 Необходимо оценить стабильность контролируемой операции (проверив однородность выборок) при уровне значимости α  0,05. 2.6 Группа из 36 человек была разбита на 18 однородных пар на основе отметок, полученных ими при проверке степени уверенности в себе. Затем одна группа (экспериментальная) прошла курс подготовки одновременно с выработкой навыков уверенного поведения, в то время как другая группа (контрольная) прошла этот курс в том же объѐме, но приобретение подобных навыков не предусматривалось. Впоследствии обе группы прошли испытание в условиях нескольких искусственно созданных ситуаций, причем оценивавшие их эксперты не были осведомлены о том, кто получил экспериментальную подготовку. По результатам эксперимента проверьте гипотезу о наличии различий между группами при уровне значимости α  0,05. однородные эксперим. контр. однородные эксперим. контр. пары группа группа пары группа группа 1 89 73 10 55 50 2 83 77 11 64 66 3 80 58 12 54 46 4 72 77 13 50 38 5 77 70 14 42 47 6 74 62 15 48 40 7 69 67 16 44 43 8 65 68 17 38 29 9 60 44 18 36 25 190 Глава 3. Оценивание тесноты взаимосвязи между признаками 3.1. Непараметрические методы оценки взаимозависимости признаков Непараметрические показатели связи применимы для измерения сопряженности между варьирующими признаками независимо от их закона распределения. Кроме того, они позволяют измерять тесноту связи между признаками, значения которых можно ранжировать.  коэффициент Фехнера используется для оценки зависимости между двумя количественными признаками. Для каждого признака по выборочным данным вычисляется средняя величина, а затем определяется знак отклонения текущего значения от его среднего значения. Подсчитывается число соответствий знаков у признаков  c и число несоответствий знаков  н . Далее вычисляется коэффициент Фехнера по формуле: КФ  с  н . с  н Связь считается достаточно тесной, если KФ  0,3. Для измерения связей между признаками, значение которых можно упорядочить (ранжировать) по степени проявления ими анализируемых свойств, применяются коэффициенты ранговой корреляции. Рангом называется номер места значения признака в упорядоченном ряду, если все значения признака – различны. Если же какие-либо значения признака встречаются неоднократно, то ранг вычисляется как среднее арифметическое этих номеров мест.  коэффициент ранговой корреляции Спирмена: n rC  1  6  d i2 i 1 2   n n 1 191 , где n - объем выборки, d i - разность между рангами i -ых значений анализируемых признаков. Пример 1.1. Требуется определить наличие или отсутствие взаимосвязи между накладными расходами по реализации продукции и обеспеченностью товарной продукцией. Результаты выборочной проверки предприятий отрасли представлены в следующей таблице: № обеспеченность предприятия товарной продукцией накладные расходы по реализации 1 12,0 462 2 18,8 939 3 11,0 506 4 29,0 1108 5 18,8 872 6 23,4 765 7 35,6 1368 8 15,4 1002 9 26,0 998 10 20,7 804 Решение: Обозначим через X - обеспеченность товарной продукцией, Y - накладные расходы по реализации. Вычислим коэффициент Фехнера. Для этого вычислим сначала средние значения по каждому признаку: x  21,07 и y  882,4. Далее в отдельном столбце находим знаки разностей xi  x , в другом столбце – знаки разностей yi  y . В следующем столбце определяются совпадения или несовпадения знаков. В итоге получаем:  c  7 и  н  3. Таким образом, значение коэффициента Фехнера: КФ  0,4. Так как значения данных количественных признаков можно упорядочить, то для определения тесноты связи можно использовать 192 также коэффициент ранговой корреляции Спирмена. Составим расчѐтную таблицу. В таблице R X и RY - ранги соответствующих значений признака X и Y . Под последним столбцом записана сумма квадратов рангов. X Y RX RY di d i2 12,0 462 2 1 1 1 18,8 939 4,5 6 -1,5 2,25 11,0 506 1 2 -1 1 29,0 1108 9 9 0 0 18,8 872 4,5 5 -0,5 0,25 23,4 765 7 3 4 16 35,6 1368 10 10 0 0 15,4 1002 3 8 -5 25 26,0 998 8 7 1 1 20,7 804 6 4 2 4 Итого: 50,5 Итак, rC  0,694 . Значения выборочных коэффициентов Фехнера и ранговой корреляции Спирмена свидетельствует о достаточно тесной зависимости величины накладных расходов по реализации продукции от обеспеченности товарной продукцией в выборочной совокупности. ■  коэффициент ранговой корреляции Кендала. Расчет данного коэффициента выполняется в следующей последовательности: 1) значения факторного признака X ранжируются; 2) значения результативного признака Y располагаются в порядке, соответствующем значениям X ; 3) для каждого ранга результативного признака определяется количество следующих за ним значений рангов, превышающих его 193 величину. Суммарная величина P является мерой соответствия последовательности рангов по X и Y ; 4) для каждого ранга Y определяется количество следующих за ним рангов, меньших его величины. Суммарная величина обозначается через Q; 5) вычисляем S K  P  Q , при этом P  Q  nn  1 / 2 ; 6) вычисляем коэффициент корреляции Кендала по формуле: rК  Как правило, 2  SK . nn  1 коэффициент Кендала меньше коэффициента Спирмена. При достаточно большом объеме выборочной совокупности n значения коэффициентов связаны соотношением: rK  2 rC . 3 Пример 1.2. По данным группы предприятий требуется оценить зависимость между величиной уставного капитала X и количеством выставленных акций Y . № Уставной капитал, млн. Число выставленных предприятия руб. акций, тыс. шт. 1 2954 856 2 1603 932 3 4102 1567 4 2350 682 5 2625 616 6 1795 497 7 2813 815 8 1751 858 9 1700 467 10 2264 661 Решение: Для вычисления коэффициента составим расчетную таблицу. 194 ранжирование P Q 9 1 8 467 1 8 0 3 858 8 1 6 1795 4 497 2 6 0 616 2264 5 661 4 4 1 1795 497 2350 6 682 5 3 1 2813 815 2625 7 616 3 3 0 1751 858 2813 8 815 6 2 0 1700 467 2954 9 856 7 1 0 2264 661 4102 10 1567 10 0 0 Итого 29 16 X Y 2954 X RX Y RY 856 1603 1 932 1603 932 1700 2 4102 1567 1751 2350 682 2625 S K  P  Q  29-16=13, корреляции Кендала тогда равно: значение коэффициента rK  (2•13)/(10•9)=0,29. ранговой Столь малое значение коэффициента свидетельствует о наличии слабой связи между рассматриваемыми роизнаками. ■  коэффициент конкордации Кендала: rW  где SW  n  S i  S  i 1 2  n    S i  n   S i2   i  1  n i 1 12  SW k 2 n3  n , 2 - сумма квадратов отклонений сумм рангов наблюдений от их общего среднего ранга, S i  k  Rij , Rij j 1 - ранг i -го наблюдения по j -ому признаку, k - число признаков ( k >2). Коэффициент конкордации рангов Кендала используют тогда, когда 195 необходимо установить статистическую связь между несколькими признаками, значения которых можно ранжировать. С помощью этого коэффициента принято оценивать согласованность мнений группы экспертов. Пример 1.3. Определить тесноту взаимосвязи между признаками, значения которых представлены в таблице. Индивидуальные оценки экспертов коммуникабельности претендентов претенденты 1 эксперт 2 эксперт 3 эксперт Иванов 0,198 0,204 0,184 Петров 0,119 0,098 0,125 Сидоров 0,211 0,234 0,198 Лялькин 0,176 0,196 0,202 Валькин 0,208 0,231 0,219 Кузьмин 0,165 0,174 0,186 Брекоткин 0,335 0,402 0,373 Мухин 0,105 0,143 0,124 Бабкин 0,112 0,132 0,109 Шуртиков 0,241 0,262 0,275 Решение: Проранжируем оценки экспертов для каждого претендента, промежуточные и итоговые расчеты оформим в таблице. 10 10 i 1 i 1 2  S i  165,  Si  3421, SW  3421-165•165/10=3421-2722.5=698.5 Тогда значение коэффициента конкордации Кендала равно: rW  0,9407. Полученное значение свидетельствует согласованности мнений экспертов. 196 о высокой степени R1 R2 R3 Si S i2 Иванов 6 6 4 16 256 Петров 3 1 3 7 49 Сидоров 8 8 6 22 484 Лялькин 5 5 7 17 289 Валькин 7 7 8 22 484 Кузьмин 4 4 5 13 169 Брекоткин 10 10 10 30 900 Мухин 1 3 2 6 36 Бабкин 2 2 1 5 25 Шуртиков 9 9 9 27 729 Итого 165 3421 претенденты ■ Задачи для самостоятельного решения 1.1 Определите силу взаимосвязи между признаками X и Y с помощью коэффициента ранговой корреляции Спирмена ( α =0,05): №завода Уровень механизации, X ,% Трудоемкость единицы продукции, Y , млн. 1 2 3 4 5 6 7 8 9 10 62 60 64 69 67 61 63 66 65 68 13 14 14 7 13 12 15 10 12 8 1.2 По данным итогов торгов (см. таблицу) на биржевом рынке с 06.03.9* — 12.03.9* определите степень зависимости средней цены сделки от номинальной стоимости акции с помощью коэффициентов ранговой корреляции Спирмена и Кендала ( α =0,05): 197 № п/п Эмитент 1 2 3 4 5 6 7 8 9 10 Средневолжский КБ «Кубань банк» «Автогаз банк» АКБ «АвтоВаз банк» «Алмазы Якутии» ТНК «Гермес-Союз» «Олби-Дипломат» Сиб. торговый банк «AVVA» АО «МММ» Номинал, тыс. Средняя цена сделки, тыс. руб. X руб. Y 1,0 2,0 1,0 6,0 1,0 4,0 1,0 4,0 2,5 7,8 10,0 16,0 10,0 11,0 5,0 18,0 10,0 16,4 1,0 5,7 1.3 По следующим данным (см. таблицу) о прибыли ( Y ,млн. руб.), затратах на 1 рубль произведенной продукции ( X , руб.), стоимости основных производственных фондов ( Z , млн. руб.) определите тесноту связи между признаками ( α =0,05): Y Z X 221 96 4,3 1070 77 5,9 1001 78 6,0 606 89 3,9 779 82 4,6 789 81 4,9 3.2. Параметрические методы оценки взаимосвязи  коэффициент ассоциации Юла применяется для оценки тесноты взаимосвязи между двумя качественными признаками, каждый из которых принимает только два возможных значения. Для его расчѐта составляется таблица «тетрахорических показателей»: да нет да a b нет c d X Y Числа a , b , c , d  5 представляют частоты появлений определенных значений признаков. Коэффициент ассоциации вычисляется по формуле: K ac .  ad  bc . ad  bc 198 Связь считается достаточно тесной, если K ac .  0,5. Однако, если одна из частот a , b , c или d равна нулю, то K ac .  1, что может не соответствовать действительности. В таких случаях тесноту взаимосвязи оценивают с помощью следующего коэффициента.  коэффициент контингенции Пирсона: K kont  ad  bc . a  bb  d c  d a  c  Связь считается достаточно тесной, если K kont  0,3. Для качественных признаков, состоящих более чем из двух групп, тесноту взаимосвязи определяют с помощью коэффициентов взаимной сопряженности:  коэффициент взаимной сопряженности Пирсона: KП  φ2 1 φ 2 , 2 где φ2 - показатель взаимной сопряженности: 1  φ   n 2xy i , j nx  n y , n xy , n x , n y - частоты совместного появления значений признаков и каждого в отдельности;  коэффициент взаимной сопряженности Чупрова: KЧ  φ2 , k1  1k2  1 где k1 и k 2 - число значений (групп) соответственно у первого и второго признаков. 199 Задачи для самостоятельного решения 2.1 По следующим данным о распределении строительных фирм по уровню рентабельности R (в %) и удельному весу активной части основных фондов d (в %) рассчитайте коэффициенты взаимной сопряженности Пирсона и Чупрова: d высокий средний низкий высокий 6 10 25 средний 19 30 20 низкий 35 10 5 R 2.2 По данным о распределении числа погибших и раненых в зависимости от причины наезда рассчитайте показатели взаимосвязи: причина наезда погибло ранено вина водителей 26807 146685 вина пешеходов 6451 40293 2.3 Вычислите коэффициент взаимной сопряженности Чупрова по распределению некоторых преступлений в регионе и их раскрываемости виды преступлений раскрыты не раскрыты разбой 110 40 мошенничество 180 65 50 25 10 20 умышленное убийство поджог 2.4 В таблице представлены результаты обследования состояния гланд у 265 учащихся младших классов. Рассчитайте показатели взаимосвязи. 200 Классы, в которых производился Обнаружено детей здоровых больных всего 3 и 4 классы 63 92 155 5 и 6 классы 71 39 110 134 131 265 осмотр учащихся всего 3.3. Проверка гипотез о значимости коэффициентов взаимосвязи Статистическая проверка гипотез о числовых значениях параметров осуществляется по схеме, описанной в главе 2 (2.1): В таблице 5 приведены критерии проверки гипотез о значимости коэффициента Фехнера, коэффициента ранговой корреляции Спирмена, коэффициентов ассоциации и контингенции, коэффициентов взаимной сопряженности Пирсона и Чупрова, коэффициента ранговой корреляции Кендала и коэффициента конкордации Кендала. Задачи 3.1 Для коэффициентов взаимосвязи, вычисленным для задач 1.1.- 1.3, проверьте гипотезы о значимости этих коэффициентов. 3.2 Для коэффициентов взаимосвязи, вычисленным для задач 2.1.- 2.4, проверьте гипотезы о значимости этих коэффициентов. 201 Таблица 5 нулевая гипотеза H 0 альтернативная гипотеза H 1 статистика критерия K  0, где K - коэффициент ассоциации Юла или контингенции Пирсона K 0 2 χ эмп nad  bc 2  a  ba  c b  d c  d  K  0, где K - коэффициент взаимной сопряженности Пирсона или Чупрова K 0 r  0, где 2 χ эмп nn    ni j  i j  k1 k 2 n     ni n j / n i  1j  1 Tэмп  rв n2 r 0 r  0, где r - коэффициент ранговой r 0 Z эмп  rв r 0 2 χ эмп  корреляции Кендала r  0, где r - коэффициент конкордации Кендала 202 9nn  1 22n  5  12 SW k nn  1 2 2 α ; 1 χ эмп  χ кр 2 , где rв - значение 2 1  rв коэффициента, вычисленное по данным выборки r - коэффициент ранговой корреляции Спирмена или коэффициент Фехнера критическая область 2 2 α ; k1  1k2  1 χ эмп  χ кр α  Tэмп  Tкр  , n  2  2  Z эмп  Z кр α  2 2 α ; n  1 χ эмп  χ кр 3.4. Корреляционно-регрессионный анализ Корреляционно-регрессионный анализ – это статистический метод анализа выявления выборочных взаимосвязи Предполагается, что наблюдений, между на предназначенный количественными формирование средних для признаками. значений результативного признака Y возможно оказывают влияние факторные признаки X1 , X 2 ,..., X k . При этом наблюдения над признаком Y должны быть независимыми, выборочная совокупность должна быть достаточно однородной в отношении изучаемого признака и подчиняться нормальному закону распределения вероятностей по результативному и факторным признакам. Задача состоит в том, чтобы: 1) определить, какое влияние оказывают факторные признаки на результативный признак, насколько тесно они связаны между собой (корреляционный анализ); 2) установить аналитическое выражение связи, выбрать наилучшую модель (регрессионный анализ). Строится статистическая модель: Y  f  X1 , X 2 ,..., X k   ε , где Y – наблюдаемые значения результативного признака; f  X1 , X 2 ,..., X k  – аналитическое выражение для определения средних значений признака Y ; ε – случайные отклонения. Линейный регрессионный анализ заключается в подборе прямой для набора наблюдений с помощью метода наименьших квадратов. Линейная статистическая модель имеет вид: Y  α0  α1  X1  α2  X 2  ...  αk  X k  ε , где α 0 , α1 ,…, α k – параметры уравнения регрессии; ε – случайное отклонение. По выборке находят оценки a0 , a1 , a2 ,...,ak α0 , α1 , α2 ,...,αk . Тогда функция регрессии будет иметь вид: 203 параметров Yˆ  a0  a1  X1  a2  X 2  ...  ak  X k . Факторные признаки могут иметь различные единицы измерения. Чтобы избежать суммирования величин разной размерности функцию регрессии представляют в стандартизированном масштабе: ZY  b1  Z X1  b2  Z X 2  ...  bk  Z X k , где ZY  Y Y , σY Xi  Xi - стандартизированные переменные, σXi Z Xi  bi - стандартизированные коэффициенты регрессии. Стандартизированный коэффициент регрессии bi показывает, на какую часть своего среднего квадратического отклонения σY изменится результативный признак Y , если фактор X i увеличится на σ X i при неизменном влиянии прочих факторов модели. Связь коэффициентов множественной регрессии ai со стандартизированными коэффициентами описывается соотношением: ai  bi σY . σXi Для того, чтобы выяснить, насколько процентов в среднем изменится результативный признак Y , если факторный признак X i увеличится на 1% от своего среднего уровня при неизменных значениях остальных факторов, эластичности: рассчитывают Ei Y   ai средние коэффициенты Xi . Y Коэффициенты эластичности и стандартизированные частные коэффициенты регрессии можно использовать для ранжирования факторов по силе влияния на результат. Чем больше величина Ei Y  или bi , тем сильнее влияет фактор X i на результат Y . Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным и осуществляют на основе 204 анализа остатков: ei  yi  yˆ i , где yi - i-ое наблюдаемое значение результативного признака, ŷi - расчетное i-ое значение результативного признака, полученное на основе функции регрессии. Отношение 2 Ŷ (дисперсии признака Y , «объясненную» уравнением регрессии) к общей дисперсии результативного признака σY2 называют коэффициентом  2ˆ  e2 Y R   1 , 2 2 Y Y 2 детерминации: где σ e2 - дисперсия остатков. Проверка значимости уравнения регрессии осуществляется с 2 помощью критерия Фишера: выдвигают основную гипотезу H 0 : R  0 о незначимости уравнения в целом и альтернативную ей гипотезу H 1 : R 2  0 о значимости уравнения. Эмпирическое значение F -статистики: Fэмп  R2 n k 1 k 1  R2  сравнивают с критическим значением Fкр α , γ1 , γ 2  , где α =0,05 – уровень значимости; γ1  k , γ2  n  k  1 распределения Фишера-Снедеккора. Если - степени свободы Fэмп  Fкр α , γ1 , γ 2 , то гипотезу о незначимости отвергают. Оценку качества построенной модели дает также средняя ошибка аппроксимации: 1 n yi  yˆ i A   100 . n i 1 yi Допустимый предел значений A - не более 8-10%. 205 Для количественной оценки взаимосвязи двух наборов данных, представленном в безразмерном коэффициент корреляции rij :  виде,  cov X i , X j rij  si  s j  используется парный , где cov X i , X j - ковариация факторов X i и X j , si и s j - выборочные средние квадратические отклонения этих факторов. Из парных коэффициентов корреляций составляется корреляционная матрица: X1 При X3 X2 … Xk X1 1 X2 r21 1 X3 r31 r32 1 : : : : : : Xk rk 1 rk 2 rk 3 … 1 построении уравнения множественной регрессии может возникнуть проблема мультиколлинеарности факторов, их тесной линейной связанности. Считается, что две переменные явно коллинеарны, если rij  0,7 . По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами det R . Чем ближе det R к 0, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И наоборот, чем ближе det R к 1, тем меньше мультиколлинеарность факторов. 206 Для проверки основной H 0 : det R  1 гипотезы вычисляют эмпирическое значение статистики: 1   2 χ эмп  n  1  2k  5 lg det R  6   и сравнивают его с критическим значением.     Если χ эмп  χ кр  α , nn  1 , то гипотеза H 0 - отклоняется. Для 2 2 1 2 небольших выборок ( n  15 ) критическое значение находят по таблицам, а для выборок большего объема χ кр  2   1 2 1,96  2n - 1 . 2 Другая проблема, которая может возникнуть при построении модели множественной регрессии – наличие гетероскедастичности. Это значит, что для каждого значения фактора X i остатки εi имеют различную дисперсию. Для проверки на наличие гетероскедастичности можно использовать тест Голфелда-Квандта (при небольшом объме выборки), либо тест ранговой корреляции Спирмена. Рассмотрим однофакторную модель. Пусть имеется n наблюдений над двумя признаками X и Y . Их наблюдаемые значения  xi , yi  можно представить в виде точек на плоскости. Полученное множество точек («облако Визуальный точек») анализ называется расположения корреляционным этого «облака» полем. позволяет сформулировать гипотезу о наличии и форме связи между признаками. Для оценки тесноты линейной связи между факторным и результативным признаками X и Y вычисляют коэффициент корреляции: ____ r __ __ x y  x  y  x  y 207 . выборочный Статистическая оценка средних значений результативного признака Y в зависимости от различных значений факторного признака X  называется парной регрессией: Y  f  X . Различают линейные и нелинейные регрессии. Линейная регрессия: Y  a0  a1  X  ε (по значениям выборочного коэффициента корреляции и оценке средних значений факторного и результативного ŷ  r признаков можно получить уравнение σY  x  x   y ). σX Нелинейные регрессии:  полиномы Y  a0  a1  X  a2  X  ...  ak  X 2 a  гипербола Y  a0  1  ε; X a  степенная Y  a0  X 1  ε;  показательная Y  a0  a1  ε; X a a  X  экспоненциальная Y  e 0 1  ε;  полулогарифмическая Y  a0  a1  ln X  ε;  обратная Y  1 . a0  a1  X  ε 208 k  ε; регрессии: Задачи для самостоятельного решения 4.1 Имеются данные о личном доходе и личных сбережениях в Великобритании (в млрд. ф. ст.): Год 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 Доход, X 8,8 9,4 10,0 10,6 11,0 11,9 12,7 13,5 14,3 15,5 16,7 17,7 18,6 19,7 21,1 22,8 23,9 25,2 Постройте Сбережения, Y 0,36 0,21 0,08 0,20 0,10 0,12 0,41 0,50 0,43 0,59 0,90 0,95 0,82 1,04 1,53 1,94 1,75 1,99 корреляционное поле. Сделайте предположение о характере зависимости. Определите тесноту взаимосвязи между признаками. Проверьте значимость коэффициента взаимосвязи на уровне значимости Получите α =0,05. уравнение регрессии. 4.2. Изучается зависимость стоимости одного экземпляра книг (руб. Y ) от тиража (тыс. экземпляров, X ) по следующим данным: X 1 2 3 5 10 20 30 50 Y 9,10 5,30 4,11 2,83 2,11 1,62 1,41 1,30 Сделайте предположение о характере зависимости. Постройте модели, выберите лучшую, оцените значимость коэффициентов регрессии. 4.3. Имеются данные по странам за 1994 г. о душевом доходе (по паритету покупательной способности валют) - X (долл.), индексе человеческого развития - Y1 , индексе человеческой бедности - Y2 . 209 1) Получите описательные статистики. Проверьте характер распределения признаков. При необходимости удалите аномальные наблюдения. 2) Постройте матрицу парных коэффициентов корреляции. 3) Постройте парные линейные уравнения регрессии, принимая душевой доход в качестве объясняющей переменной. Постройте графики остатков. Сделайте выводы. 4) Оцените значимость уравнений регрессии в целом и их параметров. Сравните полученные результаты, выберите лучшую модель. Страна ОАЭ Таиланд Уругвай Ливия Колумбия Иордания Египет Марокко Перу Шри-Ланка Филиппины Боливия Китай Зимбабве Пакистан Уганда Нигерия Индия X Y1 Y2 1600 7100 6750 6130 6110 4190 3850 3680 3650 3280 2680 2600 2600 2200 2150 1370 1350 1350 0,866 0,833 0,883 0,801 0,848 0,730 0,514 0,566 0,717 0,711 0,672 0,589 0,626 0,513 0,445 0,328 0,393 0,446 14,9 11,7 11,7 18,8 10,7 10,9 34,8 41,7 22,8 20,7 17,7 22,5 17,5 17,3 46,8 41,3 41,6 36,7 210 Лабораторный практикум по математической статистике Задача 1. В таблицах на стр. 207 - 210 приводятся наблюдаемые выборочные значения исследуемого признака Xk (номер признака студент определяет по своему порядковому номеру в журнале). Задание: 1) получить интервальный вариационный ряд (разбить выборку на 5 групп); построить гистограмму относительных частот и сформулировать гипотезу о характере распределения признака; 2) от интервального ряда распределения перейти к дискретному и построить полигон относительных частот; 3) построить эмпирическую функцию распределения; 4) получить точечные оценки параметров распределения признака и интервальные с надѐжностью 0,95; 5) проверить гипотезу о законе распределения признака; Задача 2. В таблице на стр. 211 - 212 приведены ежегодные данные о потребительских расходах и располагаемых личных доходах для США на период с 1959 по 1983 гг. По своему порядковому номеру в журнале студент определяет номер результативного признака Yk . Факторный признак X у всех одинаковый. Задание: 1) получите точечные и интервальные оценки средних значений каждого признака с надѐжностью γ =0,95; 2) постройте корреляционное поле. Сформулируйте гипотезу о форме связи; 3) рассчитайте параметры уравнения парной регрессии; 211 4) оцените тесноту связи с помощью показателя детерминации; 5) оцените качество уравнения с помощью средней ошибки аппрок- симации; 6) дайте с помощью среднего коэффициента эластичности сравни- тельную оценку силы связи фактора с результатом; 7) рассчитайте ожидаемое значение результата, если значение фактора увеличится на 5% от его последнего значения. Рассматриваются следующие показатели (млрд.долл. в сопоставимых ценах): факторный признак X - совокупные результативные признаки: Y1 – совокупные личные расходы; Y2 – текущие расходы на питание; Y3 – расходы на одежду; Y4 – расходы на бензин; Y5 – расходы на косметику; Y6 – расходы на лекарства; Y7 – плата за жильѐ; Y8 – расходы на ювелирные изделия; Y9 – оплата услуг стоматологов; Y10 – расходы на табак; Y11 – плата за телефон; Y12 – оплата медицинских услуг; Y13 – расходы отдых; Y14 – расходы на частное образование; Y15 – расходы на посуду. 212 личные доходы; Исходные данные для задачи №1: X1 X2 X3 X4 X5 X6 X7 X8 10,19 3,72 1,24 3,14 30,65 7,38 -1,18 1,12 7,36 8,43 1,60 -3,51 69,08 -3,44 2,63 11,76 14,07 4,39 0,54 5,70 37,61 5,55 1,48 1,05 10,02 3,68 2,19 -7,98 87,82 -0,85 2,45 -0,65 11,86 8,32 -0,94 -6,19 94,40 -4,73 4,14 -1,99 11,02 3,80 -0,56 8,60 77,60 -4,10 4,44 12,91 10,93 3,62 1,21 -3,81 2,46 -12,02 -0,84 -4,39 8,19 4,55 -0,12 -6,95 45,25 -5,62 3,85 1,01 9,78 3,14 2,14 4,25 5,13 10,72 2,42 12,01 10,11 8,84 2,25 -10,74 55,74 -1,85 0,54 9,68 9,18 4,35 0,72 2,31 42,42 4,70 1,46 5,53 9,23 1,34 0,91 -1,41 80,48 -1,37 6,45 3,79 13,03 5,48 2,09 2,29 28,26 0,35 1,95 3,95 7,42 4,06 3,26 3,46 51,76 0,41 1,21 3,80 12,46 4,87 1,80 -3,71 17,81 -4,99 3,19 3,12 8,35 2,46 1,10 -5,17 11,14 -10,02 4,63 -5,46 12,34 2,03 1,19 1,43 9,86 8,49 4,80 -9,90 7,27 5,93 -0,49 2,86 37,24 -0,89 1,02 0,34 7,95 4,51 0,53 10,20 62,66 -2,72 1,44 10,76 10,05 5,03 0,33 -0,03 10,89 -1,15 -0,03 -1,02 8,78 3,88 1,16 -1,51 46,17 8,35 0,68 -8,70 8,57 6,17 -1,95 -1,48 2,37 -0,57 2,13 1,73 13,94 4,33 1,08 -6,93 6,46 6,47 4,05 -2,67 7,36 2,40 -1,78 -2,13 86,13 3,57 4,11 7,35 7,74 7,25 1,82 -3,67 17,99 3,56 3,99 -7,24 12,75 4,45 -0,03 4,38 64,17 -5,78 3,44 5,61 213 Продолжение таблицы: 9,68 3,26 3,74 6,94 69,70 3,21 2,53 -3,70 7,23 5,37 1,53 -2,78 45,28 -6,40 2,58 1,60 7,54 5,02 0,22 3,03 43,68 -0,16 1,22 6,33 12,97 7,12 -1,75 5,20 36,49 -0,36 0,97 0,27 9,57 9,25 3,47 -2,59 65,78 3,47 0,92 9,29 7,67 7,65 -0,16 -2,67 97,32 4,71 4,26 1,06 10,95 5,27 0,90 -0,62 81,35 12,23 1,14 2,34 11,82 4,15 -0,96 8,59 91,86 1,61 1,24 6,07 6,41 4,28 0,29 -0,06 15,76 -1,30 0,08 5,13 8,25 3,02 1,71 -2,03 37,25 13,53 0,26 6,54 12,75 4,16 2,26 1,79 87,01 18,25 2,56 -1,83 11,77 3,33 0,29 4,90 88,84 -9,32 1,45 14,04 12,94 1,40 -0,90 3,04 15,45 1,18 2,67 3,40 11,23 5,08 -0,54 5,53 13,72 2,70 3,91 2,22 10,79 3,00 0,85 0,39 92,32 4,68 0,80 15,03 7,04 5,30 1,90 -2,24 39,19 6,54 2,82 7,10 11,96 6,04 -0,94 -6,29 86,79 -5,03 1,81 -10,38 6,95 6,53 -0,67 -3,63 29,96 1,11 3,41 11,97 9,88 7,13 0,89 -2,19 61,62 3,41 2,92 7,83 11,83 6,40 1,46 5,74 47,83 -5,97 0,97 1,89 12,11 5,74 2,85 3,67 39,96 10,05 3,01 3,41 11,70 4,15 -0,85 5,91 46,18 -6,21 1,25 5,54 8,32 3,06 -0,40 -0,34 82,89 -3,43 2,37 4,86 9,94 6,47 -1,28 8,95 57,75 1,71 3,48 5,81 214 Исходные данные для задачи №1: X9 X10 X11 X12 X13 X14 X15 3,10 -7,89 37,21 2,31 0,54 10,75 14,49 1,91 -3,90 39,14 6,97 7,98 17,87 17,47 -0,38 0,28 -41,86 4,15 7,09 13,52 18,40 -0,65 -4,20 0,37 3,87 10,92 14,53 15,99 2,88 -10,03 1,49 5,83 8,73 18,22 19,16 0,11 -8,58 11,54 2,97 -3,43 12,76 18,91 1,57 -8,05 44,15 4,85 4,21 13,23 15,49 1,46 -4,10 -7,88 4,30 5,29 16,89 10,95 4,55 -3,84 -40,13 2,63 -0,05 14,29 13,75 -0,22 -2,73 37,70 1,69 -0,20 14,93 16,34 2,28 -6,74 -31,94 4,69 3,69 12,39 12,78 0,04 -9,23 -26,87 3,10 4,33 16,79 14,28 0,39 -3,27 -28,18 1,66 6,56 14,22 17,77 -1,22 0,63 37,00 4,75 1,19 13,56 9,78 -1,15 -6,47 -40,31 4,43 -2,62 11,25 18,34 0,83 -3,02 -43,79 3,60 3,61 13,92 13,22 -0,88 -4,20 -10,16 4,92 4,16 10,37 21,98 3,45 -4,29 -48,65 2,66 3,89 16,63 10,62 0,28 -1,22 33,56 3,55 -0,86 12,79 15,14 0,85 -2,88 12,30 -0,49 -3,90 9,51 12,46 1,83 -10,31 45,62 1,84 3,51 22,38 16,41 1,49 -6,09 -44,74 3,59 0,09 13,20 18,62 0,70 -2,75 -13,01 4,00 -12,37 14,73 21,36 0,58 -4,63 -35,10 3,05 5,65 16,23 10,53 2,64 -9,26 41,92 4,37 -4,22 12,68 12,12 215 Продолжение таблицы: 2,65 -5,09 -20,97 3,32 7,65 11,21 14,10 -0,10 -5,47 33,04 5,64 8,73 16,29 13,90 3,58 -9,90 7,70 2,08 5,49 13,26 12,10 0,70 -0,82 -7,97 3,71 -8,97 12,42 14,38 0,03 -6,90 -23,53 4,38 1,73 17,21 18,37 0,61 -2,86 -4,77 5,34 15,06 19,17 14,71 3,06 -1,98 33,41 3,24 -0,56 11,08 13,64 -0,24 -0,58 25,83 1,67 0,18 16,72 15,85 -0,26 -1,63 48,38 3,88 8,40 9,82 16,02 2,49 -7,11 -0,45 1,78 1,05 11,21 8,84 1,50 -7,44 -15,33 3,92 0,09 11,58 14,23 2,45 -0,61 -19,79 0,90 7,80 16,45 15,27 -0,66 -4,54 -17,20 3,92 4,24 12,48 14,27 -1,74 -6,73 -2,85 2,90 7,52 18,18 17,69 1,14 -5,94 -43,11 3,20 3,19 16,25 17,78 -0,44 -11,46 -40,51 2,51 0,88 16,92 20,57 -0,54 -5,65 -30,83 3,31 -5,26 18,82 11,01 3,49 -2,64 -8,64 6,02 1,87 15,81 15,89 1,08 -7,53 -7,03 2,44 8,25 16,21 13,93 0,34 -5,79 34,12 5,00 1,49 19,30 15,70 -0,65 -4,71 -47,22 3,73 -0,02 17,13 19,09 1,69 -3,63 -41,47 5,45 5,78 10,39 16,05 -1,71 -10,85 -29,49 4,40 -1,50 17,97 18,99 1,56 -8,65 11,93 1,98 -3,05 15,69 15,29 3,32 -1,55 42,75 -0,12 6,16 11,50 16,15 216 Исходные данные для задачи №2 годы X Y1 Y2 Y3 Y4 Y5 Y6 Y7 1959 479,7 440,4 99,7 36,3 13,7 3,1 3,5 60,9 1960 489,7 452,0 100,9 36,6 14,2 3,5 3,9 64,0 1961 503,8 461,4 102,5 37,3 14,3 3,9 4,3 67,0 1962 524,9 482,0 103,5 38,9 14,9 4,2 4,7 70,7 1963 542,3 500,5 104,6 39,6 15,3 4,5 4,9 74,0 1964 580,8 528,0 108,8 42,6 16,0 4,8 5,1 77,4 1965 616,3 557,5 113,7 44,2 16,8 5,3 5,3 81,6 1966 646,8 585,7 116,6 46,9 17,8 5,9 5,5 85,3 1967 673,5 602,7 118,6 46,9 18,4 6,3 5,8 89,1 1968 701,3 634,4 123,4 49,0 19,9 6,6 6,4 93,5 1969 722,5 657,9 125,9 50,0 21,4 6,8 7,0 98,4 1970 751,6 672,1 129,4 49,4 22,9 7,0 7,7 102,0 1971 779,2 696,8 130,0 51,8 24,2 7,1 8,0 106,4 1972 810,3 737,1 132,4 55,4 25,4 7,4 8,7 112,5 1973 865,3 768,5 129,4 59,3 26,2 7,9 9,3 118,2 1974 858,4 763,6 128,1 58,7 24,8 7,8 9,8 124,2 1975 875,8 780,2 132,3 60,9 25,6 7,4 9,7 128,3 1976 906,8 823,1 139,7 63,8 26,8 7,5 10,0 134,9 1977 942,9 864,3 145,2 67,5 27,7 7,8 10,2 141,3 1978 988,8 903,2 146,1 73,6 28,3 8,1 10,4 148,5 1979 1015,5 927,6 149,3 76,7 27,4 8,4 10,8 154,8 1980 1021,6 931,8 153,2 77,9 25,1 8,3 10,7 159,8 1981 1049,3 950,9 153,0 82,6 25,1 8,3 10,6 164,8 1982 1058,3 963,3 154,6 84,2 25,3 8,1 10,3 167,5 1983 1095,4 1009,2 161,2 88,5 26,1 8,1 10,2 171,3 217 Продолжение таблицы X Y8 Y9 Y10 Y11 479,7 2,2 3,2 10,7 4,7 8,8 9,6 5,6 2,6 489,7 2,2 3,2 10,9 5,0 9,0 10,0 6,0 2,5 503,8 2,2 3,3 11,2 5,4 9,1 10,4 6,3 2,5 524,9 2,3 3,5 11,2 5,7 9,8 10,9 6,6 2,6 542,3 2,5 3,4 11,4 6,1 10,2 11,3 7,0 2,5 580,8 2,6 3,9 11,3 6,6 11,9 11,6 7,4 2,8 616,3 2,9 4,0 11,6 7,3 12,1 11,9 8,1 3,1 646,8 3,6 4,1 11,7 8,1 12,1 12,4 8,8 3,5 673,5 3,9 4,3 11,8 8,7 12,5 12,7 9,3 3,7 701,3 4,1 4,4 11,7 9,5 12,8 13,4 10,0 3,8 722,5 4,1 4,8 11,4 10,4 13,6 14,1 10,6 3,8 751,6 4,1 5,1 11,7 11,2 14,4 14,6 10,9 3,7 779,2 4,3 5,1 11,8 11,7 14,8 15,1 11,2 3,8 810,3 4,6 5,3 12,2 12,4 15,7 15,8 11,7 4,0 865,3 5,2 6,1 12,8 13,7 16,9 16,9 11,9 4,2 858,4 5,4 6,2 13,0 14,4 17,2 17,6 11,7 4,1 875,8 5,5 6,4 12,9 15,9 17,8 17,9 12,1 3,7 906,8 6,1 6,9 13,7 17,1 18,0 19,1 12,2 3,9 942,9 6,3 7,2 13,1 18,3 19,2 20,4 12,2 4,1 988,8 6,8 8,1 13,5 20,0 18,6 21,8 12,7 4,3 1015,5 6,7 7,9 13,7 21,6 20,1 22,2 13,1 4,5 1021,6 6,3 8,1 13,6 22,7 21,5 23,4 13,3 4,4 1049,3 6,6 8,5 14,0 23,3 22,0 26,1 13,7 4,4 1058,3 6,7 8,6 13,7 24,1 22,4 27,7 13,6 4,3 1095,4 7,0 8,5 13,0 24,2 23,3 29,8 13,7 4,7 218 Y12 Y13 Y14 Y15 ПРИЛОЖЕНИЕ №1 Значения функции φ(x)  0 1 2 3 4 5 1 2π x2 e 2 - 6 7 8 9 0,0 0,3989 3989 3989 3988 3986 3984 3982 3980 3977 3973 0,1 3970 3965 3961 3956 3951 3945 3939 3932 3925 3918 0,2 3910 3902 3894 3885 3876 3867 3857 3847 3836 3825 0,3 3814 3802 3790 3778 3765 3752 3739 3726 3712 3697 0,4 3683 3668 3652 3637 3621 3605 3589 3572 3555 3538 0,5 3521 3503 3485 3367 3448 3429 3410 3391 3372 3352 0,6 3332 3312 3292 3271 3251 3230 3209 3187 3166 3144 0,7 3123 3101 3079 3056 3034 3011 2989 2966 2943 2920 0,8 2897 2874 2850 2827 2803 2780 2756 2732 2709 2685 0,9 2661 2637 2613 2589 2565 2541 2516 2492 2468 2444 1,0 2420 2396 2371 2347 2323 2299 2275 2251 2227 2203 1,1 2179 2155 2131 2107 2083 2059 2036 2012 1989 1965 1,2 1942 1919 1895 1872 1849 1826 1804 1781 1758 1736 1,3 1714 1691 1669 1647 1626 1604 1582 1561 1539 1518 1,4 1497 1476 1456 1435 1415 1394 1374 1354 1334 1315 1,5 1295 1276 1257 1238 1219 1200 1182 1163 1145 1127 1,6 1109 1092 1074 1057 1040 1023 1006 0989 0973 0957 1,7 0940 0925 0909 0893 0878 0863 0848 0833 0818 0804 1,8 0790 0775 0761 0748 0734 0721 0707 0694 0681 0669 1,9 0656 0644 0632 0620 0608 0596 0584 0573 0562 0551 219 Продолжение таблицы 2,0 0,0540 0529 0519 0508 0498 0488 0478 0468 0459 0449 2,1 0440 0431 0422 0413 0404 0396 0387 0379 0371 0363 2,2 0355 0347 0339 0332 0325 0317 0310 0303 0297 0290 2,3 0283 0277 0270 0264 0258 0252 0246 0241 0235 0229 2,4 0224 0219 0213 0208 0203 0198 0194 0189 0184 0180 2,5 0175 0171 0167 0163 0158 0154 0151 0147 0143 0139 2,6 0136 0132 0129 0126 0122 0119 0116 0113 0110 0107 2,7 0104 0101 0099 0096 0093 0091 0088 0086 0084 0081 2,8 0079 0077 0075 0073 0071 0069 0067 0065 0063 0061 2,9 0060 0058 0056 0055 0053 0051 0050 0048 0047 0045 3,0 0044 0043 0042 0040 0039 0038 0037 0036 0035 0034 3,1 0033 0032 0031 0030 0029 0028 0027 0026 0025 0025 3,2 0024 0023 0022 0022 0021 0020 0020 0019 0018 0018 3,3 0017 0017 0016 0016 0015 0015 0014 0014 0013 0013 3,4 0012 0012 0012 0011 0011 0010 0010 0010 0009 0009 3,5 0009 0008 0008 0008 0008 0007 0007 0007 0007 0006 3,6 0006 0006 0006 0005 0005 0005 0005 0005 0005 0004 3,7 0004 0004 0004 0004 0004 0004 0003 0003 0003 0003 3,8 0003 0003 0003 0003 0003 0002 0002 0002 0002 0002 3,9 0002 0002 0002 0002 0002 0002 0002 0002 0001 0001 220 ПРИЛОЖЕНИЕ 2 Значения функции Лапласа Ф(z)  z Ф(z) z Ф(z) z z 1 2π Ф( z) t2 e 2 dt - z Ф( z) 0,00 0,5000 0,40 0,6554 0,80 0,7881 1,20 0,8849 0,01 0,5040 0,41 0,6591 0,81 0,7910 1,21 0,8869 0,02 0,5080 0,42 0,6628 0,82 0,7939 1,22 0,8883 0,03 0,5120 0,43 0,6664 0,83 0,7967 1,23 0,8907 0,04 0,5160 0,44 0,6700 0,84 0,7995 1,24 0,8925 0,05 0,5199 0,45 0,6736 0,85 0,8023 1,25 0,8944 0,06 0,5239 0,46 0,6772 0,86 0,8051 1,26 0,8962 0,07 0,5279 0,47 0,6808 0,87 0,8078 1,27 0,8980 0,08 0,5319 0,48 0,6844 0,88 0,8106 1,28 0,8997 0,09 0,5359 0,49 0,6879 0,89 0,8133 1,29 0,9015 0,10 0,5398 0,50 0,6915 0,90 0,8159 1,30 0,9032 0,11 0,5438 0,51 0,6950 0,91 0,8186 1,31 0,9049 0,12 0,5478 0,52 0,6985 0,92 0,8212 1,32 0,9066 0,13 0,5517 0,53 0,7019 0,93 0,8238 1,33 0,9082 0,14 0,5557 0,54 0,7054 0,94 0,8264 1,34 0,9099 0,15 0,5596 0,55 0,7088 0,95 0,8289 1,35 0,9115 0,16 0,5636 0,56 0,7123 0,96 0,8315 1,36 0,9131 0,17 0,5675 0,57 0,7157 0,97 0,8340 1,37 0,9147 0,18 0,5714 0,58 0,7190 0,98 0,8365 1,38 0,9162 0,19 0,5753 0,59 0,7224 0,99 0,8389 1,39 0,9177 221 Продолжение таблицы z Ф(z) z Ф(z) z Ф( z) z Ф( z) 1,60 0,9452 1,84 0,9671 2,16 0,9846 2,64 0,9959 1,61 0,9463 1,85 0,9678 2,18 0,9854 2,66 0,9961 1,62 0,9474 1,86 0,9686 2,20 0,9861 2,68 0,9963 1,63 0,9484 1,87 0,9693 2,22 0,9868 2,70 0,9965 1,64 0,9495 1,88 0,9699 2,24 0,9875 2,72 0,9967 1,65 0,9505 1,89 0,9706 2,26 0,9881 2,74 0,9969 1,66 0,9515 1,90 0,9713 2,28 0,9887 2,76 0,9971 1,67 0,9525 1,91 0,9719 2,30 0,9893 2,78 0,9973 1,68 0,9535 1,92 0,9726 2,32 0,9898 2,80 0,9974 1,69 0,9545 1,93 0,9732 2,34 0,9904 2,82 0,9976 1,70 0,9554 1,94 0,9738 2,36 0,9909 2,84 0,9977 1,71 0,9564 1,95 0,9744 2,38 0,9913 2,86 0,9979 1,72 0,9573 1,96 0,9750 2,40 0,9918 2,88 0,9980 1,73 0,9582 1,97 0,9756 2,42 0,9922 2,90 0,9981 1,74 0,9591 1,98 0,9761 2,44 0,9927 2,92 0,9982 1,75 0,9599 1,99 0,9767 2,46 0,9931 2,94 0,9984 1,76 0,9608 2,00 0,9772 2,48 0,9934 2,96 0,9985 1,77 0,9616 2,02 0,9783 2,50 0,9938 2,98 0,9986 1,78 0,9625 2,04 0,9793 2,52 0,9941 3,00 0,99865 1,79 0,9633 2,06 0,9803 2,54 0,9945 3,20 0,99931 1,80 0,9641 2,08 0,9812 2,56 0,9948 3,40 0,99966 1,81 0,9649 2,10 0,9821 2,58 0,9951 3,60 0,999841 1,82 0,9656 2,12 0,9830 2,60 0,9953 3,80 0,999928 1,83 0,9664 2,14 0,9838 2,62 0,9956 4,00 0,999968 222 ПРИЛОЖЕНИЕ 3 λk - λ Значения функции Пуассона Pk λ   e k! λ 0 0,5 0,60653 1 1,5 2 2,5 3 0,36788 0,22313 0,13534 0,08208 0,04979 1 0,30327 0,36788 0,33470 0,27067 0,20521 0,14936 2 0,07582 0,18394 0,25102 0,27067 0,25652 0,22404 3 0,01264 0,06131 0,12551 0,18045 0,21376 0,22404 4 0,00158 0,01533 0,04707 0,09022 0,13360 0,16803 5 0,00016 0,00307 0,01412 0,03609 0,06680 0,10082 6 0,00001 0,00051 0,00353 0,01203 0,02783 0,05041 k 7 0,00007 0,00076 0,00344 0,00994 0,02160 8 0,00001 0,00014 0,00086 0,00311 0,00810 9 0,00002 0,00019 0,00086 0,00270 10 0,00004 0,00022 0,00081 11 0,00005 0,00022 12 0,00001 0,00006 13 0,00001 14 15 16 17 18 19 20 223 Продолжение таблицы λ k 0 3,5 0,03020 4 4,5 5 5,5 0,01832 0,01111 0,00674 0,00409 6 0,00248 1 0,10569 0,07326 0,04999 0,03369 0,02248 0,01487 2 0,18496 0,14653 0,11248 0,08422 0,06181 0,04462 3 0,21579 0,19537 0,16872 0,14037 0,11332 0,08924 4 0,18881 0,19537 0,18981 0,17547 0,15582 0,13385 5 0,13271 0,15629 0,17083 0,17547 0,17140 0,16062 6 0,07710 0,10420 0,12812 0,14622 0,15712 0,16062 7 0,03855 0,05954 0,08236 0,10444 0,12345 0,13768 8 0,01687 0,02977 0,04633 0,06528 0,08487 0,10326 9 0,00656 0,01323 0,02316 0,03627 0,05187 0,06884 10 0,00230 0,00529 0,01042 0,01813 0,02853 0,04130 11 0,00073 0,00192 0,00426 0,00824 0,01426 0,02253 12 0,00021 0,00064 0,00160 0,00343 0,00654 0,01126 13 0,00006 0,00020 0,00055 0,00132 0,00277 0,00520 14 0,00001 0,00006 0,00018 0,00047 0,00109 0,00223 15 0,00002 0,00005 0,00016 0,00040 0,00089 16 0,00005 0,00014 0,00033 17 0,00001 0,00004 0,00012 18 0,00001 0,00004 19 0,00001 20 224 ПРИЛОЖЕНИЕ 4 Квантили распределения Стьюдента t k , p : t Г k  1 / 2  k , p  x 2  p   1 k    πk Г k / 2    k p 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120   k  1 / 2 dx , p  1  α , t1 p  t p 0,900 0,950 0,990 0,995 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 0,700 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 3,314 1,313 1,311 1,310 1,303 3,296 1,289 1,282 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,684 1,671 1,658 1,645 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,423 2,390 2,358 2,326 63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,704 2,660 2,617 2,586 225 ПРИЛОЖЕНИЕ 5 Квантили распределения Фишера f k ,k , p : 1 2 k  p   1   k2  n1 / 2 Г k1  k2  / 2  Г k1 / 2 Г k2 / 2  f k1 , k 2 , p  x k 1 / 2  1 k  1  1 k2  0  x     k1  k 2  / 2 dx p  0,95, что соответствует правосторонней области с α  0,05 k1 k2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 40 50 60 100 120 200 1 2 3 4 5 161 18,5 10,13 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,84 4,85 4,67 4,6 4,54 4,49 4,45 4,41 4,38 4,35 4,24 4,17 4,08 4,03 4,00 3,94 3,92 3,89 200 19,0 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,88 3,80 3,74 3,68 3,63 3,59 3,55 3,52 3,49 3,38 3,32 3,23 3,18 3,15 3,09 3,07 3,04 216 19,2 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3,16 3,13 3,10 2,99 2,92 2,84 2,79 2,76 2,70 2,68 2,65 225 19,25 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2,93 2,90 2,87 2,76 2,69 2,61 2,56 2,52 2,48 2,45 2,41 230 19,3 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,2 3,11 3,02 2,96 2,9 2,85 2,81 2,77 2,74 2,71 2,60 2,53 2,45 2,29 2,37 2,19 2,29 2,14 6 8 12 30 50 100 234 239 244 248 252 253 19,33 19,37 19,41 19,44 19,47 19,49 8,94 8,84 8,74 8,66 8,58 8,56 6,16 6,04 5,91 5,80 5,70 5,66 4,95 4,82 4,68 4,56 4,44 4,40 4,28 4,15 4,00 3,87 3,75 3,71 3,87 3,73 3,57 3,38 3,32 3,27 3,58 3,44 3,28 3,15 3,03 2,98 3,37 3,23 3,07 2,86 2,80 2,76 3,22 3,07 2,91 2,77 2,64 2,59 3,09 2,95 2,79 2,57 2,51 2,46 3,00 2,85 2,69 2,54 2,40 2,35 2,92 2,77 2,6 2,38 2,31 2,26 2,85 2,7 2,53 2,31 2,24 2,19 2,79 2,64 2,48 2,25 2,18 2,12 2,74 2,59 2,42 2,19 2,12 2,07 2,70 2,55 2,38 2,15 2,08 2,02 2,66 2,51 2,34 2,11 2,04 1,98 2,63 2,48 2,31 2,07 2,00 1,94 2,60 2,45 2,28 2,12 1,96 1,90 2,49 2,34 2,16 1,92 1,84 1,78 2,42 2,27 2,09 1,93 1,76 1,69 2,34 2,18 2,00 1,74 1,66 1,59 2,13 2,02 1,95 1,78 1,60 1,52 2,25 2,10 1,92 1,65 1,56 1,48 2,03 1,92 1,85 1,63 1,48 1,39 2,17 2,02 1,83 1,55 1,46 1,37 1,98 1,87 1,80 1,62 1,42 1,32 226 ПРИЛОЖЕНИЕ 6 Квантили распределения χ k2 , p : p  k 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 75 100 p 0,01 0,0002 0,02 0,12 0,30 0,55 0,87 1,24 1,65 2,09 2,56 3,05 3,57 4,11 4,66 5,23 5,81 6,41 7,02 7,63 8,26 8,90 9,54 10,20 10,86 11,52 12,2 12,88 13,56 14,26 14,95 22,16 29,71 49,5 70,07 0,025 0,003 0,05 0,21 0,48 9,83 1,24 1,69 2,18 2,70 3,25 3,82 4,40 5,01 6,63 6,26 6,91 7,56 8,23 8,91 9,59 10,3 11,0 11,7 12,4 13,1 13,8 14,6 15,3 16,0 16,8 24,4 32,4 52,9 74,2 1 2 k / 2 Г k / 2  0,05 0,004 0,10 0,35 0,71 1,15 1,64 2,17 2,73 3,33 3,94 4,58 5,23 5,89 6,57 7,26 7,96 8,67 9,39 10,12 10,85 11,59 12,34 13,09 13,85 14,61 15,37 16,15 16,93 17,71 18,49 26,51 34,76 66,1 77,93 227 0,95 3,84 5,99 7,82 9,49 11,07 12,59 14,06 15,51 16,92 18,31 19,68 21,03 22,36 23,69 25,00 26,30 27,59 28,87 30,14 31,41 32,67 33,92 35,17 36,42 37,65 38,89 40,11 41,34 42,56 43,77 56,76 67,51 96,2 124,34 χ k2 , p k / 2 1  x / 2 e dx  x 0 0,975 5,02 7,38 9,36 11,1 12,8 14,4 16,0 17,5 19,0 20,5 21,9 23,3 24,7 26,1 27,6 28,8 30,2 31,5 32,9 34,2 35,5 36,8 38,1 39,4 40,6 41,9 43,2 44,5 45,7 47,0 59,3 71,4 100,8 129,6 0,99 6,64 9,21 11,34 13,28 15,09 16,81 18,48 20,09 21,67 23,21 24,72 26,22 27,68 29,14 30,58 32,00 33,41 34,81 36,19 37,57 38,93 40,29 41,64 43,98 44,31 45,64 46,96 48,28 49,59 50,89 63,69 76,15 106,4 135,81 ПРИЛОЖЕНИЕ 7 Критические значения критерия знаков n 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 уровень значимости α 0,05 0,01 6 7 8 8 8 9 9 10 10 11 10 11 11 12 12 13 12 13 13 14 13 15 14 15 15 16 15 17 16 17 17 18 17 19 18 19 18 20 19 20 20 21 20 22 21 22 21 23 22 24 23 24 23 25 24 25 24 26 25 27 25 27 26 28 27 28 27 29 28 30 28 30 29 31 29 31 n 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 85 90 100 228 уровень значимости α 0,05 0,01 30 32 31 33 31 33 32 34 32 34 33 35 33 36 34 36 35 37 35 37 36 38 36 39 37 39 37 40 38 40 39 41 39 41 40 42 40 43 41 43 41 44 42 44 42 45 43 46 44 46 44 47 45 47 45 48 46 48 46 49 47 50 48 50 48 51 49 51 49 52 50 52 53 55 55 58 61 64 ПРИЛОЖЕНИЕ 8 Критические значения T - критерия Уайта ( α =0,05) большее число наблюдений 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 7 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 8 49 51 53 55 58 60 63 65 67 70 72 74 77 79 82 меньшее число наблюдений 9 10 11 12 13 63 65 68 71 73 76 79 82 84 87 90 93 95 78 81 85 88 91 94 97 100 103 107 110 229 96 99 103 106 110 114 117 121 124 115 119 123 127 131 135 139 137 141 145 150 154 14 15 160 164 169 185 ПРИЛОЖЕНИЕ 9.1  Ri   для расчѐта критерия Ван-дер-Вардена  n  1 Значение функции ψ  Ri n1  R  ψ i   n  1 Ri n1  R  ψ i   n  1 Ri n1  R  ψ i   n  1 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30 0,31 0,32 -2,33 -2,05 -1,88 -1,75 -1,64 -1,55 -1,48 -1,41 -1,34 -1,28 -1,23 -1,18 -1,13 -1,08 -1,04 -0,99 -0,95 -0,92 -0,88 -0,84 -0,81 -0,77 -0,74 -0,71 -0,67 -0,64 -0,61 -0,58 -0,55 -0,53 -0,5 -0,47 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 0,64 0,65 -0,44 -0,41 -0,39 -0,36 -0,33 -0,31 -0,28 -0,25 -0,23 -0,20 -0,18 -0,15 -0,13 -0,10 -0,08 -0,05 -0,03 0,00 0,05 0,08 0,10 0,13 0,15 0,18 0,20 0,23 0,25 0,28 0,31 0,33 0,36 0,39 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79 0,80 0,81 0,82 0,83 0,84 0,85 0,86 0,87 0,88 0,89 0,90 0,91 0,92 0,93 0,94 0,95 0,97 0,99 0,41 0,44 0,47 0,50 0,52 0,55 0,58 0,61 0,64 0,67 0,71 0,74 0,77 0,81 0,84 0,88 0,92 0,95 0,99 1,04 1,08 1,13 1,18 1,23 1,28 1,34 1,41 1,48 1,55 1,64 1,88 2,33 230 ПРИЛОЖЕНИЕ 9.2 Критические значения для критерия Ван-дер-Вардена n n1  n2  0 или 1 n1  n2  2 или 3 n1  n2  4 или 5 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 45 50 2,4 2,48 2,6 2,72 2,86 2,96 3,11 3,24 3,39 3,49 3,63 3,73 3,86 3,96 4,08 4,18 4,29 4,39 4,50 4,59 4,68 4,78 4,88 5,33 5,75 6,14 6,50 2,3 2,4 2,49 2,58 2,79 2,91 3,06 3,19 3,36 3,44 3,60 3,69 3,84 3,92 4,06 4,15 4,27 4,36 4,48 4,56 4,68 4,76 4,87 5,31 5,74 6,12 6,51 2,3 2,4 2,68 2,78 3,00 3,06 3,28 3,36 3,53 3,61 3,78 3,85 4,01 4,08 4,23 4,30 4,44 4,51 4,64 4,72 4,84 5,28 5,72 6,10 6,48 231 ПРИЛОЖЕНИЕ 10 Критические значения верхней и нижней границы для U - критерия Манна-Уитни, α  0,05 n1 n2 7 8 9 10 11 12 13 14 15 16 17 18 19 20 7 8 9 10 12 14 16 18 20 8 41 10 46 12 51 14 56 16 61 18 66 20 71 22 76 24 81 26 86 28 91 30 96 32 101 34 106 10 46 13 51 15 57 17 63 19 69 22 74 24 80 26 86 29 91 31 97 34 102 36 108 38 114 41 119 12 51 15 57 17 64 20 70 23 76 26 82 28 89 31 95 34 101 37 107 39 114 42 120 45 126 48 132 14 56 17 63 20 70 23 77 26 84 29 91 33 97 36 104 39 111 42 118 45 125 48 132 58 151 55 145 18 66 22 74 26 82 29 91 33 99 37 107 41 115 45 123 49 131 53 139 57 147 61 155 65 163 69 171 22 76 26 86 31 95 36 104 40 114 45 123 50 132 55 141 59 151 64 160 67 171 74 178 78 188 83 197 26 86 31 97 37 107 42 118 47 129 53 139 59 149 64 160 70 170 75 181 81 191 86 202 92 212 98 222 30 96 36 108 42 120 48 132 55 143 61 155 67 167 74 178 80 190 86 202 93 213 99 225 106 236 112 248 34 106 41 119 48 132 55 145 62 158 69 171 76 184 83 197 90 210 98 222 105 235 112 248 119 261 127 273 232 ПРИЛОЖЕНИЕ 11 Критические значения статистики W -критерия Вилкоксона n1 n2 α 7 7 8 9 10 11 12 13 14 15 20 25 0,005 32 34 35 37 38 40 41 43 44 52 60 0,025 36 38 40 42 44 46 48 50 52 62 72 8 8 9 10 11 12 13 14 15 16 20 25 43 45 47 49 51 53 54 56 58 66 75 49 51 53 55 58 60 62 65 67 77 89 233 2 MW 105 112 119 126 133 140 147 154 161 196 231 136 144 152 160 168 176 184 192 200 232 272 ПРИЛОЖЕНИЕ 12 Критические значения для критерия Аббе n 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 уровень значимости α 0,01 0,05 0,3128 0,2690 0,2808 0,3070 0,3314 0,3544 0,3759 0,3957 0,4140 0,4309 0,4466 0,4611 0,4746 0,4872 0,4989 0,5100 0,5203 0,5301 0,5393 0,5479 0,5562 0,5639 0,5713 0,5784 0,5850 0,5915 0,5975 0,6034 0,6089 0,3902 0,4102 0,4451 0,4680 0,4912 0,5121 0,5311 0,5482 0,5638 0,5778 0,5908 0,6027 0,6137 0,6237 0,6330 0,6417 0,6498 0,6574 0,6645 0,6713 0,6776 0,6836 0,6893 0,6946 0,6996 0,7046 0,7091 0,7136 0,7177 n 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 234 уровень значимости α 0,01 0,05 0,6141 0,6193 0,6242 0,6290 0,6337 0,6381 0,6425 0,6467 0,6508 0,6548 0,6587 0,6622 0,6659 0,6693 0,6727 0,6757 0,6787 0,6814 0,6842 0,6869 0,6896 0,6924 0,6949 0,6974 0,6999 0,7024 0,7049 0,7070 0,7216 0,7256 0,7292 0,7328 0,7363 0,7396 0,7429 0,7461 0,7491 0,7521 0,8550 0,7576 0,7603 0,7628 0,7653 0,7676 0,7698 0,7718 0,7739 0,7759 0,7779 0,7799 0,7817 07836 0,7853 0,7872 0,7891 0,7910 Список литературы 1. Айвазян С.А., Бежаева З.И., Сттароверов О.В. Прикладная статистика. Основы моделирования и первичная обработка данных. – М.: Финансы и статистика, 1997. – 240 с. 2. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. / 3-е изд. – М.: «Наука» Главная редакция физико-математической литературы, 1983. – 416 с. 3. Гаспаров Д.В., Шаповалов В.И. Малая выборка. – М.: Статистика, 1978. – 248 с. 4. Колемаев В.А., Калинина В.Н. Теория вероятностей и математическая статистика: Учебник / Под. ред. В.А.Колемаева. – М.: ИНФРА-М, 1997. – 302 с. 5. Крамер Г. Математические методы статистики. / пер. с англ. Под ред.А.Н.Колмогорова. – М.: Изд-во «Мир», 1975. – 648 с. 6. Кремер Н.Ш. Теория вероятностей и математическая статистика: учебник для вузов. – М.: ЮНИТИ-ДАНА, 2000ю – 543 с. 7. Лакин Г.Ф. Биометрия: учеб. пособие. / изд. 4-еизд., перераб. и доп.– М.: Высшая школа, 1990. - 352 с. 8. Никитина Н.Ш. Математическая статистика для экономистов: Учеб. пособие. – 2-е перераб. и доп. – М.: ИНФРА-М; Новосибирск: Изд-во НГТУ, 2001. – 170 с. 9. Рунион Р. Справочник по непараметрической статистике. Современный подход. Пер. с англ. – М.: Финансы и статистика, 1982. – 198 с. 10. Соколов Г.А., Гладких И.М. Математическая статистика: учебник для вузов / изд. 2-е перераб. – М.: Изд-во «Экзамен», 2007. – 431 с. 11. Справочник по теории вероятностей и математической статистике / В.С.Королюк, Н.И.Портенко, А.В.Скороход, А.Ф.Турбин. – М.: «Наука», Главная редакция физико-математической литературы, 1985. – 640 с. 235 Оглавление Введение………………………………………………………………. 3 Часть 1. ТЕОРИЯ ВЕРОЯТНОСТЕЙ……………........................ 4 Глава 1. Случайные события……………………………………… 4 1.1. Элементы теории множеств и комбинаторики……… 1.2. Действия над событиями……………………………….. 1.3. Аксиомы теории вероятностей. 4 17 Вероятностные модели……………………………………………………….. 26 1.4. Условная вероятность, зависимость и независимость событий. Формула Байеса………………………………. 40 1.5. Коэффициенты регрессии и корреляции случайных событий……………………………………………………… 1.6. Модель формула повторных независимых Бернулли и еѐ 53 испытаний: асимптотические приближения………………………………………………. 1.7. Производящие функции…………………………………. Глава 2. Случайные величины……………………………………. 59 72 75 2.1. Дискретные случайные величины: способы задания, числовые характеристики и их свойства……………….. 2.2. Основные законы распределения дискретных случайных величин……………………………………….. 2.3. Непрерывные случайные величины: законы распределения 2.5. Многомерные случайные величины…………………… 2.6. Закон больших чисел и предельные теоремы……….. практикум по теме «Нормальное распределение»…………………………………………………… 236 101 непрерывных случайных величин……………………………………….. Лабораторный 92 способы задания, числовые характеристики и их свойства…. 2.4. Основные 75 111 124 132 143 Часть 2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА………………..… 146 Глава 1. Выборочные исследования………………………….….. 146 1.1. Основные понятия теории выборок…………………….. 146 1.2. Оценивание параметров…………………………………. 150 Глава 2. Проверка гипотез…………………………………………. 156 2.1. Основные понятия задачи проверки гипотез………….. 156 2.2. Проверка гипотез о числовых значениях параметров 161 2.3. Проверка гипотез о равенстве числовых характеристик генеральных совокупностей………….. 163 2.4. Проверка гипотез об однородности выборок………… 165 2.4.1. Параметрические критерии…………………… 166 2.4.2. Непараметрические критерии…………………. 171 2.5. Проверка гипотез о согласии эмпирического распределения и выбранной модели………………….. 180 2.5.1. Параметрические критерии…………………… 180 2.5.2. Непараметрические критерии………………… 182 2.5.3. Проверка соответствия распределения эмпирического нормальному закону распределения…………………………………… 184 2.6. Проверка гипотез о стохастической независимости элементов выборки……………………………………….. Глава 3. Оценивание тесноты взаимосвязи между признаками…………………………………………………………….. 3.1. Непараметрические методы 191 оценки взаимозависимости признаков…………………………. 3.2. Параметрические методы оценки взаимосвязи……… 3.3. Проверка гипотез 185 191 198 о значимости коэффициентов взаимосвязи…………………. ………………………….... 201 3.4. Корреляционно-регрессионный анализ……………… 203 Лабораторный практикум по математической статистике 211 237 Приложения 219 Литература 235 Оглавление 236 238

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

Related documents

Products

Support

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib