1 Элементы теории вероятностей. 9 класс Из программы. Понятие случайной величины. Закон распределения. Числовые характеристики дискретных случайных величин (математическое ожидание, дисперсия). Статистические оценки математического ожидания и дисперсии. Понятие случайной величины До сих пор, изучая элементы теории вероятностей, мы интересовались случайными событиями, т.е. такими событиями, которые в рассматриваемых условиях могут произойти, а могут и не произойти. Другим важнейшим понятием теории вероятностей является понятие случайной величины. Изучение математики вы начинали с самых простых величин – постоянных. Следующим шагом стали переменные величины, которые могут принимать различные значения. Изучение переменных величин привело к важнейшей математической модели – функциональной зависимости, описывающей связь между значениями, которые принимает одна из переменных при определенных значениях другой переменной. Принципиально, что эта зависимость носила жесткий, заранее предопределенный, детерминированный характер (например, прямая пропорциональность, квадратичная функция и т.п.). Теория вероятностей имеет дело с величинами, для которых невозможно заранее, до проведения опыта однозначно указать значение, которое они могут принять. Такие величины называются случайными величинами. Например, случайной величиной является число, которое выпадает при бросании игрального кубика. Оно может принять любое значение от 1 до 6, причем заранее сказать, каким именно будет это значение, невозможно. Если рассматривать поездку на автомобиле из одного пункта в другой в реальных, не идеализированных условиях, время поездки будет случайной величиной, поскольку на него будут влиять такие не вполне предсказуемые факторы, как интенсивность движения, наличие или отсутствие «пробок» на маршруте, необходимость замены колеса в связи с его проколом и т.п. Любой автомобилист может привести примеры из личного опыта, когда поездка, которая обычно требует не более часа, затягивается на несколько часов. 1. Приведите примеры случайных величин. Объясните, почему вы считаете эти величины случайными. 2 Понятия случайной величины и случайного события тесно связаны друг с другом. Случайной величине Х – результату бросания игральной кости – соответствует случайное событие, состоящее в том, что эта величина принимает заданное значение. Например, событие А: Х = 5 , Р(А) = 1 . 6 В связи со случайной величиной Т, представляющей собой время поездки на автомобиле из одного населенного пункта в другой, можно рассматривать, например, случайное событие В: Т < 1 ч, состоящее в том, что на поездку будет затрачено меньше одного часа. Можно выделить два типа случайных величин: дискретные и непрерывные. Дискретные случайные величины принимают только отделенные друг от друга значения, которые можно заранее перечислить. Например: 1) Число, выпадающее при бросании игральной кости (может принимать значения 1, 2, 3, 4, 5, 6); 2) Количество очков, которое может получить стрелок при однократном выстреле по мишени, показанной на рисунке (может принимать значения 0 – промах, 6, 7, 8, 9, 10); 3) Число голов, забитых в ворота противника во время футбольного матча (может принимать значения 0, 1, 2, 3,…); 4) Частота появления орла при трех бросаниях монеты (может принимать значения 0, 1 2 , , 1). 3 3 Непрерывные случайные величины могут принимать любые значения из некоторого промежутка. Эти значения не отделены друг от друга и не могут быть заранее перечислены. Например: 1) Продолжительность поездки из пункта А в пункт Б; 2) Расстояние, которое проедет автомобиль за первый час поездки продолжительность поездки превышает 1 час); 3) Расстояние от центра мишени до точки, в которую попадет пуля при выстреле; (если 3 4) Самая высокая температура в Москве в 2020 году. (Эта величина случайна с наших нынешних позиций. Когда 2020 год закончится, она перестанет быть случайной.) 2. Приведите несколько примеров дискретных и непрерывных случайных величин. Для работы с непрерывными случайными величинами требуется знание разделов математики, выходящих далеко за рамки курса 9 класса. Поэтому мы в основном ограничимся рассмотрением дискретных случайных величин. Мы будем обозначать случайную величину большой буквой, а значения, которые она может принимать, той же маленькой буквой с индексом, обозначающим номер этого значения (не обязательно, но удобно нумеровать значения по возрастанию). Например, если Х – случайная величина, представляющая собой число, выпадающее при бросании игрального кубика, то х1 = 1, х2 = 2, …, х6 = 6. Если Y – частота выпадения орла при трех бросаниях монеты, то y1 = 0, y2 = 1 2 , y3 = , y4 = 1. 3 3 Примечание. Иногда удобно начинать нумерацию значений случайной величины не с 1, а с 0. Такая ситуация, например, будет рассмотрена ниже при изучении биномиального распределения. 3. Случайная величина Z представляет собой произведение чисел, выпадающих при бросании двух игральных кубиков. Сколько значений может принимать эта величина? Перечислите и обозначьте все значения случайной величины Z. Дискретная случайная величина Х будет полностью описана, если для каждого её значения х1, х2,…, хп указать вероятность его появления, т.е. указать вероятности Р(Х = х1), Р(Х = х2),…, Р(Х = хп). Для вероятности Р(Х = хi) можно использовать более простое обозначение Р(хi) или еще проще: рi. Поскольку события Х = х1, Х = х2,…, Х = хп несовместны и образуют полную группу событий (объясните, почему), для вероятностей р1, р2, …, рп выполняется равенство р1 + р2 + … + рп = 1. Совокупность вероятностей всех значений случайной величины Х называют ее законом распределения. Простейшим способом описания закона распределения является таблица, в которой каждому значению случайной величины поставлена в соответствие вероятность его появления: 4 Х х1 х2 … хп Р р1 р2 … рп Такую таблицу называют рядом распределения. Закон распределения может быть также представлен графически, так же как строятся графики других функций. На рис. 1 показано графическое представление закона распределения для некоторой случайной величины, которая может принимать значения 1, 2, 3, 4. Поскольку случайная величина дискретна, график распределения состоит из изолированных точек1. Р Р Р 0,5 0,5 0,5 0,4 0,4 0,4 0,3 0,3 0,3 0,2 0,2 0,2 0,1 0,1 0,1 0 1 2 3 Рис. 1 4 Х 0 1 2 3 4 Х Рис. 2 0 1 2 3 4 Х Рис. 3 Часто для большей наглядности точки графика соединяют, в результате чего получается так называемый многоугольник распределения2 (рис. 2), или представляют закон распределения в виде столбчатой диаграммы (рис. 3). Такие способы хотя и нагляднее, чем точечный график, но менее корректны, поскольку дискретная случайная величина не может принимать никакие значения в промежутках между значениями, входящими в ряд распределения. 4. Для графика, приведенного на рис.1, проверьте, равна ли сумма значений случайной величины единице. Постройте по этому графику ряд распределения. 5. а) Постройте закон распределения (представьте его в виде ряда распределения и с помощью графика) для следующих случайных величин: Обратите также внимание: на данном графике масштаб по координатным осям – разный. Изображать в одном масштабе величину Х, принимающую целые значения, и вероятности этих значений, лежащие в промежутке [0; 1], в одном масштабе было бы неудобно. 2 Не путать с многоугольником в геометрическом понимании. 1 5 1) число очков при однократном бросании игрального кубика; 2) сумма чисел, выпадающих при двух бросаниях игрального кубика; 3) произведение чисел, выпадающих при бросании двух игральных кубиков. б) Можно ли считать эксперименты, описанные в задании а2) (двукратное бросание кубика) и в задании а3) (бросание двух кубиков), эквивалентными? Своё мнение обоснуйте. 6. Игральный кубик бросают 5 раз. Случайная величина Х представляет собой количество выпадений единицы. Постройте закон распределения случайной величины Х. 7. Случайная величина Х имеет следующий закон распределения: Х х1 х2 … хп Р р1 р2 … рп Случайная величина Y = Х + с получается из Х прибавлением к каждому из значений хi константы с. Случайная величина Z = kХ получается из Х умножением каждого из значений хi на постоянный коэффициент k. Постройте законы распределения случайных величин Y и Z. Биномиальное распределение Полученный в задании 6 закон распределения числа выпадений единицы при пяти бросаниях кубика представляет собой частный случай так называемого биномиального распределения. В общем случае задача может быть сформулирована в рамках рассмотренной в 8 классе схемы Бернулли. Напомним эту математическую модель. Производится серия из п одинаковых независимых опытов (испытаний), в каждом из которых некоторое событие А (успех) может произойти с вероятностью р. Было установлено, что вероятность события, состоящего в том, что событие А в данной серии произойдет ровно k раз, равна р k = Сnk р k (1 p) nk . Но данная формула может рассматриваться как описание закона распределения случайной величины K – числа успехов в серии из n независимых испытаний, в каждом из которых вероятность успеха равна р. K принимает значения k = 0, 1, 2,…, n с вероятностями1 рk = Р(K = k) = Сnk p k (1 p) nk . Случайная величина K принимает п + 1 значение: 0, 1, 2, …, п. В данном случае в обозначении вероятностей рk удобнее рассматривать индексы k, принимающие значения от 0 до п, а не от 1 до п + 1. 1 6 Говорят, что случайная величина K распределена по биномиальному закону1 (имеет биномиальное распределение). 8. Постройте биномиальное распределение для р = 0,8 и п = 4. 9. Случайная величина Х подчиняется биномиальному закону распределения с параметрами р = 0,4 и п = 6. Найдите вероятности: 1) Р(Х < 6); 2) Р (1 < X < 5). 10. Помещение освещается тремя лампочками. В течение месяца каждая из лампочек может перегореть с вероятностью 0,2, причем перегорания лампочек происходят независимо друг от друга. В начале января все лампочки были работоспособны. Постройте законы распределения случайных величин V и W, где V – число перегоревших лампочек к концу января, W – число не перегоревших лампочек к концу января. Являются ли распределения случайных величин V и W биномиальными? Если да, то какие параметры у этих распределений? Математическое ожидание дискретной случайной величины Рассмотрим следующий мысленный эксперимент. Имеются 100 монет разного достоинства хi (i = 1, 2,…, 5): 1 у.е., 3 у.е., 5 у.е., 10 у.е., 20 у.е., но неразличимых на ощупь. Количество монет каждого вида ni приведено в таблице. i 1 2 3 4 5 xi(у.е.) 1 3 5 10 20 ni(шт.) 30 10 40 15 5 Монеты укладывают в мешок, перемешивают, после чего наугад берется одна из них. Угадать, какого вида окажется выбранная монета, заранее невозможно. Можно только с уверенностью сказать, что ее достоинство будет находиться в пределах от 1 у.е. до 20 у.е., и чем больше имеется монет конкретного вида, тем более вероятно вытащить монету именно этого вида. Это название происходит от формулы бинома Ньютона a bn Cn0 a 0b n Cn1 a1b n1 Cn2 a 2b n2 ... Cnn a nb 0 . Левую часть этой формулы не вполне корректно называют биномом (двучленом). Строго говоря, она представляет собой не бином, а п-ую степень бинома. Если положить в данной формуле а = р, b = 1 – р, то слагаемые в правой части будут представлять собой вероятности р0, р1, р2,…, рп. Также в связи с формулой бинома Ньютона числа Cnk получили название биномиальных коэффициентов. 1 7 А теперь предположим, что данный эксперимент повторяется многократно (при этом выбранная монета каждый раз возвращается, так что условия эксперимента не изменяются). Можно ожидать, что результаты (достоинство вытащенной монеты) будут колебаться около некоторого среднего значения. Естественно считать таким средним значением (обозначим его х ) достоинство такой гипотетической монеты, чтобы 100 этих одинаковых монет были эквивалентны 100 монетам, используемым в эксперименте. Это можно показать с помощью схемы: 30 1 10 3 100 40 5 х 15 10 5 20 Найдем такое х . Имеем (цветом выделены количества монет того или иного достоинства): х 100 = 130 + 310 + 540 + 1015 + 205. Отсюда х = 1 30 3 10 5 40 10 15 20 5 . 100 Представим правую часть полученной формулы несколько по-другому: х = 1 30 10 40 15 5 3 5 10 20 . 100 100 100 100 100 Каждая дробь в правой части представляют собой не что иное, как вероятность выбора монеты соответствующего достоинства (числитель – количество благоприятных исходов, знаменатель – общее количество исходов). Если рассматривать случайную величину Х, значениями которой являются достоинства различных участвующих в эксперименте монет, то эта случайная величина будет иметь следующий закон распределения: Х 1 3 5 10 20 Р 0,3 0,1 0,4 0,15 0,05 8 Полученное выше среднее значение х называют математическим ожиданием случайной величины Х. х представляет собой среднее взвешенное всех возможных значений Х с весами, равными вероятностям появления этих значений. В нашем примере х = 5,1. В общем случае, если дискретная случайная величина Х может принимать п значений х1, х2,…, хп с вероятностями р1, р2,…, рп соответственно, то математическим ожиданием Х называется х = х1р1 + х2р2 +…+ хпрп (для математического ожидания случайной величины Х наряду с х используются также обозначения тХ, М[Х], Е[Х]). Иными словами, математическое ожидание дискретной случайной величины представляет собой среднее взвешенное всех возможных ее значений с весами, равными вероятностям появления этих значений. Математическое ожидание – это некоторая величина, вокруг которой группируются значения случайной величины. Поэтому математическое ожидание относят к так называемым характеристикам положения случайной величины. Наряду с математическим ожиданием в теории вероятностей рассматриваются и другие характеристики положения – медиана и мода, на которых мы не будем останавливаться. Обратите внимание. 1) Математическое ожидание дискретной случайной величины может не совпадать ни с одним из ее возможных значений. Например, для рассмотренной выше случайной величины, принимающей значения х = 1, 3, 5, 10, 20, х = 5,1. 2) Необходимо различать математическое ожидание случайной величины (среднее взвешенное ее значений) и среднее арифметическое ее значений, хотя в отдельных случаях эти величины могут совпадать. Например, для рассмотренной выше случайной величины математическое ожидание равно 5,1 а среднее арифметическое возможных значений равно 7,8. 3) Математическое ожидание случайной величины имеет ту же размерность, что и значения этой случайной величины. Например, если речь идет о температуре, то среднегодовая температура (математическое ожидание температуры за год) будет выражаться в градусах; среднее время безотказной работы какого-либо технического устройства – в часах и т.п. Понятие математического ожидания имеет интересную механическую интерпретацию. Если представить возможные значения хi случайной величины Х как координаты 9 материальных точек на координатной прямой, имеющих массы рi, то тХ будет представлять собой координату центра масс этой системы точек. Роль математического ожидания состоит в том, что оно дает некоторые представления о «поведении» случайной величины даже в тех случаях, когда ее закон распределения неизвестен. Пусть, например, случайная величина Х может принимать значения 1, …, 10 с вероятностями р1, …, р10. Конкретные значения этих вероятностей неизвестны, но известно, что распределение Х симметрично, т.е. р1 = р10, р2 = р9, р3 = р8, р4 = р7, р5 = р6. Этих данных достаточно, чтобы найти математическое ожидание Х. М[X] = 1 р1 10 р10 + 2 р2 9 р9 + 3 р3 8 р8 + 4 р4 7 р7 + 5 р5 6 р6 = 11(р1 + р2 + р3 + р4 + р5). 11 р1 11 р2 11 р3 11 р4 11 р5 Поскольку р1 + … + р10 = 1 и распределение симметрично, р1 + … + р5 = М[X] = 11 1 . Следовательно, 2 1 = 5,5. Таким образом, даже не располагая полной информацией о законе 2 распределения случайной величины Х, мы можем заключить, что ее возможные значения будут группироваться около 5,5. 11. Докажите, что математическое ожидание случайной величины можно считать ее средним значением в том смысле, что оно всегда заключено между ее наименьшим и наибольшим возможными значениями. 12. Случайная величина Z представляет собой число, выпадающее при бросании игрального кубика. Найдите математическое ожидание этой случайной величины. Проверьте, совпадает ли оно со средним арифметическим возможных значений Z. 13. Найдите математические ожидания случайной величины, закон распределения которой приведен на рис. 1. 14. Найдите математические ожидания для случайных величин, рассмотренных в заданиях 5 и 6. 15. Представьте себе монету, у которой вместо орла имеется цифра 1, а вместо решки – цифра 2. 10 1) Чему равно математическое ожидание числа, выпадающего при однократном бросании этой монеты? 2) Случайная величина Y представляет собой сумму чисел, выпадающих при двух бросаниях монеты. Найдите математическое ожидание Y. Равно ли оно сумме математических ожиданий чисел, выпадающих при каждом бросании? 3) Случайная величина Z представляет собой произведение чисел, выпадающих при двух бросаниях монеты. Найдите математическое ожидание Z. 16. Имеются две монеты: достоинством 1 у.е. и достоинством 5 у.е. При выпадении решки фиксируется число, соответствующее достоинству монеты, при выпадении орла – число 0. 1) Найдите математическое ожидание числа, выпадающего при бросании первой монеты, второй монеты. 2) Найдите математическое ожидание суммы чисел, выпадающих при бросании двух монет. Равно ли это математическое ожидание сумме математических ожиданий чисел, выпадающих при бросании каждой из монет? В заданиях 15 и 16 оказалось, что математическое ожидание суммы рассматриваемых там случайных величин оказалось равно сумме математических ожиданий этих величин. Можно доказать, что это справедливо для любых случайных величин: М[X + Y] = M[X] + M[Y]. Это свойство (оно получило название теоремы сложения математических ожиданий) может быть обобщено на сумму любого количества случайных величин. Использование данного свойства упрощает нахождение математического ожидания суммы случайных величин, поскольку позволяет вычислять математическое ожидание без установления закона распределения этой суммы. Теорема сложения математических ожиданий справедлива для любого числа случайных величин: M[X1 + X2 +…+Xn] = M[X1] + M[X2] +…+ M[Xn]. 17. Найдите математическое ожидание суммы чисел, выпадающих при 100 бросаниях игрального кубика. 18. Х – случайная величина. Случайные величины Y и Z связаны с Х следующим образом (см. задание 7): Y = Х + с, Z = kХ, где с и k – константы. Найдите M[Y] и M[Z]. Обоснуйте свои выводы. 11 Математическое ожидание обладает следующими свойствами: M[Х + с] = M[X] + c, M[kX] = kM[X], где с и k – константы. 19. М[X] = m. Найдите M[k(X + c)] и М[kX + c], где с и k – константы. Различаются ли эти математические ожидания? 20. Чему равно математическое ожидание неслучайной величины (константы) с? 21. Верно ли утверждение, что М Х 2 М 2 Х ? Если считаете, что верно, докажите это; если нет – приведите контрпример. Докажем теорему сложения математических ожиданий. Пусть имеются две случайные величины: Х , принимающая значения х1, х2, …, хт, и Y, принимающая значения y1, y2, …, yn. (Величины Х и Y, вообще говоря, могут быть зависимыми, т.е. вероятность того, какое значение принимает одна из них, может зависеть от того, какое значение приняла другая.) Математическое ожидание суммы этих случайных величин равно М[X + Y] = ( x1 y1 ) P( X x1 ) (Y y1 ) +…+ ( x1 yn ) P( X x1 ) (Y yn ) + … + ( xm y1 ) P( X xm ) (Y y1 ) +…+ ( xm yn ) P( X xm ) (Y yn ) = = x1 P( X x1 ) (Y y1 ) ... P( X x1 ) (Y yn ) + … + xm P( X xm ) (Y y1 ) ... P( X xm ) (Y yn ) + + y1 P( X x1 ) (Y y1 ) ... P( X xm ) (Y y1 ) + … + yn P( X x1 ) (Y yn ) ... P( X xm ) (Y yn ) . Проанализируем выражение P( X xi ) (Y y1 ) ... P( X xi ) (Y yn ) , где i может принимать значения от 1 до т. Значения y1, y2, …, yn исчерпывают все возможные значения случайной величины Y, следовательно, события (Y = y1),…, (Y = yn) образуют полную группу; кроме того, эти события несовместны. Событие (Х = хi) может произойти с одним из них. Следовательно, рассматриваемое выражение представляет собой, не что иное, как полную вероятность того, что величина Х примет значение хi, т.е. P( X xi ) (Y y1 ) ... P( X xi ) (Y yn ) = P( X xi ) . Аналогично, для любого j от 1 до п P(Y y j ) ( X x1 ) ... P(Y yi ) ( X xm ) = P(Y y j ) . Таким образом, 12 М[X + Y] = x1 P( X x1 ) ... xm P( X xm ) y1 P(Y y1 ) ... yn P(Y yn ) = M[X] + M[Y]. M[X ] M [Y ] В приведенном доказательстве теоремы сложения мы не обратили внимания на одну тонкость. Дело в том, что мы рассматривали различные суммы вида xi + yj как разные значения случайной величины X +Y. В действительности же разные комбинации значений (номеров) i и j могут приводить к одному и тому же значению xi + yj. Рассмотрим такую ситуацию. Для простоты записи ограничимся случаем, когда одно и то же значение суммы дают две комбинации. Пусть, например, xi1 y j1 xi2 y j2 z . Тогда вероятность того, что сумма Х + Y примет значение z, на основании теоремы сложения вероятностей равна P( X Y z) P ( X xi1 ) (Y y j1 ) ( X xi2 ) (Y y j2 ) P ( X xi1 ) (Y y j1 ) P ( X xi2 ) (Y y j2 ) Поэтому слагаемое zP(X + Y = z) в исходной формуле для математического ожидания суммы X + Y может быть заменено на сумму ( xi1 y j1 ) P ( X xi1 ) (Y y j1 ) ( xi2 y j2 ) P ( X xi2 ) (Y y j2 ) , в результате чего приходим к приведенному выше доказательству теоремы сложения математических ожиданий. 22. Обоснуйте справедливость теоремы сложения математических ожиданий для произвольного числа случайных величин: M[X1 + X2 +…+Xn] = M[X1] + M[X2] +…+ M[Xn]. С помощью задания 17 было проиллюстрировано, насколько эффективной может оказаться теорема сложения математических ожиданий в случаях, когда вычисление непосредственно по формуле математического ожидания невозможно, поскольку возникают трудности с описанием закона распределения рассматриваемой случайной величины. Возможна ситуация, когда закон распределения известен, но, тем не менее, прямое вычисление затруднительно. В качестве примера рассмотрим задачу нахождения в общем виде формулы для математического ожидания случайной величины, имеющей биномиальное распределение. Напомним, что биномиальное распределение с параметрами p и n – это распределение числа успехов K в серии из n независимых испытаний, в каждом из которых вероятность успеха равна р. Выше было установлено, что закон распределения K описывается формулой Р(K = k) = Сnk p k (1 p) nk . Чтобы найти М[K] непосредственно по формуле математического ожидания, нужно привести к более простому виду выражение 0 Сn0 p 0 (1 p) п +1 Сn1 p1 (1 p) n1 +2 Сn2 p 2 (1 p) n2 +...+(n – 1) Сnn1 p n1 (1 p)1 +n Сnn p n (1 p ) 0 . Сделать это хотя и возможно, но достаточно сложно. Решение существенно упрощается, если для нахождения М[K] воспользоваться теоремой сложения математических ожиданий. Для этого рассмотрим случайные величины Х1 , Х2 ,…, Хn, каждая из которых может принимать одно из двух значений: 1, 13 если соответствующее испытание завершилось успехом, и 0, если испытание завершилось неудачей. Тогда K = Х1 + Х2 +…+ Хn. Для любого испытания имеем: P(Xi = 1) = p, P(Xi = 0) = 1 – p и, следовательно, M[Xi] = p. Используя теорему сложения математических ожиданий, получаем: М[K] = пр. Дисперсия и среднее квадратичное отклонение дискретной случайной величины Сравним два случайных эксперимента – бросание игрального кубика, с которым свяжем случайную величину Y, и бросание спичечного коробка, с которым свяжем случайную величину Z. Эксперимент с кубиком уже неоднократно рассматривался. Для него ряд распределения случайной величины Y – числа, выпадающего при однократном бросании, имеет следующий вид: Y 1 2 3 4 5 6 Р 1 6 1 6 1 6 1 6 1 6 1 6 Уточним условия эксперимента с коробком. Нанесем на грани коробка числа от 1 до 6 следующим образом: левая – 1, правая – 6, передняя – 2, задняя – 5, верхняя – 3, нижняя – 4 (см. рисунок). При такой нумерации соблюдается то же принцип, что и для кубика: сумма чисел на любых двух противоположных гранях равна 7. Под Z будем понимать случайную величину, значения которой – это числа, выпадающие при бросании коробка. а b c 3 6 2 Обозначим длину коробка а, ширину b, высоту с. Очевидно, что чем больше площадь грани, тем больше вероятность выпадения числа, написанного на этой грани. Будем считать, что вероятность выпадения того или иного числа соответствующей грани. Тогда (объясните, почему) Р(Z = 1) = (Z = 6) = bc ; 2(ab ac bc) Р(Z = 2) = (Z = 5) = аc ; 2(ab ac bc) пропорциональна площади 14 Р(Z = 3) = (Z = 4) = аb . 2(ab ac bc) Пусть коробок имеет следующие размеры: a = 8 см, b = 4 см, с = 1 см. Тогда для случайной величины Z получаем следующий ряд распределения: Z 1 2 3 4 5 6 Р 1 22 1 11 4 11 4 11 1 11 1 22 Сравним случайные величины Y и Z. Сначала перечислим их общие свойства. 1) Обе случайные величины могут принимать одни и те же значения – от 1 до 6. Как следствие, обе величины имеют один и тот же размах (разность между наибольшим и наименьшим значениями). 2) Обе случайные величины имеют одно и то же математическое ожидание: M[Y] = = M[Z] = 3,5. (Отметим, что при другой нумерации граней коробка математическое ожидание выпадающего числа могло оказаться другим). А теперь попробуем описать различия случайных величин Y и Z. Для наглядности на одном рисунке приведем их многоугольники распределения: для величины Y – пунктиром, для Z – сплошной линией. (Тонкая вертикальная линия соответствует общему математическому ожиданию обеих величин). Р 0,4 0,3 0,2 0,1 0 1 2 3 m4 5 6 Y, Z Из рисунка видно, что значения Z более тесно группируются около своего математического ожидания, вероятность больших отклонений от математического ожидания существенно меньше, чем для величины Y. Можно сказать, что случайная величина Z имеет меньшее рассеяние по сравнению с Y. Возникает вопрос, можно ли охарактеризовать степень рассеяния случайной величины одним числом, так же как ее положения мы описывали с помощью математического ожидания. Интуитивно чувствуется, что характеристика рассеяния случайной величины должна связывать возможные отклонения случайной величины от ее среднего значения 15 (математического ожидания) и вероятности их появления. Попробуем в качестве такой характеристики рассмотреть математическое ожидание таких отклонений. Для наших случайных величин Y и Z введем новые величины – отклонения Y = Y – M[Y] и Z = Z – M[Z]1. Рассмотрим законы распределения случайных величин Y и Z, исходя из того факта, что вероятность определенного значения этих величин такая же, как вероятность соответствующего значения исходной случайной величины Y или Z соответственно: Y Р –2,5 –1,5 –0,5 0,5 1,5 2,5 1 6 1 6 1 6 1 6 1 6 1 6 Z –2,5 –1,5 –0,5 0,5 1,5 1 22 Р 1 11 4 11 4 11 1 11 2,5 1 22 Используя данные таблиц, находим: М[Y] = M[Z] = 0. Таким образом, математическое ожидание отклонений случайной величины от ее среднего значения не может быть использовано в качестве характеристики рассеяния случайной величины. Дело в том, что положительные и отрицательные отклонения от среднего при сложении компенсируют друг друга. Нетрудно доказать в общем виде, что математическое ожидание отклонений любой случайной величины от ее среднего равно 0. Пусть случайная величина Х имеет математическое ожидание т. Тогда, в соответствии со свойством математического ожидания (см. задание 18), М[X – m] = М[X] – m = m – m = 0. Случайную величину Х = Х – т, где т = М[X], называют центрированной случайной величиной, соответствующей величине Х. Чтобы избежать отрицательных нежелательного отклонений от взаимного уничтожения среднего, в качестве меры положительных и рассеяния используют математическое ожидание не самих отклонений, а их квадратов. Такая мера рассеяния называется дисперсией случайной величины. Для обозначения дисперсии используют букву D. Найдем дисперсии для рассмотренных выше случайных величин Y и Z. Для этого, исходя из рядов распределения величин Y и Z, построим ряды распределения величин 2Y и 2Z : 2Y 0,25 2,25 6,25 2Z 0,25 2,25 6,25 Р 1 3 1 3 1 3 Р 8 11 2 11 1 11 D[Y] = М[ 2Y ] 2,917 D[Z] = M[ 2Z ] 1,159 Буква греческого алфавита (дельта) в математике является общепринятым обозначением для всевозможных отклонений, приращений, изменений величин. 1 16 Полученные значения дисперсии показывают различия в рассеянии случайных величин Y и Z относительно их средних значений. При переходе от отклонений значений случайной величины относительно среднего к квадратам этих отклонений может возникнуть ситуация, когда разным значениям отклонения соответствуют одинаковые значения квадратов. Это мы учли при построении рядов распределений величин 2Y и 2Z . Но распределения этих величин можно было представить и в несколько ином виде: Y –2,5 –1,5 –0,5 0,5 1,5 2,5 Z –2,5 –1,5 –0,5 0,5 1,5 2,5 2Y 6,25 2,25 0,25 0,25 2,25 6,25 2Z 6,25 2,25 0,25 0,25 2,25 6,25 Р 1 6 1 6 1 6 1 6 1 6 1 6 Р 1 22 1 11 4 11 4 11 1 11 1 22 Приведенные таблицы нельзя назвать в полном смысле «рядами распределения» величин 2Y и 2Z : во-первых, они содержат повторяющиеся значения величин 2Y и 2Z , соответствующие противоположным значениям Y и Z соответственно; во-вторых, значения 2Y и 2Z в таблицах не упорядочены. Но при расчете дисперсий мы можем рассматривать эти повторяющиеся значения 2Y и 2Z как самостоятельные с соответствующими значениями вероятностей. (Проверьте это, сравнив дисперсии, рассчитанные по последним таблицам, с полученными выше значениями D[Y] и D[Z].) В общем случае, если дискретная случайная величина Х принимает значения х1, …, xn с вероятностями р1, …, рп, то дисперсией Х называется D[X] = DX = M ( X mX ) 2 ( x1 mX ) 2 p1 ... ( xn mX ) 2 pn . 23. Дискретная случайная величина Х принимает значения х1, …, xn с вероятностями р1, …, рп. Докажите, что ее дисперсия может быть вычислена по формуле D[X] = M [ X 2 ] mX2 . Указание. Воспользуйтесь теоремой сложения математических ожиданий. Может возникнуть вопрос, почему в качестве меры рассеяния случайной величины принимают сумму квадратов ее отклонений от среднего, а не сумму модулей отклонений. Оказывается, и такая величина в теории вероятностей тоже иногда используется (она называется средним арифметическим отклонением), но по ряду причин, рассмотрение которых выходит за рамки нашего курса, не получила широкого распространения. 17 24. Дисперсия случайной величины X равна DX. Чему равна дисперсия случайной величины Y = kX, где k – константа? 25. Чему равна дисперсия неслучайной величины (константы)? 26. В мешке находятся 10 неразличимых на ощупь шаров. На двух из них написано число 0, на трех – число 1 и на пяти – число 2. Наугад вынимают один шар. Найдите математическое ожидание и дисперсию числа, которое может получиться в результате такого эксперимента. 27. Случайная величина S принимает значение 1 с вероятностью р и значение 0 с вероятностью 1 – р. Найдите M[S] и D[S]. *28. В общем случае дисперсия суммы случайных величин не равна сумме их дисперсий. Достаточным условием, позволяющим складывать дисперсии, является независимость случайных величин. Найдите дисперсию случайной величины, имеющей биномиальное распределение. *29. По цели производится 10 выстрелов, в каждом из которых вероятность попадания равна 0,8. Найдите математическое ожидание и дисперсию числа попаданий в цель. 30. Рассмотрим следующий эксперимент. Имеется 6 гирь с номерами 1, 2, …, 6. Гири №1 и №2 имеют массу по 1кг, гири №3, №4, №5 – массу по 2 кг и гиря №6 – массу 5 кг. Случайным образом (например, с помощью неразличимых на ощупь карточек) выбирается одна гиря. Найдите математическое ожидание и дисперсию массы при таком выборе. Какие размерности имеют эти характеристики случайной величины? 31. Имеется 6 термосов с номерами 1, 2, …, 6. В сосуды №1 и №2 налита вода с температурой 10, в термосы №3, №4, №5 – с температурой 20, в термос №6 – с температурой 50. Наугад выбирают один термос. Найдите математическое ожидание и дисперсию температуры воды при таком выборе. Какие размерности имеют эти характеристики? Сопоставьте это задание с заданием 30. 18 Дисперсия случайной величины, в отличие от математического ожидания, имеет размерность, квадрата случайной величины. Например, в задании 30 размерность случайной величины и ее математического ожидания кг, а размерность дисперсии кг2; в задании 31 размерность случайной величины – градусы, а размерность дисперсии – градусы в квадрате. Отличие размерности дисперсии от размерности самой случайной величины и ее математического ожидания может создавать определенные неудобства. Поэтому наряду с дисперсией в качестве характеристики рассеяния случайной величины используют числовую характеристику, представляющую собой арифметический квадратный корень из дисперсии. Эта характеристика получила название среднего квадратичного отклонения случайной величины. Используются также термины среднее квадратическое отклонение, стандартное отклонение, иногда используется аббревиатура СКО. Для среднего квадратичного отклонения имеется общепринятое обозначение (греческая буква сигма): X [ X ] D[ X ] . Математическое ожидание и дисперсия (или СКО) не являются исчерпывающими характеристиками закона распределения случайной величины. В то же время эти характеристики позволяют, не зная закона распределения, составить определенное представление о поведении случайной величины, например, ориентировочно указать промежуток, в котором сосредоточены ее практически возможные значения. Оказывается, если случайная величина имеет математическое ожидание m и СКО , то с вероятностью, весьма близкой к 1, ее значения находятся в промежутке m 3. Такой способ оценки диапазона возможных значений случайной величины называется правилом трех сигма. Элементы математической статистики Многообразие задач теории вероятностей решается в предположении, что вероятности некоторых простейших событий известны точно. Исходя из такого предположения и применяя методы теории вероятностей можно находить вероятности более сложных событий, законы распределения случайных величин и соответствующие их числовые характеристики, такие как математическое ожидание, дисперсия и т.п. В отличие от классической теории вероятностей математическая статистика делает акцент на определение аналогичных характеристик на основании результатов эксперимента. В шестом классе уже была рассмотрена одна из важных задач математической статистики – определение вероятности случайного события статистическим методом. В основе этого метода лежало использование в качестве оценки вероятности р = Р(А) некоторого случайного события А частоты его появления: 19 рˆ Рˆ ( А) nA , n где п – общее число произведенных опытов; пА – число опытов, в которых событие А произошло (число благоприятных исходов). Примечание. Значок ^ мы будем использовать, чтобы подчеркнуть, что речь идет о статистических характеристиках (оценках) соответствующих величин, а не об их точных значениях. Например, т̂ – статистическое среднее – оценка математического ожидания, ̂ – оценка СКО и т.п. В шестом классе было, фактически, «принято на веру», что частота случайного события может быть использована в качестве приближенного значения его вероятности. Сейчас мы уже в состоянии обосновать это. Докажем сначала, что математическое ожидание частоты случайного события совпадает с его вероятностью. Пусть вероятность события А равна Р(А) = р. Было проведено п независимых опытов, пА из которых оказались успешными. Частота события А, n определенная на основании этих опытов, равна рˆ Рˆ ( А) A . пА и р̂ представляют собой n случайные величины, причем пА имеет биномиальное распределение с параметрами п и р. Следовательно (см. выше), М[пА] = пр. Пользуясь возможностью вынесения постоянного множителя за знак математического ожидания (см. задание 18), получаем: 1 n 1 M рˆ ) M A M n A np p . n n n Таким образом, математическое ожидание частоты случайного события совпадает с вероятностью этого события. В математической статистике оценки, математическое ожидание которых совпадает со значением оцениваемой величины, называются несмещенными оценками. Мы установили, что частота случайного события является несмещенной оценкой его вероятности. Теперь найдем дисперсию частоты события А. В задании 28 было установлено, что дисперсия случайной величины, имеющей биномиальное распределение (а именно так распределено число успехов пА), равна D[пА] = пp(1 – p). Пользуясь свойством дисперсии произведения константы на случайную величину (см. задание 24), получаем: 1 р(1 р) n 1 D рˆ D A 2 Dn A 2 пр(1 р ) . n п n n 20 Числитель дроби р (1 р ) представляет собой константу, а знаменатель с ростом числа п опытов неограниченно возрастает. Следовательно, увеличивая число опытов, можно сделать дисперсию сколь угодно малой. (Говорят, что с ростом числа опытов дисперсия частоты события стремится к нулю). Таким образом, мы установили, что математическое ожидание (среднее значение) частоты события равно его вероятности, а дисперсия частоты, характеризующая ее разброс относительно математического ожидания, может быть сделана сколь угодно малой за счет увеличения числа опытов. Эти свойства частоты события и являются обоснованием возможности использования частоты при большом числе опытов в качестве статистической вероятности (оценки вероятности) случайного события1. 32. Постройте (в табличной форме) зависимость дисперсии и СКО частоты случайного события от числа опытов для p = 0,25, p = 0,5, p = 0,75. Образец таблицы. p = 0,25 Число опытов п 50 100 200 500 1000 2000 D рˆ р̂ Указание. Для расчетов используйте микрокалькулятор. 33. По результатам задания 32, учитывая несмещенность р̂ и пользуясь «правилом 3», определите, в каких промежутках будут находиться практически достоверно значения частоты р̂ в зависимости от числа опытов для значений истинной вероятности p = 0,25, p = 0,5, p = 0,75. Образец таблицы. p = 0,25 Число опытов п 50 100 200 500 1000 2000 р̂ Строго говоря, делая вывод о возможности замены вероятности события его частотой при большом числе испытаний, мы не утверждаем, что частота обязательно будет очень близка к истинному значению вероятности. Можно только утверждать, что с ростом числа испытаний вероятность этого приближается к 1. Данный факт носит название теоремы Бернулли и является одним из проявлений «закона больших чисел», устанавливающего устойчивость различных статистических оценок при большом числе опытов. 1 21 р 3[ pˆ ]; p 3[ pˆ ] Статистический способ определения вероятности случайного события по его частоте лежит в основе построения закона распределения дискретной случайной величины по результатам эксперимента. Если дискретная случайная величина Х может принимать k значений х1, х2, …, хk, то появление значения хi (i = 1, 2, …, k) представляет собой случайное событие, в качестве n оценки вероятности рi которого может быть принята его частота рˆ i Pˆ ( X xi ) = i , где n – n общее число проведенных испытаний, ni – число испытаний, в которых случайная величина Х приняла значение хi. На основании проведенной серии испытаний может быть построена таблица (предполагается, что в таблице значения х1,…, хk упорядочены по возрастанию): … i 1 2 хi x1 х2 xk ni n1 п2 nk p̂i p̂1 = n1 n p̂2 = n2 n k p̂k = nk n Такая таблица называется статистическим рядом дискретной случайной величины Х. По существу, это ряд распределения случайной величины, в котором неизвестные истинные вероятности заменены их оценками – частотами, найденными по результатам проведенных испытаний. В отличие от точного распределения случайной величины, статистический ряд определяет эмпирическое1 (полученное в результате опыта) распределение. Так же как точное распределение, эмпирическое распределение дискретной случайной величины может быть представлено и в графической форме – в виде точечного графика, многоугольника распределения, столбчатой диаграммы. 34. По результатам 100 бросаний постройте эмпирическое распределение числа, выпадающего при бросании игрального кубика. По результатам испытаний могут быть найдены статистическое математическое ожидание и статистическая дисперсия случайной величины. 1 22 Напомним, что истинные математическое ожидание и дисперсия случайной величины Х, принимающей значения x1, x2,…, xk с вероятностями, p2,…, pk определяются следующим образом: mX = х1р1 + х2р2 +…+ хkрk, DX = М ( X mX ) 2 ( x1 mX ) 2 p1 ( x2 mX ) 2 p2 ... ( xk mX ) 2 pk . Для получения статистического математического ожидания и статистической дисперсии нужно в этих формулах заменить неизвестные истинные вероятности значений случайной величины соответствующими частотами: mˆ X x1 n1 n n x n x n ... xk nk x2 2 ... xk k = 1 1 2 2 , n n n n n n n Dˆ X ( x1 mˆ X ) 2 1 ( x2 mˆ X ) 2 2 ... ( xk mˆ X ) 2 k = n n n = ( x1 mˆ X ) 2 n1 ( x2 mˆ X ) 2 n2 ... ( xk mˆ X ) 2 nk . n Статистическое среднее квадратичное отклонение определяется как ˆ X D̂X . Как следует из приведенных формул, статистическое среднее представляет собой среднее взвешенное значений, которые может принимать случайная величина Х, с весами, равными полученным в результате опыта частотам этих значений. Аналогично, статистическая дисперсия – среднее взвешенное квадратов отклонений от статистического среднего с теми же весами. Но те же формулы можно интерпретировать несколько по-другому. Каждый результат наблюдения мы можем рассматривать самостоятельно, не обращая внимания на то, что среди них будут повторяющиеся. Тогда в результате наблюдения будет получено n чисел x1, x2 , ..., xn (штрих использован, чтобы отличать этот набор чисел от набора x1, x2,…, xk, значений, которые может принимать случайная величина). Среди этих чисел n1 раз будет повторяться значение x1, п2 раз – значение x2 и т.д. Используя числа x1, x2 , ..., xn , можно 23 переписать формулы для статистического среднего и статистической дисперсии следующим образом: mˆ X x1 x2 ... xn ; n ( x mˆ X ) 2 ( x2 mˆ X ) 2 ... ( xn mˆ X ) 2 . Dˆ X 1 n В таком виде статистическое среднее представляет собой среднее арифметическое результатов отдельных наблюдений, а статистическая дисперсия – среднее арифметическое квадратов отклонений отдельных наблюдений от статистического среднего. 35. Найдите математическое ожидание статистического среднего m̂X . Указание. Воспользуйтесь свойствами математического ожидания (задания 18 и 22) и тем, что математические ожидания частот событий равны истинным значениям вероятностей этих событий. В задании 35 установлено, что статистическое среднее m̂X случайной величины X является несмещенной оценкой ее математического ожидания. Аналогичное утверждение относительно статистической дисперсии неверно. Можно доказать (доказательство выходит за рамки нашего курса), что математическое ожидание статистической дисперсии, определяемой по приведенным выше формулам, равно n 1 M Dˆ X DX , n где DX – истинная дисперсия. Чтобы устранить смещение статистической дисперсии, вводят коэффициент и вычисляют статистическую дисперсию по формулам ( x mˆ X ) 2 n1 ( x2 mˆ X ) 2 n2 ... ( xk mˆ X ) 2 nk Dˆ X 1 n 1 или ( x mˆ X ) 2 ( x2 mˆ X ) 2 ... ( xп mˆ X ) 2 Dˆ X 1 . n 1 поправочный 24 При большом количестве опытов различия между оценками дисперсии, полученными по исходным и по скорректированным формулам, незначительны. 36. На тренировке стрелок сделал 50 выстрелов по мишени. Его результаты приведены в таблице. Область мишени 6 7 8 9 10 Число попаданий в область 4 9 16 15 6 Найдите статистические характеристики ( mˆ , Dˆ , ̂ ) результата выстрела (числа выбиваемых очков) для этого стрелка. Статистика непрерывных случайных величин До сих пор мы занимались дискретными случайными величинами, то есть такими случайными величинами, которые могут принимать только отделенные друг от друга значения. В отличие от дискретных непрерывные случайные величины могут принимать любые значения из некоторого промежутка. Судить о распределении непрерывной случайной величины1 по результатам наблюдений можно с помощью процедуры дискретизации – перехода к дискретной случайной величине, обладающей близкими вероятностными свойствами. Исходной информацией для этого являются полученное в результате эксперимента конечное число n значений непрерывной случайной величины Х. Обозначим эти значения (в порядке возрастания) x1, x2,… , xn. Приписывать этим значениям частоты их появления, как это делалось в случае дискретных случайных величин, не имеет смысла. Дело в том, что частоты, если среди результатов наблюдений нет повторяющихся (что характерно для непрерывных величин), будут равны 1 , независимо от того, насколько густо или, наоборот, редко, располагаются п эти результаты в той или иной части диапазона значений. При увеличении числа наблюдений п все частоты будут приближаться к 0. В другой серии из того же числа наблюдений те же самые близкие к 0 частоты будут приписаны другим значениям случайной величины. Такой Мы не вводим строгого понятия распределения непрерывной случайной величины. Отметим только, что это характеристика, показывающая, насколько «густо» могут располагаться значения случайной величины в той или иной части всего промежутка ее возможных значений. 1 25 подход можно считать бессодержательным. С похожей ситуацией мы столкнулись в 7 классе, когда пытались использовать классический подход к определению вероятности случайной точки с определенными координатами на плоскости, в пространстве или на прямой. Тогда было решено вместо вероятностей конкретных рассматривать вероятности попадания в некоторые области. случайных точек Мы и теперь поступим аналогичным образом. Разобьем весь промежуток [x1; xn] полученных в эксперименте значений случайной величины на k промежутков: x1; x2 , x2 ; x3 ,…, xk ; xk 1 . Как, правило, такие промежутки берут одинаковой длины, хотя это не является обязательным. Штрихи в обозначениях границ промежутков использованы для того, чтобы не путать эти границы с полученными в результате эксперимента значениями x1, x2,… , xn случайной величины Х.