Теория вероятностей и математическая

Национальный институт ВЫСШАЯ ШКОЛА УПРАВЛЕНИЯ В. И. Соловьев МАТЕМАТИКА для специальностей «Государственное и муниципальное управление», «Менеджмент организации» Часть 3 ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В ЭКОНОМИКЕ Р а з д е л 3.3 РАБОЧАЯ ТЕТРАДЬ Москва — 2005 УДК 51 (075.8) ББК 22.17я73 Ф., и., о. студента (регион) (группа)  В. И. Соловьев, 2005  НИ «ВШУ», 2005 Глава 4. СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ § 4.1. НЕКОТОРЫЕ ВЕРОЯТНОСТНЫЕ НЕРАВЕНСТВА И ИХ СЛЕДСТВИЯ При доказательстве многих теорем теории вероятностей и математиче ской статистики используется ряд вспомогательных неравенств. Впрочем, эти неравенства используются не только в теории вероятностей и математической статистике, но и повсеместно в математике. Читатели наверняка знакомы с большинством из приводимых неравенств из курса математического анализа. НЕРАВЕНСТВО МАРКОВА. Если неотрицательная случайная величина X име ет конечное математическое ожидание MX, то для любого ε > 0 справедливо неравенство MX . ε P{ X> ε} (4.1.1) Доказательство. Проведем доказательство для дискретных случайных величин. В вы ражении для математического ожидания MX = ∑ xi pi отбросим из суммы в правой части те i слагаемые, для которых ε: MX = ∑ xi pi ∑ xp i Но ∑p i i . ε, т. е. MX i: xi >ε i ∑ xp i i: xi >ε = P{ X >ε} , поэтому MX > εP{ X >ε} , откуда P{ X > ε} i > ∑ εp i: xi >ε i = ε ∑ pi . i: xi >ε MX / ε , что доказывает i: xi >ε формулу (4.1.1) для д и с к р е т н ы х неотрицательных случайных величин. Справедливость ее для п р о и з в о л ь н ы х неотрицательных случайных величин следует из того, что любая случайная величина может быть приближена монотонно неубывающей последовательностью дискретных случайных величин, и математическое ожидание случайной величины определяет ся как предел последовательности соответствующих математических ожиданий (см. п. 2.6.2). Из неравенства Маркова (4.1.1) следует НЕРАВЕНСТВО ЧЕБЫШЁВА. Если случайная величина X имеет конечные ма тематическое ожидание MX и дисперсию DX, то для любого ε > 0 справед ливо неравенство DX P{| X − MX | < ε} 1− 2 . (4.1.2) ε Доказательство. Пусть Y = (X – MX) , δ = ε , тогда Y 2 ва (4.1.1) P{Y > δ} 2 0, δ > 0 и согласно неравенству Марко MY / δ или P{ | X − MX| > ε} = P{( X − MX )2 > ε2 } При этом P{ | X − MX| DX / ε2 . ε} = 1− P{ |X − MX| > ε} 1− DX / ε2 , что и требовалось доказать. Также из неравенства Маркова (4.1.1) следует, что если математическое ожидание неотрицательной случайной величины X равно нулю, то эта слу чайная величина равна нулю с вероятностью, равной единице. Доказательство. Пусть X 0, MX = 0, тогда для любого ε > 0 P{ X > ε} чит, P{X > 0} = 0, и учитывая, что X MX / ε = 0 , зна 0, получаем, что P{X = 0} = 1 – P{X > 0} = 1, что и тре бовалось доказать. Теперь мы можем провести доказательство, обещанное в п. 2.2.2. Доказательство второй части утверждения о формуле для дисперсии константы (2.2.20). Покажем, что если для некоторой случайной величины X выполняется равенство DX = 0, то 3 существует такое число c = MX, что P{X = c} = 1, т. е. с вероятностью, равной единице, эта случайная величина равна константе. Согласно неравенству Чебышёва (4.1.2) для любого ε > 0 P{| X − MX | < ε} 1− DX / ε2 . Но в данном случае DX = 0, т. е. для любого ε > 0 P{|X – MX| < ε} 1. Учитывая, что по теореме об ограниченности вероятности (1.4.8) вероят ность любого события, в том числе, и события {|X – MX| < ε}, не превосходит единицы, заклю чаем, что для любого ε > 0 P{|X – MX| < ε} = 1, откуда P{|X – MX| = 0} = 1, значит, P{X = MX} = 1, т. е. существует такое число c = MX, что P{X = c} = 1, что и требовалось дока зать. С помощью неравенства Чебышёва (4.1.2) можно доказать ПРАВИЛО ТРЕХ СИГМ ДЛЯ ПРОИЗВОЛЬНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ. Вероятность P{|X – MX| < ε} для произвольной случайной величины с конечным матема тическим ожиданием и конечной дисперсией составляет не менее 8/9 = 0,(8) ≈ 0,89: P{| X − MX | < 3σ X } Доказательство. Согласно неравенству 8 . 9 (4.1.3) Чебышёва (4.1.2) для ε>0 любого DX σ σ 1 8 . Пусть ε = 3σX, тогда P{| X − MX | < 3σ X } 1− = 1− = 1− = , 2 2 ε (3σ X ) 9σ 9 9 что и требовалось доказать. НЕРАВЕНСТВО ЙЕНСЕНА. Для любой случайной величины X и любой выпуклой 2 X P{| X − MX | < ε} 1− 2 X 2 X вверх [выпуклой вниз] функции ϕ(x) справедливо неравенство Mϕ(X) ϕ(MX) [соответственно Mϕ(X) ϕ(MX)]. (4.1.4) Доказательство. Если функция u(x) в ы п у к л а в в е р х, то для любого x0 ∈ R найдет ся такое λ = λ(x0), что для всех x ∈ R u(x) u(x0) + (x – x0)λ(x0). Подставляем x0 = MX: u(MX) + (x – MX)λ(MX), откуда, учитывая, что величины u(MX) и λ(MX) не являются u(x) случайными, а M(X – MX) = 0, получаем Mu(X) u(MX), что и требовалось. Для в ы п у к л ы х в н и з функций доказательство аналогично. Интерпретация неравенства Йенсена такова. Индивидуум, функция по лезности которого выпукла, всегда предпочтет любому случайному доходу X детерминированный доход в размере MX. НЕРАВЕНСТВО КОШИ – БУНЯКОВСКОГО – ШВАРЦА. Для любых случайных вели чин X, Y справедливо неравенство |M(XY)| MX 2 M Y 2 . (4.1.5) Доказательство. Рассмотрим случайную величину Z = (X + tY) , где t ∈ R — произволь 2 ное вещественное число. Эта случайная величина неотрицательна, поэтому ее математическое ожидание также будет неотрицательным: MZ 2 2 2 2 2 2 2 + (tY) ] = M[X ] +2tM[XY] + t M[Y ] = at + bt + c, где a = M[Y ] 2 2 0. Но MZ = M[(X + tY) ] = M[(X) +2tXY + 2 0, b = 2M[XY], c = M[X ]. Для того, чтобы квадратный трехчлен at + bt +c, в котором коэффициент a > 0, был неотрица тельным, необходимо и достаточно, чтобы дискриминант этого квадратного трехчлена был 4 неположителен: 2 2 D = b – 4ac 2 4M[X ]M[Y ], откуда |M( XY)| 0, 2 т. е. 2 2 (2M[XY]) – 4M[X ]M[Y ] 0 или 4(M[XY]) 2 MX 2 MY 2 , что и требовалось доказать. Если же a = 0, то 2 это означает, что M[Y ] = 0, откуда следует, что Y = 0 с вероятностью, равной единице (по следствию из неравенства Маркова), и тогда справедливость неравенства Коши — Буняков ского — Шварца также не вызывает сомнений. Теперь мы можем провести еще два доказательства, обещанных ранее — в п. 2.10.2. Доказательство нормированности коэффициента корреляции (3.2.20). Пусть случайные величины X и Y имеют нулевые математические ожидания, тогда MX = 0, MY = 0, DX = 2 2 2 2 2 2 = M[X ] – (MX) = M[X ], DY = M[Y ] – (MY) = M[Y ], cov(X, Y) = M[XY] – MXMY = M[XY]. Из не | M[XY] | равенства Коши — Буняковского — Шварца (4.1.5) следует, что 1 . Учиты M[ X 2 ] M[Y 2 ] 2 2 вая, что M[XY] = cov(X, Y), M[X ] = DX, M[Y ] = DY, заключаем, что cov( X, Y) σ X σY 1 , т. е. |ρ(X, Y)| | cov(X, Y) | DX DY 1 или 1, откуда и получаем доказываемое неравенство. Если теперь X и Y — произвольные случайные величины, то случайные величины X′ = X – MX и Y′ = Y – MY имеют нулевые математические ожидания, значит, как мы только что показали, |ρ(X′, Y′)| 1. Но по свойству (3.2.17) ρ(X′, Y′) = ρ(X, Y), поэтому для любых слу чайных величин X и Y коэффициент корреляции лежит в границах [–1; 1], что и требовалось доказать. Доказательство второй части утверждения о формуле для коэффициента корреляции линейно связанных случайных величин (3.2.22). Покажем, что если для какихлибо случайных величин X и Y |ρ(X, Y)| = 1, то существуют такие числа a, b ∈ R, a ≠ 0, что P{Y = aX + b} = 1. Пусть X= X − MX Y − MY ,Y= , тогда D X = D Y = 1, σ = σ = 1, ρ( X, Y) = ρ(X, Y) . X Y σX σY Поскольку |ρ(X, Y)| = 1, возможны два случая: ρ(X, Y) = 1 и ρ(X, Y) = –1. В случае ρ(X, Y) = 1 имеем: D(Y− X) = D Y + D X− 2σ σ ρ( X, Y) = 2[1−ρ(X, Y)] = 0 , откуда по (недавно до Y X казанной) второй части утверждения о формуле для дисперсии константы получаем, что X − MX   Y − MY существует такая константа c ∈ R, что P{Y− X = c} = 1 или P  = c+   = 1 , т. е.  σY σ X   σY    σY  σY σ P > 0, b = MY − Y MX + Y =   X + MY − MX + σY c  = 1 или P{Y = aX + b} = 1, где a =   σ σ σ σ  X   X X X   +σY c ∈ . В случае ρ(X, Y) = –1 аналогичным образом получаем: D(Y + X ) = 2[1 + ρ(X, Y)] = 0 ,   Y = − σY  X + MY + σY MX +σ c  откуда P{Y + X = c} = 1 или P    Y  = 1 , т. е. P{Y = aX + b} = 1,     σ σ     X X     σY σY < 0, b = MY + MX + σ Y c ∈ . Утверждение доказано. где a = − σX σX При решении задач могут оказаться полезными еще два неравенства. НЕРАВЕНСТВО ГЁЛЬДЕРА. Для любых случайных величин X, Y при α ∈ (0; 1) справедливо неравенство M | XY| α 1−α (M |X|1/α ) (M |Y|1/(1−α ) ) . (4.1.6) 5 НЕРАВЕНСТВО МИНКОВСКОГО. Для любых случайных величин X, Y при r справедливо неравенство (M | X + Y|r ) 1/ r (M |X|r ) 1/ r + (M |Y|r ) 1/ r . 1 (4.1.7) Доказательство этих неравенств оставляем читателю в задачах 392—393. Задачи 386. Сумма всех вкладов в некотором банке составляет 2 000 000 ден. ед., а вероятность того, что случайно взятый вклад не превысит 10 000 ден. ед., равна 0,8. Оценить с помощью неравенства Маркова число вкладчиков банка. Решение. Пусть n — число вкладчиков, а (неотрицательная) случайная величина X описывает размер случайно выбранного вклада. Тогда средний размер вклада 2 000 000 MX ден. ед., и по неравенству Маркова P{ X> 10 000} , откуда MX = n 10 000 MX 200 P{ X 10 000} 1− или P{ X 10 000} 1− . Но по условию P{X 10 000} = 0,8, отку n 10 000 да 1− 200/ n 0,8 , значит, n 1000 человек. 387. Для новогоднего праздника Петя должен сделать гирлянду из 400 электрических лампочек. Он решает включить их параллельно. Лампочки оказа лись очень низкого качества — вероятность того, что какаялибо из них погаснет во время праздника, составляет 0,5. С помощью неравенства Чебышёва оценить вероятность того, что число горящих лампочек будет заключено между 100 и 300. 388. Инвестор покупает ценные бумаги за счет кредита, взятого под i про центов годовых под залог своей недвижимости. Годовая доходность ценных бу маг X представляет собой случайную величину с математическим ожиданием a > i и средним квадратичным отклонением σ. Оценить вероятность того, что ин вестор не сможет вернуть кредит: а) не имея никаких сведений о характере за кона распределения случайной величины X, зная только, что она положительна; б) предполагая случайную величину X распределенной по нормальному закону. 389. Средние ежедневные расходы на покупку канцелярских принадлеж ностей для офиса банка составляют 1000 руб., а среднее квадратичное отклонение этой случайной величины не превышает 200 руб. Оценить вероятность того, что расходы на канцелярские принадлежности в любой наугад выбранный день не превысят 2000 руб, используя: а) неравенство Маркова; б) неравенство Чебышёва. 390. По статистическим данным в среднем 87% новорожденных доживают до 50 лет (т. е. вероятность дожития до 50 лет равна 0,87). С помощью неравенст ва Чебышёва оценить вероятность того, что из 1000 новорожденных доля (отно сительная частота) доживших до 50 лет будет отличаться от вероятности не бо лее, чем на 0,04 (по модулю). 391. Пусть X — положительная случайная величина с конечным матема тическим ожиданием. Доказать, что 1/ MX M(1/ X) . 392. Доказать неравенство Гельдера (4.1.6). 393. Доказать неравенство Минковского (4.1.7). 394. Доказать, что для любых случайных величин X, Y при α 1 справед ливо неравенство M | X + Y|α M | X |α +M |Y|α . 6 7 8 § 4.2. ВИДЫ СХОДИМОСТИ СЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ Мы же встречались ранее с примерами сходимости случайных величин: когда в п. 2.6.2 определяли и н т е г р а л Л е б е г а, мы рассматривали после довательность случайных величин {Xn}, которая сходится к случайной вели чине X равномерно по ω. Рассмотрим другие виды сходимости случайных ве личин. Последовательность случайных величин X1, X2 , …, Xn , … сходится почти наверное к случайной величине X , если P {lim Xn = X } = 1 . n→∞ Сходимость почти наверное обозначается так: п. н. Xn → X. Последовательность случайных величин X1, X2 , …, Xn , … сходится по веро ятности к случайной величине X , если для любого ε > 0 lim P {| Xn − X |< ε} = 1 . n→∞ Сходимость по вероятности обозначается так: P Xn  →X . Последовательность случайных величин X1, X2 , …, Xn , … сходится по распределению (или слабо сходится) к случайной величине X , если во всех точках x , в которых функция распределения FX (x) непрерывна, lim FXn (x) = FX (x) n→∞ равномерно по x. Сходимость по распределению обозначается так: D →X . Xn ⇒ X или Xn  Примером сходимости по распределению является формула Пуассона (1.6.5). Различные виды сходимости обладают следующими с в о й с т в а м и: P если Xn  → X, P Xn + Yn  → X + Y, P Yn  → Y , то P Xn Yn  → XY ; (4.2.1) P если Xn  → X и ϕ(x) — непрерывная функция, то P ϕ( Xn )  →ϕ( X) ; (4.2.2) P → x0 и ϕ(x) непрерывна в точке x0 , то если Xn  P ϕ(Xn )  →ϕ(x0 ) ; (4.2.3) P если Xn  → x = const, Yn ⇒ Y , то Xn + Yn ⇒ x + Y, Xn Yn ⇒ xY ; (4.2.4) 9 п. н. P если Xn → X , то Xn  →X , (4.2.5) P если Xn  → X , то Xn ⇒ X ; (4.2.6) P если Xn ⇒ x = const , то Xn  →x ; (4.2.7) н о н е н а о б о р о т!; Доказать свойства (4.2.1)—(4.2.7) мы предлагаем читателю самостоятель но в задаче 395. Отметим также, что из сходимости по вероятности н е с л е д у е т схо димость математических ожиданий, дисперсий и других характеристик. При доказательстве центральной предельной теоремы в п. 4.4.1 нам пона добится следующий важный факт, который мы примем без доказательства. ТЕОРЕМА НЕПРЕРЫВНОСТИ. Следующие три утверждения эквивалентны: • последовательность случайных величин X1, X2 , …, Xn , … сходится по распределению к случайной величине X: lim FXn (x) = FX (x) равномерно по x; n→∞ • последовательность производящих функций случайных величин X1, X2 , …, Xn , … сходится к производящей функции случайной величины X : lim ϕ Xn (z) = ϕ X (z) равномерно по z; n→∞ • последовательность характеристических функций случайных величин X1, X2 , …, Xn , … сходится к характеристической функции случайной вели чины X : lim gXn (t) = gX (t) равномерно по t. n→∞ Доказательство теоремы непрерывности можно найти, например, в книгах [16, 49]. Задачи 395. Доказать свойства (4.2.1)—(4.2.7). 396. Привести пример такой последовательности случайных величин Xn (n = 1, 2, …) , чтобы она сходилась по вероятности к некоторой случайной ве личине X, но при этом lim MXn ≠ MX . n→∞ 397. Доказать, что из сходимости почти наверное следует сходимость по вероятности, а обратное утверждение неверно. 10 11 § 4.3. ЗАКОНЫ БОЛЬШИХ ЧИСЕЛ Под з а к о н а м и б о л ь ш и х ч и с е л понимается обобщенное назва ние группы теорем, утверждающих, что при неограниченном увеличении чис ла испытаний средние величины сходятся (в какомто из смыслов, рассмот ренных в предыдущем параграфе) к некоторым постоянным. Наиболее общей из этих теорем является теорема Чебышёва, также называемая просто зако ном больших чисел. ТЕОРЕМА ЧЕБЫШЁВА. Если дисперсии некоррелированных случайных вели чин X1, X2 ,…, Xn ограничены сверху числом B , то для произвольного сколь угодно малого ε > 0 справедливо неравенство n n       X M X ∑ i ∑  i  i=1  B i=1  1 P − < ε −     n nε2  n  (4.3.1) и предельное равенство n n       ∑ X i ∑ MX i  i=1  lim P  − i=1 < ε = 1 ,  n→∞   n  n (4.3.2) т. е. n ∑ Xi i=1 n n  → P ∑ MX i=1 i . n Доказательство. Очевидно, если X1 , X2 ,…, Xn — случайные величины, то величина n X= ∑X i =1 n i также является случайной, причем по свойствам математического ожидания и n ∑ MX i дисперсии M X = i=1 n , и поскольку случайные величины X1 , X2 ,…, Xn некоррелированы, n ∑ DXi то D X = i=1 2 n . Применим к случайной величине X неравенство Чебышёва: n n n       X i ∑ MX i DX i   ∑ ∑  i=1  DX i =1 i =1  − < ε = − < ε − = − {| | } 1 1 . P P X M X     ε2 n n2 ε2  n  n ∑ DX n i ∑B nB B = 1− 2 , т. е. 2 2 nε nε nε nε доказана справедливость неравенства (4.3.1). Переходя в этом неравенстве к пределу при n → ∞ , получаем равенство (4.3.2). Учитывая, что все DX i B , получим, что 1− i =1 2 2 1− i =1 2 2 = 1− Закон больших чисел утверждает, что среднее арифметическое случай ных величин при возрастании их числа обладает свойством статистической устойчивости, т. е. сходится по вероятности к н е с л у ч а й н о й величине 12 — среднему арифметическому математических ожиданий этих случайных величин. Практическое применение закона больших чисел состоит в том, что среднее арифметическое, вычисленное по достаточно большому числу ре зультатов измерений какойлибо величины, будет сколь угодно близко к из меряемой величине. Статистическая устойчивость относительной частоты появления успеха в серии независимых испытаний доказывается в следующей теореме. ТЕОРЕМА БЕРНУЛЛИ. Если вероятность успеха в каждом из n независимых испытаний постоянна и равна p , то для произвольного сколь угодно малого ε > 0 справедливо предельное равенство  m  lim P  − p < ε = 1 , n→∞  n   (4.3.3) где m — число успехов в серии из n испытаний. Доказательство. Рассмотрим случайные величины X1 , X2 , …, Xn , определяемые по сле дующему правилу: 1, если произошел успех в iм испытании [с вероятностью p], Xi =  0, если не произошел успех в iм испытании [с вероятностью (1− p)]. n Тогда MX i = p, DX i = p(1− p), m = ∑ X i . Поскольку 0 p 1 , дисперсии случайных ве i =1 личин Xi ограничены сверху единицей (так как DXi = p(1− p) 1 ), и можно воспользоваться теоремой Чебышёва (4.3.2), согласно которой n n       Xi ∑ MXi   ∑  m     i=1  m np   i =1  lim P  − p < ε = lim P  − < ε = lim P  − < ε = 1 , n→∞  n n→∞  n n →∞   n n    n        что и требовалось доказать. Теорему Бернулли, очевидно, можно записать и в форме, аналогичной (4.3.1):  m  p(1 − p) . P  − p < ε 1 − nε2  n  (4.3.4) Если для некоторой последовательности случайных величин вместо схо димости по вероятности имеет место сходимость почти наверное: n ∑ Xi i=1 n n п. н. → ∑ MX i=1 n i , то говорят, что такая последовательность удовлетворяет усиленному закону больших чисел. Задачи 398. Последовательность некоррелированных случайных величин X1, X2 , X3 ,… определяется по следующему правилу: случайная величина Xi принимает значения − n , 0, n с вероятностями 1/n, 1 – 2/n, 1/n соответст 13 венно. Доказать, что для этой последовательности выполняются условия теоре мы Чебышёва. Доказательство. Условия теоремы Чебышёва выполнены, поскольку MXi = 0, DXi = 2 . 399. Для определения среднего дохода налогоплательщиков города нало говой инспекцией была проведена проверка 250 жителей этого города, отобран ных случайным образом. Оценить вероятность того, что средний годовой доход 250 жителей города отклонится от среднего арифметического X = ∑ X i /250 годо i=1 вых доходов выбранных 250 жителей не более, чем на 1000 руб., если известно, что среднее квадратичное отклонение годового дохода не превышает 2500 руб. Решение. Согласно неравенству (4.3.1), которым можно пользоваться, поскольку все n  n      ∑ X i ∑ MXi   2500 ⋅ 2500 25 2 i =1 i =1 − > 1− = 1− = 0,975 . DXi (2500) , P  1000   n  ⋅ ⋅ 250 1000 1000 1000 n   400. Доказать, что для последовательности некоррелированных случай ных величин X1, X2 , X3 , … , определяемых рядом распределения Xi p a −a n +1 n 2n + 1 2n + 1 выполняется усиленный закон больших чисел. 401. Доказать, что для последовательности некоррелированных случай ных величин X1, X2 , X3 ,… , таких что MX i = a, DX i b (i = 1, 2, 3, …), выполняется усиленный закон больших чисел. 14 15 § 4.4. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 4.4.1. Т е о р е м ы Л е в и , Л я п у н о в а и Л и н д е б е р г а Законы больших чисел устанавливают факт приближения среднего зна чения большого числа случайных величин к некоторым постоянным в виде сходимости последовательностей случайных величин по вероятности и почти наверное. Но этим не ограничиваются закономерности, возникающие в ре зультате суммарного действия случайных величин. Центральная предельная теорема — это общее название группы теорем, утверждающих, что достаточ но большая сумма сравнительно малых случайных величин распределена приближенно по нормальному закону. Практическое значение центральной предельной теоремы велико — она составляет теоретиковероятностную основу методов м а т е м а т и ч е с к о й с т а т и с т и к и. ТЕОРЕМА ЛЕВИ. Если независимые случайные величины X1, X2 , …, Xn , … рас пределены по одному и тому же закону с математическим ожиданием a и средним квадратичным отклонением σ, то при n→∞ случайная величина n Zn = ∑ (X i − a) i=1 σ n сходится по распределению к стандартной нормальной случайной величине N (0;1) : Zn ⇒ N (0;1) . tY Доказательство. Пусть gY(t) = Me — характеристическая функция случайных величин Yi = Xi – a (так как законы распределения этих случайных величин одинаковы, то и характе ристическая функция у всех них одна и та же). Напишем разложение этой функции в р я д М а к л о р е н а:  Y t (Y t)2 (Y t)3  gY (t) = M e Yi t = M 1 + i + i + i eθYi t  ,   1! 2! 3! где θ ∈ (0;1) . При этом, поскольку M(Yi t) = tMYi = tM( X i − a) = t ⋅ 0 = 0, M((Yi t)2 ) = t 2MYi2 = t 2 (MYi2 − 02 ) = = t 2 (MYi2 − (MYi )2 ) = t 2DYi = t 2 (D(Yi + a)) = t 2DXi = t 2σ2 , получаем, что gY (t) = M(1) + 2  (Y t)3   (Y t)3  M(Yi t) M ((Yi t) ) 0 t 2σ2 t 2σ2 + + M  i eθYi t  = 1 + + + M i eθYi t  = 1 + +δ(t),  3!   3!  1! 2! 1! 2! 2!  (Y t)3  где δ(t) = M i eθYi t  .  3!  Найдем теперь характеристическую функцию случайной величины 16 n n ∑ (X − a) ∑ Y i Zn = i = i =1 σ n i =1 . σ n Имеем: n ∑ Yi gZ (t) = M eZn t = M e t  n tYi  = M ∏ e σ n  ,  i=1  i=1 σ n и поскольку математическое ожидание произведения независимых случайных величин рав но произведению их математических ожиданий, n n  n tYi  n tYi  t    t   = gZ (t) = M ∏ e σ n  = ∏ M e σ n = ∏ gY  g .   σ n   Y  σ n   i=1  i=1 i =1 ( ) Здесь  t  2  σ  σ n   t   t   t   t  t 2σ2 t2    1 1 1 = + + δ = + + δ = + + δ  gY     ,  2    σ n    σ n  σ n   σ n  2! 2σ n 2n  tY 3   i    θ θtYi tY  i  σ n   t  t3  3 σ n  = σ n  e e . δ  = M M Y i   σ n   6σ3 n n 3! 2 ( ) Примем дополнительное н е о б я з а т е л ь н о е п р е д п о л о ж е н и е, упрощаю щее доказательство. Будем считать, что случайные величины Yi ограничены в совокупности: |Yi| < A, i = 1, 2, 3, …, тогда при |t| < T ( θtYi n  t  t3 M Yi3 e σ δ  =   σ n  6σ3 n n ) < 6Aσ n| t |n M(e ) 3 At σ n 3 3 и  t   t  t2 t2  = + + δ = + gY  1 1 (1 + ηn (t)),    σ n   σ n  2n 2n ηn (t) = ( 2n  t  2n A3 | t |3 M eσ ρ < t 2  σ n  t 2 6σ3 n n At n )= A ( 3 At n |t| M eσ 3 3σ n ) → 0 n→∞ равномерно по t. Это означает, что n t 2     t  1 + t  = e 2 ,   gZ (t) = gY   →   n→∞  2n    σ n  n 2 т. е. последовательность характеристических функций случайных величин Zn сходится рав номерно по t к характеристической функции случайной величины N (0; 1) , значит, по теоре ме непрерывности (см. § 4.2) Zn ⇒ N (0; 1) , что и требовалось доказать. Приведем строгую формулировку двух более общих теорем (без доказа тельства). Рассмотрим последовательность произвольных независимых случайных величин X1, X2 , …, Xn , … , и пусть MX i = a i , DX i = σ2i . 17 Говорят, что для этой последовательности случайных величин выполня ется у с л о в и е Л я п у н о в а, если n ∑M | X lim − ai |3 i =0. i=1 n→∞  n 2  ∑ σi   i=1  3/2 (4.4.1) ТЕОРЕМА ЛЯПУНОВА. Если независимые случайные величины X1, X2 ,…, Xn удовлетворяют условию Ляпунова (4.4.1), то случайная величина n Zn = ∑ (X i − MX i ) i=1 n ∑σ 2 i i=1 сходится по распределению к стандартной нормальной случайной величине N (0;1) : Zn ⇒ N (0;1) . С м ы с л у с л о в и я Л я п у н о в а состоит в том, что при его выполне нии дисперсия каждой случайной величины Xi составляет лишь м а л у ю ч а с т ь в общей дисперсии суммы X1 + X2 + · · · + Xn. Если бы это было не так, а, например, величина X1 имела бы существенно больший разброс, чем остальные величины X2, X3, …, Xn, то закон распределения суммы X1 + X2 + · · · + Xn опреде лялся бы в основном величиной X1, и тогда ожидать нормального распределе ния суммы X1 + X2 + · · · + Xn не было бы оснований. Если же все случайные вели чины X1, X2, …, Xn вносят в дисперсию суммы X1 + X2 + · · · + Xn приблизительно равноправный вклад, то сумма будет распределена по нормальному закону. Говорят, что для этой последовательности случайных величин выполня ется у с л о в и е Л и н д е б е р г а, если для любого τ > 0 n ∑ ∫ lim (xi − ai )2 fi (xi )dxi i=1 | x −a |>τb i i n =0, n n→∞ ∑σ (4.4.2) 2 i i=1 где bn = n ∑σ 2 i i=1 ТЕОРЕМА ЛИНДЕБЕРГА. Если независимые случайные величины X1, X2 ,…, Xn удовлетворяют условию Линдеберга (4.4.2), то случайная величина n Zn = ∑ (X i − MX i ) i=1 n ∑σ 2 i i=1 18 сходится по распределению к стандартной нормальной случайной величине N (0;1) : Zn ⇒ N (0;1) . С м ы с л у с л о в и я Л и н д е б е р г а таков. В знаменателе дроби стоит сумма дисперсий случайных величин X2, X3, …, Xn, а в числителе — сумма «хвостов» этих дисперсий. Когда условие Линдеберга выполняется, говорят, что «хвосты» дисперсий «легкие». Теорема Линдеберга является наиболее общей из приведенных форму лировок центральной предельной теоремы: и из условий теоремы Леви, и из условия Ляпунова следует условие Линдеберга. Таким образом, в условиях центральной предельной теоремы 1 P {Zn < z} → FZ (z) = + Φ0 (z) . n→∞ 2 В ряде задач приходится сталкиваться с ситуацией, когда исследуемая случайная величина является суммой большого числа независимых слагае мых, влияние каждого из которых на сумму очень мало. Такими случайными величинами являются, например, капиталы банков и страховых компаний (доля каждого отдельно взятого вкладчика не зависит от доли других вклад чиков и относительно мала, но в сумме все эти доли весьма весомы), выручка торговых предприятий (покупатели действуют независимо друг от друга и по купают товары на относительно небольшие суммы) и др. — мы уже говорили об этом в п. 2.5.3. На основании центральной предельной теоремы часто можно до наблю дения того или иного явления сказать, что соответствующая случайная вели чина должна иметь нормальное распределение или близкое к нему. Пусть n X= ∑X i=1 n i , x= u−a , σ/ n тогда  n   ∑ Xi  n      ∑ X i  i=1 −a    i=1    n P{ X < u} = P  < u = P  < x =  σ / n   n   n   ∑ X i − na   u − a  1 1  i=1  , = P  < x → + Φ0 (x) = + Φ0  n→∞  σ / n  2 2  σ n   (4.4.3) т. е. выборочное среднее X при n → ∞ сходится по распределению к случай ной величине, распределенной по нормальному закону с параметрами aX = a, σ X = σ / n . 19 Задачи 402. Суточная выручка в универсаме равна в среднем 100 000 руб. и в 90% случаев отличается от 100 000 руб. не более, чем на 10 000 руб. Найти вероят ность того, что очередная суточная выручка окажется в пределах от 80 000 до 120 000 руб. Решение. Пусть X — суточная выручка. Как было отмечено выше, покупатели действуют независимо друг от друга и покупают товары на относительно небольшие суммы X X , но i покупателей в районе достаточно много, так что можно считать, что их количество n → ∞ . По этому суммарная выручка будет иметь нормальное распределение с некоторыми параметра ми a и σ. Поскольку для нормального распределения a = MX, то по условию a = MX = 100 000. Также в условии сказано, что P{90 000 < X < 110 000} = 0,9 . Но P{90 000 < X < 110 000} = 110 000 − a   90 000 − a  10 000   −10 000  10 000  10 000  = Φ0  −Φ0   = Φ0   −Φ0   = 2Φ0   , откуда Φ0   = 0,45 ,            σ  σ σ σ σ σ 10 000 ≈ 1,65 . Искомая вероятность P{80 000 < X < 120 000} = и по таблице можно найти σ     120 000 −100 000   80 000 −100 000   20 000    −Φ0   = 2Φ0   = 2Φ0 (2 ⋅1,65) = 2Φ0 (3,3) = 2⋅ 0,4995 = 0,999 . = Φ0           σ σ σ  403. Банкомат выдает стандартные суммы в 500, 100 и 50 долл., причем первые составляют 10%, а последние — 60% всех выдач. В среднем банкомат производит 100 выдач в сутки. Определить размер денежной суммы, которую необходимо заложить в банкомат утром, чтобы этой суммы с вероятностью 0,9 хватило для выдачи наличности вкладчикам до следующего утра. 404. При составлении статистического отчета нужно было сложить 104 чисел, каждое из которых было округлено с точностью до 10–m. Предполагая, что ошибки, возникающие при округлении, независимы в совокупности и рас пределены равномерно на отрезке [–0,5·10–m; 0,5·10–m], определить пределы, в которых с вероятностью, большей 0,987, будет лежать суммарная ошибка. 405. Торговец газетами ходит по вагонам электропоездов. В каждом из ва гонов он может продать газету с вероятностью 1/3. Случайная величина X — число вагонов, в которые заходил торговец прежде, чем продал первые 100 газет. Найти распределение случайной величины X. Решение. Пусть Yi — число вагонов, которые обошел торговец за время от продажи (i – 1)й газеты до продажи iй. Тогда все Yi (i = 1, 2, …, n) имеют одинаковый (геометриче n ский) закон распределения, X = ∑ Yi . Согласно центральной предельной теореме, при i =1 большом n случайная величина X имеет нормальное распределение. Предоставляем чита телю показать, что параметры этого распределения равны a = 300, σ = 30 . 406. Построить на одном рисунке графики композиций двух, трех, четырех одинаковых равномерных распределений. На том же рисунке построить график плотности нормального распределения. Убедиться, что при увеличении числа сла гаемых графики сближаются. 407. Построить на одном рисунке графики композиций двух, трех, четырех одинаковых показательных распределений. На том же рисунке построить график плотности нормального распределения. Убедиться, что при увеличении числа сла гаемых графики сближаются. 20 408. В условиях задачи 390 найти вероятность того, что из 1 000 новорож денных доля (относительная частота) доживших до 50 лет: а) будет заключена в пределах от 0,9 до 0,95; б) будет отличаться от вероятности не более, чем на 0,04 (по модулю). 409. Мера длины «фут», как видно из названия, имеет прямое отношение к ноге: это длина ступни. Но, как известно, размеры ног бывают разные. Немцы в XVI в. выходили из положения так. В воскресный день ставили рядом 16 первых вышедших из церкви мужчин, сумма длин их левых ступней делилась на 16 — средняя длина и была «правильным и законным футом». Известно, что размер стопы взрослого мужчины того времени описывается случайной величиной с ма тематическим ожиданием 262,5 мм и средним квадратичным отклонением 12 мм. Найти вероятность того, что два «правильных и законных фута», рассчитанных указанным способом в разные дни, отличаются друг от друга более, чем на 5 мм. Сколько нужно было бы взять мужчин для того, чтобы с вероятностью, большей 0,99, средний размер их ступней отличался бы от 262,5 мм менее, чем на 0,5 мм? 21 22 23 24 4.4.2. Т е о р е м ы М у а в р а — Л а п л а с а Приведем теперь два следствия из центральной предельной теоремы, от носящиеся к н е з а в и с и м ы м и с п ы т а н и я м. ЛОКАЛЬНАЯ ТЕОРЕМА МУАВРА — ЛАПЛАСА. Если вероятность p успеха в каж дом испытании отлична от нуля и единицы, а число испытаний n доста точно велико, то для расчета вероятности Pn (k) появления ровно k успехов в серии из n испытаний можно пользоваться приближенной формулой Pn (k) ≈  k − np  1 ϕ   np(1 − p)  np(1 − p)  ( k = 0,1, 2, … ), (4.4.4) где ϕ(u) — функция плотности нормального закона распределения. На практике, очевидно, вероятность появления любого конкретного числа успехов близка к нулю. Это имеет простое объяснение — ведь всего есть (n + 1) различных событий (может наступить 0, 1, 2, …, n успехов), и сумма ве роятностей этих (n + 1) событий должна быть равна единице. Поэтому важно уметь вычислять вероятности Pn (k1, k2 ) того, что число успехов в серии из n испытаний будет заключено между числами k1 и k2. Для этого используется ИНТЕГРАЛЬНАЯ ТЕОРЕМА МУАВРА — ЛАПЛАСА. Если вероятность p успеха в каждом испытании отлична от нуля и единицы, а число испытаний n дос таточно велико, то для расчета вероятности Pn (k1, k2 ) того, что число ус пехов в серии из n испытаний будет заключено в промежутке [k1; k2 ) , можно пользоваться приближенной формулой  k − np   k1 − np  Pn (k1, k2 ) ≈ Φ0  2  −Φ0    np(1 − p)   np(1 − p)  ( k1 = 0,1, 2, …; k2 > k1 ),(4.4.5) где Φ0 (u) — функция Лапласа. Доказательство. Пусть в серии из n испытаний Бернулли произошло X успехов. То гда, случайную величину X = Bi(n; p) , можно представить в виде суммы n независимых оди наково распределенных случайных величин  1, если произошел успех в iм испытании (с вероятностью p), Xi =    0, если не произошел успех в iм испытании [с вероятностью (1− p)]: т. е. n X = ∑ Xi . i =1 При этом по теореме Леви X − MX  <x = lim P n→∞      σ n       lim P  n→∞  n          i =1        ∑ X − nM X i σ n i                  1 <x = +Φ0 (x) . 2 Но MXi = p, σ = p(1− p) , поэтому    X − np  1 lim P  < x   = +Φ0 (x) n→∞  p(1− p) n      2 25 и  k − np   1       1 −  +Φ0  k1 − np  = Φ0  k2 − np  −Φ0  k1 − np , lim Pn (k1 ; k2 ) = +Φ0  2      n→∞  np(1− p)   2 2  np(1− p)   np(1− p)   np(1− p)   что и требовалось доказать. Локальная теорема Муавра — Лапласа (4.4.5) является простым следствием инте гральной теоремы Муавра — Лапласа (4.4.6), что предлагаем читателю доказать самостоя тельно в задаче 417. Задачи 410. Строительная фирма для привлечения инвестиций в строительство нового дома собирается воспользоваться банковским кредитом. Вероятность то го, что какойлибо банк в ответ на поступление бизнесплана примет положи тельное решение о кредитовании фирмы, равна 0,3. Строительная фирма обра тилась в 100 банков. Найти вероятности того, что решения о предоставлении кредитов этой фирме примут: а) ровно один банк; б) ровно 15 банков; в) ровно 30 банков; г) ровно 50 банков. Решение. Данную ситуацию можно рассматривать как серию из n = 100 испытаний Бернулли, в которых успехом считается принятие банком решения о кредитовании. Вероят ность успеха в единичном испытании равна по условию p = 0,3 . Поскольку число испытаний n велико, а произведение np = 30 > 10 , можно воспользоваться локальной теоремой Муав   1 1−100 ⋅ 0,3 1 1− 30  ϕ  ра — Лапласа: P100 (1) ≈ ϕ  =  = 0,22ϕ(−6,33) = 21  21  100 ⋅ 0,3 ⋅ (1− 0,3)  100 ⋅ 0,3 ⋅ (1− 0,3)  = 0,22ϕ(6,33) ≈ 0,22⋅0 = 0, P100 (15) ≈ 1 15 − 30  ϕ  = 0,22ϕ(−3,27) = 0,22ϕ(3,27) = 0,22⋅0,0020 = 0,00044 , 21  21  1  30 − 30  1  50 − 30  ϕ ϕ  = 0,22ϕ(0) = 0,22⋅0,3989 = 0,088, P100 (50) ≈  = 0,22 ϕ(4,36) ≈  21  21  21  21  ≈ 0,22⋅0 = 0 . P100 (30) ≈ 411. Вероятность появления успеха в каждом из независимых испытаний равна 0,25. Найти вероятность того, что в серии из 300 испытаний успех наступит ровно 75 раз. 412. Вероятность появления успеха в каждом из независимых испытаний равна 0,25. Найти вероятность того, что в серии из 300 испытаний успех наступит от 70 до 100 раз. 413. Менеджер ресторана по своему опыту знает, что в среднем около 70% клиентов, заказавших в ресторане столик на вечер, приходят вечером в ресто ран. В ресторане 30 столиков, но сегодня менеджер принял заказы у 35 клиентов. Определить, с какой вероятностью вечером в ресторан придут более чем 30 по сетителей, заказавших столики. Ответ: 0,02. 414. В условиях задачи 410 найти вероятности того, что решения о предос тавлении кредитов этой фирме примут: а) хотя бы один банк; б) более 15 банков; в) более 50 банков. 415. Во время каникул Петя работал в предвыборном штабе кандидата в депутаты, который проводил выборочный опрос избирателей. Примерное рас пределение голосов было известно: по 40% избирателей «за» и «против» канди дата, остальные воздержались. Сколько нужно опросить людей, чтобы с вероят ностью, не меньшей 0,9, гарантировать отклонение процента голосов, отданных 26 за кандидата при выборочном опросе, от истинного мнения избирателей не более, чем на 2% от всего электората? 416. В дачном поселке 2500 жителей, каждый из которых примерно шесть раз в месяц ездит на поезде в город, выбирая дни поездок случайным образом и не зависимо от других жителей. Какой наименьшей вместимостью должен обладать поезд, чтобы он переполнялся в среднем не чаще одного раза в 100 дней (поезд хо дит раз в сутки). 417. Доказать локальную теорему Муавра — Лапласа (4.4.3) как следствие интегральной теоремы Муавра — Лапласа (4.4.4). 27 28 29 § 4.5. МАТЕМАТИЧЕСКИЕ ОСНОВЫ ТЕОРИИ СТРАХОВАНИЯ Эффективным способом уменьшения потерь от неопределенностей явля ется объединение отдельных людей и организаций в с т р а х о в ы е с о о б щ е с т в а, поскольку трудно предсказать время, место и характер событий, способных повлиять на экономическое состояние индивидуумов, вместе с тем, по з а к о н у б о л ь ш и х ч и с е л, средние (или суммарные) потери большой группы индивидуумов предсказать можно. В страховых сообществах каждый индивидуум вносит сумму, намного меньшую его возможного ущерба, и в слу чае наступления ущерба убытки возмещаются из средств, собранных всеми членами сообщества, в случае же, когда для когото из членов страхового со общества ущерб не наступает, первоначально выплаченная этим индивидуу мом сумма распределяется между теми членами сообщества, которые понесли убытки. Первая математическая модель страхования была построена Т. Барруа в 1834 г. (она была нами уже рассмотрена в п. 2.7.2.), современные актуарные (т. е. страховые) модели восходят к Ф. Лундбергу, который в 1903 г. заложил ос новы а к т у а р н о й т е о р и и р и с к а. По д о г о в о р у с т р а х о в а н и я одна сторона (с т р а х о в а т е л ь) платит другой стороне (с т р а х о в щ и к у) определенную денежную сумму (с т р а х о в у ю п р е м и ю), и за это страховщик гарантирует в о з м е щ е н и е возможных убытков страхователя (в случае их возникновения). Смысл договора страхования состоит в том, что страхователь подвержен определен ному р и с к у (который заключается в возможном наступлении некоторого страхового случая) и стремится от этого риска защититься, а задачей стра ховщика является предоставление такой защиты. В качестве с т р а х о в о г о с л у ч а я может выступать болезнь, смерть, автомобильная авария, потеря имущества при пожаре, потеря финансовых средств при неблагоприятно складывающейся рыночной ситуации, а также отмеченные выше переломы ног у балерин, пальцев у пианистов, зубов у фотомоделей и т. п. В договоре страхования указываются срок его действия, условия и способ возмещения ущерба. Например, в договоре страхования гражданской ответственности во дителя транспортного средства обычно указывается, что если в момент насту пления страхового случая (при аварии) водитель находился в состоянии алко гольного опьянения, то страховщик ответственности по полису не несет. Если в указанный в договоре страхования срок страховой случай не наступил, страхователь теряет уплаченную премию. Далее мы более подробно рассмотрим математические модели страхова ния жизни, которое получило наибольшее развитие. Договор страхования жизни может быть обязательным (в силу действия определенного закона) или добровольным (по взаимному волеизъявлению страховщика и страхователя), краткосрочным (как правило, на один год) или долгосрочным. Основным источником случайности в страховании жизни является неоп ределенность момента смерти отдельного человека. Однако в случае, когда од 30 новременно у одного и того же страховщика страхуется большая однородная (по возрасту, полу, типу профессии, месту проживания и т. п.) группа страхо вателей, в силу закона больших чисел можно говорить об у с т о й ч и в о с т и о т н о с и т е л ь н ы х ч а с т о т и рассматривать продолжительность жизни как неотрицательную случайную величину X с функцией распределения F(x) = P{X < x}. Функция выживания s(x) = P{X x} = 1 – F(x), (4.5.1) равна вероятности того, что человек из данной однородной группы проживет не менее x лет. Функция выживания (4.5.1) предполагается монотонно убы вающей (иначе в определенных интервалах времени смерть будет невозмож на) и непрерывной (иначе возможны моменты, в которые смерть наступает с положительной вероятностью). Кроме того, функция выживания (4.5.1) долж на удовлетворять всем свойствам, которые следуют из того, что F(x) = 1 – s(x) является ф у н к ц и е й р а с п р е д е л е н и я случайной величины X. Пусть T(x) = X – x — о с т а т о ч н о е в р е м я ж и з н и человека в возрасте x лет. Через px = P{T(x) t t} обозначается вероятность того, что человек в возрасте x лет проживет еще не менее t лет. По определению условной вероятности t px = P{T(x) t} = P{ X x + t| X x} = P{ X x + t} = P{ X x} p0 s(x + t) = . s(x) x p0 x+t В т а б л и ц а х п р о д о л ж и т е л ь н о с т и ж и з н и рассматривается группа новорожденных одного пола, проживающих в одинаковой местности, в количестве l0 чел. Пусть Xk — продолжительность жизни kго человека из данной группы (k = 1, 2, … , l0). Количество доживших до возраста x обозначим L(x), и в таблицах продолжительности жизни приводится математическое ожидание случайной величины L(x): l0 lx = ML(x) = ∑ P{ Xk k=1 l0 x} = ∑ s(x) = l0s(x) . k=1 Фрагмент такой таблицы продолжительности жизни для городского на селения Российской Федерации в 1993 г. приведен в табл. 4.5.1. Простейший вид к р а т к о с р о ч н о г о с т р а х о в а н и я ж и з н и за ключается в следующем. Страхователь (некоторый человек) платит страхов щику (страховой компании) страховую премию в сумме c ден. ед., а страхов щик соглашается выплатить наследникам страхователя страховую выплату (или страховое пособие) в сумме b ден. ед. в случае его смерти в течение года (и не платить ничего в противном случае). Величина страховой выплаты, конечно, должна быть много больше стра ховой премии. 31 Т а б л и ц а 4.5.1 Фрагмент таблицы продолжительности жизни городского населения Российской Федерации в 1993 г. x 0 1 5 10 15 20 25 30 35 40 45 50 Женщины Мужчины x s(x) s(x) lx lx 100 000 1,00000 100 000 1,00000 55 98 324 0,98324 97 822 0,97822 60 97 922 0,97922 97 416 0,97416 65 97 790 0,97790 97 080 0,97080 70 97 623 0,97623 96 764 0,96764 75 97 278 0,97278 95 804 0,95804 80 96 832 0,96832 94 194 0,94194 85 96 296 0,96296 92 009 0,92009 90 95 572 0,95572 89 008 0,89008 95 94 474 0,94474 85 003 0,85003 99 92 831 0,92831 79 644 0,79644 100 90 335 0,90335 72 722 0,72722 110 Женщины s(x) lx 87 007 0,87007 82 469 0,82469 76 558 0,76558 67 118 0,67118 53 628 0,53628 36 986 0,36986 20 192 0,20192 7607 0,07607 1591 0,01591 237 0,00237 130 0,00130 0 0,00000 Мужчины s(x) lx 64 338 0,64338 54 864 0,54864 44 222 0,44222 32 706 0,32706 21 417 0,21417 11 814 0,11814 5113 0,05113 1571 0,01571 297 0,00297 48 0,00048 28 0,00028 0 0,00000 Одной из важнейших задач актуарной математики является вычисление соотношений между страховой выплатой b и страховой премией c. ТЕОРЕМА О СУММАРНОМ ДОХОДЕ СТРАХОВЩИКА. Пусть страховщик продал страхователям одного пола, одного возраста (x лет), проживающим в оди наковой местности, n договоров страхования, согласно которым в случае смерти страхователя в течение ближайшего года его наследникам выплачи вается страховая выплата b ден. ед. Стоимость одного договора равна c ден. ед., а годовая ставка безрисковых вложений составляет i. Тогда P{U  np   n(c(1 + i) − bpx ) − u(1 + i)  x  u} = Φ0  + Φ   0  .    b npx (1 − px )  1 − px   (4.5.2) Доказательство. В общем случае страховщик получит доход, не меньший u, если раз ность U между суммарной страховой премией и суммарными страховыми выплатами за год окажется не менее u. Суммарная страховая премия, которую получит страховщик от всех n страхователей, равна, очевидно, C = nc ден. ед. Пусть за год наступит K страховых случаев (умрет K человек из n страхователей). Тогда суммарные страховые выплаты составят B = Kb ден. ед. Приведя –1 их к настоящему времени [умножив на коэффициент дисконтирования v = (1 + i) ], полу чим, что искомая вероятность P{U { u} = P nc − Kb 1+ i } { u =P K } (nc − u)(1 + i) . b Вероятность того, что любой страхователь, случайно выбранный из n человек, которые приобрели полисы, умрет в течение ближайшего года, можно найти по таблице продолжи тельности жизни для данной социальной группы: px ≡ 1 px = где lx — количество доживших до возраста x. 32 s(x + 1) lx+1 = , s(x) lx При этом страховые случаи не зависят друг от друга, и можно рассмотреть биномиальную случайную величину K = Bi(n; px) — количество смертей в группе из n страхователей. При n → ∞ можно воспользоваться интегральной теоремой Муавра — Лапласа, согласно которой P{K k} = P{0 K k} = Pn (0; k) =  np   k − npx   0 − npx   k − npx  x  = Φ0   −Φ0   = Φ0   +Φ0  .  npx (1− px )   npx (1− px )   npx (1− px )   1− px  В частности, P{U { u} = P K } (nc − u)(1 + i) = b  (nc − u)(1 + i)   − npx   np   np   n(c(1 + i) − bpx ) − u(1 + i)    b x  x  = Φ0  = Φ0   +Φ0   +Φ0   . npx (1− px ) b npx (1− px )  1− px   1− px      Таким образом, P{U  np   n(c(1 + i) − bpx ) − u(1 + i)  x  u} = Φ0  ,  +Φ0    1− px    b npx (1− px ) что и требовалось доказать. Определим такое соотношение между страховой выплатой b и страховой премией c на один договор, чтобы с вероятностью γ, близкой к единице, обес печить страховой компании доход, не меньший u. При этом P{U u} = γ , по этому по формуле (4.5.4) получим, что  np   n(c(1 + i) − bpx ) − u(1 + i)  x   = γ . Φ0  + Φ  0   b npx (1 − px )  1 − px   или  n(c(1 + i) − bpx ) − u(1 + i)  1 + Φ0  =α .  2 b npx (1 − px )  где  np  1 x  . α = + γ −Φ0  2  1 − px  Если обозначить xα квантиль уровня α стандартного нормального распре деления N(0; 1), то n(c(1 + i) − bpx ) − u(1 + i) = xα , b npx (1 − px ) откуда c=u+ b (npx + xα npx (1 − px ) ) n(1 + i) . (4.5.3) Тем самым доказана 33 ТЕОРЕМА О СООТНОШЕНИИ СТРАХОВОЙ ВЫПЛАТЫ И СТРАХОВОЙ ПРЕМИИ. Пусть страховщик продал страхователям одного пола, одного возраста (x лет), проживающим в одинаковой местности, n договоров страхования, согласно которым в случае смерти страхователя в течение ближайшего года его на следникам выплачивается страховая выплата b ден. ед. Стоимость одного договора равна c ден. ед., а годовая ставка безрисковых вложений составляет i. Тогда при выполнении соотношения (4.5.3) между страховой выплатой b и страховой премией c на один договор, чтобы с вероятностью , близкой к единице, обеспечить страховой компании доход, не меньший u. Естественно, в реальных страховых компаниях стоимость договора стра хования складывается из теоретической оценки страховой премии (4.5.3) и оценки средних транзакционных издержек на один договор. Первое из этих слагаемых одинаково для всех страховых компаний, действующих на одном рынке, и компания может обеспечить конкурентоспособность своих страховых продуктов только за счет снижения транзакционных издержек. Задачи 418. Вероятность смерти тридцатилетнего мужчины составляет 0,006. Страховая компания заключила 10 000 договоров страхования с мужчинами в возрасте тридцати лет, согласно которым в случае смерти застрахованного лица в течение ближайшего года его наследникам в конце этого года выплачивается 120 000 руб. Стоимость одного договора равна 1200 руб, а годовая ставка по бан ковским депозитам равна 20%. Найти вероятности следующих событий: а) к кон цу года страховая компания окажется в убытке; б) доход страховой компании превысит 4 000 000 руб. Решение. Пусть за год наступило K страховых случаев, тогда доход страховой компа нии составит U = 10 000 ⋅1200 − 120 000K = 100 000(120 − K) 1 + 0,2  здесь мы привели все выплаты к настоящему моменту времени: выплата 120 000 руб. че  120 000  . 1 + 0,2  Поэтому компания окажется в убытке (U < 0), если за год наступит более 120 страхо вых случаев (т. е. от 121 до 10 000). Доход страховой компании превысит 4 000 000 руб. (U > 4 000 000), если за год наступит менее 80 страховых случаев. Вероятность наступления страхового случая px = 0,006. Всего проводится n = 10 000 испытаний. Поскольку число ис пытаний т велико, можно воспользоваться интегральной теоремой Муавра — Лапласа: рез год имеет с е г о д н я ценность  10 000 − 60   9 940   61    121− 60 P10 000 (121;10 000) ≈ Φ0   −Φ0   −Φ0  =  = Φ0   59,64   59,64   60 ⋅ (1− 0,006)   60 ⋅ (1− 0,006)  = Φ0 (1287,56) −Φ0 (7,90) ≈ 0, т. е. страховая компания окажется в убытке с нулевой вероятностью;       20  60  80 − 60 0 − 60   −Φ0  − P10 000 (0;80) ≈ Φ0  =  −Φ0   = Φ0     59,64   59,64    60(1− 0,006)   60(1− 0,006)  = Φ0 (2,589) −Φ0 (−7,77) ≈ 0,995, 34 значит, доход страховой компании превысит 4 000 000 руб. с вероятностью 0,995, очень близ кой к единице, т. е. почти наверное. 419. В страховой компании 10 000 клиентов, взнос каждого из которых со ставляет 1000 руб. Вероятность наступления страхового случая равна (по оцен кам экспертов компании) 0,005, а страховая выплата при наступлении страхово го случая составляет 100 000 руб. Определить, на какую прибыль может рассчи тывать страховая компания с вероятностью 0,99. Определить минимальный раз мер страховой премии, при котором страховая компания получит прибыль, не меньшую 1 000 000 руб., с вероятностью 0,999. 35 36 Глава 5. ВВЕДЕНИЕ В МАТЕМАТИЧЕСКУЮ СТАТИСТИКУ § 5.1. ОСНОВЫ ВЫБОРОЧНОГО МЕТОДА 5.1.1. Г е н е р а л ь н а я с о в о к у п н о с т ь и в ы б о р к а Генеральной совокупностью называют совокупность результатов в с е х м ы с л е н н о в о з м о ж н ы х н а б л ю д е н и й над какойлибо случайной величиной X (в том числе, и повторяющихся), проводимых в одинаковых ус ловиях. Иными словами, генеральная совокупность представляет собой набор всех возможных значений данной случайной величины. Как правило, огром ный объем генеральной совокупности не позволяет просто переписать все ее элементы, в таких случаях подвергают изучению ограниченное количество значений, отобранных из всей совокупности. Выборочной совокупностью (или просто выборкой) называют результа ты ограниченного числа наблюдений над случайной величиной X . С у щ н о с т ь в ы б о р о ч н о г о м е т о д а состоит в том, чтобы п о в ы б о р к е как некоторой части генеральной совокупности делать выводы о в с е й гене ральной совокупности в целом. Выборку называют репрезентативной, если она адекватно отражает ис следуемые свойства генеральной совокупности. Чтобы выборка была репрезен тативной, можно организовать ее следующим образом. Из генеральной совокуп ности случайным образом отбирается элемент и обследуется, после чего возвра щается в общую совокупность и может быть отобран и обследован повторно. Такая выборка называется повторной случайной. В повторной случайной выборке наблюдения X1, X2 , …, Xn независимы и проводятся в одинаковых (с вероятностной точки зрения) условиях, т. е. распределены по одному и тому же закону: FXi (x) = FX (x), i = 1, 2, …, n . Конкретной выборкой называется конкретный набор чисел x1, x2 , …, xn , полученный в результате наблюдений над случайной величиной X , т. е. набор, состоящий из n р е а л и з а ц и й случайной величины X . Число элементов в выборке называется ее объемом. Выборочным средним называется величина n X= ∑X i=1 i . (5.1.1) n Эта величина является в ы б о р о ч н ы м а н а л о г о м м а т е м а т и ч е с к о г о о ж и д а н и я MX . В ы б о р о ч н ы м а н а л о г о м д и с п е р с и и является, например, ве личина n ˆ σ2X = ( X − X )2 = ∑ (X i=1 i − X)2 n , (5.1.2) называемая выборочной дисперсией. 37 По результатам наблюдений двумерной случайной величины (X1; Y1 ), ( X2 ; Y2 ), …, ( Xn ; Yn ) можно вычислить выборочную ковариацию n cov( X, Y) = ( X − X)(Y − Y) = ∑ (X i=1 i − X)(Yi − Y) (5.1.3) n и выборочный коэффициент корреляции ˆ ρ( X, Y) = cov(X, Y) . ˆ σ Xˆ σY (5.1.4) Для выборочной дисперсии и выборочной ковариации несложно доказать формулы  n  X  ∑ X i  ∑  2  ˆ σ2X = X 2 − ( X ) = i=1 −  i=1  ,  n  n 2 n 2 i (5.1.5) и n cov( X, Y) = XY − X ⋅ Y = ∑X Y i i=1 n i −X⋅Y, (5.1.6) но пользоваться этими формулами можно только в теоретических выкладках, так как при практических расчетах эти формулы обладают существенно большей вычислительной погрешностью, чем их аналоги (5.1.2) и (5.1.3). Дока зать формулы (5.1.5) и (5.1.6) мы предлагаем читателю в задачах 422 и 423. Несложно также показать, что выборочный коэффициент корреляции заключен в пределах от –1 до 1 и характеризует близость зависимости между выборками X и Y к линейной (рис. 5.1.1). Чем ближе точки (xi; yi) расположены к некоторой прямой, тем ближе | ρ( X, Y) | к единице, значение модуля выборочного коэффициента корреляции ˆ | ρ( X, Y) | к единице, тем ближе точки (xi; yi) расположе и наоборот, чем ближе ˆ ны к некоторой прямой. При этом выборочный коэффициент корреляции ˆ ρ( X, Y) положителен [отрицателен] тогда и только тогда, когда при увеличении одной из величин X, Y значения другой имеют тенденцию к увеличению [соот ветственно, к уменьшению], т. е. прямая, около которой расположены точки (xi; yi), имеет положительный [соответственно, отрицательный] наклон. Значение выборочного коэффициента корреляции, близкое к нулю, озна чает отсутствие линейной связи между переменными, но при этом может на блюдаться сильная нелинейная корреляционная зависимость (как на рис. 5.1.1, е, где точки расположены близко к некоторой п а р а б о л е ) или ста тистическая связь, которую в виде функциональной зависимости переменных представить невозможно, так, на рис. 5.1.1, ж приведен пример статистиче ской зависимости, когда с увеличением x растет разброс точек вдоль оси y, однако никакой функцией y = f(x) (линейной или нелинейной) такую зави симость выразить нельзя. 38 y y y x x а) x в) y д) y y x x б) г) x е) y x ж) Рис. 5.1.1. Виды зависимости между выборками: ρ( X, Y) ≈ 1 (а); сильная линейная прямая,ˆ ρ( X, Y) ≈ −0,5 (б); слабая линейная прямая,ˆ ρ( X, Y) ≈ −1 (в); сильная линейная обратная,ˆ ρ( X, Y) ≈ −0,5 (г); слабая линейная обратная,ˆ отсутствие зависимости,ˆ ρ( X, Y) ≈ 0 (д); ρ( X, Y) ≈ 0 (е); сильная нелинейная,ˆ ρ( X, Y) ≈ 0 (ж) зависимость, не являющаяся корреляционной,ˆ 39 Задачи 420. Вычислить выборочный коэффициент корреляции по результатам наблюдений двумерной случайной величины: xi 3 yi 5 10 9 12 4 6 7 Решение. Последовательно вычисляем x, y,ˆ σ2X ,ˆ σ2Y , cov( X, Y) , заполняя столбцы табл. 5.1.1. Т а б л и ц а 5.1.1 Расчет выборочных характеристик в задаче 420 y−y (x − x)(y − y) x−x x y (x − x)2 (y − y)2 3 4 6 7 5 10 9 12 –2 –1 1 2 x=5 y=9 4 1 0 3 4 1 1 4 16 1 0 9 8 –1 0 6 (x − x)2 = 2,5 (y − y)2 = 6,5 (x − x)(y − y) = 3,25 Получили следующие значения: x = 5; y = 6,5;ˆ σ2X = (x − x)2 = 2,5;ˆ σ2Y = (y − y)2 = 6,5; cov(X, Y) = (x − x)(y − y) = 3,25. Затем находим ˆ σX = ˆ σ2X ≈ 1,58;ˆ σY = ˆ σ2Y = 2,55 и подставляем рассчитанные значения ρ( X, Y) = в формулу (5.1.4): ˆ cov( X, Y) 3,25 = ≈ 0,81 . ˆ σ Xˆ σY 1,58 ⋅ 2,55 421. Вычислить выборочный коэффициент корреляции по результатам наблюдений двумерной случайной величины: x i − 2 −1 0 1 2 yi 4 1 0 1 4 422. 423. 40 Доказать формулу (5.1.5). Доказать формулу (5.1.6). 41 5.1.2. Д о п у с т и м ы й о б ъ е м в ы б о р к и для обеспечения ее репрезентативности Из теоремы Чебышева (4.3.2) следует, что если DX B (1 − γ)ε2 (5.1.7)) с вероятностью, большей γ , выполняется неравенство | X − MX |<ε , т. е. гаран тируется меньшая, чем ε , ошибка репрезентативности при замене математи ческого ожидания MX выборочным средним X . Пусть выборка состоит из n испытаний Бернулли, в которых произошло m успехов. Тогда выборочным аналогом вероятности успеха является отно% сительная частота ˆ p= m . n Из теоремы Бернулли (4.3.4) следует, что P{|ˆ p − p |<ε}.1− p(1 − p) , nε2 поэтому при объеме выборки n> p(1 − p) (1 − γ)ε2 (5.1.8) с вероятностью, большей γ , выполняется неравенство ˆ | p − p | < ε , т. е. гаранти руется меньшая, чем ε , ошибка репрезентативности при замене вероятности p относительной частотой p̂ . Поскольку для любых p ∈ [0,1] p(1 − p) < 1/4 , то при неизвестной p неравенство для n можно заменить на n> 1 . 4(1 − γ)ε2 (5.1.9) Если математическое ожидание случайной величины X равно a , ее среднее квадратичное отклонение равно σ , а объем выборки велик, то соглас но следствию (4.4.3) из центральной предельной теоремы P{| X − MX |< ε} =   ε    ε  ε X − MX ε  ε  = P − < < −Φ0 − = 2Φ0   = Φ0    ,  σ / n   σ / n σ/ n σ / n   σ / n   σ / n  поэтому при объеме выборки n> 42 Bu2γ /2 ε2 (5.1.10) (где uγ /2 — такое число, что Φ0 (uγ /2 ) = γ /2 ) с вероятностью, большей γ , вы полняется неравенство | X − MX |<ε , т. е. гарантируется меньшая, чем ε , ошиб ка репрезентативности при замене математического ожидания MX выбороч ным средним X . Эту же формулу для объема выборки используют и в случае, когда n велико, и есть основания пользоваться центральной предельной тео ремой. В частности, при большом числе испытаний Бернулли n и не очень малой вероятности p (такой, что np > 10 ) в силу локальной и интегральной теорем Му авра — Лапласа (4.4.6)—(4.4.7) относительная частота p̂ имеет нормальный за кон распределения с параметрами a = p, σ = p(1− p)/ n , поэтому при объеме выборки n> u2γ /2p(1 − p) ε2 (5.1.11) (где uγ /2 — такое число, что Φ0 (uγ /2 ) = γ /2 ) с вероятностью, большей γ , вы полняется неравенство ˆ | p − p |<ε , т. е. гарантируется меньшая, чем ε , ошибка репрезентативности при замене вероятности p относительной частотой p . Задачи Дисперсия случайной величины X не превышает 10. Требуется вероятность того, что отклонение выборочного среднего 424. оценить 16 000 X= ∑X i 16 000 , рассчитанного по 16 000 результатов наблюдений случай i=1 ной величины (независимых, проведенных в одинаковых с вероятностной точ ки зрения условиях) от математического ожидания MX не превысит 0,25. Решение. По формуле (5.1.7), в которой n = 16 000, B = 10, ε = 0,25 , получаем: B 10 P{| X − MX |< ε} . 1− 2 = 1− = 0,99 . Если обратить внимание на то, что n велико, то nε 16 000 ⋅ 0,252  ε      ε 0,25 согласно (5.1.10) P{| X − MX |< ε} = 2Φ0   . 2Φ0   = 2Φ0   = 2Φ0 (10) ≈ 1 .  σ / n   B / n   10/16 000  425. В условиях задачи 424 требуется определить, сколько следует провести наблюдений, чтобы с вероятностью, не меньшей 0,99, можно было утверждать, что ошибка репрезентативности при замене математического ожидания MX выборочным средним X не превысит 0,2. Решение. По формуле (5.1.7), в которой B = 10, γ = 0,99, ε = 0,2 , получим: B 10 n> = = 0,99 . Предположив же нормальность распределения случайной 2 (1− γ)ε (1− 0,99)0,22 величины X и воспользовавшись формулой (5.1.10), в которой uγ /2 =u0,99/2 =u0,495 =2,55 [так как Φ0 (2,55) = 0,495 ], получим: n > Bu2γ /2 ε2 = 10 ⋅ 2,552 = 1625,6 — значительно меньше 25 000. 0,22 426. Известно, что в среднем из каждой тысячи кредитов, выданных на развитие малого предпринимательства 30 не возвращаются. Определить, сколько нужно отобрать предприятий, чтобы с вероятностью, не меньшей 0,9, 43 можно было бы ожидать, что доля предприятий в выборке, не возвращающих кредиты, будет отличаться от доли аналогичных предприятий в генеральной совокупности меньше, чем на 0,01. Решение. По формуле (5.1.8), в которой p= p(1− p) 30 = =0,03, γ = 0,9 , получаем: n > 1000 (1− γ)ε2 0,03 ⋅ 0,97 . По формуле (5.1.11), учитывая, что uγ/2 = u0,9/2 = u0,45 = 1,65 (так как Φ0 (1,65) = 0,45 ), (1− 0,9)0,012 u2γ /2p(1− p) 1,652 ⋅ 0,03 ⋅ 0,97 n> = =792,25 При этом, поскольку np > 792,25 ⋅ 0,03 = 23 > 10 , есть ε2 0,012 основания пользоваться теоремами Муавра — Лапласа. Таким образом, необходимо ото брать 793 предприятия. = 427. Определить количество респондентов, которых необходимо опро сить, чтобы рейтинг Президента (доля граждан, поддерживающих Президен та), вычисленный по выборке, с вероятностью, не меньшей 0,99, отличался от истинного рейтинга президента для всех жителей страны не более чем на 5% по абсолютной величине. 428. Компания, управляющая зданиями, желает по выборке оценить среднюю стоимость эксплуатации квартир определенного типа с надежностью 99% и ошибкой репрезентативности ±10 ден. ед. Определить объем выборки, необходимой для такой оценки, если из подобного же исследования, проведен ного ранее, известно, что среднее квадратичное отклонение стоимости экс плуатации уне превышает 50 ден. ед. 44 45 46 5.1.3. О ц е н к а ф у н к ц и и р а с п р е д е л е н и я и плотности распределения Расположив элементы выборки в порядке неубывания, получим вариаци% онный ряд. Далее будем считать, что именно в таком порядке уже расставлены выборочные наблюдения. Выборочной случайной величиной называется при этом дискретная случайная величина X , задаваемая рядом распределения X x1′ x2′ p ˆ p1 ˆ p2 xl′ ˆ pl (5.1.12) в котором xi′ (i = 1, 2, …, l) — это варианты1 (расположенные по возрастанию различные элементы выборки), а ˆ pi = mi / n (i = 1, 2, …, l) — отвечающие этим значениям относительные частоты (здесь mi — частота варианты xi′ , т. е. количество ее появлений в статистическом ряде распределения). При этом, l очевидно, n = ∑ mi . i=1 Иногда ряд распределения (5.1.12) выборочной случайной величины на зывают статистическим рядом распределения. Выборочное среднее и выборочную дисперсию можно при этом вычис лить по формулам n x= ∑x i=1 n l i l ′i p i = = ∑ xˆ ∑ x′ m i=1 n i=1 k k i=1 i=1 i i ; ˆ pi = ∑ (xi′)2ˆ pi − (x)2 . σX2 = ∑ (xi′ − x)2ˆ (5.1.13) (5.1.14) Для н е п р е р ы в н ы х случайных величин при достаточно больших объе мах выборки n вместо выборочной случайной величиины используют интер% вальный вариационный ряд X [a1; a2 ) [a2 ; a3 ) ˆ ˆ p p1 p2 [aν ; aν+1 ) ˆ pν (5.1.15) Ширина интервала ∆= x(max) − x(min) 1 + 3,322lg n (5.1.16) (здесь x(min) — минимальный элемент выборки, а x(max) — максимальный, расчет ∆ производится с числом знаков после запятой, на один большим, чем в исход ных данных). Границы интервалов [aj ; aj+1 ) рассчитываются по правилу: a1 = x(min) −∆ /2, a2 = a1 + ∆, a3 = a2 + ∆, …; формирование интервалов заканчива 1 Варианта — слово женского рода. 47 ется, как только для конца aν+1 очередного интервала выполняется условие aν+1 > x(max) . Значения ˆ pi = mi / n — это выборочные интервальные относи% тельные частоты: mi — число вариант, попавших в i й интервал ( i = 1, 2, …, ν ). По интервальному вариационному ряду (5.1.15) оценки математического ожидания и дисперсии вычисляются точно так же, как и по статистическому ряду распределения, при этом xi′ = (ai + ai+1 )/2 и, например, выборочное сред нее можно рассчитывать по формуле (5.1.13), а выборочную дисперсию — по формуле (5.1.14). Выборочным аналогом плотности распределения fX (x) случайной вели чины X служит выборочная плотность распределения, рассчитываемая по интервальному вариационному ряду как f X (x) =ˆ pi / ∆ при x ∈ (ai ; ai+1 ), i = 1, 2, …, ν , (5.1.17) график этой функции называется гистограммой; ломаная с вершинами в точках (xi′;ˆ pi / ∆) , где через xi′ = (ai + ai+1 )/2 обозначены середины интервалов — полигоном частот, а фигура, состоящая из прямоугольников, в основании которых лежат интервалы группирования (aj; aj + 1), а высотами являются значе ния ˆ fX (xj′ ) , называется гистограммой. Кривая распределения относительных частот — это ломаная с вершинами (a ,ˆ f (a )) . i +1 i +1 X По выборочной плотности распределения легко построить выборочную функцию распределения  0, x < a1,   i   FX (x) =  pk , ai < x - ai+1 (i = 1, 2, …, ν), ∑ˆ  k=1   1, x > aν+1,    ( ν (5.1.18) ) при этом ломаная с вершинами в точках xi′; ∑ˆ pi называется кумулятой. i=1 По интервальному вариационному можно вычислить оценку медианы случайной величины X — выборочную медиану F(al ) 0,5 −ˆ ˆ , (5.1.19) xmed = al + ∆ ˆ pl где al — начало медианного интервала, т. е. такого интервала группирования F(al ) < 0,5 , а ˆ F(al+1) . 0,5 , а также оценку моды случайной величи (al; al + 1), что ˆ ны X — выборочную моду ˆ xm o d = a m + ∆ ˆ pm −ˆ pm−1 , pm −ˆ pm−1 −ˆ pm+1 2ˆ (5.1.20) где am — начало модального интервала, т. е. такого интервала группирования pm = maxˆ pi (am; am + 1), чтоˆ i=1,2,…,ν 48 В пакете Microsoft Excel существует надстройка «Анализ данных», в кото рой реализовано автоматизированное решение многих статистических задач. Эта надстройка состоит из нескольких десятков программ, например, для рас чета интервальных частот и построения полигона, гистограммы и кумуляты, можно воспользоваться программой «Гистограмма» из надстройки «Анализ данных» Microsoft Excel. Пример использования надстройки «Анализ данных» пакета Microsoft Excel (и, в частности, программы «Гистограмма»)разобран в задаче 432. Задачи 429. Ежедневные суммарные денежные вклады населения (в тыс. руб.) в отделение банка в течение последних 20 рабочих дней были такими: 60; 20; 70; 70; 30; 20; 50; 50; 40; 60; 30; 40; 30; 50; 50; 60; 50; 60; 40; 40. Построить вариа ционный ряд, статистический ряд распределения, полигон частот, гистограм му, кумуляту, оценить средний суммарный дневной вклад и его среднее квад ратичное отклонение. Решение. Расположив элементы выборки в порядке возрастания, получим вариацион ный ряд: 20; 20; 30; 30; 30; 40; 40; 40; 40; 50; 50; 50; 50; 50; 60; 60; 60; 60; 70; 70. Построим теперь статистический ряд распределения (5.1.12): X p 20 2 20 30 3 20 40 4 20 50 5 20 60 4 20 70 2 20 или 30 40 50 60 70 X 20 p 0,10 0,15 0,20 0,25 0,20 0,10 Средний суммарный дневной вклад оценим с помощью выборочного среднего (5.1.13): 2 3 4 5 4 2 920 + 30 ⋅ + 40 ⋅ + 50 ⋅ + 60⋅ + 70 ⋅ = = 46 , 20 20 20 20 20 20 20 а дисперсию — с помощью выборочной дисперсии (5.1.14): l x = ∑ xi′ p i = 20 ⋅ i =1 k ( ) 2 2 3 4 5 4 + 900⋅ + 1600 ⋅ + 2500⋅ + 3600⋅ + i =1 20 20 20 20 20 2 46600 +4900 ⋅ − 462 = − 2116 = 2330 − 2116 = 214, 20 20 k ′ ˆ pi − ∑ xˆ σ2 = ∑ (xi′)2ˆ = 400 ⋅ i pi X i =1 при этом выборочное σX = 214 = 14,63 . 430. Построить интервальный вариационный ряд, полигон частот, гис тограмму и кумуляту, оценить средний рост студента и его среднее квадра тичное отклонение по данным о росте 30 студентов (в см): 182; 171; 186; 175; 188; 177; 176; 178; 183; 187; 167; 180; 182; 179; 176; 179; 172; 173; 183; 168; 180; 179; 172; 177; 175; 173; 189; 176; 190,5; 172. Решение. Определим длину интервала по формуле (5.1.16): ∆≈ ′ − x(min) ′ x(max) 1 + 3,322lg30 = 190,6 −167 ≈ 4,00 . 1 + 3,322lg30 При этом интервальный вариационный ряд (5.1.15) будет иметь вид X [165;169) [169;173) [173;177) [177;181) [181;185) [185;189) [189;193) 2 4 7 8 4 3 2 p 30 30 30 30 30 30 30 49 Теперь по интервальному вариационному ряду построим выборочную плотность рас пределения (5.1.17) и выборочную функцию распределения (5.1.18): 0, x < 165, x < 165,  0,    2   2 , 165 < x < 169,  , 165 < x < 169,    4 ⋅ 30 120    4   4 , 169 < x < 173,   , 169 < x < 173,   4 ⋅ 30 120      7  7 , 173 < x < 177,  , 173 < x < 177,    ⋅ 4 30 120     8  8 fX (x)= , 177 < x < 181, = , 177 < x < 181,    4 ⋅ 30 120    4   4 , 181 < x < 185,  , 181 < x < 185,    4 ⋅ 30 120    3   3 , 185 < x < 189,   , 185 < x < 189,   4 ⋅ 30 120      2  2 , 189 < x < 193,  , 189 < x < 193,    120   4 ⋅ 30   0, x > 193, x > 193  0,  0, x - 165,    0, x - 165,   2  , 165 < x - 169,      2 30   , 165 < x - 169,     2 4 30    + , 169 < x - 173,    6 30 30     , 169 < x - 173,   2 4 7  30   + + , 173 < x - 177,     13  30 30 30   , 173 < x - 177,     30 2 4 7 8 fX (x)=  + + + , 177 < x - 181, =    30 30 30 30  21  , 177 < x - 181,    30  2 + 4 + 7 + 8 + 4 ,  181 < x - 185,   30 30 30 30 30  25  , 181 < x - 185,    2 4 7 8 4 3 30  + + + + + ,  185 < x - 189,   30 30 30 30 30 30  28    , 185 < x - 189,  2 4 7 8 4 3 2   30   + + + + + + < x , 189 193,     30 30 30 30 30 30 30 x > 193.  1,    x > 193,  1, Гистограмма (тонкая линия) и полигон частот (полужирная линия) представлены на рис. 5.1.2 а, а кумулята — на рис. 5.1.2, б соответственно. По их внешнему виду можно пред положить, что рост студента подчиняется нормальному закону распределения. Средний рост студента оценим с помощью выборочного среднего (5.1.13) k ′ x = ∑ xˆ i pi = 167⋅ i =1 2 4 7 8 4 3 2 535 1 + 171⋅ + 175 ⋅ + 179⋅ + 183⋅ + 187⋅ + 191⋅ = = 178 , 30 30 30 30 30 30 30 3 3  k  ′i pi  = ˆ σ = ∑ (xi′) ˆ pi −∑ xˆ X  i=1  2 k при этом выборочная дисперсия (5.1.14) составит 2 2 i =1 2 4 7 8 4 3 2 – = 27889 ⋅ + 29241⋅ + 30625 ⋅ + 32041⋅ + 33489 ⋅ + 34969 ⋅ + 36481⋅ 30 30 30 30 30 30 30 2  535  95527 286225 356 , и оценка среднего квадратичного отклонения роста студен − − =  =  3  3 9 9 356 та будет равнаˆ σX = ≈ 6,29 . 9 50 ˆ F(x) ˆ f (x ) 0,07 1 0,06 0,05 0,04 0,5 0,03 0,02 0,01 x 0 165 169 173 177 181 185 189 0 165 193 x 169 173 а) 177 181 185 189 193 б) Рис. 5.1.2. Гистограмма (тонкая линия), полигон частот (жирная линия) (а) и кумулята (б) в задаче 429 431. По выборке 11; 11; 11; 9; 9; 5; 10; 10; 10; 14 построить вариационный ряд, статистический ряд распределения, полигон частот, гистограмму, куму ляту, вычислить выборочное среднее и выборочную дисперсию. 432. Служба маркетинга оценивает дилеров фирмы по объему продаж. Сведения об объеме ежедневных продаж товара (в тыс. ден. ед.) дилером за последние 100 дней приведены в табл. 5.1.2. Т а б л и ц а 5.1.2 Объем проджаж в задаче 432 47,0 46,7 35,6 56,9 72,1 37,2 46,3 41,5 53,2 64,4 52,4 63,4 34,8 40,6 63,0 62,8 49,1 46,4 47,6 51,1 62,0 48,1 49,7 51,3 50,0 67,3 44,9 50,3 55,6 54,5 28,2 69,7 46,8 51,4 49,7 47,7 58,7 71,9 40,9 39,5 61,0 73,8 32,6 68,8 32,3 39,1 43,5 42,6 54,9 58,3 43,1 66,6 24,2 50,7 54,4 33,1 33,9 64,5 58,3 56,2 31,5 55,4 37,2 58,6 52,1 40,2 59,0 43,5 43,6 39,7 42,3 69,2 57,6 40,8 62,4 28,8 49,2 54,7 61,1 46,9 44,3 44,8 58,7 38,0 41,6 46,0 56,8 56,0 34,4 41,8 51,3 46,2 36,3 57,1 45,7 46,3 57,6 38,8 56,4 45,5 Требуется построить интервальный вариационный ряд; полигон и гисто грамму (на одном рисунке); кумуляту (на другом рисунке). Решение. Построим интервальный вариационный ряд. В ячейки A1:A101 рабочего лис та Microsoft Excel введем данные об объеме продаж из табл. 5.1.2 (в первой строке — заголо вок, как показано на рис. 5.1.3). Ширина интервала x − x(min) ∆ = (max) 1 + 3,322lg n (здесь x(max) — максимальный объем продаж, а x(min) — минимальный, расчет ∆ производится с числом знаков после запятой, на один большим чем в исходных данных). Границы интерва лов (aj; aj+1) рассчитываются по правилу: a1 = x(min) – ∆ / 2, a2 = a1 + ∆, a3 = a2 + ∆, …; фор мирование интервалов заканчивается, как только для конца aν+1 очередного интервала вы полняется условие aν+1 > x(max). Расчет границ интервалов проиллюстрирован рис. 5.1.3. Для расчета интервальных частот и построения полигона и гистограммы воспользуем ся программой «Гистограмма» из надстройки «Анализ данных» Microsoft Excel. Выберем в ме ню «Сервис | Анализ данных» Microsoft Excel пункт «Гистограмма» (если пункт «Анализ данных» в меню «Сервис» отсутствует, то это означает, что надстройка «Анализ данных» не установ лена, — чтобы ее установить, необходимо отметить флажок «Пакет анализа» в списке над строек пакета Microsoft Excel, который вызывается с помощью выбора пункта меню «Сер вис | Надстройки»). 51 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 A Объем продаж за 100 дней 47,0 37,2 52,4 62,8 62,0 67,3 28,2 47,7 61,0 39,1 43,1 33,1 31,5 40,2 16 B Параметры Объем выборки n x(min) x(max) Ширина интервала C Значения параметров =СЧЕТ(A2:A101) =МИН(A2:A101) =МАКС(A2:A101) =(C4–C3)/(1+3,322*LOG(C2;10)) Границы интервалов Левые границы Правые границы =C3–C5/2 =B9+C5 =B9+C5 =B10+C5 =B10+C5 =B11+C5 =B11+C5 =B12+C5 =B12+C5 =B13+C5 =B13+C5 =B14+C5 =B14+C5 =B15+C5 =B15+C5 =B16+C5 =B16+C5 =B17+C5 а) формулы Microsoft Excel 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A Объем продаж за 100 дней 47,0 37,2 52,4 62,8 62,0 67,3 28,2 47,7 61,0 39,1 43,1 33,1 31,5 40,2 B Параметры Объем выборки n x(min) x(max) Ширина интервала C Значения параметров Границы интервалов Левые границы Правые границы 20,956 27,444 33,933 40,422 46,911 53,399 59,888 66,377 72,866 100 24,2 73,8 6,49 27,444 33,933 40,422 46,911 53,399 59,888 66,377 72,866 79,354 б) результаты расчетов Рис. 5.1.3. Расчет границ интервалов В окне ввода исходных данных программы «Гистограмма» (рис. 5.1.4) укажем входной интервал (ссылку на ячейки A1:A101, содержащие данные об объеме продаж; выделять заго ловок столбца и отмечать флажок «Метки» не будем), интервал карманов (ссылку на ячейки C7:C16, содержащие правые границы интервалов), установим флажок «Метки», которые оз начает, что в первой строке каждого из диапазонов A1:A101 и C7:C16 содержится текстовый заголовок. Укажем, что результаты работы программы необходимо вывести на новый рабо чий лист. Установим флажок для генерации интегральных процентных отношений — значений выборочной функции распределения, также установим флажок автоматического вывода графика — гистограммы и кумуляты. Результаты работы программы «Гистограмма» пред ставлены на рис. 5.1.5. В столбце «Правые границы» на рис. 5.1.5, а указаны правые границы интервалов, в столбце «Частота» — интервальные частоты, а в столбце «Интегральный %» — накопленные частоты, рассчитанные программой. На рис. 5.1.5, б представлен график, построенный про граммой, — на одной диаграмме построены гистограмма и кумулята (впоследствии мы раз делим этот график на два). 52 Рис. 5.1.4. Окно ввода данных программы «Гистограмма» Правые границы Частота Интегральный % 27,444 1 1,00% 33,933 7 8,00% 40,422 12 20,00% 46,911 25 45,00% 53,399 18 63,00% 59,888 20 83,00% 66,377 9 92,00% 72,866 7 99,00% 79,354 1 100,00% Еще 0 100% а) числовые результаты Частота Гистограмма 30 120,00% 25 100,00% 20 80,00% 15 60,00% 10 40,00% 5 20,00% Частота Интегральный % 0,00% 0 27,444 33,933 40,422 46,911 53,399 59,888 66,377 72,866 79,354 Еще Правые границы б) графические результаты Рис. 5.1.5. Результаты работы программы «Гистограмма» Добавим к таблице, полученной в результате работы программы «Гистограмма» и уже содержащей правые границы интервалов (aj; aj+1) и интервальные частоты mj , столбцы, со держащие: • левые границы интервалов; 53 • середины интервалов x j′ = (aj + a j+1 )/2 ; • интервальные относительные частоты ˆ pj = m j / n ; • оценки функции плотности внутри интервалов ˆ fX (x j′ ) =ˆ pj / ∆ . Для получения оценок функции распределения в концах интервалов ˆ FX (aj+1 ) = p ∑ˆ k k- j +1 установим в столбце «Интегральный %» (в результатах работы программы «Гистограмма» — рис. 5.1.5) числовой формат значений с двумя десятичными знаками после запятой. Теперь заполним табл. 5.1.3. Т а б л и ц а 5.1.3 Оценка функции плотности и функции распределения в задаче 432 Интервальная Оценка функ Оценка функ Середина ин Интервальная Интервал ции распре относительная ции плотности тервала xj′ частота mj (aj; aj + 1) ˆ частота ˆ pj fX (xj′ ) деления ˆ FX (aj+1 ) [20,956; 27,444) [27,444; 33,933) [33,933; 40,422) [40,422; 46,911) [46,911; 53,399) [53,399; 59,888) [59,888; 66,377) [66,377; 72,866) [72,866; 79,354) Итого 54 24,20 30,69 37,18 43,67 50,16 56,65 63,14 69,63 76,12 — 1 7 12 25 18 20 9 7 1 100 0,01 0,07 0,12 0,25 0,18 0,20 0,09 0,07 0,01 1,00 0,0015 0,0108 0,0185 0,0385 0,0277 0,0308 0,0139 0,0108 0,0015 — 0,01 0,08 0,20 0,45 0,63 0,83 0,92 0,99 1,00 — 55 56 57 § 5.2. ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ 5.2.1. С в о й с т в а т о ч е ч н ы х о ц е н о к Статистикой называется любая функция γ = γ( X1, X2 , …, Xn ) от элемен тов выборки X1, X2 , …, Xn [на конкретной выборке x1, x2 , …, xn эта статистика принимает конкретное значение γ = γ(x1, x2 ,…, xn ) ]. Очевидно, любая стати стика является случайной величиной, поскольку она является функцией слу чайных величин. Оценкой θ числовой характеристики или параметра θ называется любая статистика θ = θ(x1, x2 , …, xn ) , используемая в качестве приближенного значе ния θ . Например, в качестве оценки параметра a = MX случайной величины X, распределенной по нормальному закону (с неизвестными параметрами), мож но использовать: • результат единичного наблюдения â = X1 ; • полусумму минимального и максимального элементов выборки:ˆ a= • • • X(min) + X(max) 2 ; выборочную медиану â = X med ; выборочную моду ˆ a = X mod ; выборочное среднее â = X и др. Как определить, какая из этих оценок лучше? Качество оценки определяется по выполнению следующих трех свойств: состоятельности, несмещенности и эффективности. Прежде всего, от оценки θ n хотелось бы требовать, чтобы по мере роста числа наблюдений она сходилась по вероятности к оцениваемому параметру, т. е. чтобы для любого сколь угодно малого ε > 0 было справедливо предельное равенство lim P { θ n − θ n < ε} = 1 . n→∞ (5.2.1) Оценка θ n , обладающая свойством (5.2.1), называется состоятельной оценкой параметра θ . Также от «хорошей» оценки θ n естественно требовать, чтобы она не со держала систематической ошибки, т. е. при любом фиксированном объеме вы борки n результат осреднения оценки по всем возможным выборкам данного объема должен приводить к точному значению параметра: Mθ n = θ . (5.2.2) Оценка θ n , обладающая свойством (5.2.2), называется несмещенной оцен% кой параметра θ . Наконец, от оценки θ n желательно требовать, чтобы ее дисперсия была минимальной в некотором классе оценок Θ : 58 ∗ Dθ n = min Dθ n . (5.2.3) θ n ∈Θ ∗ Оценка θ n , обладающая свойством (5.2.3), называется эффективной оцен% кой параметра θ в классе оценок Θ . Выборочное среднее X (5.1.1) является состоятельной, несмещенной и эффективной (в классе линейных несмещенных оценок) оценкой математиче ского ожидания MX . Доказательство. Выборочное среднее X является состоятельной оценкой математического ожидания, если генеральная совокупность имеет ограниченную дисперсию, поскольку предель ное равенство lim P{ X − MX < ε} = 1 непосредственно следует из теоремы Чебышева (4.3.2), так n→∞ n как X = ∑X i =1 i n  n   ∑ X  MX i ∑ i   = MX . Из того, что M X = MX , следует также, что , а M X = M  i=1  = i=1  n  n n выборочное среднее X является несмещенной оценкой математического ожидания MX . Дока зательство эффективности выборочного среднего оставляем читателю в задаче 436. Относительная частота p̂ (5.1.8) является состоятельной, несмещенной и эффективной (в классе линейных несмещенных оценок) оценкой вероятности успеха p . Доказательство этого утверждения оставляем читателю в задаче 437. Выборочная дисперсия ˆ σ2X (5.1.2) является смещенной оценкой диспер сии DX : Mˆ σ2X = n −1 DX ≠ DX . n (5.2.4) Доказательство. Действительно, 1 n  1 n 2 σ2X = M  ∑ ( X i − X )2  = ∑ M ( X i2 )− 2M ( X i X ) + M ( X ) , Mˆ  n i=1  n i=1 ( ) при этом: по определению дисперсии M(X i2 ) = DX i + (MX i )2 = σ2 + a2 ; поскольку наблюдения X i и X j независимы, M( X i X j ) = MX i MX j (при i ≠ j ), и    M( X i X ) = M  X i  n ∑X j=1 n j   2 n  = 1 MX 2 + (MX MX ) = 1 (σ2 + a2 + (n −1)a2 ) = σ + a2 ; ∑ i i j   n   n n j=1   j≠ i наконец,  n  ∑ Xi 2  i=1 M(X ) = M   n n ∑X j=1 n j    n  n n 2  = 1 ∑ MX 2 + ∑ ∑ MX MX  = 1 (n(σ2 + a2 ) + n(n −1)a2 ) = σ + a2 .   i i j   n2  i=1 n2 n i =1 j=1   j≠ i   Подставляя найденные выражения для математических ожиданий в формулу для 2 X Mσ , получим:  σ2   σ2  1 n  σ2  1  σ2  n −1 2 n −1 1 n  Mˆ DX , σ2X = ∑ (σ2 + a2 ) − 2 + a2  +  + a2  = ∑ σ2 −  = n σ2 −  = σ = n  n  n i=1  n i=1  n n  n n n поэтому выборочная дисперсияˆ σ2X является смещенной оценкой дисперсии. 59 Однако смещенность выборочной дисперсии ˆ σ2X легко исправима, доста точно в качестве оценки дисперсии выбрать величину n s2X = ∑ (X i=1 i − X)2 = n −1 n 2 ˆ σX , n −1 (5.2.5) называемую исправленной выборочной дисперсией; исправленная выбороч ная дисперсия s2X является состоятельной и несмещенной оценкой дисперсии. При доказательстве состоятельности выборочной дисперсии (и исправ ленной выборочной дисперсии), что мы предлагаем сделать читателю само стоятельно в задаче 438 полезно следующее ДОСТАТОЧНОЕ УСЛОВИЕ СОСТОЯТЕЛЬНОСТИ. Для того, чтобы несмещенная оценка θ n была состоятельной, достаточно, чтобы lim Dθ n = 0 . n→∞ Доказательство. Согласно неравенству Чебышёва (4.1.2), для любого ε>0 2 P{ |θ n − Mθ n | - ε} > 1− Dθ n / ε , откуда, учитывая несмещенность оценки θ n (т. е. Mθ n = θ ), по лучаем: P{ |θ n −θ| - ε} > 1− Dθ n / ε2 , и поскольку lim Dθ n = 0 , окончательно имеем, что n→∞ lim P{ | θ n −θ | - ε} = 1 , т. е. θ n является состоятельной оценкой θ . n→∞ Если известно точное значение a = MX математического ожидания нор мальной случайной величины X , распределенной п о н о р м а л ь н о м у з а к о н у, то статистика n s02 = ∑ (X i=1 i − a)2 (5.2.6) n является состоятельной, несмещенной и эффективной (в классе всех несме щенных оценок) оценкой дисперсии DX случайной величины X . Однако на практике оценка (5.2.6) не используется, так как точное значение математиче ского ожидания почти никогда не известно. Для получения оценки дисперсии случайной величины X, распределен ной по нормальному закону, на основании интервального вариационного ряда с шириной интервала ∆ следует пользоваться п о п р а в к о й Ш е п п а р д а: σ2X =ˆ σ2X − ∆2 . 12 (5.2.7) Выборочное среднее квадратичное отклонение — этоˆ σX = ˆ σ2X , а стан% дартное отклонение — это sX = s2X . По аналогии с т е о р е т и ч е с к и м начальным моментом порядка k (k = 0, 1, 2, …) случайной величины X [т. е. величиной νk ( X) = M(X k ) — см. п. 2.8.1] и т е о р е т и ч е с к и м центральным моментом порядка k (k = 0, 1, 2, …) этой случайной величины [т. е. величиной µ k ( X ) = M(X − MX )k ] определяются выбо% рочные начальный и центральный моменты порядка k (k = 0, 1, 2, …) — это статистики 60 ˆ νk = X k и ˆ µ k = (X − X )k соответственно. С в о й с т в а выборочных моментов аналогичны свойствам соответст вующих теоретических моментов (2.8.3)—(2.8.7). В качестве выборочных оценок асимметрии (2.8.8) и эксцесса (2.8.9) можно взять выборочную асимметрию ˆ µ ˆ A X = 33 ˆ σ и выборочный эксцесс ˆ µ ˆ E X = 44 − 3 ˆ σ соответственно; эти оценки являются смещенными, однако их можно подпра вить и получить несмещенные оценки AX и EX — исправленную выборочную асимметрию n(n − 1)ˆ AX = AX n −2 и исправленный выборочный эксцесс EX = E X + 6] (n − 1)[(n + 1)ˆ . (n − 2)(n − 3) Отношение s ˆ VX = X X называется выборочным коэффициентом вариации. Выборочный коэффици ент вариации оценивает относительный разброс значений случайной величи ны вокруг математического ожидания. Задачи 433. В условиях задачи 432 требуется с помощью программы «Описа тельная статистика» пакета Microsoft Excel вычислить выборочные характери стики: среднее, дисперсию, среднее квадратичное отклонение, коэффициент вариации, асимметрию, эксцесс, моду, медиану. Решение. Для вычисления в ы б о р о ч н ы х х а р а к т е р и с т и к воспользуемся программой «Описательная статистика», выбрав соответствующий пункт меню надстройки «Анализ данных» пакета Microsoft Excel. В окне ввода исходных данных программы «Описательная статистика» (рис. 5.2.1) ука жем входной интервал (ссылку на ячейки A1:A101, содержащие данные об объеме продаж с заголовком; так как первая строка входного интервала содержит заголовок, отметим фла жок «Метки»), установим флажок для генерации итоговой статистики — набора основных вы борочных характеристик. Укажем, что исходные данные помещены в столбце, а результаты работы программы необходимо вывести на новый рабочий лист. 61 Рис. 5.2.1. Окно ввода данных программы «Описательная статистика» В результате работы программы «Описательная статистика» получены значения выборочных характеристик ежедневного объема продаж (рис. 5.2.2): • n выборочное среднее x = ∑ xi n = 49,6 ; i =1 • n исправленная выборочная дисперсия s2X = ∑ (xi − x)2 (n −1) = 117,8 , откуда легко вы i =1 n числить выборочную дисперсию ˆ σ2X = ∑ (xi − x)2 n = i =1 n −1 2 sX = 116,6 ; с учетом поправки n Шеппарда σ2X =ˆ σ2X −∆2 /12 = 113,12 ; • стандартное отклонение sX = s2X = 10,85 (выборочное среднее квадратичное отклоне ниеˆ σX = ˆ σ2X = 10,80 , с учетом поправки Шеппарда σ X = σ2X = 10,64 ); • исправленная выборочная асимметрия A X = n(n −1)ˆ A X (n − 2) = 0,091 , откуда легко ˆ вычислить выборочную асимметрию A =ˆ µ /ˆ σ3 = (n − 2)A / n(n −1) = 0,089 X 3 X n   здесь ˆ µ k = ∑ (xi − x)k n ;   i =1 (n −1)[(n + 1)ˆ E X + 6] = −0,47 , откуда легко вы (n − 2)(n − 3) (n − 2)(n − 3)E X 6 числить выборочный эксцесс ˆ µ 4 /ˆ σ4 − 3 = − = −0,51 ; E X =ˆ (n + 1)(n −1) n +1 • выборочный коэффициент вариации ˆ V = s / x = 0,2188 = 21,88% . • исправленный выборочный эксцесс E X = X X Значения некоторых характеристик могут изменяться при переходе от несгруппиро ванных данных к сгруппированным (интервальному вариационному ряду). Такими величи нами являются, в том числе, выборочная медиана x̂med и выборочная мода x̂mod . Программа «Описательная статистика» вычисляет все характеристики п о н е с г р у п п и р о в а н н ы м д а н н ы м. Между тем, указанные две характеристики несут в себе гораздо больше смысла, если их вычислять п о и н т е р в а л ь н о м у в а р и а ц и о н н о м у р я д у (по лученному в задаче 432 — см. табл. 5.1.3) при помощи формул (5.119) и (5.1.20) соответственно: 62 F(al ) 0,5 −ˆ , где al — начало медианного интервала; в нашем случае med ˆ pl 6,49 al = 46,911, поэтому ˆ x = 46,911 + (0,5 − 0,45) = 48,71 ; med 0,18 ˆ pm −ˆ pm−1 ˆ x = am + ∆ • , где am — начало модального интервала; в нашем случае mod ˆ ˆ pm+1 2pm − pm−1 −ˆ 0,25 − 0,12 am = 40,422, поэтомуˆ x = 40,422 + 6,49 ⋅ = 44,64 . mod 2⋅ 0,25 − 0,12 − 0,18 Итак, все требуемые выборочные характеристики получены. • ˆ x = al +∆ Объем продаж за 100 дней Среднее Стандартная ошибка Медиана Мода Стандартное отклонение Дисперсия выборки Эксцесс Асимметричность Интервал Минимум Максимум Сумма Счет 49,6 1,09 49,15 37,2 10,85 117,8 –0,47 0,091 49,6 24,2 73,8 4959,6 100 Рис. 5.2.2. Результаты работы программы «Описательная статистика» 434. В условиях задачи 432 требуется с помощью программы «Описа тельная статистика» пакета Microsoft Excel требуется, заменив параметры нор мального закона распределения их выборочными характеристиками, скоррек тированными на поправку Шеппарда, рассчитать и построить графики функ ции плотности и функции распределения нормального закона, «наложив» эти графики соответственно на полигон и кумуляту. Решение. По данным табл. 5.1.3 построим полигон и гистограмму на рис. 5.2.3 и кумуляту на рис. 5.2.4. f( x) 0,0450 0,0400 0,0350 0,0300 0,0250 0,0200 0,0150 0,0100 0,0050 x 0 24,20 30,69 37,18 Гистограмма 43,67 50,16 56,64 63,13 Полигон 69,62 76,11 Функция плотности нормального закона Рис. 5.2.3. Гистограмма, полигон и функция плотности нормального закона 63 F (x ) 1,0000 0,8000 0,6000 0,4000 0,2000 x 0,0000 27,444 33,933 40,422 46,911 Кумулята 53,399 59,888 66,377 72,866 79,354 Функция распределения нормального закона Рис. 5.2.4. Кумулята и функция распределения нормального закона Заменим параметры нормального a закона и σ их выборочными оценка ми: a = x = 49,6, σ = σ X = 10,64 и рассчитаем значения функции плотности нормального закона − 1 e fN (x) = σ 2π в серединах интервалов ( x−a )2 2σ2 [воспользовавшись функцией Microsoft Excel fN(x) = = НОРМРАСП(<x>; <a>; <σ>; ЛОЖЬ)] и функции распределения x − 1 FN (x) = e ∫ σ 2π −∞ (t −a )2 2σ2 dt = НОРМРАСП(<x>; <a>; < σ>; ИСТИНА) в правых концах интервалов. Результаты расчетов представлены в седьмом и восьмом столбцах табл. 5.2.1 (первые шесть столбцов табл. 5.2.1 взяты из табл. 5.1.3). Графики функ ций fN(x) и FN(x) построены на рис. 5.2.3 и 5.2.4 соответственно. Т а б л и ц а 5.2.1 Результаты раасчетов в задаче 434 Сере Интер Оценка Функция Ин Оценка дина валь терваль функции плотности Функция рас функции Интервал пределения ин ная ная отно плотности распре нормаль (aj; aj + 1) терва часто сительная деления ного зако нормального ˆ ′ f x ( ) закона F (aj + 1) X j ˆ pj ла xj′ та mj частотаˆ FX (aj+1 ) на fN (x j′ ) [20,956; 27,444) [27,444; 33,933) [33,933; 40,422) [40,422; 46,911) [46,911; 53,399) [53,399; 59,888) [59,888; 66,377) [66,377; 72,866) [72,866; 79,354) Итого 24,20 30,69 37,18 43,67 50,16 56,65 63,14 69,63 76,12 — 1 7 12 25 18 20 9 7 1 100 0,01 0,07 0,12 0,25 0,18 0,20 0,09 0,07 0,01 1,00 0,0015 0,0108 0,0185 0,0385 0,0277 0,0308 0,0139 0,0108 0,0015 — 0,01 0,08 0,20 0,45 0,63 0,83 0,92 0,99 1,00 — 0,0022 0,0077 0,0190 0,0321 0,0374 0,0301 0,0167 0,0064 0,0017 — 0,0187 0,0704 0,1942 0,4002 0,6395 0,8332 0,9426 0,9856 1,0000 — 435. По данным задачи 429 вычислить выборочные характеристики: коэффициент вариации, асимметрию, эксцесс, моду, медиану. 436. Доказать, что выборочное среднее X (5.1.1) является эффективной (в классе линейных несмещенных оценок) оценкой математического ожидания MX . 64 437. Доказать, что относительная частота является состоятельной, не смещенной и эффективной (в классе всех несмещенных оценок) оценкой веро ятности наступления события. 438. Доказать, что выборочная дисперсия и исправленная выборочная дисперсия являются состоятельными оценками дисперсии. 65 66 5.2.2. М е т о д ы п о с т р о е н и я т о ч е ч н ы х о ц е н о к Будем считать, что известен общий вид p(x; θ) закона распределения слу чайной величины X , соответствующей генеральной совокупности, из которой извлечена выборка x1, x2 ,…, xn (функция вероятности p(xi ; θ) = P{ X = xi } для дискретной случайной величины или плотность распределения p(x; θ) = fX (x) для непрерывной случайной величины), где θ — некоторый неизвестный па раметр закона распределения. Метод моментов заключается в следующем. Определяется зависимость θ = g(ν1, ν2 , …, νk , µ1, µ 2 , …, µ l ) (5.2.8) параметра θ от начальных моментов с первого по kй и центральных моментов с первого по lй, после чего для вычисления оценки θ мм параметра θ по мето% ду моментов в эту зависимость (5.2.7) вместо неизвестных теоретических мо ментов подставляют их выборочные аналогиˆ µj : ν i иˆ θ мм = gˆˆ νk ,ˆˆ µ1, µ 2 , …,ˆ µl ) . (ν1, ν2 , …,ˆ (5.2.9) Очевидным достоинством метода моментов является его простота, одна ко качество оценок, полученных с помощью этого метода, не всегда бывает вы соким, особенно при небольших объемах выборки. Изложим теперь алгоритм метода максимального правдоподобия. По выборке x1, x2 ,…, xn составляется функция правдоподобия L(θ) = p(x1; θ)p(x2 ; θ) p(xn ; θ) , (5.2.10) равная вероятности получения и м е н н о набора x1, x2 , …, xn при извлечении выборки объемом n из генеральной совокупности в случае дискретной слу чайной величины (и плотности распределения этой вероятности — в случае непрерывной случайной величины). Чем больше L(θ) , тем вероятнее (или п р а в д о п о д о б н е е) получить при наблюдениях и м е н н о д а н н у ю к о н к р е т н у ю в ы б о р к у x1, x2 , …, xn . Оценкой максимального правдоподобия параметра θ называют при этом такое значение θ ммп , которое максимизирует функцию правдоподобия L(θ) : L(θ ммп ) = max L(θ) . θ (5.2.11) Для многих распределений вместо оптимизационной задачи (5.2.11) удоб нее решать эквивалентную задачу ln L(θ ммп ) = max ln L(θ) , θ (5.2.12) так как натуральный логарифм является монотонно возрастающей функцией. Если существует состоятельная и эффективная оценка θ параметра θ (в классе всех оценок — несмещенных и смещенных), то при весьма общих усло виях такой оценкой является θ ммп , если при этом оценка θ ммп оказывается смещенной, то ее подправляют аналогично тому, как это было сделано с выбо рочной дисперсией [см. формулу (5.2.5)]. 67 Задачи 439. По выборке x1, x2 , …, xn найти оценку λ̂ параметра λ случайной величины, распределенной по закону Пуассона: а) методом моментов; б) методом максимального правдоподобия. Решение. а) Известно, что начальный момент первого порядка распределения Пуассона равен ν1 = MX = λ , откуда λ = ν1 = MX . Поэтому оценкой метода моментов для параметра λ будетˆ λ =ˆ ν =x. мм 1 б) Для распределения Пуассона p(x; λ) = P{ X = x} = λ x −λ e . Составим функцию правдо x! подобия: x L(λ) = p(x1 ; λ)p(x2 ; λ) x λ 1 −λ λ 2 −λ p(xn ; λ)= e e x1! x2! x + x + + xn x λ n −λ λ 1 2 e = xn! x1! x2! xn! e−nλ . Ее логарифм равен n   ∑ xi   i =1 n  λ  −nλ  l(λ) = ln L(λ) = ln  e  = ln λ ∑ xi − nλ − ln(x1 ! x2 !  x1 ! x2 ! xn !  i =1 xn !) . Чтобы функция l(λ) достигала максимального значения, необходимо, чтобы ее произ водная l ′(λ) = 0 , а вторая производная l ′′(λ) < 0 . В нашем случае l ′(λ) = n d  ln λ ∑ xi − nλ − ln(x1 ! x2 ! dλ  i =1  n  n n  ∑ x  ∑ xi ∑ xi   i  d  i=1 xn !) = i=1 −n, l ′′(λ) = −n = − i=12 ,   λ dλ  λ  λ n ∑x поэтому оценку максимального правдоподобия найдем из условия i =1 ˆ λ ммп i −n = 0 : n ˆ λ ммп = ∑x i =1 i = x . При этом вторая производная отрицательна, так как в числителе дроби n стоит положительное число (поскольку генеральная совокупность распределена по закону Пуассона и ее элементы не могут принимать отрицательных значений), в знаменателе дроби также стоит положительное число λ̂ 2ммп , а перед дробью стоит знак «минус». 440. Случайная величина X = U(a; b) . По выборке x1, x2 , …, xn найти оценки параметров a и b: а) методом моментов; б) методом максимального правдоподобия. Решение. а) Найдем âмм что a < b ), получим: и b̂мм методом моментов. Известно, что  a +b   ν1 = , 2  a+b (b − a)  2  ν1 ( X) = MX = , µ1 ( X ) = DX = . Решив систему  относительно a и b  2 12 (b − a)2  µ2 =   12   (учитывая, оценки a = ν1 − 3µ 2 , ˆ aмм =ˆ ν1 − 3ˆ µ 2 = x − 3ˆ σX2 , bмм =ˆ ν1 + 3ˆ µ 2 = x + 3ˆ σX2 . 68 b = ν1 + 3µ 2 , а потому  1   , x ∈ [a; b],  б) Так как fX =  b − a то функция правдоподобия   x ∉ [a; b],  0,  1 все xi ∈ [a; b], i = 1,2,…, n, ,  L(a; b) = (b − a)n  хотя бы одно значение xi ∉ [a; b]. 0, Так как a - min{x1 , x2 , …, xn } , а b . max{x1 , x2 , …, xn } , то максимум функции L достига ется при a ммп = min{x1 , x2 , …, xn } и bммп = max{x1 , x2 , …, xn } . 441. Построить по выборке x1, x2 , …, xn оценку параметра p геометри ческого распределения а) методом моментов; б) методом максимального прав доподобия. 442. По выборке x1, x2 , …, xn найти оценку параметра µ случайной ве личины, распределенной по показательному закону: а) методом моментов; б) методом максимального правдоподобия. 443. Случайная величина X = N (a; σ) . По выборке x1, x2 , …, xn найти оценки параметров a и σ : а) методом моментов; б) методом максимального правдоподобия. 444. По данным социологического опроса получено распределение чис ла групп по числу респондентов в группе, отрицательно отзывающихся о но вой рекламной политике фирмы (в каждой группе по 10 респондентов): Число респондентов, не поддерживающих новую рекламную политику Число групп 0 1 2 3 4 132 43 20 3 2 Предполагая, что число респондентов в группе, не поддерживающих но вую рекламную политику, распределено по закону Пуассона, оценить пара метр λ этого закона и определить долю групп, в которых все респонденты поддерживают новую рекламную политику. 69 70 71 § 5.3. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ Вычисляя по выборке оценку θ какоголибо параметра θ , мы отдаем себе отчет, что даже если она будет обладать свойствами состоятельности, несме щенности и эффективности, она все равно остается всего лишь п р и б л и ж е н н ы м значением параметра θ . Насколько же может отклониться это приближенное значение от истинного? Иными словами, можно ли указать ин тервал (θ1; θ2 ) , который с заранее заданной вероятностью γ (близкой к едини це) накрывал бы истинное значение параметра θ . Такой интервал называется доверительным интервалом или интервальной оценкой, а вероятность γ — доверительной вероятностью или надежностью интервальной оценки. Предположим, что наблюдения независимы и проводятся в одинаковых условиях, т. е. элементы выборки X1, X2 , …, Xn представляют собой независи мые случайные величины, распределенные по одному и тому же закону с ма тематическим ожиданием a и дисперсией σ2 . Тогда, если объем выборки n ве лик (на практике — при n > 30 ), то в силу центральной предельной теоремы n (см. § 4.4) случайная величина X = ∑ X i n имеет нормальное распределение с i=1 параметрами a и σ / n , поэтому, как несложно показать, случайная величина (X − a) n распределена по нормальному закону с параметрами 0 и 1. σ Найдем по таблице значений функции Лапласа Φ0 такое значение uγ/2, чтобы Φ0 (uγ /2 ) = γ /2 . При этом Z= P{| Z | <uγ /2 } =P{−uγ /2 <Z< uγ /2 }=Φ0 (uγ /2 ) −Φ0 (−uγ /2 ) = 2Φ0 (uγ /2 ) = γ .  ( X − a) n  σu (X − a) n <uγ /2 ⇔ a − X < γ /2 ⇔ γ= P  <uγ /2  . Но Итак,   σ σ n σu σu σu σu ⇔ − γ /2 < a − X < γ /2 ⇔ X − γ /2 < a < X + γ /2 , значит, n n n n  (X − a) n   σu σu      (5.3.1) γ = P < uγ /2  = P  X − γ /2 < a < X + γ /2  ,    σ n n         т. е. вероятность того, что интервал    X − σuγ /2 ; X + σuγ /2  (5.3.2)  n n  н а к р о е т истинное значение математического ожидания, равна γ . Таким образом, получена интервальная оценка математического ожидания при большом объеме выборки. В пакете Microsoft Excel есть функция НОРМСТОБР(α), которая является обратной к функции нормального распределения 1 НОРМРАСП(u; 0; 1; ИСТИНА) = + Φ0 (u) , 2 72 т. е. для любого α ∈ [0;1] НОРМРАСП(НОРМСТОБР(α); 0; 1; ИСТИНА)) совпадает с α. Поэтому uгγ/2 можно найти так: uγг/2 = НОРМСТОБР((1 + γ)/2) и вообще для любо го α ∈ [0;1] uα = НОРМСТОБР(α+1/2). Предположим, что выборка X1, X2 ,…, Xn взята из генеральной совокупно сти, соответствующей индикатору некоторого события (успеха), тогда смысл элементов выборки таков:  1, если произошел успех в iм испытании, Xi =     0, если не произошел успех в iм испытании. n При этом MX i = p, DX i = p(1 − p) , число m = ∑ Xi можно считать количе i=1 ством успехов в серии из n испытаний Бернулли, а выборочное среднее X совпадает с относительной частотой p̂ : n X= ∑X i=1 n i = m =ˆ p, n поэтому m −p ( X − a) n n Z= = , σ p(1 − p)/ n и по формуле 5.3.1   m     − p  ( X − a) n    n γ = P < uγ /2  = P  < uγ /2  =      p(1 − p)/ n  σ     m  p(1 − p) m p(1 − p)  = P  − uγ /2 < p < + uγ /2 .  n n n n  (5.3.3) Истинное значение вероятности успеха p в единичном испытании нам не известно, но при большом объеме выборки n можно в качестве p взять при p = m / n , являющуюся состоя ближенное значение — относительная частота ˆ тельной, несмещенной и эффективной оценкой вероятности (см. п. 5.2.1). В ре зультате получим п р и б л и ж е н н ы й д о в е р и т е л ь н ы й и н т е р в а л  m  m  m  m    − 1  m  1 − n    m n n n  , ; + uγ /2 (5.3.4)  − uγ /2 n  n n n который с вероятностью γ накроет истинное значение вероятности успеха p в единичном испытании. На практике точное значение среднего квадратичного отклонения σ не известно, но по выборке можно получить его состоятельную, несмещенную и (для нормальной случайной величины) эффективную оценку 73 n n 2 ˆ s = s2X = σX = n −1 ∑ (X i=1 i − X)2 n −1 . При большом объеме выборки n оправдано использование s в качестве приближенного значения σ в доверительном интервале (5.3.2) для математи ческого ожидания a . Если же объем выборки не очень велик ( n < 30 ), так де лать нельзя. Рассмотрим статистику ( X − a) n . (5.3.5) T= s Оказывается, распределение величины Tn−1 не зависит ни от X , ни от s , а зависит только от числа n − 1 , называемого числом степеней свободы. Это распределение называется р а с п р е д е л е н и е м С т ь ю д е н т а (см. п. 2.5.5). Для этого закона распределения составлены таблицы значений tα; k, при которых P{| Tk |>tp;k } = p , а в пакете Microsoft Excel есть функция tp; k = СТЬЮДРАСПОБР(p; k). Поэтому при небольшом объеме выборки интервальная оценка (5.3.2) для математического ожидания переходит в оценку    X − st1−γ;n−1 ; X + st1−γ;n−1  ,  n n  (5.3.6) где X — выборочное среднее, s — стандартное отклонение, а t1–гγ; n–1 = = СТЬЮДРАСПОБР(1 – γ; n – 1). Для удобства сведем рассмотренные интервальные оценки основных чи словых характеристик и параметров случайных величин в табл. 5.3.1. Т а б л и ц а 5.3.1 Интервальные оценки основных числовых характеристик и параметров случайных величин Параметр Предположения Интервальная оценка σ σ   < a < X + uγ /2 P  X − u γ /2 = γ σ2 известно параметр a n n   нормального закона  s s  распределения P < a < X + t1−γ; n−1  X − t1−γ; n−1 = γ σ2 не известно  n n  вероятность p успеха  ˆ ˆ p(1−ˆ p) p(1−ˆ p)  n порядка нескольких P < p <ˆ p − uγ /2 p + uγ /2 ˆ = γ в серии из n десятков или более  n n  испытаний Бернулли Задачи 445. При выборочной проверке 100 банковских счетов была получена оценка x = 25 тыс. руб. для среднего остатка на счете. Известно среднее квад ратичное отклонение σ = 8 тыс. руб. Построить 90%ный доверительный ин 74 тервал для математического ожидания суммы, находящейся на счете случай но выбранного клиента. Решение. По условию γ = 90% = 0,9 . При этом uγ /2 = u0,45 = 1,65 , и по формуле (5.3.2) по  8 ⋅1,65 8 ⋅1,65  ;25 + лучаем искомый доверительный интервал: 25 −  или, окончательно,  100 100  (23,68; 26,32). 446. Из некоторой отрасли было случайным образом отобрано 20 ком паний. По выборочным данным оказалось, что выборочное среднее для срока, прошедшего с момента основания компании, составило x = 6 лет при исправ ленном выборочном среднем квадратичном отклонении s = 2 г. Построить 99% ный доверительный интервал для среднего времени, прошедшего с момента основания компании, для всех компаний в отрасли. 447. В институте 500 студенческих групп. Из них было случайным об разом отобрано 20 групп. По выборочным данным оказалось, что в среднем в группе учится 22 девушки при исправленном выборочном среднем квадра тичном отклонении s = 5 . Пользуясь 95%ным доверительным интервалом, оценить число девушек во всем институте. 448. Маркетинговое агентство хочет установить степень известности некоторого продукта в данном городе. Для этого было опрошено 400 человек, 80 из которых сказали, что знакомы с продуктом (остальные — что незнако мы). Построить 95%ный доверительный интервал для степени известности продукта среди всех жителей города. 75 76 77 § 5.4. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 5.4.1. П р о в е р к а г и п о т е з о п а р а м е т р а х нормального закона распределения Статистической гипотезой называется любое высказывание относи тельно генеральной совокупности, проверяемое по выборочным данным. Гипо теза называется параметрической, если в ней содержится утверждение о значении какоголибо параметра генеральной совокупности, и непараметри% ческой в противном случае. Параметрическую гипотезу называют простой, если в ней значение параметра приравнивается конкретному числу, или сложной, если значение параметра выбирается из какоголибо интервала. Проверяемую гипотезу называют нулевой и обозначают H0 . Гипотезу H1 , логически противоречащую гипотезе H0 , называют альтернативной. Прави ло, по которому принимают решение «принять или отклонить гипотезу H0 », называют критерием. Статистику ψ = ψ( X1, X2 , …, Xn ) , (5.4.1) измеряющую согласие выборки ( X1, X2 , …, Xn ) с гипотезой H0 , называют ста% тистикой критерия. Из множества S значений статистики ψ выделяется такое подмножество Sкр , что при условии истинности гипотезы H0 вероятность P{ψ ∈ Sкр | H0 } = α , где α — уровень значимости — достаточно малое число (обычно α берут равным 0,05; 0,01; 0,005 или 0,001). Это подмножество Sкр называется крити% ческой областью. ОБЩАЯ СХЕМА ПРОВЕРКИ ГИПОТЕЗ. 1. Формулируется в виде статистической гипотезы задача исследования (т. е. определяется нулевая гипотеза H0 и альтернативная гипотеза H1 ). 2. Выбирается статистическая характеристика гипотезы — статистика критерия ψ . 3. Анализируются возможные ошибочные решения и их последствия. 4. Задается уровень значимости α и рассчитываются границы критиче% ской области Sкр , в которую статистика ψ может попасть только с малой ве роятностью α . 5. Если фактическое значение статистики ψ (вычисленное по конкретной выборке x1, x2 , …, xn ) попадает в критическую область, то нулевая гипотеза H0 отвергается и принимается альтернативная гипотеза H1 ; в противном случае нулевая гипотеза H0 не отвергается. Множество S \ Sкр называется областью принятия гипотезы H0 . Если гипотеза H0 отвергается, это значит, что выборочные данные проти воречат ей, т. е. она неверна, если же гипотеза H0 принимается, то это вовсе не означает, что H0 является единственно верной гипотезой: просто гипотеза Н0 78 н е п р о т и в о р е ч и т результатам испытаний; однако таким же свойством, наряду с H0 , могут обладать и другие гипотезы. Таким образом, приняв или отклонив гипотезу H0 , можно оказаться правым, а можно совершить ошибку первого или второго рода (табл. 5.4.1). Т а б л и ц а 5.4.1 Риски при проверке гипотез Принятая гипотеза H0 H1 H0 правильное решение, P{H0 |H0 } = P{ψ ∈ (S \ Sкр )|H0 } =1−α — ошибка первого рода, P{H1 |H0 } = P{ψ ∈ Sкр |H0 } = α — H1 надежность ошибка второго рода, P{H0 |H1 } = P{ψ ∈ (S \ Sкр )|H1 } = β уровень значимости правильное решение, P{H1 |H1 } = P{ψ∈ Sкр |H1 } =1−β — Истинная гипотеза мощность К одной и той же нулевой гипотезе H0 можно предложить несколько раз личных альтернативных гипотез H1 , например, нулевой гипотезе H0 : MX = a0 о равенстве математического ожидания случайной величины конкретному зна чению a0 могут соответствовать такие альтернативные гипотезы: H1 : MX > a0 ; H1′ : MX < a0 ; H1′′: MX ≠ a0 . Поэтому в каждом конкретном случае важно правильно выбирать аль тернативную гипотезу, удобную для принятия содержательного решения. Критерии проверки основных параметрических гипотез приведены в табл. 5.4.2, а идея вывода критериев проверки гипотез содержится в задаче 449. Задачи 449. Из многолетнего опыта руководитель отдела продаж знает, что в среднем каждые три из десяти визитов коммерческого представителя к пред полагаемым клиентам заканчиваются подписанием контракта. Продавец Ива нов за последний месяц провел 100 встреч с предполагаемыми клиентами и заключил 48 договоров, после чего потребовал повышения зарплаты. Опреде лить, какое решение должен принять начальник Иванова: «Иванов — выдаю щийся продавец» либо «Иванов — такой же, как все остальные, и его высокие результаты объясняются только случайностью». Решение. Выберем уровень значимости α = 0,05, т. е. допустим возможность ошибки первого рода с вероятностью 0,05. Будем проверять нулевую гипотезу H0: p = p0, состоящую в том, что Иванов — такой же, как все остальные, т. е. вероятность заключения договора Ивановым равна средней вероятности заключения договора p0 = 3/10 = 0,3 . В качестве аль тернативной выберем гипотезу H1: p > p0, соответствующую тому, что Иванов выдающийся продавец, и у него вероятность заключения контракта выше, чем у остальных его коллег. В предположении справедливости нулевой гипотезы (т. е. если p = p0) можно записать, согласно (5.3.3), формулу  γ = P      ˆ p − p0 p (1− p0 ) p (1− p0 )  p < p0 + uγ /2 0 < uγ /2  = P p0 − uγ /2 0 <ˆ .   n n  p0 (1− p0 )/ n  79 Т а б л и ц а 5.4.2 Проверяемая гипотеза H0 Критерии проверки гипотез о числовых значениях параметров нормального распределения Альтернативная Критическая Предположения Статистика критерия гипотеза H1 область a = a1 > a0 Z > u(1−2α )/2 a = a1 < a0 Z < −u(1−2α )/2 a = a1 ≠ a0 |Z| > u(1−α )/2 a = a1 > a0 Tn−1 > t2α ;n−1 a = a1 < a0 Tn−1 < −t2α ;n−1 a = a1 ≠ a0 |Tn−1 | > tα ;n−1 p = p1 > p0 Z > u(1−2α )/2 p = p1 < p0 Z < −u(1−2α )/2 p = p1 ≠ p0 |Z| > u(1−α )/2 X (1) − X (2) a1 > a2 Z > u(1−2α )/2 σ12 σ22 + n1 n2 a1 < a2 Z < −u(1−2α )/2 a1 ≠ a2 |Z| > u(1−α )/2 p1 > p2 Z > u(1−2α )/2 p1 < p2 Z < −u(1−2α )/2 p1 ≠ p2 |Z| > u(1−α )/2 σ2 известно ( X − a0 ) n Z= σ σ2 не известно ( X − a0 ) n Tn−1 = s n порядка несколь ких десятков или бо лее, np0 > 10 , n(1−p0 )>10 ˆ (p − p0 ) n Z= p0 (1− p0 ) a = a0 p = p0 a1 = a2 Z= σ12 , σ22 известны Z= p1 = p2 n1 , n2 порядка не скольких десятков или более ˆ (p1 −ˆ p2 ) n , 1 1   ˆ p(1−ˆ p) +   n1 n2  p= где ˆ m1 + m2 n1 + n2 Пусть γ = 1− 2α = 0,9 , тогда с вероятностью γ = 0,9 относительная частота ˆ p = m/n  p (1− p0 ) p (1− p0 )   (при этом с вероятностью должна лежать в границах p0 − uγ /2 0 ; p0 + uγ /2 0   n n α = 0,05 относительная частота окажется правее этого интервала и с вероятностью α = 0,05 — левее). Отметим этот интервал на координатной оси (рис. 5.4.1). Он разобьет всю числовую  p (1− p0 )   — слева от интервала, прямую на три области: −∞; p0 − uγ /2 0   n    p (1− p0 ) p (1− p0 )  p (1− p0 )  — внутри интервала и p0 + uγ /2 0  — + ∞ ; p0+ uγ /2 0 ; p0− uγ /2 0       n n n справа от интервала . Если справедлива гипотеза H0: p = p0, то относительная частота ˆ p = m / n , рассчитан ная по выборочным данным, скорее всего (с вероятностью γ), попадет в центральную об ласть; при этом такая ситуация, чтобы при истинной гипотезе H0 относительная частота по   p (1− p0 ) пала в самую правую область p0 + uγ /2 0 ; + ∞ , маловероятна, зато эта ситуация   n очень вероятна, если считать, что p > p0, поэтому к р и т и ч е с к о й о б л а с т ь ю являет   p (1− p0 ) ся область ˆ p ∈ p0 + uγ /2 0 ; + ∞ , т. е. в случае, когда   n ˆ p > p0 + uγ /2 80 p0 (1− p0 ) , n (5.4.2) нулевая гипотеза H0: p = p0 отвергается, и принимается гипотеза H1: p > p0. Относи тельная частота ˆ p = m / n нахо дится левее веро ятности p0, поэто му нет оснований отвергнуть прове ряемую гипотезу H0: p = p0 при аль тернативе H0: p = p0 p0 − uγ /2 Относитель ная частота ˆ p = m / n может находиться как левее вероятности p0, так и правее нее, поэтому нет оснований отверг нуть проверяемую ги потезу H0: p = p0 p0 (1 − p0 ) n p0 p0 − uγ /2 Относительная час тота ˆ p = m / n с боль шой вероятно стью на ходится правее вероят ности p0. Если гипотеза H0 справедлива, то такое собы тие может произойти лишь с очень малой веростностью α = 0,05, поэтому есть осно вания отвергнуть проверяе мую гипотезу H0: p = p0 и принять альтернативную гипотезу H1: p < p0 p p0 (1 − p0 ) n Рис. 5.4.1 Критическая область (заштрихована) и область принятия нулевой гипотезы в задаче 449 48 = 0,48, p0 = 0,3 , с помощью Microsoft Excel получа 100 p (1− p0 ) 0,3(1− 0,3) = 0,3 + 1,65 = ем uγ/2 = u0,45 = НОРМСТОБР((1 + 0,9)/2)) = 1,64, p0 + uγ /2 0 100 n 21 = 0,3 + 1,65 ≈ 0,38 , поэтому неравенство (5.4.2) выполняется, что является основанием от 100 вергнуть нулевую гипотезу и принять альтернативную гипотезу, состоящую в том, что веро ятность заключение контракта Ивановым выше, чем средним сотрудником. Преобразуем неравенство (5.4.2): p= В нашем случае γ = 0,9, n = 100,ˆ ˆ p > p0 + uγ /2 ˆ p0 (1− p0 ) (p − p0 ) n ⇔ > uγ /2 . n p0 (1− p0 ) Теперь можно при проверке нулевой гипотезы H0: p = p0 при альтернативной гипотезе ˆ (p − p0 ) n и сравнить H1: p > p0 вычислить по выборочным данным значение статистики Z = p0 (1− p0 ) его с критическим значением uγ/2. Критической области при этом соответствует неравенство Z > uγ /2 . 450. Торговая компания собирается открыть в новом районе города фи лиал. Из опыта работы компании известно, что филиал будет работать при быльно, если за неделю средний доход жителей района превышает 400 ден. ед.; также известна дисперсия дохода σ2 = 400 . Требуется: а) определить правило принятия решения, с помощью которого, основываясь на выборке объемом n = 100 и уровне значимости α = 0,05 , может быть установлено, что филиал будет работать прибыльно; б) предположив, что в действительности средний доход за неделю достигает 406 ден. ед., рассчитать вероятность того, 81 что при применении предложенного правила принятия решения будет совер шена ошибка второго рода. Решение. а) Компания не откроет филиал, если средний доход жителей не превысит 400 ден. ед. Потому будем считать, что H0 : a = a0 = 400 , H1 : a > a0 . Так как значение гене ральной дисперсии σ2 = 400 известно, то гипотезу H0 принимают, если ( X − a0 ) n > u(1−2α )/2 . По условию a0 = 400 , u0,45 = 1,65 , потому гипотезу H1 : a > a0 прини σ мают и, следовательно, филиал открывают, если если недельный среднедушевой доход 100 жителей x > 400 + 2⋅1,65 = 403,3 . б) Альтернативное значение среднего дохода равно a1 = 430 , и гипотеза H1: a = 406 > a0 .  (a −a ) n  −u(1−2α )/2 = В этом случае вероятность ошибки второго рода β= 0,5 −Φ0  1 0   σ Z=  6 ⋅10  = 0,5 −Φ0  −1,65 = 0,09 .  20  451. Производитель электроламп утверждает, что средний срок их службы составляет a0 = 1000 ч. Проверить эту гипотезу на 5%ном уровне значимости по выборке из n = 25 ламп, для которой x = 875 ч, s = 50 ч. Решение. Будем проверять на уровне значимости α = 5% = 0,05 нулевую гипотезу H0 : MX = a0 о том, что математическое ожидание срока службы лампы равно a0 = 1000 ч при альтернативной гипотезе H1 : MX < a0 , что на самом деле математическое ожидание срока службы лампы меньше, чем заявляет их производитель. Значение ( X − a0 ) n (875 −1000) 25 tn−1; 2α = t24; 0,1 = 21,71 , а значение статистики T = равно = −12,5 . s 50 Поскольку T > −tn−1;2α , нулевую гипотезу H0 не отвергаем, т. е. считаем, что производи тель не завышает истинный срок службы ламп. 452. В условиях задачи 432 требуется, предположив нормальность рас пределения объема продаж, на 5%ном уровне значимости проверить гипоте зу H0: MX = [x] при альтернативной гипотезе H1: MX ≠ [x] (здесь [s] — целая часть числа s); рассчитать вероятность ошибки второго рода, задавшись аль тернативным числовым значением MX. Решение. В предположении нормальности распределения объема продаж проверим на 5%ном уровне значимости справедливость гипотезы H0: MX = 49 при альтернативной гипо тезе H1: MX ≠ 49. ( X − a0 ) n (49,6 − 49) 100 Наблюдаемое числовое значение статистики Tn−1 = равно = 0,55 . sX 10,85 При α = 0,05 значение критической точки tα ; n−1 = t0,05; 99 = 1,98 . Поскольку |0,55| < t0,05; 99 , нет оснований отвергнуть проверяемую гипотезу H0. Пусть альтернативное значение математического ожидания равно a1 = 50, тогда веро ятность ошибки второго рода равна         (a − a1 ) n (a − a1 ) n β = P − tα ; n−1  + tα ; n−1  Tn−1 > 0 − P  Tn−1 > 0 =     sX sX                 (49 − 50) 100 (49 − 50) 100 = P − t0,05; 99  + t0,05; 99  T99 > − P  T99 > =     10,85 10,85         = P {T99 > −0,92 −1,98} − P {T99 > −0,92 + 1,98} = P {T99 < 2,9} − P {T99 > 1,06} = = 1− 0,002 − 0,146 = 0,857. 82 Здесь вероятности P{Tk > t} можно рассчитать с помощью функции Microsoft Excel P{Tk > t} = СТЬЮДРАСП(<t>; <k>; 1). 453. Инвестиционный фонд объявил, что доходность по вложениям в него превысила среднерыночную на 0,003. В течение последнего года средняя доходность по рынку составила 0,005, а средняя доходность по фонду состави ла 0,0065 с исправленным средним квадратичным отклонением 0,019. Прове рить на 5%ном уровне значимости, насколько справедливо заявление фонда. 454. Продюсер некоторой телепередачи утверждает, что она должна привлечь внимание, по крайней мере, трети телезрителей. Из 64 опрошенных только 16 заявили о своем намерении посмотреть эту передачу. Оценить ут верждение продюсера на 5%ном уровне значимости. 455. Средняя оценка контрольной работы в студенческой группе из 25 человек оказалась равной 3,25. После контрольной работы преподаватель провел консультацию, после чего была повторно написана контрольная рабо та, и средняя оценка оказалась равной 3,3. Проверить на 5%ном уровне зна чимости, помогла ли консультация, считая средние квадратичные отклонения оценок известными и в обоих случаях равными σ1 = σ2 = 1 . 456. Такси оснащается двумя видами шин A и B. Десять шин вида A имеют x1 = 40 000 км, s1 = 5 950 км, двенадцать шин вида B — x2 = 38 000 км, s2 = 5150 км. Определить, существенно ли различие между стойкостью двух видов шин, если генеральные совокупности нормальны и σ1 = σ2 . 83 84 85 5.4.2. К р и т е р и и с о г л а с и я Разобьем множество возможных значений случайной величины X на k р а з р я д о в (для непрерывной случайной величины роль разрядов играют ин тервалы значений, а для дискретной — отдельные возможные значения или их группы). Выдвинем нулевую гипотезу H0: FX (x) = F теор. (x) (состоящую в том, что генеральная совокупность распределена по закону F теор. (x) ) при альтерна тивной гипотезе H1: FX (x) ≠ F теор. (x) . Одним из критериев согласия выборочно го и теоретического распределений является критерий χ2 (критерий Пир% сона), который основывается на том, что распределение статистики χ (ni − npiтеор. )2 , npiтеор. i=1 k 2 ν−l−1 =∑ (5.4.3) (где ni — число попаданий элементов выборки в iй разряд, n — общее число элементов выборки, а piтеор. — теоретическая вероятность попадания случайной величины X в iй разряд при условии истинности нулевой гипотезы) не зави сит от выдвинутой гипотезы и определяется только числом степеней свободы k = ν − l − 1 , где ν — число разрядов, а l — число оцениваемых параметров. Если выбрать уровень значимости α , то γ = 1 −α = P {χ2ν−l−1 < χ 2ν−l−1;α } , (5.4.4) и критическая область определяется неравенством χ 2 ν−l−1 > χ2ν−l−1;α . (5.4.5) О б р а т и м в н и м а н и е на то, что критерий Пирсона можно использо вать только в том случае, когда npiтеор. . 5 , поэтому разряды, для которых это условие не выполняется, необходимо объединять с соседними. Задачи 457. Были случайно отобраны 80 банковских счетов, и зафиксированы остатки на них. Результаты таковы: Остаток на счете, [2,5; 3,5) [3,5; 4,5) [4,5; 5,5) [5,5; 6,5) [6,5; 7,5) [7,5; 8,5) [8,5; 9,5) [9,5;10,5) тыс. ден. ед. Число 2 4 13 25 16 11 6 3 вкладчиков Проверить на 5%ном уровне значимости гипотезу о том, что остаток на счете распределен по нормальному закону. Решение. Построим по данному интервальному вариационному ряду гистограмму и по лигон (рис. 5.4.2). По их виду, действительно, можно предположить, что наблюдаемая слу чайная величина распределена по нормальному закону с параметрами a и σ . Значения па раметров возьмем равными их несмещенным, состоятельным и эффективным оценкам: a = x; σ = s . Вычислим эти оценки: 86 n ∑ x ′n i x= i =1 n i = 3 ⋅ 2 + 4 ⋅ 4 + 5 ⋅13 + 6 ⋅ 25 + 7⋅16 + 8 ⋅11 + 9⋅ 6 + 10⋅ 3 521 = = 6,5125 , 80 80 n ∑ (x ′) n 2 9 ⋅ 2 + 16 ⋅ 4 + 25 ⋅13 + 36⋅ 25 + 49⋅16 + 64 ⋅11 + 81⋅ 6 + 100⋅ 3 3581 = = 44,7625 , 80 80 n n 2 80 ˆ ˆ σ2 = (x − x)2 ≈ 2,35 , s2 = σ = ⋅ 2,35 ≈ 2,38 , s = 2,38 ≈ 1,54 . n −1 79 i x2 = i =1 i = На том же рис. 5.4.2 начертим график кривой нормального распределения с парамет рами a = 6,5125, σ = 1,54 . f(x) 0,3 0,2 0,1 x 0 1 2 4 3 5 6 7 8 9 Рис. 5.4.2 Гистограмма, полигон и кривая теоретического распределения в задаче 457 Между гистограммой и кривой распределения есть различия. Выясним, можно ли на 5%ном уровне значимости отнести эти различия на счет случайности, или же мы выдвину ли ложную гипотезу. Вычислим значение статистики χ2ν∗ −l−1 . Для этого сначала найдем вероятности, кото рые приходятся на каждый интервал [при этом первый интервал считаем начинающимся в точке −∞ , а последний интервал — заканчивающимся в точке +∞ ].  3,5 − 6,5125   1  −∞− 6,5125  1 p1 = P{ X < 3,5} = F(3,5) − F(−∞) = +Φ0   −  +Φ0   = 0,0252 − 0 = 0,0252.  2 1,54 1,54    2   Аналогично, p2 = P{3,5 -X< 4,5} = 0,0704 , p3 = P{4,5 -X < 5,5} = 0,1598 , p4 = = P{5,5 -X< 6,5} = 0,2413 , p5 = P{6,5 -X< 7,5}= 0,2426 , p6 = P{7,5 -X < 8,5}=0,1623 , p7 = P{8,5 -X< 9,5} = 0,0722 , p8 = P{ X . 9,5} = 0,0262 . Дальнейшие вычисления для удобства и наглядности сведем в табл 5.4.3. Критерий Пирсона можно использовать только в том случае, когда npiтеор. . 5 , поэтому интервалы, для которых это условие не выполняется, объединим с соседними. Новое число интервалов обозначим ν ′ = 6 . Окончательное значение χ2ν ′−l−1 равно сумме величин в последнем столбце, т. е. 3,0934. Теперь найдем критическую точку χ2ν ′−l−1;α . Для этого, прежде всего, рассчитаем число степеней свободы: при расчете χ 2 ν ′−l−1 использовалось ν ′ = 6 интервалов, у предполагаемого нормального распределения были неизвестны l = 2 параметра, поэтому ν ′ − l −1 = 6 − 2 −1 = 3 . С помощью Microsoft Excel находим χα2 ;ν′−l−1 = χ20,05; 3 = ХИ2ОБР(0,05; 3) = 7,81. Поскольку χ 2 ν ′−l−1 < χα2 ; ν ′−l−1 , нет оснований отвергнуть гипотезу о нормальном распре делении остатка на счете. 87 Расчет ai ai +1 ni χ Т а б л и ц а 5.4.3 2 ν ′−l−1 в задаче 457 F(ai ) F(ai +1 ) piтеор = F(ai +1 ) − F(ai ) 2,5 3,5 2   6 0,0000 0,0252   3,5 4,5 4  0,0252 0,0956 0,0252 4,5 5,5 6,5 7,5 np теор i (ni − npiтеор )2 npiтеор 0,3559 0,0704 2,02   7,65  5,63   0,2554 0,4968 0,7393 0,9016 0,1598 0,2413 0,2426 0,1623 12,78 19,31 19,40 12,98 0,0038 1,6766 0,5959 0,3020 8,5 9,5 6   9 0,9016 0,9738   9,5 10,5 3  0,9738 1,0000 0,0722 5,78   7,88  2,10   0,1592 χ 5,5 6,5 7,5 8,5 13 25 16 11 0,0956 0,2554 0,4968 0,7393 0,0262 2 ν ′−l−1 3,0934 458. Для каждого из 100 компьютеров в офисе фирмы регистрирова лось число поломок в течение года: Число поломок 0 1 2 3 4 и более Число компьютеров 50 25 18 7 0 Проверить на 5%ном уровне значимости гипотезу о том, что число поло мок компьютера за год распределено по закону Пуассона. 459. Дано распределение успеваемости 50 студентов, сдавших 4 экза мена в сессию: Число сданных экзаменов 0 1 2 3 4 Число студентов 1 1 3 15 30 Проверить на уровне значимости α = 0,1 гипотезу о том, что число сдан ных экзаменов (из четырех) имеет биномиальный закон распределения. 460. В условиях задачи 432 требуется с помощью программы «Описатель ная статистика» пакета Microsoft Excel на 5%ном уровне значимости проверить ги потезу о нормальном законе распределения объема ежедневных продаж. Решение. Для проверки гипотезы о нормальном законе распределения воспользуемся критерием χ . По данным табл. 5.2.1 вычислим значения интервальных частот для нормаль 2 ного закона распределения npj = n[FN(aj+1) – FN(aj)], предварительно приняв FN(a1) = 0 и FN(aν+1) = 1. Объединим те интервалы, в которых npj - 5 (в данном случае необходимо объединить первый интервал со вторым, а восьмой — с девя тым), при этом соответствующие выборочные интервальные частоты mj (и теоретические частоты npj) складываются. Затем в каждом из интервалов (с учетом объединения) вычис лим значение величины (npj − mj )2 npj 88 и просуммируем эти значения по интервалам — получим выборочное (наблюдаемое) число вое значение статистики χ 2 ν∗ −l−1 ν∗ (npj − m j )2 j=1 npj =∑ , это значение равно 3,80. * * Здесь ν — число интервалов после их объединения (в данном случае ν = 7), l — число параметров нормального закона распределения, точные значения которых неизвестны (в данном случае нам неизвестны точные значения обоих параметров нормального закона a и σ, поэтому l = 2). Значение статистики χ2ν∗ −l−1 сравним с критической точкой χ2α ; ν∗ −l−1 , где α — уровень зна чимости (по условию задачи α = 5% = 0,05). Критическая точка χ2α ; ν∗ −l−1 = χ 20,05; 4 = 9,49 [это зна чение получено с помощью функции Microsoft Excel χ2α ; k = ХИ2ОБР(<α>; <k>)]. Наблюдаемое значение статистики χ24 оказалось меньше критической точки, поэтому нет оснований отверг нуть гипотезу о нормальном законе распределения объема ежедневных продаж. Результаты расчетов сведены в табл. 5.4.4. 89 Сере дина ин терва ла xj′ 24,20 30,69 37,18 43,67 50,16 56,65 63,14 69,63 76,12 — Интервал (aj; aj + 1) [20,956; 27,444) [27,444; 33,933) [33,933; 40,422) [40,422; 46,911) [46,911; 53,399) [53,399; 59,888) [59,888; 66,377) [66,377; 72,866) [72,866; 79,354) Итого 100 1 7 12 25 18 20 9 7 1 Интер валь ная часто та mj χ 2 ν ′−l−1 1,00 0,01 0,07 0,12 0,25 0,18 0,20 0,09 0,07 0,01 — 0,0015 0,0108 0,0185 0,0385 0,0277 0,0308 0,0139 0,0108 0,0015 — 0,01 0,08 0,20 0,45 0,63 0,83 0,92 0,99 1,00 — 0,0022 0,0077 0,0190 0,0321 0,0374 0,0301 0,0167 0,0064 0,0017 — 0,0187 0,0704 0,1942 0,4002 0,6395 0,8332 0,9426 0,9856 1,0000 Функция рас пределения нормального закона F (aj + 1) в задаче 460 Оценка Функция Ин Оценка функции плотности терваль функции распре нормаль ная отно плотности деления ного зако сительная ˆ fX (xj′ ) ˆ частотаˆ pj FX (aj+1 ) на fN (x j′ ) Расчет — 0,0000 0,0187 0,0704 0,1942 0,4002 0,6395 0,8332 0,9426 0,9856 F (aj) — 0,0187 0,0518 0,1237 0,2060 0,2393 0,1937 0,1094 0,0430 0,0144 — 1,87 5,18 12,37 20,60 23,93 19,37 10,94 4,30 1,44 8 5,74 100 12 25 18 20 9 12,37 20,60 23,93 19,37 10,94 — 8 7,04 2 4 χ =3,80 0,8876 0,0112 0,9375 1,4677 0,0203 0,3429 0,1295 npj mj (npj − m j )2 pj = после объ Частота = F (aj + 1)– npj единения npj –F (aj) интерва лов Т а б л и ц а 5.4.4 91 92 93 КОНТРОЛЬНЫЕ ЗАДАНИЯ Организация выполнения контрольных заданий По дисциплине «Математика» в каждом семестре предусмотрено выполнение контрольных заданий. В процессе работы над контрольным заданием студент ак тивно закрепляет и углубляет теоретические знания, полученные на лекциях и практических занятиях. Во втором семестре студент должен выполнить четыре задачи: три по теории вероятностей и одну по математической статистике. Условия задач приведены да лее, а конкретные числовые данные для каждого варианта — в прил. 3. Номер ва рианта выбирается по последней цифре номера зачетной книжки студента. При выполнении контрольного задания следует строго придерживаться ука занных ниже правил. Работы, выполненные без соблюдения этих правил, не засчи тываются и возвращаются студенту для переработки. 1. Контрольное задание выполняется аккуратно в рабочей тетради. Графики либо строятся при помощи компьютера и вклеиваются в работу (рекомендуется ис пользование пакета Microsoft Excel), либо вычерчиваются от руки (черными или цвет ными карандашами средней твердости на обычной или миллиметровой бумаге). Листы с текстом контрольного задания и графики должны быть сшиты. 2. В работу должны быть включены все требуемые задачи строго по по ложенному варианту. Контрольные работы, содержащие задания не своего вари анта, не засчитываются. 3. Перед решением каждой задачи необходимо полностью выписать ее усло вие. В том случае, когда формулировка задачи одна для всех вариантов, а различаются лишь исходные данные, необходимо переписывая общее условие задачи, заменять об щие данные конкретными, соответствующими своему варианту. 4. Текст работы должен содержать все необходимые расчеты и пояснения. Контрольное задание сдается преподавателю до экзамена для проверки. На экзамене студент должен показать, кроме владения теоретическим материалом, умение математически ставить, решать и анализировать конкретные задачи, в первую очередь, те, которые он решал при выполнении контрольного задания. При указании рецензента работы на требуемую переработку все необходимые допол нения студент прилагает к первоначальному тексту работы, не делая в нем ника ких исправлений. Содержание контрольного задания 1. Апостериорное исследование качества продукции. Магазин получает од нотипный товар от трех поставщиков: m1 единиц товара поступило от первого по ставщика, m2 единиц от второго и m3 единиц от третьего. Продукция, поступающая от первого поставщика, содержит k1 процентов брака, поступающая от второго по ставщика — k2% брака, а поступающая от третьего поставщика — k3% брака. По купатель оставил в книге пожеланий покупателей жалобу о неудовлетворитель ном качестве приобретенного товара. Найти вероятности того, что плохой товар, вызвавший нарекания покупателя, поступил от первого, второго и третьего по ставщиков (числа mi и ki (i = 1, 2, 3) приведены для каждого варианта в прил. 3). Указание. См. решения задач 97, 113. 94 2. Оптимальность инвестиционных операций по Парето. Инвестор рассматри вает четыре инвестиционные операции со случайными эффективностями, описы ваемыми случайными величинами E1, E2, E3, E4 с рядами распределения, приведен ными для каждого варианта в прил. 3. Требуется определить, какие из этих опера ций оптимальны по Парето. Указание. См. решение задачи 283. 3. Определение рациональной стоимости опционов. Найти рациональные стоимости опционов покупателя и продавца с терминальной стоимостью X руб. и сроком исполнения 1 год, выписанного на акцию, текущая цена которой составляет S0 руб., если известно, что годовая безрисковая процентная ставка составляет i = 10%, а год разбивается на четыре периода, в каждом из которых акция может возрасти в цене или упасть в цене в u раз (параметры X, S0, u приводятся для каж дого варианта в прил. 3). Указание. См. решения задач 199, 201, 202. 4. Статистическое исследование объемов продаж. Служба маркетинга оце нивает дилеров фирмы по объему продаж. Сведения об объеме ежедневных про даж товара (в тыс. ден. ед.) некоторым дилером за последние 100 дней приведены для каждого варианта в прил. 3. Требуется: а) построить интервальный вариаци онный ряд; полигон и гистограмму (на одном рисунке); кумуляту (на другом рисун ке); б) вычислить выборочные характеристики: среднее, дисперсию, среднее квад ратичное отклонение, коэффициент вариации, асимметрию, эксцесс, моду, медиа ну; в) заменив параметры нормального закона распределения их выборочными ха рактеристиками, скорректированными на поправку Шеппарда, рассчитать и по строить графики функции плотности и функции распределения нормального зако на, «наложив» эти графики соответственно на полигон и кумуляту; г) на 5%ном уровне значимости проверить гипотезу о нормальном законе распределения объе ма ежедневных продаж; д) предположив нормальность распределения объема продаж, построить 95%ные интервальные оценки математического ожидания, дисперсии и среднего квадратичного отклонения, а также на 5%ном уровне зна чимости проверить гипотезу H0: MX = [x] при альтернативной гипотезе H1: MX ≠ [x] (здесь [s] — целая часть числа s); рассчитать вероятность ошибки вто рого рода, задавшись альтернативным числовым значением MX. Указание. См. решения задач 432—434, 461. 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 1. Агапов Г. И. Задачник по теории вероятностей: Учебное пособие. – М.: Высшая школа, 1986. 2. Айвазян С. А., Мхитарян В. С. Теория вероятностей и прикладная статистика: Учеб ник. – М.: ЮНИТИДАНА, 2001. 3. Айвазян С. А., Мхитарян В. С. Прикладная статистика в задачах и упражнениях: Учебник. – М.: ЮНИТИДАНА, 2001. 4. Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. – М.: Наука, 1983. 5. Боровков А. А. Теория вероятностей: Учебник. – М.: Эдиториал УРСС, 1999. 6. Боровков А. А. Математическая статистика. – Новосибирск: Наука, 1997. 7. Ван дер Варден Б. Л. Математическая статистика. – М.: Издательство иностранной литературы, 1960. 8. Ватутин В. А., Ивченко Г. И., Медведев Ю. И., Чистяков В. П. Теория вероятностей и математическая статистика в задачах. – М.: Дрофа, 2004. 9. Вентцель Е. С. Теория вероятностей: Учебное пособие. – М.: Высшая школа, 2000. 10. Вентцель Е. С., Овчаров Л. А. Задачи и упражнения по теории вероятностей: Учебное пособие. – М.: Высшая школа, 2000. 11. Вентцель Е. С., Овчаров Л. А. Теория вероятностей и ее инженерные приложения. – М.: Наука, 1988. 12. Вероятность и математическая статистика: Энциклопедия / Гл. ред. Ю. В. Прохоров. – М.: Большая Российская энциклопедия, 1999. 13. Вуколов Э. А., Ефимов А. В., Земсков В. Н. и др. Сборник задач по математике для вту зов. Ч. 3. Теория вероятностей и математическая статистика: Учебное пособие. – М.: Наука, 1990. 14. Гихман И. И., Скороход А. В., Ядренко М. И. Теория вероятностей и математическая статистика: Учебник. – Киев: Вища школа, 1979. 15. Гланц С. Медикобиологическая статистика. – М.: Практика, 1999. 16. Гнеденко Б. В. Курс теории вероятностей: Учебник: 7е издание. – М.: Эдиториал УРСС, 2001. 17. Гнеденко Б. В. Очерк по истории теории вероятностей. – М.: Эдиториал УРСС, 2001. 18. Дороговцев А. Я., Сильвестров Д. С., Скороход А. В., Ядренко М. И. Теория вероятно стей: Сборник задач: Учебное пособие. – Киев: Вища школа, 1980. 19. Елисеева И. И., Князевский В. С., Ниворожкина Л. И., Морозова З. А. Теория статисти ки с основами теории вероятностей: Учебное пособие. – М.: ЮНИТИДАНА, 2001. 20. Емельянов Г. В., Скитович В. П. Задачник по теории вероятностей и математической статистике: Учебное пособие. – Л.: Издательство Ленинградского университета, 1967. 21. Зубков А. М., Севастьянов Б. А., Чистяков В. П. Сборник задач по теории вероятно стей: Учебное пособие. – М.: Наука, 1989. 22. Ивченко Г. И., Медведев Ю. И. Математическая статистика: Учебное пособие. – М.: Высшая школа, 1993. 23. Калинина В. Н. Математическая статистика в примерах и задачах: Учебное пособие. – М.: ГУУ, 1996. 24. Калинина В. Н., Панкин В. Ф. Математическая статистика: Учебник. – М.: Дрофа, 2002. 25. Карандаев И. С., Малыхин В. И., Соловьев В. И. Прикладная математика: Учебное по собие. – М.: ИНФРАМ, 2002. 26. Кендел М., Стюарт А. Теория распределений. – М.: Наука, 1966. 27. Кендел М., Стюарт А. Статистические выводы и связи. – М.: Наука, 1973. 28. Колемаев В. А., Калинина В. Н. Теория вероятностей и математическая статистика: Учебник. – М.: ЮНИТИДАНА, 2003. 29. Колемаев В. А., Калинина В. Н., Соловьев В. И. и др. Теория вероятностей в примерах и задачах: Учебное пособие. – М.: ГУУ, 2001. 30. Колемаев В. А., Калинина В. Н., Соловьев В. И. Математическая статистика в приме рах и задачах: Учебное пособие. – М.: ГУУ, 2001. 31. Колемаев В. А., Староверов О. В., Турундаевский В. Б. Теория вероятностей и мате матическая статистика: Учебное пособие. – М.: Высшая школа, 1991. 32. Колмогоров А. Н. Основные понятия теории вероятностей. – М.: ФАЗИС, 1998. 110 33. Королев В. Ю. Теория вероятностей и математическая статистика: Учебник. – М.: Проспект, 2006. 34. Коршунов Д. А., Фосс С. Г. Сборник задач и упражнений по теории вероятностей: Учебное пособие. – Новосибирск: Издательство НИИ МИОО НГУ. – 1997. 35. Коршунов Д. А., Чернова Н. И. Сборник задач и упражнений по математической ста тистике: Учебное пособие. – Новосибирск: Издательство Института математики. – 2001. 36. Крамер Г. Математические методы статистики: 2е издание. – М.: Мир, 1975. 37. Кремер Н. Ш. Теория вероятностей и математическая статистика: Учебник. – М.: ЮНИТИ–ДАНА, 2003. 38. Лоэв М. Теория вероятностей. – М.: Издательство иностранной литературы, 1962. 39. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика: Начальный курс: Учебник. – М.: Дело, 2001. 40. Макарова Н. В., Трофимец В. Я. Статистика в Excel: Учебное пособие. – М.: Финансы и статистика, 2002. 41. Малыхин В. И. Математика в экономике: Учебное пособие. – М.: ИНФРА–М, 2000. 42. Малыхин В. И. Финансовая математика: Учебное пособие. – М.: ЮНИТИДАНА, 2003. 43. Мацкевич И. П., Свирид Г. П. Высшая математика: Теория вероятностей и математи ческая статистика: Учебное пособие. – Минск: Вышэйшая школа, 1993. 44. Мацкевич И. П., Свирид Г. П, Булдык Г. М. Сборник задач и упражнений по высшей математике: Теория вероятностей и математическая статистика: Учебное пособие. – Минск: Вы шэйшая школа, 1996. 45. Мельников А. В. Рискменеджмент: Стохастический анализ рисков в экономике фи нансов и страхования. – М.: Анкил, 2003. 46. Мешалкин Л. Д. Сборник задач по теории вероятностей. – М.: Издательство Москов ского университета, 1963. 47. Прохоров А. В., Ушаков В. Г., Ушаков Н. Г. Задачи по теории вероятностей: Основные понятия. Предельные теоремы. Случайные процессы: Учебное пособие. – М.: Наука, 1986. 48. Розанов Ю. А. Теория вероятностей, математическая статистика и случайные процес сы: Учебник. – М.: Наука, 1989. 49. Ротарь В. И. Теория вероятностей: Учебное пособие. – М.: Высшая школа, 1992. 50. Севастьянов Б. А. Вероятностные модели. – М.: Наука, 1992. 51. Севастьянов Б. А. Курс теории вероятностей и математической статистики: Учебник. – М.: Наука, 1982. 52. Секей Г. Парадоксы в теории вероятностей и математической статистике. – М.: Мир, 1990. 53. Сигел Э. Практическая бизнесстатистика. – М.: Издательский дом «Вильямс», 2002. 54. Смирнов Н. В., Дунин:Барковский И. В. Курс теории вероятностей и математической статистики для технических приложений: Учебное пособие. – М.: Наука, 1965. 55. Соловьев В. И. Математические методы управления рисками: Учебное пособие. – М.: ГУУ, 2003. 56. Соловьев В. И. Стохастические модели математической экономики и финансовой ма тематики: Учебное пособие. – М.: ГУУ, 2001. 57. Сулицкий В. Н. Методы статистического анализа в управлении: Учебное пособие. – М.: Дело, 2002. 58. Тутубалин В. Н. Теория вероятностей: Краткий курс и научнометодические указа ния. – М.: Издательство Московского университета, 1972. 59. Тутубалин В. Н. Теория вероятностей и случайных процессов: Учебное пособие. – М.: Издательство Московского университета, 1992. 60. Уилкс С. Математическая статистика. – М.: Наука, 1967. – 632 с. 61. Уотшем Т. Дж., Паррамоу К. Количественные методы в финансах: Учебное посо бие. – М.: ЮНИТИДАНА, 1999. 62. Феллер В. Введение в теорию вероятностей и ее приложения: В 2х т.. – М.: Мир, 1984. 63. Четыркин Е. М., Калихман И. Л. Вероятность и статистика. – М.: Финансы и стати стика, 1982. 64. Чистяков В. П. Курс теории вероятностей: Учебник. – М.: Наука, 1987. 65. Ширяев А. Н. Вероятность: Учебное пособие: В 2х кн. – М.: МЦНМО, 2004. 111 ПРИЛОЖЕНИЕ 1 ПАРАМЕТРИЧЕСКИЕ СЕМЕЙСТВА ЗАКОНОВ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН, РАСПРОСТРАНЕННЫХ В ЭКОНОМИКЕ Т а б л и ц а СВ.1 Законы распределений дискретных случайных величин, часто встречающиеся на практике Краткое Обозначение случайной величины, Название обозначение механизм ее формирования и обо закона распределения закона значения параметров закона закон распределения индикатора события A альтернативный (вместо него чаще используется индикатор события) биномиальный геометрический X = IA IA = 1, если событие A наступило, и IA = 0 — в противном случае X = A(p) X = 1 означает успех в единичном испытании (с вероятностью p), X = 0 — неудачу (с вероятностью (1 – p)) X = Bi(n; p) X — число успехов в n испытаниях или Бернулли с вероятностью p успеха X = B(n; p) в единичном испытании X = G(p) X — число испытаний Бернулли, которые придется произвести до первого успеха (иногда — номер ис пытания, на котором впервые про изошел успех) X — число изделий первого сорта среди l изделий, отобранных слу чайным образом из партии, состоя гипергеометрический X = H(L; K; l) щей из L изделий, K из которых первого сорта, а остальные (L – K) — второго сорта X = Π(λ) 1. X — число успехов в n испытани ях Бернулли с вероятностью p ус пеха в единичном испытании, при чем n → ∞, np → λ = const; на прак тике данным распределением поль зуются в случае, когда n велико (не сколько десятков или более), а λ = np < 10 X = Π(мt) 2. X — число наступлений события простейшего потока с интенсивно стью м за время t Пуассона Т а б л и ц а СВ.2 Законы распределений непрерывных случайных величин, часто встречающиеся на практике Название Краткое обо Обозначение случайной величины, закона распределения значение за механизм ее формирования и обозна кона чения параметров закона X — случайная величина, принимаю щая значения только из некоторого X = U(a; b) отрезка [a; b] , причем с содержатель равномерный ной точки зрения все значения внутри этого отрезка одинаково возможны X — интервал времени между двумя последовательными наступлениями показательный X = Exp(м) события в простейшем потоке с ин (экспоненциальный) тенсивностью м X = X1 +X2 + ··· +Xn при n → ∞, где X1, X2, …, Xn — независимые в сово купности одинаково распределенные случайные величины (согласно цен тральной предельной теореме, см. нормальный X = N(a; σ) § 4.4); на практике этим распределе ние можно пользоваться, когда воз действие каждой из величин X1, X2, …, Xn равномерно, незначитель но и равновероятно по знаку, а число n достаточно велико (n . 60) логарифмически нор: мальный X = LN(a; σ) X = ln N(a; σ) χ (n) = N 2 «Хи квадрат» с k степенями свободы (Пирсона с k степеня: ми свободы) Стьюдента с k степенями свободы Фишера с k1 и k2 степенями сво: боды X = χ2k X = Tk X = Fk1 ;k2 2 1 (0;1) + N 22 (0;1) +" + N k2 (0;1) , где N1(0; 1), N2(0; 1), …, Nn(0; 1) — неза висимые в совокупности случайные величины, распределенные по нор мальному закону с параметрами a = 0, σ=1 Tk= N (0;1) χ 2 k /k , где N(0; 1) и χ 2 k — неза висимые случайные величины χ2k / k1 , где χ2k1 и χ2k2 — неза Fk1 ;k2 = 21 χk1 / k2 висимые случайные величины ПРИЛОЖЕНИЕ 2 СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ Т а б л и ц а СТ.1 u2 1 −2 Значения плотности стандартного нормального распределения ϕ(u) = e 2π u 2 t − 1 2 и функции Лапласа Φ0 (u) = dt e 2π ∫o u 0,00 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00 1,05 1,10 1,15 1,20 1,25 1,30 1,35 ϕ(u) Φ0 (u) 0,3989 0,3984 0,3970 0,3945 0,3910 0,3867 0,3814 0,3752 0,3683 0,3605 0,3521 0,3429 0,3332 0,3230 0,3123 0,3011 0,2897 0,2780 0,2661 0,2541 0,2420 0,2299 0,2179 0,2059 0,1942 0,1826 0,1714 0,1604 0,0000 0,0199 0,0398 0,0596 0,0793 0,0987 0,1179 0,1368 0,1554 0,1736 0,1915 0,2088 0,2257 0,2422 0,2580 0,2734 0,2881 0,3023 0,3159 0,3289 0,3413 0,3531 0,3643 0,3749 0,3849 0,3944 0,4032 0,4115 u 1,40 1,45 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 2,00 2,05 2,10 2,15 2,20 2,25 2,30 2,35 2,40 2,45 2,50 2,55 2,60 2,65 2,70 2,75 ϕ(u) Φ0 (u) 0,1497 0,1394 0,1295 0,1200 0,1109 0,1023 0,0940 0,0863 0,0790 0,0721 0,0656 0,0596 0,0540 0,0488 0,0440 0,0396 0,0355 0,0317 0,0283 0,0252 0,0224 0,0198 0,0175 0,0154 0,0136 0,0119 0,0104 0,0091 0,4192 0,4265 0,4332 0,4394 0,4452 0,4505 0,4554 0,4599 0,4641 0,4678 0,4713 0,4744 0,4772 0,4798 0,4821 0,4842 0,4861 0,4878 0,4893 0,4906 0,4918 0,4929 0,4938 0,4946 0,4953 0,4960 0,4965 0,4970 ϕ(u) u 2,80 0,0079 2,85 0,0069 2,90 0,0060 2,95 0,0051 3,00 0,0044 3,05 0,0038 3,10 0,0033 3,15 0,0028 3,20 0,0024 3,25 0,0020 3,30 0,0017 3,35 0,0015 3,40 0,0012 3,45 0,0010 3,50 0,0009 3,55 0,0007 3,60 0,0006 3,65 0,0005 3,70 0,0004 3,75 0,0004 3,80 0,0003 3,85 0,0002 3,90 0,000199 3,95 0,000163 4,00 0,000134 4,25 0,000048 4,50 0,000016 5,00 0,0000015 Φ0 (u) 0,4974 0,4978 0,4981 0,4984 0,4987 0,4989 0,4990 0,4992 0,4993 0,4994 0,4995 0,4996 0,4997 0,4997 0,4998 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,499952 0,499961 0,499968 0,499989 0,499997 0,4999997 Указание. При u > 5 ϕ(u) ≈ 0 , Φ0 (u) ≈ 0,5 . Следует также обратить внимание на то, что функция ϕ(u) четная, т. е. ϕ(−u) = ϕ(u) , а функция Φ0 (u) — нечетная, т. е. Φ0 (−u) = −Φ0 (u) . Для расчета ϕ(u) можно пользоваться стандартной функцией НОРМРАСП(; 0; 1; ЛОЖЬ) = = ϕ(u) , а для расчета плотности нормального распределения N (a; σ) — функцией  u − a  . НОРМРАСП(; < a >; < σ >; ЛОЖЬ) = ϕ   σ  Для расчета функции Φ0 (u) можно пользоваться стандартной функцией НОРМРАСП(; 0; 1; ИСТИНА) = Φ0 (u) , а функция распределения случайной величины N (a; σ) равна при этом НОРМРАСП(; < a >; < σ >; ИСТИНА). 114 Значения χ p k 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Указание. 0,99 0,95 2 p ;k , соответствующие вероятности p = P {χ > χ 2 0,9 0,1 0,05 0,01 p k 0,99 0,95 0,9 0,1 Т а б л и ц а СТ.2 2 p ;k } 0,05 0,01 0,0002 0,0039 0,02 2,71 3,84 6,63 18 7,01 9,39 10,86 25,99 28,87 34,81 0,02 0,10 0,21 4,61 5,99 9,21 19 7,63 10,12 11,65 27,20 30,14 36,19 0,11 0,35 0,58 6,25 7,81 11,34 20 8,26 10,85 12,44 28,41 31,41 37,57 0,30 0,71 1,06 7,78 9,49 13,28 21 8,90 11,59 13,24 29,62 32,67 38,93 0,55 1,15 1,61 9,24 11,07 15,09 22 9,54 12,34 14,04 30,81 33,92 40,29 0,87 1,64 2,20 10,64 12,59 16,81 23 10,20 13,09 14,85 32,01 35,17 41,64 1,24 2,17 2,83 12,02 14,07 18,48 24 10,86 13,85 15,66 33,20 36,42 42,98 1,65 2,73 3,49 13,36 15,51 20,09 25 11,52 14,61 16,47 34,38 37,65 44,31 2,09 3,33 4,17 14,68 16,92 21,67 26 12,20 15,38 17,29 35,56 38,89 45,64 2,56 3,94 4,87 15,99 18,31 23,21 27 12,88 16,15 18,11 36,74 40,11 46,96 3,05 4,57 5,58 17,28 19,68 24,73 28 13,56 16,93 18,94 37,92 41,34 48,28 3,57 5,23 6,30 18,55 21,03 26,22 29 14,26 17,71 19,77 39,09 42,56 49,59 4,11 5,89 7,04 19,81 22,36 27,69 30 14,95 18,49 20,60 40,26 43,77 50,89 4,66 6,57 7,79 21,06 23,68 29,14 40 22,16 26,51 29,05 51,81 55,76 63,69 5,23 7,26 8,55 22,31 25,00 30,58 50 29,71 34,76 37,69 63,17 67,50 76,15 5,81 7,96 9,31 23,54 26,30 32,00 100 70,06 77,93 82,36 118,50 124,34 135,81 6,41 8,67 10,09 24,77 27,59 33,41 150 112,67 122,69 128,28 172,58 179,58 193,21 Для расчета χ2p;k можно пользоваться стандартной функцией ХИ2ОБР(; < k >) = χ2p;k . Т а б л и ц а СТ.3 Значения tp;k , соответствующие вероятности p = P{| Tk |>tp;k } p k 1 2 3 4 5 6 7 8 9 10 11 12 13 Указание. Для 0,1 0,05 0,01 0,005 p k 0,1 0,05 0,01 0,005 6,31 12,71 63,66 127,32 14 1,76 2,14 2,98 2,92 4,30 9,92 14,09 15 1,75 2,13 2,95 2,35 3,18 5,84 7,45 16 1,75 2,12 2,92 2,13 2,78 4,60 5,60 17 1,74 2,11 2,90 2,02 2,57 4,03 4,77 18 1,73 2,10 2,88 1,94 2,45 3,71 4,32 19 1,73 2,09 2,86 1,89 2,36 3,50 4,03 20 1,72 2,09 2,85 1,86 2,31 3,36 3,83 25 1,71 2,06 2,79 1,83 2,26 3,25 3,69 30 1,70 2,04 2,75 1,81 2,23 3,17 3,58 40 1,68 2,02 2,70 1,80 2,20 3,11 3,50 60 1,67 2,00 2,66 1,78 2,18 3,05 3,43 120 1,66 1,98 2,62 1,77 2,16 3,01 3,37 ∞ 1,64 1,96 2,58 расчета tp;k можно пользоваться 3,33 3,29 3,25 3,22 3,20 3,17 3,15 3,08 3,03 2,97 2,91 2,86 2,81 стандартной функцией СТЬЮДРАСПОБР(; < k >) = tp;k . 115 Т а б л и ц а СТ. 4 Значения fp; k1 ;k2 , соответствующие вероятности p = P{Fk1 ;k2 > fp; k1 ;k2 } p = 0,05 k1 k2 1 2 3 4 5 6 7 8 9 10 20 30 50 100 1 2 3 4 5 6 7 8 9 10 20 30 50 100 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 248,02 250,10 251,77 253,04 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,45 19,46 19,48 19,49 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,66 8,62 8,58 8,55 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,80 5,75 5,70 5,66 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,56 4,50 4,44 4,41 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 3,87 3,81 3,75 3,71 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,44 3,38 3,32 3,27 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,15 3,08 3,02 2,97 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 2,94 2,86 2,80 2,76 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,77 2,70 2,64 2,59 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,12 2,04 1,97 1,91 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 1,93 1,84 1,76 1,70 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,78 1,69 1,60 1,52 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,68 1,57 1,48 1,39 p = 0,01 k1 k2 1 2 3 4 5 6 7 8 9 10 20 30 50 100 1 2 3 4 5 6 7 8 9 10 20 30 50 100 4052 98,50 34,12 21,20 16,26 13,75 12,25 11,26 10,56 10,04 8,10 7,56 7,17 6,90 4999 99,00 30,82 18,00 13,27 10,92 9,55 8,65 8,02 7,56 5,85 5,39 5,06 4,82 5404 99,16 29,46 16,69 12,06 9,78 8,45 7,59 6,99 6,55 4,94 4,51 4,20 3,98 5624 99,25 28,71 15,98 11,39 9,15 7,85 7,01 6,42 5,99 4,43 4,02 3,72 3,51 5764 99,30 28,24 15,52 10,97 8,75 7,46 6,63 6,06 5,64 4,10 3,70 3,41 3,21 5859 99,33 27,91 15,21 10,67 8,47 7,19 6,37 5,80 5,39 3,87 3,47 3,19 2,99 5928 99,36 27,67 14,98 10,46 8,26 6,99 6,18 5,61 5,20 3,70 3,30 3,02 2,82 5981 99,38 27,49 14,80 10,29 8,10 6,84 6,03 5,47 5,06 3,56 3,17 2,89 2,69 6022 99,39 27,34 14,66 10,16 7,98 6,72 5,91 5,35 4,94 3,46 3,07 2,78 2,59 6056 99,40 27,23 14,55 10,05 7,87 6,62 5,81 5,26 4,85 3,37 2,98 2,70 2,50 6209 99,45 26,69 14,02 9,55 7,40 6,16 5,36 4,81 4,41 2,94 2,55 2,27 2,07 6260 99,47 26,50 13,84 9,38 7,23 5,99 5,20 4,65 4,25 2,78 2,39 2,10 1,89 6302 99,48 26,35 13,69 9,24 7,09 5,86 5,07 4,52 4,12 2,64 2,25 1,95 1,74 6334 99,49 26,24 13,58 9,13 6,99 5,75 4,96 4,41 4,01 2,54 2,13 1,82 1,60 Указание. Следует учитывать, что f1−p; k1 ;k2 = 1 fp; k2 ;k1 . Для расчета fp; k1 ;k2 можно пользоваться стан дартной функцией FРАСПОБР(; < k1 >; < k2 >) = fp; k1 ;k2 . 116 ПРИЛОЖЕНИЕ 3 ИСХОДНЫЕ ДАННЫЕ К КОНТРОЛЬНЫМ ЗАДАНИЯМ Исходные данные для задачи исследования качества продукции m2 m3 k1 k2 k3 m1 1. 6 19 24 2 6 11 2. 7 18 23 3 7 12 3. 8 17 22 4 8 13 4. 9 16 21 5 9 14 5. 10 15 20 6 10 15 6. 11 14 19 7 11 16 7. 12 13 18 8 12 17 8. 13 12 17 9 13 18 9. 14 11 16 10 14 19 10. 15 10 15 11 15 20 Исходные данные для задачи оптимизации по Парето 1. (0, 1/2) (2, 1/4) (4, 1/8) (16, 1/8) 2. (0, 1/4) (4, 1/4) (6, 1/3) (12, 1/6) 3. (0, 1/3) (1, 1/3) (2, 1/6) (8, 1/6) 4. (0, 1/5) (4, 1/5) (6, 1/5) (10, 2/5) 5. (0, 1/5) (1, 2/5) (5, 1/5) (14, 1/5) 6. (0, 1/2) (8, 1/8) (16, 1/8) (20, 1/4) 7. (0, 1/4) (4, 1/4) (10, 1/4) (14, 1/4) 8. (0, 1/2) (4, 1/4) (5, 1/5) (20, 1/20) 9. (0, 1/2) (4, 1/4) (8, 1/8) (32, 1/8) 10. (0, 1/4) (8, 1/4) (12, 1/3) (24, 1/6) 11. (0, 1/3) (2, 1/3) (4, 1/6) (16, 1/6) 12. (0, 1/5) (8, 1/5) (12, 1/5) (20, 2/5) 13. (0, 1/5) (2, 2/5) (10, 1/5) (28, 1/5) Указание. В варианте с номером n необходимо выбрать операции с номерами n, n + 1, n + 2, n + 3 из числа приведенных выше (для каждой операции компактно записан ряд ее распределе ния: первое число в скобках означает возможное значение эффективности операции, а второе — вероятность соответствующего значения). Например, первая операция имеет эффектив ность, описываемую таким рядом распределения: E1 0 2 4 16 . p 1/2 1/4 1/8 1/8 Исходные данные для задачи определения рациональной стоимости опционов u X S0 1. 120 80 1,06 2. 110 80 1,07 3. 120 80 1,08 4. 110 80 1,09 5. 120 80 1,11 6. 110 80 1,12 7. 120 80 1,13 8. 110 80 1,14 9. 120 80 1,15 10. 110 80 1,16 117 Исходные данные для статистического анализа 1 0,91 0,62 1,07 1,38 1,36 1,52 0,34 0,93 1,33 0,67 0,79 0,49 0,45 0,71 0,77 0,36 0,83 0,88 1,04 0,89 0,90 0,89 1,40 0,97 0,94 0,85 1,59 1,26 1,71 0,80 1,50 0,52 1,16 1,27 1,58 0,97 0,84 1,20 0,89 1,23 0,57 0,75 0,54 0,89 0,99 1,01 0,90 1,66 0,48 0,78 0,23 1,43 0,62 0,80 1,23 1,14 1,26 1,18 0,59 0,67 1,21 1,10 0,72 0,93 1,04 1,17 1,04 0,73 1,57 1,15 1,02 1,25 1,26 0,81 0,72 1,33 0,64 0,53 1,21 1,19 1,66 1,43 1,39 1,03 1,00 1,14 0,99 0,68 0,47 1,25 1,13 1,19 1,06 0,69 1,37 0,91 0,75 0,75 0,87 0,86 2 2,39 1,80 1,91 1,64 1,91 0,66 1,92 1,20 2,09 2,30 2,79 1,63 1,55 2,09 1,86 1,88 2,95 2,02 1,91 3,10 1,62 2,76 1,99 1,96 2,97 2,22 2,26 1,86 2,41 1,96 1,56 1,34 2,12 1,41 3,16 1,92 1,05 1,80 2,57 1,77 1,61 1,18 2,19 1,90 2,34 1,62 1,79 2,17 1,80 2,13 0,52 1,96 2,15 3,27 1,08 1,06 0,62 2,70 3,42 1,77 1,40 2,33 2,40 1,49 2,49 2,40 1,88 1,07 2,61 2,46 1,79 1,59 2,52 2,21 2,33 3,25 2,16 1,34 2,29 1,26 2,34 1,91 2,18 2,21 2,08 1,84 1,19 3,27 2,96 2,63 1,11 1,33 2,32 2,04 1,99 2,10 0,87 1,85 1,44 1,40 3 2,54 3,42 3,32 2,92 2,90 3,81 1,47 1,46 3,52 4,64 1,52 4,12 3,87 3,82 2,53 2,98 3,36 2,95 5,26 2,24 3,65 3,55 3,60 3,63 3,22 3,58 1,73 1,34 4,03 4,33 2,94 4,01 3,25 1,74 3,29 3,08 2,90 2,81 3,95 3,20 3,41 3,67 2,34 3,29 3,16 3,00 2,89 3,72 3,15 2,55 4,71 2,86 3,71 3,33 2,97 4,38 2,76 3,74 2,25 4,03 2,96 2,79 0,51 3,52 3,65 2,94 1,00 2,42 4,05 3,12 3,21 3,61 3,18 2,65 2,50 2,13 3,20 2,35 3,72 2,94 2,80 5,11 2,76 2,62 3,98 2,60 1,63 1,97 3,20 2,76 3,03 3,50 2,83 4,14 2,93 3,93 3,76 1,17 3,12 3,33 4 4,95 4,03 4,16 5,09 3,10 4,78 3,64 2,96 3,02 3,61 2,64 1,44 4,55 5,11 3,04 3,83 3,61 4,77 4,28 3,85 3,52 4,27 4,18 4,12 3,74 3,53 3,54 2,08 5,85 3,62 2,47 3,79 4,25 2,97 2,76 3,66 3,81 3,37 3,28 3,69 3,09 4,39 5,11 3,56 5,47 5,68 3,51 5,39 3,62 4,12 4,53 2,37 5,07 6,73 2,36 3,59 6,53 4,65 3,92 5,59 3,15 3,57 2,61 3,99 4,85 3,20 2,52 3,90 3,58 1,06 5,22 2,90 4,48 3,06 5,06 6,24 5,21 2,79 6,73 5,86 5,89 3,27 2,03 4,12 4,61 4,21 5,10 3,42 6,01 4,17 1,84 4,69 5,18 5,79 6,09 3,78 3,76 4,37 5,21 2,04 5 5,73 5,87 3,14 4,29 5,37 4,77 3,35 3,11 4,45 5,49 5,89 3,70 5,12 5,97 5,26 6,61 5,95 3,45 4,53 7,68 6,98 7,99 5,16 5,28 5,35 6,26 3,22 5,68 7,57 4,26 8,23 3,99 5,44 4,69 5,56 5,25 7,80 6,69 5,12 6,62 3,77 6,67 3,88 4,18 5,43 6,08 5,12 4,56 4,44 4,38 6,03 6,09 4,60 5,77 3,43 4,92 5,68 4,24 7,00 5,53 4,00 3,91 5,39 5,99 5,13 2,89 4,91 4,58 3,99 5,66 5,13 5,62 4,37 1,40 6,09 2,54 4,65 5,17 4,97 3,02 7,00 4,16 3,51 5,23 5,68 6,08 5,19 4,91 1,90 4,64 6,20 5,92 9,01 4,43 2,34 5,32 2,14 3,79 4,36 6,51 6 5,11 3,18 9,57 6,29 7,43 6,67 6,16 7,72 5,90 4,02 4,90 5,03 4,31 5,80 2,25 4,06 7,24 4,56 7,02 7,31 8,42 4,12 4,41 1,79 6,58 5,16 7,18 3,15 6,31 6,25 8,29 7,73 2,84 4,67 4,54 4,12 6,68 7,94 6,36 5,55 5,36 6,37 9,46 3,49 3,58 2,63 8,39 8,21 5,81 6,63 6,77 7,18 8,60 8,32 6,53 5,73 8,37 6,72 6,18 4,93 2,98 7,88 5,57 5,50 5,16 8,36 5,79 3,82 3,64 3,96 2,18 3,88 7,62 4,97 11,04 6,63 5,94 7,41 5,46 6,11 6,38 6,35 7,05 5,85 6,26 4,76 8,90 3,80 6,46 5,27 5,99 5,40 7,66 6,03 3,44 7,08 5,85 5,53 2,31 7,46 7 4,85 7,15 7,40 5,27 7,69 4,00 4,59 7,77 3,40 7,69 4,22 8,90 6,79 4,24 10,96 4,20 8,31 7,23 4,81 12,19 8,00 8,86 8,25 9,89 7,56 4,30 6,14 8,07 4,85 6,73 6,30 5,46 4,46 7,17 5,02 8,70 4,59 7,76 8,54 4,84 9,19 5,81 7,82 5,67 7,77 5,94 3,86 7,27 5,53 10,10 7,05 7,22 7,15 7,68 8,32 10,75 9,26 5,43 3,66 10,65 2,89 4,98 5,39 7,54 6,26 5,86 7,77 6,09 3,30 4,44 5,57 7,03 3,81 9,78 8,53 7,95 2,98 7,67 8,14 8,78 4,61 10,14 8,73 2,63 6,99 6,18 5,27 4,43 6,34 9,37 5,93 6,37 4,73 12,84 5,43 3,63 8,35 7,18 3,77 9,14 8 7,12 9,42 7,35 8,61 6,35 6,46 8,81 11,78 6,09 10,73 9,59 6,52 9,09 10,23 11,22 8,92 5,43 11,24 6,30 9,36 6,73 10,57 9,54 7,56 10,03 8,23 9,57 7,44 7,72 4,71 9,55 4,27 11,34 7,24 1,91 6,89 8,66 12,65 11,43 6,69 11,64 3,03 7,66 8,14 8,34 5,13 8,23 6,45 9,83 9,58 4,69 7,41 9,75 6,27 4,62 8,02 9,62 10,20 8,61 8,09 10,21 10,15 7,38 8,90 8,30 7,65 7,96 4,17 2,52 7,04 10,92 9,08 7,54 6,79 7,40 12,19 3,71 6,10 12,36 10,36 7,54 10,03 8,04 8,74 10,42 5,99 7,62 5,96 10,14 10,19 5,02 6,35 8,45 8,66 5,77 9,87 8,47 5,99 6,55 10,15 9 10,31 12,30 10,01 8,55 13,49 5,55 16,47 8,46 12,20 9,55 12,50 6,70 9,01 9,73 14,79 3,82 5,74 8,79 7,39 9,76 10,68 7,56 8,00 11,20 9,41 10,99 11,88 6,52 11,04 11,83 12,01 4,46 8,55 7,01 7,33 8,66 10,87 9,53 9,25 13,58 9,48 7,87 4,25 12,10 6,89 6,34 7,91 8,59 10,15 10,05 9,73 11,23 6,19 9,57 9,21 7,03 5,57 7,23 13,44 9,43 10,01 5,85 9,41 4,51 8,62 7,96 11,69 11,01 6,67 9,02 10,22 12,27 9,15 13,36 10,61 9,84 9,58 6,49 5,24 8,74 6,27 10,50 6,92 8,40 8,65 10,41 11,13 10,78 9,05 12,67 7,23 6,17 8,35 7,29 2,83 10,04 4,53 9,09 11,44 7,44 10 10,30 12,87 12,80 13,40 8,09 6,87 13,08 10,61 11,40 10,79 8,60 12,11 4,06 14,75 7,28 10,35 9,94 7,56 13,96 7,87 10,33 9,79 9,26 7,57 8,09 9,19 9,97 5,99 14,39 6,14 9,21 17,57 9,86 9,51 5,21 5,32 2,53 6,64 12,86 6,18 14,17 13,55 8,78 11,10 16,11 13,75 15,09 6,38 12,90 14,68 12,20 9,99 7,33 9,38 10,22 7,61 8,50 9,86 9,14 9,87 2,00 12,05 13,38 4,34 11,62 11,24 3,21 8,50 13,23 14,14 4,28 6,44 7,90 7,28 9,59 12,86 9,07 9,64 5,99 5,02 11,64 7,13 13,12 15,07 11,22 10,98 10,80 6,71 8,33 11,34 7,84 7,22 11,19 7,94 6,63 12,36 10,24 12,51 5,56 11,93 ОГЛАВЛЕНИЕ Глава 4. § 4.1. § 4.2. § 4.3. § 4.4. Случайные последовательности ......................................................................................3 Некоторые вероятностные неравенства и их следствия .........................3 Виды сходимости случайных последовательностей....................................9 Законы больших чисел...........................................................................................................12 Центральная предельная теорема...............................................................................16 4.4.1. Теоремы Леви, Ляпунова и Линдеберга ...............................................................................................16 4.4.2. Теоремы Муавра — Лапласа..........................................................................................................................25 § 4.5. Глава 5. § 5.1. Математические основы теории страхования ................................................30 Введение в математическую статистику..............................................................37 Основы выборочного метода.............................................................................................37 5.1.1. Генеральная совокупность и выборка ....................................................................................................37 5.1.2. Допустимый объем выборки для обеспечения ее репрезентативности ...................42 5.1.3. Оценка функции распределения и плотности распределения........................................47 § 5.2. Точечные оценки параметров..........................................................................................58 5.2.1. Свойства точечных оценок ...............................................................................................................................58 5.2.2. Методы построения точечных оценок ....................................................................................................66 § 5.3. § 5.4. Интервальные оценки параметров.............................................................................71 Проверка статистических гипотез..............................................................................77 5.4.1. Проверка гипотез о параметрах нормального закона распределения......................77 5.4.2. Критерии согласия ..................................................................................................................................................85 Контрольные задания ............................................................................................................................................94 Список использованной литературы...................................................................................................110 Приложение 1..............................................................................................................................................................112 Приложение 2..............................................................................................................................................................114 Приложение 3..............................................................................................................................................................117

Теория вероятностей и математическая

Related documents

Products

Support

Теория вероятностей и математическая

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib