4Двумерные СВ 88

advertisement
4. ДВУМЕРНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
4.1. Функция распределения двумерной случайной
величины. Закон распределения. Условные распределения
Определение. Двумерным случайным вектором (или двумерной
случайной величиной) называется совокупность случайных величин:
  col(, ) , где  и  - случайные величины.
Пример. Скорость ветра в текущий момент времени в конкретной
точке на поверхности Земли является двумерной случайной величиной.
Определение. Функция распределения F ( x, y ) (или просто
распределение) двумерной случайной величиной   col(, ) задается
соотношением
F ( x, y )  P  x,   y  P : X ()  x : ()  y .
Замечание 1. Предполагается, что случайные величины X ( ) и
Y () определены на одном и том же пространстве  элементарных
событий  .
Замечание 2. Значение функции распределения F ( x1 , y1 ) равно
вероятности попадания двумерной случайной величины ( X ,Y ) в
бесконечный квадрант D11 с вершиной в точке ( x1 , y1 ) ( рисунок 4.1).
у
0
х
Рисунок 4.1
Замечание 3. Далее вместо записи P : X ()  x,Y ()  y будет
часто использоваться более краткая: PX  x, Y  y.
Свойства функции распределения двумерной случайной
величины.
1. Функция распределения F ( x, y ) есть неотрицательная функция,
заключенная между нулем и единицей, т.е. 0  F ( x, y)  1 .
88
Утверждение следует из того, что F ( x, y) есть вероятность.
2. Функция распределения F ( x, y) есть неубывающая функция по
каждому из аргументов, т.е.
при x2  x1
F ( x2 , y)  ( x1 , y) ,
при y2  y1
F ( x, y 2 )  ( x, y1 ) .
3. Если хотя бы один из аргументов обращается в  , функция
распределения F ( x, y) равна нулю, т.е.
F ( x,)  F (, y)  F (,)  0 .
Функция распределения F ( x, y) в отмеченных случаях равна нулю,
так как события X  , Y   и их произведения представляют
невозможные события.
4. Если один из аргументов обращается в  , функция
распределения F ( x, y) становиться равной функции распределения
случайной величины, соответствующей другому аргументу:
F ( x,)  F1 ( x) ,
F (, y)  F2 ( y) ,
где F1 ( x) и F2 ( y ) - функции распределения случайных величин X и Y ,
т.е. F1 ( x)  P( X  x),
F2 ( y)  P(Y  y) .
Произведение события ( X  x) и достоверного события (Y  )
есть само событие ( X  x) , следовательно, F ( x,)  P( X  x)  F1 ( x) .
Аналогично можно показать, что F (, y)  F2 ( y) .
5. Если оба аргумента равны  , то функция распределения равна
единице: F (,)  1 .
Это следует из того, что совместное осуществление достоверных
событий ( X  , Y  ) есть событие достоверное.
Наиболее полным, исчерпывающим описанием многомерной
случайной величины является закон ее распределения. При конечном
множестве возможных значений многомерной случайной величины
такой закон может быть задан в форме таблице (матрицы), содержащей
всевозможные сочетания значений каждой из одномерных случайных
величин, входящих в систему, и соответствующие им вероятности. Так,
если рассматривается двумерная случайная величина ( X , Y ) , то ее
двумерное распределение можно представить в виде таблицы (матрицы)
распределения, в каждой клетке (i, j) которой располагаются
вероятности произведения событий: p ij  P( X  x i )(Y  y j ) .
89
Таблица
yj
y1
xi
…
…
m
…
yj
 pj
ym
j 1
p1 j
…
p1m
p1
…
…
…
…
…
p i1
…
p ij
…
pim
pi
…
…
…
…
…
…
…
xn
p n1
…
pnj
…
pnm
pn
 pi
p1
…
pj
…
pm
1
x1
p11
…
….
xi
n
i 1
Здесь
pij  PX  xi , Y  y j ,
i  0, n ;
j  0, m ,
с
условием
n m
нормировки:   pij  1 .
i 0 j 0
Функция
n m
распределения
F ( x, y)    pij l ( x  xi )l ( y  y j ) ,
где
имеет
l единичные
вид
ступенчатые
i 1 j 1
функции. Единичной ступенчатой функцией называется функция вида
0, x  0,
l ( x)  
1, x  0.
Чтобы по таблице распределения найти вероятность того, что
одномерная случайная величина примет определенное значение, надо
просуммировать вероятности p ij из соответствующей этому значению
строки (столбца) данной таблицы.
Определение. Условным законом распределения одной из
одномерных составляющих двумерной случайной величины ( X , Y )
называется ее законом распределения, вычисленный при условии, что
90
другая составляющая приняла определенное значение (или попала в
какой-то интервал).
Если зафиксировать значение одного из аргументов, например,
положить Y  y j , то полученное распределение случайной величины
X при условии Y  y j . Вероятность p j ( xi ) этого распределения будут
события
X  xi , найденными в
предположении, что событие Y  y j произошло. Из определения
условными
вероятностями
условной вероятности
p j ( xi ) 
P[( X  xi )(Y  y j )]
P(Y  y j )

pij
pj
.
Аналогично условное распределение случайной величины Y при
условии X  xi задается с помощью условных вероятностей
pj (yj ) 
P[( X  xi )(Y  y j )]
P ( X  xi )

pij
pi
.
Случайные величины X и Y называются независимыми, если их
совместная функция распределения F ( x, y) представляется в виде
произведения функции распределения F1 ( x) и F2 ( y ) этих случайных
величин, т.е.
F ( x, y)  F1 ( x)  F2 ( y) .
В противном случае, при невыполнении этого равенства,
случайные величины X и Y называются зависимыми.
Определение. Зависимость между двумя случайными величинами
называется вероятностной (стохастической или статистической), если
каждому значению одной из них соответствует определенное (условное)
распределение другой.
4.2. Ковариация и коэффициент корреляции
Если
имеется
двумерная
случайная
величина
( X ,Y ) ,
распределение которой известно, т.е. известна таблица или совместная
плотность вероятности f ( x, y ) , тогда можно найти математическое
ожидание M ( X )  a x , M (Y )  aY и дисперсии D( X )   x2 и D(Y )   y2
одномерных составляющих X и Y . Однако математические ожидания и
дисперсии случайных величин X и Y недостаточно полно
характеризуют двумерную случайную величину ( X , Y ) , так как не
91
выражают степени зависимости ее составляющих X и Y . Эту роль
выполняют ковариация и коэффициент корреляции.
Определение. Ковариацией (или корреляционным моментом) K xy
случайной величины X и Y называется математическое ожидание
произведения отклонение этих величин от своих математических
ожиданий, т.е.
K xy  M [( X  M ( X ))(Y  M (Y ))] или K xy  M [( X  a x )(Y  a y )] .
Из определения следует, что K xy  K yx .
Определение. Ковариацией (корреляционным моментом) K XY
непрерывных случайных величин X и Υ называется второй
центральный смешанный момент
 
K XY  M ( X  a X )(Y  aY )    ( x  a X )( y  aY ) f ( x, y)dxdy.
 
K XY
Замечание. Корреляционный момент (ковариация)
дискретных случайных величин X и Υ определяются следующим
n m
образом: K XY    ( xi  a X )( y j  aY ) pij .
i 0 j 0
Ковариация двух случайных величин характеризует как степень
зависимости случайных величии, так и их рассеяние вокруг точки
(a x , a y ) . Об этом, в частности, свидетельствуют свойства ковариации
случайных величин:
- ковариация двух случайных величин равна математическому
ожиданию их произведения минус произведение математических
ожиданий, т.е.
K xy  M ( XY )  M ( X )  M (Y ) или K xy  M ( XY )  a x a y .
Доказательство. По определению:
K xy  M [( X  ax )(Y  a y )]  M ( XY  axY  a y X  ax a y )
Учитывая, что математические ожидания M ( X )  a x , M ( X )  a y неслучайные величины, получим
K xy  M ( XY )  a x M (Y )  a y M ( X )  a x a y 
 M ( XY )  a x a y  a y a x  a x a y  M ( XY )  a x a y .
92
- ковариация двух независимых случайных величин равна нулю,
т.к. равны нулю математические ожидания центрированных случайных
величин.
- ковариация двух случайных величин по абсолютной величине не
превосходит произведения их средних квадратических отклонений, т.е.
K xy   x y .
Доказательство. Возьмем очевидное неравенство:
 X  ax Y  a y
M

 
y
x

2

 0


или
 X  a
x
M 
  x


1
 x2
2
M ( X  ax )2 

(учтено,
 X  ax Y  ay

  2


 
y
x


что
D( X )

2
x
x
и
2
 x y

2 K xy
 x y
y

  Y  ay

  
y
 

M ( X  a x )(Y  a y ) 

D(Y )

2
y
 2
числа
2 K xy
 x y
1
 y2




2




M (Y  a y ) 2 
0
D( X )  M ( X  a x ) 2   x2 ,
и
D(Y )  M (Y  a y )   y2 ).
Тогда K xy   x y .
Ковариация, как уже отмечено, характеризует на только степень
зависимости двух случайных величин, но и их разброс, рассеяние.
Кроме того, она – величина размерная, ее размерность определяется
произведением размерности случайных величин.
Это затрудняет
использование ковариации для оценки степени зависимости для
различных случайных величин. Этих недостатков лишен коэффициент
корреляции.
Определение. Коэффициентом корреляции двух случайных
величин называется отношение их ковариации к произведению средних
квадратических отклонений этих величин:
 xy 
K xy
 x y
.
Из определения следует, что  xy   yx   . Очевидно так же, что
коэффициент корреляции есть безразмерная величина.
93
Определение. Корреляция между случайными величинами X и Υ
называется положительной, если  XY  0 , и отрицательной, если
 XY  0 .
Свойства коэффициента корреляции.
- коэффициент корреляции принимает значения на отрезке [1;1] ,
т.е. 1    1 .
2 K xy
K xy
Доказательство.
Т.к.
и
2
0
  , то
 x y
2
2 K xy
 x y
 x y
 2  2   0 откуда 1    1 .
- если случайные величины независимы, то их коэффициент
корреляции равен нулю, т.е.   0 .
Случайные величины называются некоррелированными, если их
коэффициент корреляции равен нулю. Таким образом, из независимости
случайных величин следует их некоррелированность.
Обратное
утверждение,
вообще
говоря,
неверно:
из
некоррелированности двух случайных величин еще не следует их
независимость.
-если коэффициент корреляции двух случайных величин равен (по
абсолютной величине) единице, то между этими случайными
величинами существует линейная функциональная зависимость.
Доказательство. Выше было получено, что
 X  ax Y  a y
M

 
y
x

2

2 K xy
  2
 2  2.

 x y

2
 X  ax Y  a y 
 0

Если   1 , 2  2  0 и M 
 
 y 
x

Равенство математического ожидания неотрицательной случайной
величины нулю означает, что сама случайная величина тождественно
равна нулю:
X  ax Y  a y

 0 при   1
x
y
y
y
( X  a x ) при   1 и Y  a y 
( X  a x ) при   1 ,
x
x
т.е. X и Y связанны линейной функциональной зависимостью.
или Y  a y 
94
Коэффициент корреляции можно рассматривать как характеристику
степени линейности взаимосвязи случайных величин X и Y .
Сформулируем это утверждение более строго.
Найдем такие коэффициенты a и b , чтобы
дисперсия
DY  aX  b отклонения Y от функции aX  b была минимальна.
Задача поиска наилучшего приближения Y с помощью линейной
функции aX  b является оптимизационной задачей. Можно доказать,
что минимум дисперсии DY  aX  b достигается, если
a0   XY
Y

, b0  aY   XY Y a X .
X
X
2
.
При этом DY  a0 X  b0    Y2 1   XY
2
Отсюда следует, что чем ближе  XY
к единице, тем меньше
дисперсия отклонения Y от наилучшего линейного приближения
a 0 X  b0 . В этом смысле коэффициент корреляции можно считать
“измерителем” степени линейности взаимосвязи двух случайных
величин.
Наилучшее линейное приближение функции регрессии Y на X на
основании критерия минимума дисперсии DY  aX  b имеет вид
y   XY
Y

x  aY   XY Y a X
X
X
Отсюда, в частности, следует, что если функция регрессии Y на X
имеет вид
f x   ax  b , т.е. если M Y / X  x   ax  b , то
коэффициенты
b0  aY   XY
a
Y
aX
X
и b определяются формулами
и
выведенная формула
a0   XY
Y
X
и
в этом случае задает
функцию регрессии.
Наилучшее линейное приближение функции регрессии имеет вид
Y
x  a X  , и эта функция называется линейной средней
X
квадратической регрессией Y на X .
y  aY   XY
С помощью ковариации можно дополнить и уточнить некоторые
свойства математического ожидания и дисперсии:
- математическое ожидание произведения двух случайных величин
равно сумме произведения их математических ожиданий и ковариации
этих случайных величин:
M ( XY )  M ( X )  M (Y )  K xy .
95
Эта формула
следует непосредственно из первого свойства
ковариации
Если K xy  0 , то M ( XY )  M ( X )  M (Y ) , т.е. математическое
ожидание произведения двух случайных величин равно произведению
их математических ожиданий.
- дисперсия суммы двух случайных величин равна сумме их
дисперсии плюс удвоенная ковариация этих случайных величин:
D( X  Y )  D( X )  D(Y )  2 K xy .
Пусть
свойству
Z  X  Y , M ( X )  a X , M (Y )  aY , M (Z )  a Z . По
az  ax  a y .
математического
ожидания
Поэтому
Z  a z  ( X  a x )  (Y  a y ) .
По определению дисперсии
D( X  Y )  D(Z )  M (Z  az ) 2  M ( X  ax ) 2  2M [( X  ax )(Y  a y )] 
 M (Y  a y ) 2  D( X )  2K xy  D(Y ).
Условным математическим ожиданием дискретной случайной
величины
Y при X (регрессией
Y на X ) называется сумма
Y
произведений возможных значений
на их условные вероятности
n
M (Y / X  x)   yi  p( yi / x) .
j 1
4.3. Решение типовых задач
Пример 1. Фирма выпускает мини-заводы по производству хлеба. На
рекламу может быть израсходовано определенное количество средств.
В таблице приведены возможное количество проданных в течение
месяца заводов  X  и объем средств, израсходованных на рекламу Y  .
x , y 
Каждой паре
i
j
случайных величин


X ,Y 
поставлена в
соответствие вероятность p xi , y j появления этой пары.
Таблица
1
0
0,12
X
1
0,15
2
0,10
2
0,08
0,10
0,12
3
0,05
0,10
0,18
Y
96
Требуется составить таблицы распределения вероятностей для
каждой из величин X и Y и выразить условный закон распределения
вероятностей величины Y при X  2 .
Решение. Так как с каждым значением x i встречается ровно три
значения
y j , т.е. имеет место полная группа событий, сумма
вероятностей которых равна единице, то
 pxi , y j    pxi  py j / xi   pxi   py j / xi   pxi  .
3
3
3
j 1
j 1
j 1
Таким
образом,


вероятность
события
p  xi 
равна
сумме
вероятностей p xi , y j в каждой колонке.
В результате получаем таблицу распределения вероятностей величины
X.
xi
p  xi 
0
1
2
0,25
0,35
0,4
Аналогично получаем таблицу распределения для величины Y .
yj
py j 
1
2
3
0,37
0,3
0,33
Сумма вероятностей для каждой из величин должна быть равна
единице. Проведем проверку:
 pxi   0,25  0,35  0,4  1 ;
3
j 1
 py j   0,37  0,3  0,33  1 .
3
j 1
Находим условные вероятности величины Y при X  2 :
PY  1 / X  2  PY  1, X  2 / P X  2  0,10 / 0,4  0,25 ;
PY  2 / X  2  PY  2, X  2 / P X  2  0,12 / 0,4  0,30 ;
PY  3 / X  2  PY  3, X  2 / P X  2  0,18 / 0,4  0,45 .
Пример 2. Найти регрессию величины Y на X для двух значений
x1  3 и x2  6 на основе заданной таблицы распределения двумерной
случайной величины
97
X
Y
3
6
10
0,25
0,10
14
0,15
0,05
18
0,32
0,13
Решение. Условное математическое ожидание, или регрессия,
величины Y на X находится на основе соотношения
M Y / X  xi    y j  py j / xi  ,
n
j 1
где
p  y j / xi  
p xi , y j 
p  xi 
.
Определяем P X  3 и P  X  6 :
P X  3  0,25  0,15  0,32  0,72 ;
P X  6  0,10  0,05  0,13  0,28 .
Вычисляем условные вероятности:
PY
PY
PY
PY
PY
PY
 10 / X
 10 / X
 14 / X
 14 / X
 18 / X
 18 / X
 3  0,25 / 0,72  0,35 ;
 6  0,10 / 0,28  0,36 ;
 3  0,15 / 0,72  0,21 ;
 6  0,05 / 0,28  0,18 ;
 3  0,32 / 0,72  0,44 ;
 6  0,13 / 0,28  0,46 .
Находим условные математические ожидания:
M Y / X  3  10  0,35  14  0,21  18  0,44  14,4 ;
M Y / X  6  10  0,36  14  0,18  18  0,46  14,3 .
Пример 3. Задан закон распределения двумерной случайной
величины (X ; Y) .
98
Y
X
2
0,10
0,05
0,12
1
3
4
3
0,20
0,14
0,08
5
0,15
0,11
0,05
Найти коэффициент корреляции между величинами X и Y .
Решение. Находим вероятности значений X  1 , X  3 , X  4 ;
P X  1  0,10  0,20  0,15  0,45 ;
P X  3  0,05  0,14  0,11  0,30 ;
P X  4  0,12  0,08  0,05  0,25 .
Определяем вероятности значений Y  2 , Y  3 , Y  5 :
PY  2  0,10  0,05  0,12  0,27 ;
PY  3  0,20  0,14  0,08  0,42 ;
PY  5  0,15  0,11  0,05  0,31 .
Находим M Y  : M Y   2  0,27  3  0,42  5  0,31  3,35 .
Определяем M  X  : M  X   1 0,45  3  0,3  4  0,25  2,35 .
  и M Y  :
M  X   1  0,45  9  0,3  16  0,25  7,15 ;
M Y   4  0,27  9  0,42  25  0,31  12,61 .
Вычисляем M X
2
2
2
2
Находим D x , D y :
Dx  7,15  2,35 2  7,15  5,52  1,63 ;
Dy  12,61 3,352  12,61 11,22  1,39 .
Откуда
 x  D x  1,28 ;  y  Dy  1,18 .
Ковариация величин X и Y может быть найдена по формуле
k xy  M  XY   a x a y .
Итак,
99
M  XY     xi y j PX  xi , Y  y j ,
3
i 1
3
j 1
M ( XY )  1  2  0,1  1  3  0,2  1  5  0,15  3  2  0,05  3  3  0,14 
 3  5  0,11  4  2  0,12  4  3  0,08  4  5  0,05  7,68,
k xy  7,68  2,35  3,35  0,19 ,
 xy 
k xy
 x y

 0,19
 0,126 .
1,28 1,18
4.4. Индивидуальное домашнее задание
по теме «Двумерные дискретные случайные величины»
Найти линейную среднюю квадратическую регрессию случайной
величины Y на случайную величину X на основе заданного закона
распределения случайной величины. Найти коэффициент корреляции
между величинами X и Y . Найти условное математическое ожидание
величины X для всех возможных значений величины Y (т.е. регрессию
величины Y на X ).
№1
X
2
3
№2
№3
Y
3
4
0,16
0,14
0,10
0,20
0,28
0,12
2
0,06
0,12
Y
3
0,18
0,13
5
0,24
0,27
X
I
4
X
3
4
№4
1
2
0,24
0,15
4
7
№5
4
0,22
0,07
5
X
7
9
0,14
0,16
0,15
0,20
0,21
0,14
1
0,14
0,13
X
4
0,12
0,20
6
0,13
0,28
5
0,11
0,21
X
8
0,13
0,06
10
0,26
0,23
Y
3
7
№6
Y
1
0,12
0,20
Y
Y
2
6
100
№7
X
1
3
№8
3
4
0,16
0,14
0,10
0,20
0,28
0,12
X
4
6
2
0,06
0,12
3
0,18
0,13
3
0,10
0,20
4
0,28
0,12
2
Y
4
5
0,12
0,18
0,13
0,06
0,24
0,27
4
0,06
0,12
Y
5
0,18
0,13
6
0,24
0,27
2
0,12
0,18
Y
4
0,13
0,06
1
0,13
0,18
Y
3
0,24
0,06
№10 X
1
3
X
2
3
№12 X
1
3
№13 X
3
6
0,22
0,14
X
7
0,09
0,17
0,32
0,06
8
0,14
0,23
X
9
0,11
0,04
12
0,18
0,30
3
0,21
0,11
X
6
0,07
0,20
8
0,23
0,18
3
X
4
7
0,15
0,21
0,23
0,09
0,15
0,17
4
0,13
0,24
X
5
0,14
0,08
8
0,19
0,22
Y
1
6
№16
Y
1
3
4
7
5
0,24
0,27
2
0,16
0,14
Y
4
№15
Y
№9 X
№11
№14
Y
2
Y
2
8
№17 Y
4
8
№18 Y
3
5
№19 Y
5
0,24
0,27
5
9
X
6
0,23
0,17
№20 Y
4
0,12
0,27
2
7
101
9
9
0,07
0,20
12
0,15
0,18
X
5
0,11
0,20
8
0,21
0,09
10
0,14
0,25
№21
3
5
№22
Y
3
4
0,13
0,18
0,24
0,06
0,12
0,27
X
3
1
3
№23
0,12
0,20
X
2
5
X
4
7
9
0,30
0,08
0,12
0,12
0,10
0,28
№27 Y
0,22
0,07
5
9
X
2
6
9
0,21
0,08
0,18
0,14
0,14
0,25
№28 Y
0,12
0,31
3
0,30
0,05
Y
4
0,20
0,12
7
0,10
0,23
4
Y
6
8
0,24
0,10
0,30
0,12
0,05
0,19
№25 X
4
10
6
0,13
0,20
№24 X
3
6
Y
5
0,24
0,15
Y
6
0,08
0,16
4
3
5
№26 Y
1
X
8
2
7
№29
9
0,15
0,23
0,16
0,20
X
1
0,11
0,21
Y
3
5
102
7
0,09
0,17
Y
4
8
№30
X
4
4
0,24
0,08
8
0,17
0,19
X
4
8
14
0,12
0,23
0,13
0,12
0,20
0,20
Download