Высоковероятное подмножество и его свойства.

advertisement
С.Я. Шатских
Лекции по теории вероятностей
Высоковероятное подмножество и его свойства
Черновик
Рассмотрим последовательность независимых одинаково распределенных дискретных случайных величин
X1 , X2 , . . . , Xn , . . . .
(1.14)
Будем считать, что эти случайные величины принимают значения из конечного множества
X ≡ {x1 , . . . , xm }
со следующими вероятностями
P{Xi = xk } = pk ∈ (0, 1),
m
X
pk = 1.
k=1
Ввиду свойства независимости, для любого натурального n и любых zr ∈ X
P{Xi1 = z1 ; . . . ; Xin = zn } =
n
Y
θ(1)
P{Xir = zr } = p1
θ(m)
. . . pm
,
(1.15)
r=1
где θ(k) - число элементов xk из множества X , входящих в последовательность1 z1 , . . . , zn .
Ясно, что
m
X
0 ≤ θ(k) ≤ n,
θ(k) = n.
k=1
Теперь возьмем первые n членов последовательности (1.14) и рассмотрим случайный
вектор X ( n) = (X1 , . . . , Xn ). Множество всех реализаций этого вектора имеет вид
X n ≡ {z (n) : z (n) = (z1 , . . . , zn ), zk ∈ X , k = 1, n }.
Во множестве X n рассмотрим подмножество
m \
(n)
n θ(k)
−1/4
Vn :=
z ∈X :
− pk < n
.
n
k=1
1
Другими словами, число появлений элемента xk ∈ X в последовательности z1 , . . . , zn . Например,
при m = 3 и n = 5 для последовательности x2 , x2 , x1 , x3 , x1
θ(1) = 2, θ(2) = 2, θ(3) = 1.
1
Теорема 1. Имеет место равенство
lim P{X (n) ∈ Vn } = 1.
n→∞
Доказательство. Дополнение подмножества Vn до всего множества X n имеет вид
m [
−1/4
n
(n)
n θ(k)
.
− pk ≥ n
Wn := X \ Vn =
z ∈X :
n
k=1
Так как вероятность суммы случайных событий не превосходит суммы вероятностей
этих событий, то
P{X (n) ∈ Vn } = 1 − P X (n) ∈ Wn ≥
m
X
Θ(k)
−1/4
≥1−
P ,
(1.16)
− pk ≥ n
n
k=1
где Θ(k) - случайная величина, равная числу появлений элемента xk ∈ X в последовательности случайных величин X1 , . . . , Xn .
Случайную величину Θ(k) можно представить в виде суммы
Θ(k) =
n
X
Θi (k),
i=1
где случайная величина
Θi (k) =
1, когда Xi = xk ,
0, когда Xi 6= xk .
равна числу появлений элемента xk ∈ X на i−ом месте в последовательности X1 , . . . , Xn .
Нетрудно видеть, что для любого i = 1, n
M{Θi (k)} = pk , D{Θi (k)} = pk (1 − pk ).
(1.17)
Кроме того, из независимости случайных величин {X1 , . . . , Xn } следует независимость
случайных величин {Θ1 (k), . . . , Θn (k)}. Таким образом, для любого k = 1, m последовательность случайных величин {Θ1 (k), . . . , Θn (k)} образует схему Бернулли.
Используя неравенство Чебышева и равенства (1.17), нетрудно получить оценку
)
!
(
m
n
m
m
1X
X
X
X
n
·
p
(1
−
p
)
1
k
k
Θi (k) − pk ≥ n−1/4 ≤
= 1/2 1 −
pk2 .
P 2 · n−1/2
n
n
n
i=1
k=1
k=1
k=1
Следовательно,
(
)
n
1X
lim
P Θi (k) − pk ≥ n−1/4 = 0.
n→∞
n
i=1
k=1
m
X
Поэтому, ввиду (1.16)
lim P{X (n) ∈ Wn } = 0
n→∞
и
lim P{X (n) ∈ Vn } = 1.
n→∞
(1.18)
Замечание. Множество всех реализаций случайного вектора X ( n) = (X1 , . . . , Xn )
нам удалось представить в виде объединения двух непересекающихся подмножеств
X n = Wn ∪ Vn ,
2
Wn ∩ Vn = ∅,
которые обладают свойствами (1.18).
Подмножество Vn называют высоковероятным подмножеством.
В следующей теореме будет установлено, что распределение вероятностей на высоковероятном подмножестве является асимптотически равномерным.
Теорема 2. Для любых двух элементов z (n) и y (n) из высоковероятного подмножества Vn имеет место равенство
log2 P X (n) = z (n)
= 1.
lim
n→∞ log2 P {X (n) = y (n) }
Доказательство. Из равенства (1.15) следует, что
θ(1)
θ(m)
.
P X (n) = z (n) = p1 . . . pm
Поэтому
m
X
log2 P X (n) = z (n) =
θ(k) log2 pk .
(1.19)
k=1
С другой стороны, для z
(n)
∈ Vn
pk − n−1/4 <
θ(k)
< pk + n−1/4 ,
n
для любого k = 1, m.
Следовательно
m
X
(n · pk + n3/4 ) log2 pk <
m
X
θ(k) log2 pk <
k=1
k=1
k=1
m
X
(n · pk − n3/4 ) log2 pk .
Отсюда, учитывая (1.19), получаем неравенство
m
X
(n · pk + n
3/4
) log2 pk < log2 P X
(n)
=z
(n)
k=1
m
X
(n · pk − n3/4 ) log2 pk .
<
(1.20)
k=1
Далее, запишем формулу для энтропии случайной величины X из последовательности
(1.14):
m
X
H(X) = −
pk log2 pk > 0, так как pk ∈ (0, 1).
k=1
Поэтому неравенство (1.20) можно переписать в виде
−n · H(X) + n3/4
m
X
m
X
log2 pk . (1.21)
log2 pk < log2 P X (n) = z (n) < −n · H(X) − n3/4
k=1
k=1
Аналогично рассуждая можно получить неравенство для вектора y (n) :
−n · H(X) + n
3/4
m
X
log2 pk < log2 P X
(n)
=y
(n)
< −n · H(X) − n
3/4
m
X
log2 pk . (1.22)
k=1
k=1
Используя неравенства (1.21) и (1.22), будем иметь
P
P
log2 P X (n) = z (n)
−n · H(X) − n3/4 m
log2 pk
−n · H(X) + n3/4 m
log2 pk
k=1
Pm
Pk=1
<
<
.
m
3/4
(n)
(n)
3/4
−n · H(X) + n
log2 P {X = y }
−n · H(X) − n
k=1 log2 pk
k=1 log2 pk
3
Или
P
P
log2 P X (n) = z (n)
H(X) − n−1/4 m
H(X) + n−1/4 m
log2 pk
k=1 log2 pk
k=1
P
P
<
<
. (1.23)
m
m
H(X) − n−1/4 k=1 log2 pk
log2 P {X (n) = y (n) }
H(X) + n−1/4 k=1 log2 pk
Выше было отмечено, что энтропия H(X) > 0, поэтому в неравенстве (1.23) можно
перейти к пределу , устремляя n → ∞. В результате будем иметь
log2 P X (n) = z (n)
lim
= 1.
n→∞ log2 P {X (n) = y (n) }
Далее, через |A| будем обозначать число элементов конечного множества A.
В следующей теореме мы дадим оценку для |Vn | - числа элементов высоковероятного
множества и приведем асимптотику log2 |Vn | при n → ∞.
Теорема 3. Для любого δ > 0, найдется натуральное nδ такое, что для всех
n > nδ выполняется неравенство
1◦ . (1 − δ) · 2 n(H(X)+n
−1/4
Pm
k=1
≤ |Vn | ≤ 2 n(H(X)−n
log2 pk )
−1/4
Pm
k=1
log2 pk )
,
log2 |Vn |
= H(X).
n→∞
n
2◦ . lim
Доказательство. 1◦ . Из неравенства (1.21) следует, что
3/4
2(−n·H(X)+n
Pm
k=1
log2 pk )
Pm
3/4
k=1 log2 pk ) .
< P X (n) = z (n) < 2(−n·H(X)−n
(1.24)
Далее, нетрудно видеть, что
P X (n) ∈ Vn ≥ |Vn | · min P X (n) = z (n) ,
z (n) ∈Vn
P X (n) ∈ Vn ≤ |Vn | · max P X (n) = z (n) .
z (n) ∈Vn
Поэтому
P X (n) ∈ Vn
P X (n) ∈ Vn
≤ |Vn | ≤
.
maxz(n) ∈Vn P {X (n) = z (n) }
minz(n) ∈Vn P {X (n) = z (n) }
Отсюда, используя неравенство (1.24), будем иметь
|Vn | ≤
1
= 2 n(H(X)−n
−1/4
P
(−n·H(X)+n3/4 m
k=1 log2 pk )
Pm
k=1
log2 pk )
,
(1.25)
2
|Vn | ≥
P X (n) ∈ Vn
Pm
−1/4
k=1 log2 pk ) .
= P X (n) ∈ Vn · 2 n(H(X)+n
(1.26)
2
Используя теорему 1, можно утверждать, что для любого δ > 0, найдется натуральное
nδ такое, что для всех n > nδ
P X (n) ∈ Vn > 1 − δ.
P
(−n·H(X)−n3/4 m
k=1 log2 pk )
Значит, ввиду (1.26) для всех n > nδ
(1 − δ) · 2 n(H(X)+n
−1/4
Pm
k=1
log2 pk )
≤ |Vn | ≤ 2 n(H(X)−n
−1/4
4
Pm
k=1
log2 pk )
.
2◦ . Нетрудно видеть, что из п. 1◦ следует неравенство
m
m
X
X
log2 |Vn |
log2 (1 − δ)
+ H(X) + n−1/4
log2 pk ≤
≤ H(X) − n−1/4
log2 pk .
n
n
k=1
k=1
Переходя к пределу при n → ∞, получаем доказательство нашего утверждения.
Оценим отношение числа элементов высоковероятного подмножества Vn к числу
элементов всего множества X n .
Теорема 4.
|Vn |
1, если распределение сл. величины X равномерное,
lim
=
0, если распределение сл. величины X неравномерное.
n→∞ |X n |
Доказательство. Так как |X n | = mn , то нас будет интересовать оценка величины
|Vn |
.
mn
Вначале рассмотрим случай, когда случайные величины входящие в последовательность (1.14) имеют равномерное распределение, тогда для любых xk ∈ X и z (n) ∈ X n
pk = P{Xi = xk } ≡
1
1
и P{X (n) = z (n) } ≡
.
m
mn
Следовательно
|Vn |
.
P X (n) ∈ Vn = |Vn | · P X (n) = z (n) =
mn
Поэтому, ввиду теоремы 1
lim
n→∞
|Vn |
= lim P X (n) ∈ Vn = 1.
n
|X | n→∞
(1.27)
Таким образом, для больших n высоковероятное подмножество Vn практически совпадает с множеством X n .
Пусть теперь распределение вероятностей случайных величин из последовательности (1.14) не является равномерным. Тогда по известному свойству энтропии (см.
свойство 4)
H(X) < log2 m.
(1.28)
Пользуясь неравенством теоремы 3, получим
Pm
P
k=1 log2 pk )
|Vn |
2 n(H(X)−n
n((H(X)−log2 m)−n−1/4 m
k=1 log2 pk ) .
≤
=
2
n
n
log
m
2
m
2
−1/4
Так как ввиду (1.28)
lim n (H(X) − log2 m) − n−1/4
n→∞
m
X
k=1
то
lim
n→∞
|Vn |
= 0.
|X n |
5
!
log2 pk
= −∞,
Замечание. Несмотря на то, что вероятность высоковероятного подмножества Vn
близка к единице, тем не менее (для неравномерных распределений) это множество
составляет лишь очень малую долю от числа элементов множества X n .
Пример. Пусть множество значений случайной величины X состоит из двух элементов (m = 2) :
X = {0, 1} и P{X = 1} = 0.1 , P{X = 0} = 0.9.
4
Рассмотрим n = 104 , тогда для двоичных последовательностей z (10 ) = (z1 , . . . , z10000 )
θ(2)
(104 )
104 θ(1)
V104 = z
∈X
: 4 − 0.1 < 0.1; 4 − 0.9 < 0.1 ,
10
10
4
где θ(1) − число единиц в последовательности z (10 ) , а θ(2) − число нулей.
Заметим, что в этом примере неравенство для числа нулей следует из неравенства
для числа единиц. Поэтому, убирая излишнее условие для числа нулей, будем иметь
n 4
o
(10 )
104
V104 = z
∈X
: 0 < θ(1) < 2000 .
6
Download