3. Вероятностная модель индексов влияния

advertisement
Об одном общем подходе к измерению влияния
в коллективных органах принятия решений
Бацын М.В., НФ ГУ-ВШЭ, mikhail.batsyn@auriga.ru
Калягин В.А., НФ ГУ-ВШЭ, vkalyagin@hse.nnov.ru
1. Введение
Измерение влияния является эффективным инструментом анализа принятия решений.
Широко используются классические способы измерения влияния с помощью индексов
Банцафа и Шепли-Шубика (Shapley & Shubik 1954, Banzhaf 1965). В последние годы возрос интерес к вероятностной интерпретации индексов влияния. Впервые вероятностный
подход был применен в работе Оуэна (Owen 1972), где было предложено вероятностное
обобщение для значения Шепли в кооперативных играх. Основываясь на подходе Оуэна,
Штраффин разработал вероятностную интерпретацию для индекса Банцафа и индекса
Шепли-Шубика (Straffin 1977). Наиболее общая вероятностная модель индексов влияния
предложена Ларуелль и Валенсиано (Laruelle & Valenciano 2005). Каниовский, на основе
интерпретации Штраффина, предложил вероятностный подход к оценке влияния, позволяющий учитывать корреляцию между голосами игроков при подсчете индекса Банцафа
(Kaniovskiy 2006).
Основной задачей настоящей работы является изучение общих свойств индексов влияния,
имеющих вероятностное описание в рамках модели Laruelle & Valenciano в задаче голосования с квотой. В качестве основного свойства индекса влияния выбрана аксиома аддитивности. Найдены необходимые и достаточные условия вероятностного представления
общего индекса влияния при выполнении аксиом диктатора, аддитивности и анонимности.
2. Основные определения
Основной характеристикой участника голосования выступает его вес  в голосовании,
под которым обычно понимается принадлежащее ему число голосов (например, число голосов фракции в парламенте или число акций у акционера). В работе рассматриваются
только голосования за принятие того или иного решения, в которых каждый участник может проголосовать только «за» – за принятие решения, или «против» – против принятия
решения. Решение считается принятым, если общий вес проголосовавших «за» превышает
определенную квоту q (  i  q ). Два наиболее распространенных значения q : 50% –
простое большинство и 66% (иногда – 75%) – квалифицированное большинство (Алескеров & Хабина & Шварц 2006).
В определении индекса влияния используются следующие понятия:

Ситуация голосования – набор весов игроков и квоты с зафиксированными значениями  1 , 2 , ..., n ; q  . Таким образом, две ситуации отличаются друг от друга
только весами игроков и квотой (Алескеров 2007).

Коалиция – это множество игроков, которые голосуют одинаково, то есть все «за»
или все – «против».

Выигрывающая коалиция – это коалиция, общий вес которой превышает квоту
q.

Проигрывающая коалиция – это коалиция, общий вес которой не превышает
квоты q .

Ключевой игрок в коалиции – это член коалиции, вместе с которым коалиция является выигрывающей, а без него становится проигрывающей.

Значимая коалиция для игрока – это коалиция, в которой данный игрок является
ключевым.
Будем обозначать через  (S ) общий вес коалиции S :  ( S) 
v
iS
i
.
Два наиболее известных и распространенных индекса влияния – это индекс Банцафа и индекс Шепли-Шубика. Для любого игрока можно определить набор коалиций, в которых
он является ключевым. Индекс Банцафа для игрока i определяется формулой:
i 
bi
,
n
b
j 1
j
где bi – это число различных коалиций, в которых игрок i является ключевым, а n – общее число игроков. Индекс Шепли-Шубика для игрока i определяется формулой:
i  
S
( s  1)!(n  s)!
,
n!
где суммирование производится по всем коалициям S , в которых игрок i является ключевым, а s  S – число игроков, входящих в коалицию S .
3. Общие аксиомы и теорема о представлении
В настоящей работе используются следующие основные аксиомы описания общих индексов влияния в задаче голосования с квотой (Бацын & Калягин 2009).
Аксиома диктатора: Диктатор всегда имеет влияние в голосовании, то есть его влияние
всегда ненулевое,   0 .
Аксиома аддитивности: Если в ситуации 1 игрок A – ключевой в некотором множестве
коалиций W 1 , в ситуации 2 A – ключевой в множестве коалиций W 2 , а в ситуации 3 A –
2
ключевой в множестве коалиций W 3  W 1  W 2 , и множества коалиций W 1 и W 2 не пересекаются, то влияние A в ситуации 3 равно сумме его влияний в первых двух ситуациях,
т.е.  3 ( A)  1 ( A)   2 ( A) .
Аксиома анонимности: Если две ситуации 1 и 2 отличаются друг от друга, только тем, что
веса двух игроков А и В поменялись местами:  A2   1B ,  B2   1A , то и индексы влияния
этих игроков поменяются местами  2 ( A)  1 ( B),  2 ( B)  1 ( A) .
Можно показать (Бацын & Калягин 2009), что в задаче голосования с квотой при выполнении аксиом диктатора и аддитивности индекс влияния игрока A, ключевого в коалициях
S1 , S 2 , ...., S k , не зависит от ситуации, а зависит только от набора значимых коалиций и ра-
вен сумме
C A (S1 )  C A (S 2 )  ...  C A (S k ) ,
где C A (S )  0 – это функция, определяющая вклад коалиции S в индекс влияния ее ключевого игрока А (при этом вклад коалиции не зависит от ситуации). При условии анонимности функция вклада коалиции C A (S ) определяется только числом игроков s в коалиции C A (S )  C(s) и не зависит не только от ситуации, но и от самого игрока А, и от набора
игроков в коалиции S . В этом случае справедлива следующая теорема о представлении
(Бацын & Калягин 2009).
Теорема: В задаче голосования с квотой индекс влияния игрока А может быть представлен в виде ( A)   C ( s) , C ( s )  0 (суммирование выполняется по всем значимым для А
S
коалициям S ) тогда и только тогда, когда выполнены аксиомы диктатора, аддитивности и
анонимности.
Далее мы исследуем, при каких условиях на вклады значимых коалиций общий индекс
влияния имеет вероятностное представление.
3. Вероятностная модель индексов влияния
Согласно вероятностной модели Ларуелль и Валенсиано (Laruelle & Valenciano 2005) индекс влияния игрока – это вероятность для этого игрока оказать решающее влияние на исход голосования (если он проголосует «за», то и исход всего голосования будет «за», а если проголосует «против», то и исход будет «против») при заданном совместном распределении вероятностей проголосовать «за»/«против» для всех игроков. Поскольку голос игрока – это дискретная случайная величина, имеющая 2 возможных значения: 1 («за») и 0
(«против»), то совместное распределение таких величин представляет собой набор вероятностей всех возможных исходов голосования: 00…00, 00…01, …, 11…11. Все индексы
влияния отличаются друг от друга только этим совместным распределением:
3
p00... 00 , p00... 01 , ..., p11... 11 . Например, индексы Банцафа и Шепли-Шубика имеют соответственно следующие распределения в этой модели:
pi1 ,i2 ,..., in 
1
и pi1 ,i2 ,..., in 
2n
1
n
(n  1) 
k 
n
, где k   il .
l 1
Ниже доказаны следующие свойства вероятностных индексов влияния:
1. Для вероятностных индексов влияния выполняются аксиомы аддитивности и диктатора.
2. Выполнение аксиомы анонимности для вероятностного индекса влияния равносильно
тому, что вероятности исходов голосования не зависят от конкретного распределения голосов «за» и «против», а только от их количества.
3. Произвольный индекс влияния, для которого выполнены аксиомы аддитивности, диктатора и анонимности, будет иметь вероятностное представление тогда и только тогда, когда его функция вклада коалиции удовлетворяет определенной системе неравенств.
3.1. Вспомогательные леммы
Следующие леммы необходимы для доказательства теоремы о вероятностном представлении (подробные доказательства см. Бацын & Калягин 2009).
Лемма 1: Пусть игрок А – ключевой в коалициях 1A , ...,  mA , и пусть веса игроков А и В
поменяли местами:  A '   B ,  B '   A . Тогда после замены весов В будет ключевым только
в коалициях:  '1B , ...,  ' mB , где:
 A ,
если В   iA
 'iB   i A
 i \ A  B, если В   iA
Например, если А был ключевым в коалициях АВЕ и АС, то после замены весов В будет
ключевым в коалициях АВЕ и ВС.
Лемма 2: Пусть игрок А – ключевой в m коалициях, и число участников каждой из этих
коалиций равно s1 , ..., s m , а игрок В – ключевой в k коалициях с числом участников
t1 , ..., t k . Пусть веса игроков А и В поменяли местами:  A '   B ,  B '   A . Тогда после заме-
ны весов В будет ключевым в m коалициях с размерами s1 , ..., s m , а А будет ключевым в k
коалициях с размерами t1 , ..., t k .
3.2. Аксиома анонимности для вероятностных индексов влияния
Теорема: Для индексов влияния, имеющих описание в рамках вероятностной модели, аксиома анонимности игроков равносильна тому, что вероятности исходов голосования не
зависят от конкретного распределения голосов «за» и «против», а только от их количества:
4
n
n
i  i '  s
i1 , i2 ,..., in ; i1 ' , i2 ' ,..., in '
l 1
l
l 1
l
 pi1 , i2 , ..., in  pi1 ', i2 ', ..., in '  p s ,
где i k – это голос игрока k : ik  1 , если он проголосовал «за» и ik  0 , если – «против».
То есть вероятность любого исхода голосования не зависит от распределения i1 , i2 ,..., in
голосов «за» и «против», а только от числа s голосов «за».
Назовем это свойство однородностью совместного распределения. Заметим также, что
такой индекс влияния может быть вычислен по формуле:
( A)    p( S )  p( S \ { A})    p s  p s 1  ,
S
S
где S – каждая значимая для игрока А коалиция, s  S – число участников этой коалиции, p( S )  p s – вероятность образования этой коалиции из s игроков, а P( S \ { A})  p s 1
– вероятность образования этой же коалиции только без игрока А (из s  1 игрока).
Доказательство: Аксиома анонимности формулируется в следующем виде: если веса двух
игроков А и В поменять местами:  A '   B ,  B '   A , то и индексы влияния этих игроков
поменяются местами: ' ( A)  ( B), ' (B)  ( A) . Докажем сначала необходимость: то,
что из этой аксиомы следует независимость вероятностей исходов голосования от распределения голосов. А затем – достаточность: то, что из независимости вероятностей следует
анонимность.
Необходимость: Рассмотрим случай, когда игроки i и j – ключевые только в одной коалиции S . Тогда в соответствии с вероятностной моделью их индексы влияния равны:
(i)  p(S )  p(S \ {i})  p*1*1*  p*0*1* , ( j )  p(S )  p(S \ { j})  p*1*1*  p*1*0*
i j
i j
i j
i j
Из леммы 1 следует, что после замены весов игроки i и j так и останутся ключевыми
только в коалиции S . А значит, по свойству равенства влияний их индексы влияния не
изменятся:
' (i)  (i), ' ( j )  ( j ) .
Тогда,
из
свойства
анонимности
следует
 (i )   ( j ) . Следовательно, следующие вероятности равны:
p*0*1*  p*1*0*
i j
(1)
i j
Так как в качестве S можно взять любую коалицию, а в качестве i и j – любых ее участников, то равенство (1) означает, что в любом исходе голосования можно поменять любые
1 и 0 местами и от этого его вероятность не изменится. Следовательно, любые 2 исхода
i1 , i2 ,..., in и i1 ' , i2 ' ,..., in ' с одинаковым числом s единиц (голосов «за») имеют одинаковую
вероятность p s , потому что один можно получить из другого, переставляя единицы.
5
Достаточность: Докажем, что из справедливости:
i1 , i2 ,..., in ; i1 ' , i2 ' ,..., in '
n
n
i  i '  s
l 1
l
l
l 1
 pi1 , i2 , ..., in  pi1 ', i2 ',..., in '  ps
следует, что если веса двух игроков А и В поменять местами:  A '   B ,  B '   A , то и индексы влияния этих игроков поменяются местами: ' ( A)  ( B), ' ( B)  ( A) . Пусть
размеры коалиций, в которых А был ключевым до замены весов, равны s1 , ..., s m , а в которых В был ключевым – t1 , ..., t k . Тогда их индексы влияния были:







( A)  ps1  ps1 1  ...  psm  psm 1 , ( B)  pt1  pt1 1  ...  ptk  ptk 1

По лемме 2 после замены весов А стал ключевым в коалициях с размерами t1 , ..., t k , а В – в
коалициях с размерами s1 , ..., s m . То есть их индексы влияния стали:







' ( A)  pt1  pt1 1  ...  ptk  ptk 1 , ' ( B)  ps1  ps1 1  ...  psm  psm 1
Таким образом, индексы влияния игроков поменялись местами:

 ' ( A)   ( B ) ,
 ' ( B )   ( A) . Что и требовалось доказать.
3.3. Теорема о вероятностном представлении
Индекс влияния, имеющий вероятностное описание с однородным совместным распределением, может быть представлен в виде:
( A)    p s  p s 1  ,
(2)
S
где  ( A) – индекс влияния игрока А, суммирование выполняется по всем значимым для
А коалициям S , s  S – число участников коалиции S , p s – вероятность образования
этой коалиции из s игроков, а p s 1 – вероятность образования этой же коалиции только
без игрока А (из s  1 игроков).
Теорема: индекс влияния имеет вероятностное описание с однородным совместным распределением (может быть представлен в виде (2)) тогда и только тогда, когда выполнены:
аксиома диктатора, аксиома аддитивности, аксиома анонимности и следующая система
неравенств на функцию вклада коалиции C (s ) :
C ( s)   s 1
C ( s)    

s 1
s 3
s  3, n 
,
...

C ( s)   s 1   s 3  ...   2
где  s  C ( s)  C ( s  1)
(3)
6
(Эти неравенства приведены для нечетного s , для четного s – последнее неравенство будет заканчиваться на 1 вместо  2 .)
Доказательство: Сначала докажем необходимость: то, что из представления индекса в виде (2) следует выполнение аксиом диктатора, аддитивности, анонимности, неравенств (3).
Необходимость: Диктатор является ключевым игроком во всех возможных коалициях,
включающих его. Число различных коалиций из s игроков, включающих диктатора равно
 n  1

 , поэтому его индекс влияния равен:
 s  1
n
 n  1
   p s  p s 1  .
( A)   
s 1  s  1 
Сумма вероятностей всех возможных исходов равна 1. Поэтому вероятность хотя бы одного исхода положительна:
n
 n  1
   p s  p s 1   0 .
s p s  0  ( A)   
s 1  s  1 
Доказательство справедливости аксиомы аддитивности несложно и полностью аналогично соответствующему доказательству, приведенному в общей теореме о представлении
(Бацын & Калягин 2009). То, что из представления в виде (2) следует справедливость аксиомы анонимности, доказано в предыдущей теореме. Таким образом, все три аксиомы
выполняются. В общей теореме о представлении показано, что их выполнение равносильно представлению индекса влияния в виде:
( A)   C ( s) ,
(4)
S
где суммирование выполняется по всем значимым для игрока А коалициям S . Получили,
что один и тот же индекс влияния может быть представлен и виде (2), и в виде (4). Приравнивая эти выражения с учетом коэффициента k , появляющегося из-за того, что для
индексов влияния не важны их абсолютные значения, а лишь отношения между этими
значениями, имеем:
p
s
 p s 1   k   C ( s) .
S
S
Так как игрок А может оказаться ключевым в различных наборах коалиций, то это равенство должно выполнятся для любых множеств коалиций S , в том числе и когда суммирование производится только по некоторой одной коалиции S . Поэтому для любой коалиции S должно выполняться равенство:
p s  p s 1  k  C ( s) .
7
Поскольку все элементы этого равенства зависят только от размера коалиции – s , а для n
участников голосования коалиции могут включать от 1 до n игроков, то получается следующая система уравнений:
 p0  p1  k  C (1)
 p  p  k  C (2)
 1
2

...
 p n 1  p n  k  C (n)
(5)
Так как p s – это вероятность образования любой коалиции из s игроков, число различn
ных коалиций размером s равно   , и сумма вероятностей всех возможных исходов гоs
лосования равна 1, то должно выполняться равенство:
n
 n
n
  p0    p1  ...    p n  1
0
1
n
Всего получается n  1 уравнение на неизвестные p0 ,..., p n . Запишем эту систему в виде
матрицы:
1

0
0

 ...
0

 n
  
 0
1
1
0
0
1
1
0 ...
0 ...
1 ...
0
0
0
0
0
0
0
0
0 ...
1
1
n
 
1
n
 
 2
n
 n 
  ... 

 3
 n  1
n
 
n
k  C (1) 

k  C (2) 
k  C (3) 


k  C (n) 

1


Вычтем 1-ю, 2-ю, …, n-ю строки из последней строки, так чтобы в первых n столбцах последней строки получились нули. В результате в последней строке получим:
n
n 1 
i
 n
 n 
 
pn   (1) ni    1  k    C (i  1)   (1) j 
i
i

j
i 0
i

0
j

0
 



Используя бином Ньютона, получаем, что сумма в левой части равна нулю:
n
 (1)
n i
i 0
n n  n i
     (1) (1) n i  1  1n  0
 i  i 0  i 
В результате значение коэффициента k равно:
k
1
i

 n 

 
C
(
i

1
)

(1) j 



i 0 
j 0
i  j 
n 1
Решение системы имеет вид:
8

p  t
 0
 p1  k  C (1)  t

 p 2  k  C (2)  k  C (1)  t
...

n 1

p

k

(1) i  C (n  i )  (1) i  t

 n
i 0



Так как требование, чтобы сумма вероятностей равнялась 1, уже выполнено, то для того
чтобы существовали такие вероятности p0 ,..., p n , необходимо и достаточно, чтобы выражения в правых частях были неотрицательны:
t  0
t  k  C (1)  C (2) 

t  k  C (1)  C (2)  C (3)  C (4) 
...

t  k  C (1)  C (2)  C (3)  C (4)  ...  C (n  2)  C (n  1) 
t  k  C (1)
t  k  C (1)  C (2)  C (3) 

t  k  C (1)  C (2)  C (3)  C (4)  C (5) 
...

t  k  C (1)  C (2)  C (3)  C (4)  ...  C (n  2)  C (n  1)  C (n) 
Здесь представлена система неравенств для случая нечетного n . Для четного n рассуждения аналогичны. Для того чтобы эта система неравенств была совместна, необходимо и
достаточно, чтобы каждое выражение в правой части неравенств из нижней группы было
не меньше, чем каждое выражение в правой части неравенств из верхней группы. Такое
условие приводит к следующим неравенствам на
C (s ) .
Введем обозначение:
( s)  C ( s )  C ( s  1) . Для любого s  3, n должно быть выполнено:
C ( s)   s 1
C ( s)    

s 1
s 3

...
C ( s)   s 1   s 3  ...   2
Эти неравенства приведены для нечетного s , для четного – последнее неравенство будет
заканчиваться на 1 вместо  2 . Таким образом, получена система неравенств (3) и необходимость доказана. Система уравнений (5) имеет решения тогда и только тогда, когда
выполнены эти неравенства.
Достаточность: Из аксиом диктатора, аддитивности и анонимности следует, что индекс
влияния может быть представлен в виде (4). Докажем, что при условии выполнения нера9
венств (3) индекс влияния имеет вероятностное описание, то есть может быть представлен
в виде (2). Чтобы индекс влияния, имеющий вид (4), можно было представить в виде (2),
необходимо и достаточно, чтобы система уравнений (5) имела решения. Выше было показано, что эта система имеет решения, если выполнены неравенства (3). Таким образом,
достаточность доказана.
Заметим, что неравенства (3) выполняются для широкого набора функций вклада коалиции C (s ) . Например, они выполняются для любой монотонной функции.
5. Примеры индексов влияния, имеющих вероятностное представление
Рассмотрим два примера монотонных функций вклада коалиций: C ( s )  s и C ( s ) 
1
.
s
При функции C ( s )  s вклад коалиции в индексы влияния ее ключевых игроков прямо
пропорционален размеру коалиции. Чем больше коалиции, в которых игрок является ключевым, тем больше его влияние. Такой выбор функции C (s ) можно объяснить: для того
чтобы быть ключевым игроком в большой коалиции, нужно обладать большим влиянием.
При функции C ( s ) 
1
вклад коалиции в индексы влияния ее ключевых игроков обратно
s
пропорционален размеру этой коалиции. Чем меньше коалиции, которые игрок делает
выигрывающими, тем больше его влияние. Такой выбор функции C (s ) также может быть
оправдан: для того чтобы сделать маленькую коалицию выигрывающей, нужно обладать
большим влиянием.
Чтобы найти вероятностное распределение, соответствующее индексу влияния, заданному
функцией C (s ) , необходимо решить систему линейных уравнений. Например, для
C ( s )  s в случае 4 игроков получается следующая система уравнений:
 p 0  p1  k
 p  p  2k
2
 1
 p 2  p3  3k
 p  p  4k
4
 3
 p 0  4 p1  6 p 2  4 p3  p 4  1
Решив эту систему, получаем распределение вероятностей для нашего индекса влияния:
10
p 0000  p 0 
1
40
p 0001  p 0010  p 0100  p1000  p1 
1
40
p 0011  p 0101  p 0110  p1001  p1010  p1100  p 2 
p1110  p1101  p1011  p0111  p3 
p1111  p 4 
3
40
3
40
5
40
Из этого распределения видно, что более вероятны те исходы голосования, в которых
больше голосов «за». Аналогично можно получить вероятностное распределение для
функции C ( s ) 
1
в случае 4 игроков:
s
p 0000  p 0 
17
90
p 0001  p 0010  p 0100  p1000  p1 
7
90
p 0011  p 0101  p 0110  p1001  p1010  p1100  p 2 
p1110  p1101  p1011  p0111  p3 
p1111  p 4 
5
90
3
90
3
90
Здесь уже более вероятными являются исходы с большим числом голосов «против».
Отметим, что вероятностное описание имеют индексы влияния и с немонотонными функциями вклада коалиций. В частности при выполнении следующего условия симметрии:
C (n  s)  C ( s ) .
Имеются и другие классы функций вклада коалиций, обеспечивающие вероятностное
представление индексов влияния.
11
Список литературы
1. Алескеров Ф.Т., Хабина Э.Л., Шварц Д.А. Бинарные отношения, графы и коллективные решения. Москва. Издательский дом ГУ ВШЭ. 2006. 298 С.
2. Алескеров Ф.Т. Индексы влияния, учитывающие предпочтения участников по созданию коалиций //Доклады Академии Наук, 2007, т.414, №5, с.594-597
3. Бацын М.В., Калягин В.А. Об аксиоматическом определении общих индексов влияния
в задаче голосования с квотой// WP7/2009, Москва, ГУ ВШЭ, 2009.
4. Оуэн Г. Теория игр. Москва. Издательство «Мир». 1971. 228 С.
5. Banzhaf J. F. Weighted Voting Doesn' t Work: А Mathematical Analysis// Rutgers Law Review 19, p.317-343, 1965.
6. Dubey P. On the Uniqueness of the Shapley Value// International Journal of Game Theory 4,
p.131-139, 1975.
7. Dubey P., Shapley L.S. Mathematical Properties of the Banzhaf Power Index// Mathematics
of Operation Research 4, p.99-131, 1979.
8. Kaniovskiy S. The exact bias of the Banzhaf measure of power when votes are not equiprobable and independent// Austrian Institute of Economic Research, 2006.
9. Laruelle A., Valenciano F. Assessing success and decisiveness in voting situations// Social
Choice and Welfare 24, p.171-197, 2005.
10. Laruelle A., Valenciano F. Shapley-Shubik and Banzhaf Indicies Revisited// Mathematics of
Operation Research 26, p.89-104, 2000.
11. Owen G. Multilinear Extensions of Games// Management Science 18, p.64-79, 1972.
12. Shapley, L.S., Shubik M. A method for Evaluting the Distribution of Power in a Committee
System// American Political Science Review 48, p.787-792, 1954.
13. Straffin P. Homogeneity, independence, and power indices// Public Choice 30, p.107-118,
1977.
12
Download