АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ УТВЕРЖДАЮ Декан АВТФ

advertisement
Федеральное агентство по образованию
ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ
УНИВЕРСИТЕТ
УТВЕРЖДАЮ
Декан АВТФ
________________ Гайворонский С.А.
« _____ » _______________ 2009 г.
АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ
методические указания по курсу
«Теория риска и моделирование рисковых ситуаций»
для студентов специальности 080116«Математические методы в экономике»
ТОМСК 2008
УДК 519.2
АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ
Mетодические указания по курсу методические указания по курсу
«Теория риска и моделирование рисковых ситуаций»
для студентов специальности 080116«Математические методы в экономике»
- Томск: Изд. ТПУ, 2008. - 8 с.
Составители:
Кочегуров А.И.
Рецензент:
Бабушкин Ю.В.
Методические указания обсуждены на заседании кафедры прикладной
математики 06.04.2008 г.
Зав. кафедрой
В.П.Григорьев
1. Понятие функции полезности и её применение в задачах принятия
решения (ЗПР).
Полезность – некоторое число, приписываемое лицом, принимающим
решение, каждому возможному исходу. Функция полезности НейманаМоргенштерна для лица, принимающего решение, (ЛПР) показывает
полезность, которую он приписывает каждому возможному исходу. У
каждого ЛПР своя функция полезности, которая показывает его
предпочтение тем или иным исходам в зависимости от его отношения к
риску.
Понятие функции полезности возникло в теории потребительского
спроса при сравнении различных наборов товаров. Полезность потребления
продукта, например, для потребителя может быть выражена в виде функции,
отражающей полезность в зависимости от количества потребления этого
продукта. В определённых пределах полезность может увеличиваться,
уменьшаться или оставаться без изменения при увеличении потребления
продукта. Функция полезности может быть построена и для определенного
набора продуктов. При этом, в зависимости от того, являются ли продукты
взаимозаменяемыми или нет, интегральная функция полезности набора
потребляемых продуктов определяется с учётом взаимного их влияния на
общую их полезность потребления.
В ЗПР значение функции полезности выражает предпочтения,
полезность альтернатив. Она может быть оценена на множестве альтернатив
и на множестве критериев, при этом критерии могут быть взаимно
независимыми и зависимыми.
1.1.
Формализация задач принятия решений.
Принятие решений – действие над множеством альтернатив, в
результате которого получается множество выбранных альтернатив.
Сделаем формальное описание задачи:
Пусть: z = { z1 ,…, z q } – множество целей системы управления.
x = { x1 ,…, x m } – множество альтернатив.
Y- множество исходов альтернатив.
e = { e1 ,…, en } – множество возможных состояний (ситуаций).
Исход y  Y может быть представлен в виде трёх аргументов:
y ijl  F ( xi , e j , z l ) , где i  1, m , j  1, n , l  1, q . Матрицу Y  y ijl называют
матрицей исходов, оценочным функционалом, функцией предпочтения.
Необходимо построить модель исходов альтернативных решений в
соответствии с предпочтением ЛПР.
Для обеспечения комплексной оценки решений необходимо
сформулировать для полного множества целей систему показателей
(критериев), характеризующую степень их достижения. Множеству целей Z
сопоставим множество критериев К. В частном случае каждой цели z l  Z
может быть сопоставлен один критерий k j  K . Для построения модели
оценки решений необходимо:
1) получить оценку предпочтительности решений по каждому критерию
для каждой ситуации;
2) получить комплексную оценку решений по совокупности критериев
для каждой ситуации;
3) получить интегральную оценку решений с учётом возможных
ситуаций.
Модель оценки решений в частных постановках может быть записана в
виде функциональной зависимости от параметров, характеризующих
внешнюю среду и локальных критериев. Как правило, модель оценки
решений носит более сложный характер причинно-следственных связей и не
описывается простыми формальными состояниями.
Выбор лучшего решения в транспортной задаче связан с определением
экстремума функции. И только для задач векторной оптимизации требуется
вмешательство ЛПР, для определения приоритетов нескольких критериев. Во
всех этих случаях рассматривались задачи принятия решений, в которых
выбор решения производили в
условиях определённости, с учётом
конкретной ситуации, определённые состоянием внешней среды.
В реальной практике нередко приходится иметь дело с более сложной
обстановкой, когда выбор альтернативы под влиянием внешней среды,
неподдающейся точному прогнозу и имеющей случайный характер,
приводит к одному из нескольких возможных исходов, и для осуществления
выбора наилучшего решения необходимо оценивать альтернативы в
зависимости от возможных ситуаций (ситуаций внешней среды) и целевых
установок. Такая комплексная оценка решения не может быть произведена
без участия ЛПР, без учёта системы его взглядов (системы предпочтений) на
ценность альтернатив.
1.2.
Аксиоматический подход к построению функции полезности.
Аксиоматический подход к ЗПР базируется на поверке ряда аксиом для
построения функции полезности альтернатив. Аксиомы делятся на две
группы:
1) аксиомы существования функции полезности;
2) аксиомы независимости критериев.
Аксиомы существования функции полезности формализованы на
множестве альтернатив и множестве критериев. В случае независимости
альтернатив xi  X , где i  1, m , и существования линейного порядка их
предпочтения x1  x2 ... xm (> - знак отношения строгого предпочтения)
показано, что на этом множестве можно построить функцию полезности
такую, что U1 ( x1 )U 2 ( x2 )...U m ( xm ) . При наличии информации (количественной
или качественной) на множестве критериев k j  K , где
j  1, n ,
характеризующих альтернативы, показано, что для них могут быть
построены функции полезности, как по каждому критерию V j (k j ) , так и по
совокупности критериев.
Методология рационального принятия решений
в условиях
неопределённости, основанная на функции полезности индивида, опирается
на пять аксиом, которые отражают минимальный набор необходимых
условий
непротиворечивого и рационального поведения игрока. Для
компактного изложения аксиом потребуется следующее определение.
Предположим, что конструируется игра, в которой индивид с
вероятностью р получает денежную сумму х и с вероятностью (1-р) – сумму
z. Эту ситуацию будем обозначать G(x, z: p ).
Аксиома 1. Аксиома сравнимости (полноты).
Для всего множества S неопределённых альтернатив (возможных
исходов) индивид может сказать, что либо исход x предпочтительнее исхода
y ( x  y ), либо ( y  x ), либо индивид безразличен в отношении к выбору
между x и y ( x  y ). Запись x  y означает, что исход x предпочтительнее
исхода y либо индивид безразличен в отношении к выбору между x и y.
Аксиома 2. Аксиома транзитивности (состоятельности).
Если x  y и y  z , то x  z . Если x  y и y  z , то x  z .
Аксиома 3. Аксиома сильной независимости.
Предположим, что мы конструируем игру, в которой индивид с
вероятностью p получает денежную сумму x и с вероятностью (1-p) – сумму
z, т.е. G(x, z:p). Сильная независимость означает, что если индивид
безразличен в отношении к выбору между x и y, ( x  y ), то он также будет
безразличен в отношении к выбору между игрой (лотереей) G(x, z:p) и игрой
G(y ,z:p), т.е. из x  y следует G(x, z:p)  G(y, z:p).
Аксиома 4. аксиома измеримости.
Если x  y  z или x  y  z , то существует единственная вероятность p,
такая, что y  G(x, z:p).
Аксиома 5. Аксиома ранжирования.
Если альтернативы y и u находятся по предпочтительности между
альтернативами x и z и можно построить игры, такие, что к выбору между y и
G(x, z: p1 ), а также к выбору между u и G(x, z: p2 ), то при p1 > p1 y  u .
Если принять приведённые аксиомы и предположить, что люди
предпочитают большее количество некоторого блага меньшему, то всё это в
совокупности определяет рациональное поведение ЛПР.
При названных предпочтениях американскими учёными Дж. Нейманом
и О. Моргенштерном было показано, что ЛПР при принятии решения будет
стремиться к максимизации ожидаемой полезности. Другими словами, из
всех возможных решений он выберет то, которое обеспечивает наибольшую
ожидаемую полезность.
1.3.
Построение и структура функции полезности.
Вид аддитивной функции полезности:
n
U(x)=   jV j (k j ) , где
i 1
U(k) – функция полезности альтернативы на множестве критериев K,
0  U(k)  1;
V j ( k j ) - функция полезности альтернативы по критерию k j ,
0  V j (k j )  1, j  1, n ;
 j - вес j-го критерия,
n

j 1
j
 1 ,  j >0.
Дж. Нейман и О. Моргенштерн предложили процедуру построения
индивидуальной функции полезности, которая (процедура) заключается в
следующем: ЛПР отвечает на ряд вопросов, обнаруживая при этом свои
индивидуальные предпочтения, учитывающие его отношение к риску. В
общем случае график функции полезности может быть трёх типов:
 для ЛПР, не склонного к риску, - строго вогнутая функция, у которой
каждая дуга кривой лежит выше своей хорды;
 для ЛПР, безразличного к риску, - прямая лини;
 для ЛПР, склонного к риску, - строго вогнутая функция, у которой
каждая дуга кривой лежит ниже своей хорды.
2. Исследование функции полезности на моделях экономических систем.
Классификация задач принятия решений:
ЗПР
Одна цель
Одна ситуация
Несколько целей
Несколько ситуаций
Одна ситуация
Будем считать, что имеется несколько целей и одна ситуация.
Несколько ситуаций
2.1. Построение аддитивной функции полезности.
Перед выпускником учебного заведения стоит проблема выбора
оптимального места дальнейшей работы. Выбор определяется значением
критериев:
k1 - величина зарплаты;
k 2 - процент творческой работы;
k 3 - время, за которое можно добраться до работы.
Выпускник может производить выбор из пяти предполагаемых мест
работы со следующими оценками:
Предприятие
Критерии
k1
k2
k3
100
50
30
140
30
50
170
25
45
x4
130
15
10
x5
140
40
40
Построим функцию полезности по каждому критерию V j (k j ) , где
j  1,3 , 0  V j (k j )  1.
Введём обозначения: k *j - лучшее значение по критерию j ( k1* =170;
k 2* =50; k 3* =10), k 0j - худшее значение по критерию j ( k10 =100; k 20 =15; k 30 =50).
Для удобства работы с ЛПР все критерии представить с позиции их
максимизации или минимизации. Поэтому новое значение критерия k 3H
лучше представить как разность k 3Hi  k 3 max  k 3i , где k 3i - значение критерия 3
для i-ой альтернативы. k 3 max - максимальное значение критерия 3 ( k 3 max =50).
Тогда для третьего критерия будем иметь (50-30; 50-50; 50-45; 50-10; 50-40) =
40. k 30 = 0, т.е. 0  k 3  40.
0
V j (k j ) =0, V j (k *j ) = 1. Остальные три определяются опросом ЛПР. ЛПР
должно указать последовательно значения полезности соответственно будут
равны 0,5; 0,25; 0,75. Будем считать, что данная задача решена. Тогда для
определения коэффициентов  j предлагается следующий подход.
Пусть даны две альтернативы ( k10 , k 2* , k 3 ) и ( k1 - ?, k 20 , k 3 ), где k 0j и k *j худшее и лучшее значение критерия j, k 3 - значение третьего критерия (для
нас безразлично значение дополняющего критерия, т.к. все критерии
взаимозависимы). Спрашиваем у ЛПР: каково должно быть значение
критерия k1 у второй альтернативы, чтобы эти альтернативы были
эквивалентны, т.е. функции полезности у них были одинаковы. Для нашей
задачи сравниваем альтернативы (100, 50, k 3 ) и ( k1 - ?, 15, k 3 ). Выясняем у
ЛПР: какова должна быть зарплата, если процент творческой работы
составляет 15 %, а работа должна быть эквивалентна по степени
x1
x2
x3
удовлетворения в работе, зарплата которой – 100, но процент творческой
работы составляет 50 %. Если ЛПР называет допустим k1 = 155, то
U( k10 , k 2* , k 3 ) =U( k1 , k 20 , k 3 ).
1V1 (k10 )  2V2 (k 2* )  3V3 (k 3 )  1V1 (k1 )  2V2 (k 20 )  3V3 (k 3 )
1 (V1 (k1 )  V1 (k10 ))  (V2 (k 2* )  V2 (k 20 ))
2  1 (k1 )
По графику функции полезности V1 (k1 ) определяем для k1 = 155
V1 (155) = (155-150)(0,75-0,5)/(160-150) +0,5 = 0,625 =
1
2
Аналогично у ЛПР определяем эквивалентность альтернатив:
(100, k 2 , 40)  ( k1 - ?, k 2 ,0).
Пусть ЛПР выбирает k1 = 140. Тогда получаем:
1V1 (k1 )  2V2 (k 2 )  3V3 (k * 3 )  1V1 (k1 )  2V2 (k 2 )  3V3 (k 30 )
3  1V 1(k1 )  1V1 (140)
V1 (140) =(140-130)(0,5-0,25)/(150-130)+0,25 = 0,375
Получаем систему:
1  2  3  1
0,625 1  2  0
0,375 1  3  0
Решаем систему и получаем:
1  0,5; 2  0,3125; 3  0,1875.
Определяем значение функции полезности для всех альтернатив
U(100;
50;
20)=0,5*0+0,3125*1+(20-15)*0,5/(25x1 :
15)+0,25*0,1875=0,3828
x 2 : U(140,30,0)=0,3047
x3 : U(170,25,5)=0,6093
x 4 : U(130,15,40)=0,3125
x5 : U(140,40,10) =0,4139
Вывод: Наиболее благоприятное место работы – третье предприятие.
АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ
Методические указания по выполнению лабораторной работы
Составитель: доцент, к.т.н. Кочегуров Александр Иванович
Подписано к печати
Формат 60х84/16. Бумага писчая №2.
Плоская печать. Усл.печ.л. Уч.-изд.л.
Тираж 50 экз. Заказ
. Цена свободная.
ИПФ ТПУ. Лицензия ЛТ №1 от 18.07.94.
Типография ТПУ. 634034, Томск, пр.Ленина, 30.
Download