Федеральное агентство по образованию ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ УТВЕРЖДАЮ Декан АВТФ ________________ Гайворонский С.А. « _____ » _______________ 2009 г. АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ методические указания по курсу «Теория риска и моделирование рисковых ситуаций» для студентов специальности 080116«Математические методы в экономике» ТОМСК 2008 УДК 519.2 АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ Mетодические указания по курсу методические указания по курсу «Теория риска и моделирование рисковых ситуаций» для студентов специальности 080116«Математические методы в экономике» - Томск: Изд. ТПУ, 2008. - 8 с. Составители: Кочегуров А.И. Рецензент: Бабушкин Ю.В. Методические указания обсуждены на заседании кафедры прикладной математики 06.04.2008 г. Зав. кафедрой В.П.Григорьев 1. Понятие функции полезности и её применение в задачах принятия решения (ЗПР). Полезность – некоторое число, приписываемое лицом, принимающим решение, каждому возможному исходу. Функция полезности НейманаМоргенштерна для лица, принимающего решение, (ЛПР) показывает полезность, которую он приписывает каждому возможному исходу. У каждого ЛПР своя функция полезности, которая показывает его предпочтение тем или иным исходам в зависимости от его отношения к риску. Понятие функции полезности возникло в теории потребительского спроса при сравнении различных наборов товаров. Полезность потребления продукта, например, для потребителя может быть выражена в виде функции, отражающей полезность в зависимости от количества потребления этого продукта. В определённых пределах полезность может увеличиваться, уменьшаться или оставаться без изменения при увеличении потребления продукта. Функция полезности может быть построена и для определенного набора продуктов. При этом, в зависимости от того, являются ли продукты взаимозаменяемыми или нет, интегральная функция полезности набора потребляемых продуктов определяется с учётом взаимного их влияния на общую их полезность потребления. В ЗПР значение функции полезности выражает предпочтения, полезность альтернатив. Она может быть оценена на множестве альтернатив и на множестве критериев, при этом критерии могут быть взаимно независимыми и зависимыми. 1.1. Формализация задач принятия решений. Принятие решений – действие над множеством альтернатив, в результате которого получается множество выбранных альтернатив. Сделаем формальное описание задачи: Пусть: z = { z1 ,…, z q } – множество целей системы управления. x = { x1 ,…, x m } – множество альтернатив. Y- множество исходов альтернатив. e = { e1 ,…, en } – множество возможных состояний (ситуаций). Исход y Y может быть представлен в виде трёх аргументов: y ijl F ( xi , e j , z l ) , где i 1, m , j 1, n , l 1, q . Матрицу Y y ijl называют матрицей исходов, оценочным функционалом, функцией предпочтения. Необходимо построить модель исходов альтернативных решений в соответствии с предпочтением ЛПР. Для обеспечения комплексной оценки решений необходимо сформулировать для полного множества целей систему показателей (критериев), характеризующую степень их достижения. Множеству целей Z сопоставим множество критериев К. В частном случае каждой цели z l Z может быть сопоставлен один критерий k j K . Для построения модели оценки решений необходимо: 1) получить оценку предпочтительности решений по каждому критерию для каждой ситуации; 2) получить комплексную оценку решений по совокупности критериев для каждой ситуации; 3) получить интегральную оценку решений с учётом возможных ситуаций. Модель оценки решений в частных постановках может быть записана в виде функциональной зависимости от параметров, характеризующих внешнюю среду и локальных критериев. Как правило, модель оценки решений носит более сложный характер причинно-следственных связей и не описывается простыми формальными состояниями. Выбор лучшего решения в транспортной задаче связан с определением экстремума функции. И только для задач векторной оптимизации требуется вмешательство ЛПР, для определения приоритетов нескольких критериев. Во всех этих случаях рассматривались задачи принятия решений, в которых выбор решения производили в условиях определённости, с учётом конкретной ситуации, определённые состоянием внешней среды. В реальной практике нередко приходится иметь дело с более сложной обстановкой, когда выбор альтернативы под влиянием внешней среды, неподдающейся точному прогнозу и имеющей случайный характер, приводит к одному из нескольких возможных исходов, и для осуществления выбора наилучшего решения необходимо оценивать альтернативы в зависимости от возможных ситуаций (ситуаций внешней среды) и целевых установок. Такая комплексная оценка решения не может быть произведена без участия ЛПР, без учёта системы его взглядов (системы предпочтений) на ценность альтернатив. 1.2. Аксиоматический подход к построению функции полезности. Аксиоматический подход к ЗПР базируется на поверке ряда аксиом для построения функции полезности альтернатив. Аксиомы делятся на две группы: 1) аксиомы существования функции полезности; 2) аксиомы независимости критериев. Аксиомы существования функции полезности формализованы на множестве альтернатив и множестве критериев. В случае независимости альтернатив xi X , где i 1, m , и существования линейного порядка их предпочтения x1 x2 ... xm (> - знак отношения строгого предпочтения) показано, что на этом множестве можно построить функцию полезности такую, что U1 ( x1 )U 2 ( x2 )...U m ( xm ) . При наличии информации (количественной или качественной) на множестве критериев k j K , где j 1, n , характеризующих альтернативы, показано, что для них могут быть построены функции полезности, как по каждому критерию V j (k j ) , так и по совокупности критериев. Методология рационального принятия решений в условиях неопределённости, основанная на функции полезности индивида, опирается на пять аксиом, которые отражают минимальный набор необходимых условий непротиворечивого и рационального поведения игрока. Для компактного изложения аксиом потребуется следующее определение. Предположим, что конструируется игра, в которой индивид с вероятностью р получает денежную сумму х и с вероятностью (1-р) – сумму z. Эту ситуацию будем обозначать G(x, z: p ). Аксиома 1. Аксиома сравнимости (полноты). Для всего множества S неопределённых альтернатив (возможных исходов) индивид может сказать, что либо исход x предпочтительнее исхода y ( x y ), либо ( y x ), либо индивид безразличен в отношении к выбору между x и y ( x y ). Запись x y означает, что исход x предпочтительнее исхода y либо индивид безразличен в отношении к выбору между x и y. Аксиома 2. Аксиома транзитивности (состоятельности). Если x y и y z , то x z . Если x y и y z , то x z . Аксиома 3. Аксиома сильной независимости. Предположим, что мы конструируем игру, в которой индивид с вероятностью p получает денежную сумму x и с вероятностью (1-p) – сумму z, т.е. G(x, z:p). Сильная независимость означает, что если индивид безразличен в отношении к выбору между x и y, ( x y ), то он также будет безразличен в отношении к выбору между игрой (лотереей) G(x, z:p) и игрой G(y ,z:p), т.е. из x y следует G(x, z:p) G(y, z:p). Аксиома 4. аксиома измеримости. Если x y z или x y z , то существует единственная вероятность p, такая, что y G(x, z:p). Аксиома 5. Аксиома ранжирования. Если альтернативы y и u находятся по предпочтительности между альтернативами x и z и можно построить игры, такие, что к выбору между y и G(x, z: p1 ), а также к выбору между u и G(x, z: p2 ), то при p1 > p1 y u . Если принять приведённые аксиомы и предположить, что люди предпочитают большее количество некоторого блага меньшему, то всё это в совокупности определяет рациональное поведение ЛПР. При названных предпочтениях американскими учёными Дж. Нейманом и О. Моргенштерном было показано, что ЛПР при принятии решения будет стремиться к максимизации ожидаемой полезности. Другими словами, из всех возможных решений он выберет то, которое обеспечивает наибольшую ожидаемую полезность. 1.3. Построение и структура функции полезности. Вид аддитивной функции полезности: n U(x)= jV j (k j ) , где i 1 U(k) – функция полезности альтернативы на множестве критериев K, 0 U(k) 1; V j ( k j ) - функция полезности альтернативы по критерию k j , 0 V j (k j ) 1, j 1, n ; j - вес j-го критерия, n j 1 j 1 , j >0. Дж. Нейман и О. Моргенштерн предложили процедуру построения индивидуальной функции полезности, которая (процедура) заключается в следующем: ЛПР отвечает на ряд вопросов, обнаруживая при этом свои индивидуальные предпочтения, учитывающие его отношение к риску. В общем случае график функции полезности может быть трёх типов: для ЛПР, не склонного к риску, - строго вогнутая функция, у которой каждая дуга кривой лежит выше своей хорды; для ЛПР, безразличного к риску, - прямая лини; для ЛПР, склонного к риску, - строго вогнутая функция, у которой каждая дуга кривой лежит ниже своей хорды. 2. Исследование функции полезности на моделях экономических систем. Классификация задач принятия решений: ЗПР Одна цель Одна ситуация Несколько целей Несколько ситуаций Одна ситуация Будем считать, что имеется несколько целей и одна ситуация. Несколько ситуаций 2.1. Построение аддитивной функции полезности. Перед выпускником учебного заведения стоит проблема выбора оптимального места дальнейшей работы. Выбор определяется значением критериев: k1 - величина зарплаты; k 2 - процент творческой работы; k 3 - время, за которое можно добраться до работы. Выпускник может производить выбор из пяти предполагаемых мест работы со следующими оценками: Предприятие Критерии k1 k2 k3 100 50 30 140 30 50 170 25 45 x4 130 15 10 x5 140 40 40 Построим функцию полезности по каждому критерию V j (k j ) , где j 1,3 , 0 V j (k j ) 1. Введём обозначения: k *j - лучшее значение по критерию j ( k1* =170; k 2* =50; k 3* =10), k 0j - худшее значение по критерию j ( k10 =100; k 20 =15; k 30 =50). Для удобства работы с ЛПР все критерии представить с позиции их максимизации или минимизации. Поэтому новое значение критерия k 3H лучше представить как разность k 3Hi k 3 max k 3i , где k 3i - значение критерия 3 для i-ой альтернативы. k 3 max - максимальное значение критерия 3 ( k 3 max =50). Тогда для третьего критерия будем иметь (50-30; 50-50; 50-45; 50-10; 50-40) = 40. k 30 = 0, т.е. 0 k 3 40. 0 V j (k j ) =0, V j (k *j ) = 1. Остальные три определяются опросом ЛПР. ЛПР должно указать последовательно значения полезности соответственно будут равны 0,5; 0,25; 0,75. Будем считать, что данная задача решена. Тогда для определения коэффициентов j предлагается следующий подход. Пусть даны две альтернативы ( k10 , k 2* , k 3 ) и ( k1 - ?, k 20 , k 3 ), где k 0j и k *j худшее и лучшее значение критерия j, k 3 - значение третьего критерия (для нас безразлично значение дополняющего критерия, т.к. все критерии взаимозависимы). Спрашиваем у ЛПР: каково должно быть значение критерия k1 у второй альтернативы, чтобы эти альтернативы были эквивалентны, т.е. функции полезности у них были одинаковы. Для нашей задачи сравниваем альтернативы (100, 50, k 3 ) и ( k1 - ?, 15, k 3 ). Выясняем у ЛПР: какова должна быть зарплата, если процент творческой работы составляет 15 %, а работа должна быть эквивалентна по степени x1 x2 x3 удовлетворения в работе, зарплата которой – 100, но процент творческой работы составляет 50 %. Если ЛПР называет допустим k1 = 155, то U( k10 , k 2* , k 3 ) =U( k1 , k 20 , k 3 ). 1V1 (k10 ) 2V2 (k 2* ) 3V3 (k 3 ) 1V1 (k1 ) 2V2 (k 20 ) 3V3 (k 3 ) 1 (V1 (k1 ) V1 (k10 )) (V2 (k 2* ) V2 (k 20 )) 2 1 (k1 ) По графику функции полезности V1 (k1 ) определяем для k1 = 155 V1 (155) = (155-150)(0,75-0,5)/(160-150) +0,5 = 0,625 = 1 2 Аналогично у ЛПР определяем эквивалентность альтернатив: (100, k 2 , 40) ( k1 - ?, k 2 ,0). Пусть ЛПР выбирает k1 = 140. Тогда получаем: 1V1 (k1 ) 2V2 (k 2 ) 3V3 (k * 3 ) 1V1 (k1 ) 2V2 (k 2 ) 3V3 (k 30 ) 3 1V 1(k1 ) 1V1 (140) V1 (140) =(140-130)(0,5-0,25)/(150-130)+0,25 = 0,375 Получаем систему: 1 2 3 1 0,625 1 2 0 0,375 1 3 0 Решаем систему и получаем: 1 0,5; 2 0,3125; 3 0,1875. Определяем значение функции полезности для всех альтернатив U(100; 50; 20)=0,5*0+0,3125*1+(20-15)*0,5/(25x1 : 15)+0,25*0,1875=0,3828 x 2 : U(140,30,0)=0,3047 x3 : U(170,25,5)=0,6093 x 4 : U(130,15,40)=0,3125 x5 : U(140,40,10) =0,4139 Вывод: Наиболее благоприятное место работы – третье предприятие. АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ Методические указания по выполнению лабораторной работы Составитель: доцент, к.т.н. Кочегуров Александр Иванович Подписано к печати Формат 60х84/16. Бумага писчая №2. Плоская печать. Усл.печ.л. Уч.-изд.л. Тираж 50 экз. Заказ . Цена свободная. ИПФ ТПУ. Лицензия ЛТ №1 от 18.07.94. Типография ТПУ. 634034, Томск, пр.Ленина, 30.