АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ УТВЕРЖДАЮ Декан АВТФ

Федеральное агентство по образованию ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ УТВЕРЖДАЮ Декан АВТФ ________________ Гайворонский С.А. « _____ » _______________ 2009 г. АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ методические указания по курсу «Теория риска и моделирование рисковых ситуаций» для студентов специальности 080116«Математические методы в экономике» ТОМСК 2008 УДК 519.2 АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ Mетодические указания по курсу методические указания по курсу «Теория риска и моделирование рисковых ситуаций» для студентов специальности 080116«Математические методы в экономике» - Томск: Изд. ТПУ, 2008. - 8 с. Составители: Кочегуров А.И. Рецензент: Бабушкин Ю.В. Методические указания обсуждены на заседании кафедры прикладной математики 06.04.2008 г. Зав. кафедрой В.П.Григорьев 1. Понятие функции полезности и её применение в задачах принятия решения (ЗПР). Полезность – некоторое число, приписываемое лицом, принимающим решение, каждому возможному исходу. Функция полезности НейманаМоргенштерна для лица, принимающего решение, (ЛПР) показывает полезность, которую он приписывает каждому возможному исходу. У каждого ЛПР своя функция полезности, которая показывает его предпочтение тем или иным исходам в зависимости от его отношения к риску. Понятие функции полезности возникло в теории потребительского спроса при сравнении различных наборов товаров. Полезность потребления продукта, например, для потребителя может быть выражена в виде функции, отражающей полезность в зависимости от количества потребления этого продукта. В определённых пределах полезность может увеличиваться, уменьшаться или оставаться без изменения при увеличении потребления продукта. Функция полезности может быть построена и для определенного набора продуктов. При этом, в зависимости от того, являются ли продукты взаимозаменяемыми или нет, интегральная функция полезности набора потребляемых продуктов определяется с учётом взаимного их влияния на общую их полезность потребления. В ЗПР значение функции полезности выражает предпочтения, полезность альтернатив. Она может быть оценена на множестве альтернатив и на множестве критериев, при этом критерии могут быть взаимно независимыми и зависимыми. 1.1. Формализация задач принятия решений. Принятие решений – действие над множеством альтернатив, в результате которого получается множество выбранных альтернатив. Сделаем формальное описание задачи: Пусть: z = { z1 ,…, z q } – множество целей системы управления. x = { x1 ,…, x m } – множество альтернатив. Y- множество исходов альтернатив. e = { e1 ,…, en } – множество возможных состояний (ситуаций). Исход y  Y может быть представлен в виде трёх аргументов: y ijl  F ( xi , e j , z l ) , где i  1, m , j  1, n , l  1, q . Матрицу Y  y ijl называют матрицей исходов, оценочным функционалом, функцией предпочтения. Необходимо построить модель исходов альтернативных решений в соответствии с предпочтением ЛПР. Для обеспечения комплексной оценки решений необходимо сформулировать для полного множества целей систему показателей (критериев), характеризующую степень их достижения. Множеству целей Z сопоставим множество критериев К. В частном случае каждой цели z l  Z может быть сопоставлен один критерий k j  K . Для построения модели оценки решений необходимо: 1) получить оценку предпочтительности решений по каждому критерию для каждой ситуации; 2) получить комплексную оценку решений по совокупности критериев для каждой ситуации; 3) получить интегральную оценку решений с учётом возможных ситуаций. Модель оценки решений в частных постановках может быть записана в виде функциональной зависимости от параметров, характеризующих внешнюю среду и локальных критериев. Как правило, модель оценки решений носит более сложный характер причинно-следственных связей и не описывается простыми формальными состояниями. Выбор лучшего решения в транспортной задаче связан с определением экстремума функции. И только для задач векторной оптимизации требуется вмешательство ЛПР, для определения приоритетов нескольких критериев. Во всех этих случаях рассматривались задачи принятия решений, в которых выбор решения производили в условиях определённости, с учётом конкретной ситуации, определённые состоянием внешней среды. В реальной практике нередко приходится иметь дело с более сложной обстановкой, когда выбор альтернативы под влиянием внешней среды, неподдающейся точному прогнозу и имеющей случайный характер, приводит к одному из нескольких возможных исходов, и для осуществления выбора наилучшего решения необходимо оценивать альтернативы в зависимости от возможных ситуаций (ситуаций внешней среды) и целевых установок. Такая комплексная оценка решения не может быть произведена без участия ЛПР, без учёта системы его взглядов (системы предпочтений) на ценность альтернатив. 1.2. Аксиоматический подход к построению функции полезности. Аксиоматический подход к ЗПР базируется на поверке ряда аксиом для построения функции полезности альтернатив. Аксиомы делятся на две группы: 1) аксиомы существования функции полезности; 2) аксиомы независимости критериев. Аксиомы существования функции полезности формализованы на множестве альтернатив и множестве критериев. В случае независимости альтернатив xi  X , где i  1, m , и существования линейного порядка их предпочтения x1  x2 ... xm (> - знак отношения строгого предпочтения) показано, что на этом множестве можно построить функцию полезности такую, что U1 ( x1 )U 2 ( x2 )...U m ( xm ) . При наличии информации (количественной или качественной) на множестве критериев k j  K , где j  1, n , характеризующих альтернативы, показано, что для них могут быть построены функции полезности, как по каждому критерию V j (k j ) , так и по совокупности критериев. Методология рационального принятия решений в условиях неопределённости, основанная на функции полезности индивида, опирается на пять аксиом, которые отражают минимальный набор необходимых условий непротиворечивого и рационального поведения игрока. Для компактного изложения аксиом потребуется следующее определение. Предположим, что конструируется игра, в которой индивид с вероятностью р получает денежную сумму х и с вероятностью (1-р) – сумму z. Эту ситуацию будем обозначать G(x, z: p ). Аксиома 1. Аксиома сравнимости (полноты). Для всего множества S неопределённых альтернатив (возможных исходов) индивид может сказать, что либо исход x предпочтительнее исхода y ( x  y ), либо ( y  x ), либо индивид безразличен в отношении к выбору между x и y ( x  y ). Запись x  y означает, что исход x предпочтительнее исхода y либо индивид безразличен в отношении к выбору между x и y. Аксиома 2. Аксиома транзитивности (состоятельности). Если x  y и y  z , то x  z . Если x  y и y  z , то x  z . Аксиома 3. Аксиома сильной независимости. Предположим, что мы конструируем игру, в которой индивид с вероятностью p получает денежную сумму x и с вероятностью (1-p) – сумму z, т.е. G(x, z:p). Сильная независимость означает, что если индивид безразличен в отношении к выбору между x и y, ( x  y ), то он также будет безразличен в отношении к выбору между игрой (лотереей) G(x, z:p) и игрой G(y ,z:p), т.е. из x  y следует G(x, z:p)  G(y, z:p). Аксиома 4. аксиома измеримости. Если x  y  z или x  y  z , то существует единственная вероятность p, такая, что y  G(x, z:p). Аксиома 5. Аксиома ранжирования. Если альтернативы y и u находятся по предпочтительности между альтернативами x и z и можно построить игры, такие, что к выбору между y и G(x, z: p1 ), а также к выбору между u и G(x, z: p2 ), то при p1 > p1 y  u . Если принять приведённые аксиомы и предположить, что люди предпочитают большее количество некоторого блага меньшему, то всё это в совокупности определяет рациональное поведение ЛПР. При названных предпочтениях американскими учёными Дж. Нейманом и О. Моргенштерном было показано, что ЛПР при принятии решения будет стремиться к максимизации ожидаемой полезности. Другими словами, из всех возможных решений он выберет то, которое обеспечивает наибольшую ожидаемую полезность. 1.3. Построение и структура функции полезности. Вид аддитивной функции полезности: n U(x)=   jV j (k j ) , где i 1 U(k) – функция полезности альтернативы на множестве критериев K, 0  U(k)  1; V j ( k j ) - функция полезности альтернативы по критерию k j , 0  V j (k j )  1, j  1, n ;  j - вес j-го критерия, n  j 1 j  1 ,  j >0. Дж. Нейман и О. Моргенштерн предложили процедуру построения индивидуальной функции полезности, которая (процедура) заключается в следующем: ЛПР отвечает на ряд вопросов, обнаруживая при этом свои индивидуальные предпочтения, учитывающие его отношение к риску. В общем случае график функции полезности может быть трёх типов:  для ЛПР, не склонного к риску, - строго вогнутая функция, у которой каждая дуга кривой лежит выше своей хорды;  для ЛПР, безразличного к риску, - прямая лини;  для ЛПР, склонного к риску, - строго вогнутая функция, у которой каждая дуга кривой лежит ниже своей хорды. 2. Исследование функции полезности на моделях экономических систем. Классификация задач принятия решений: ЗПР Одна цель Одна ситуация Несколько целей Несколько ситуаций Одна ситуация Будем считать, что имеется несколько целей и одна ситуация. Несколько ситуаций 2.1. Построение аддитивной функции полезности. Перед выпускником учебного заведения стоит проблема выбора оптимального места дальнейшей работы. Выбор определяется значением критериев: k1 - величина зарплаты; k 2 - процент творческой работы; k 3 - время, за которое можно добраться до работы. Выпускник может производить выбор из пяти предполагаемых мест работы со следующими оценками: Предприятие Критерии k1 k2 k3 100 50 30 140 30 50 170 25 45 x4 130 15 10 x5 140 40 40 Построим функцию полезности по каждому критерию V j (k j ) , где j  1,3 , 0  V j (k j )  1. Введём обозначения: k *j - лучшее значение по критерию j ( k1* =170; k 2* =50; k 3* =10), k 0j - худшее значение по критерию j ( k10 =100; k 20 =15; k 30 =50). Для удобства работы с ЛПР все критерии представить с позиции их максимизации или минимизации. Поэтому новое значение критерия k 3H лучше представить как разность k 3Hi  k 3 max  k 3i , где k 3i - значение критерия 3 для i-ой альтернативы. k 3 max - максимальное значение критерия 3 ( k 3 max =50). Тогда для третьего критерия будем иметь (50-30; 50-50; 50-45; 50-10; 50-40) = 40. k 30 = 0, т.е. 0  k 3  40. 0 V j (k j ) =0, V j (k *j ) = 1. Остальные три определяются опросом ЛПР. ЛПР должно указать последовательно значения полезности соответственно будут равны 0,5; 0,25; 0,75. Будем считать, что данная задача решена. Тогда для определения коэффициентов  j предлагается следующий подход. Пусть даны две альтернативы ( k10 , k 2* , k 3 ) и ( k1 - ?, k 20 , k 3 ), где k 0j и k *j худшее и лучшее значение критерия j, k 3 - значение третьего критерия (для нас безразлично значение дополняющего критерия, т.к. все критерии взаимозависимы). Спрашиваем у ЛПР: каково должно быть значение критерия k1 у второй альтернативы, чтобы эти альтернативы были эквивалентны, т.е. функции полезности у них были одинаковы. Для нашей задачи сравниваем альтернативы (100, 50, k 3 ) и ( k1 - ?, 15, k 3 ). Выясняем у ЛПР: какова должна быть зарплата, если процент творческой работы составляет 15 %, а работа должна быть эквивалентна по степени x1 x2 x3 удовлетворения в работе, зарплата которой – 100, но процент творческой работы составляет 50 %. Если ЛПР называет допустим k1 = 155, то U( k10 , k 2* , k 3 ) =U( k1 , k 20 , k 3 ). 1V1 (k10 )  2V2 (k 2* )  3V3 (k 3 )  1V1 (k1 )  2V2 (k 20 )  3V3 (k 3 ) 1 (V1 (k1 )  V1 (k10 ))  (V2 (k 2* )  V2 (k 20 )) 2  1 (k1 ) По графику функции полезности V1 (k1 ) определяем для k1 = 155 V1 (155) = (155-150)(0,75-0,5)/(160-150) +0,5 = 0,625 = 1 2 Аналогично у ЛПР определяем эквивалентность альтернатив: (100, k 2 , 40)  ( k1 - ?, k 2 ,0). Пусть ЛПР выбирает k1 = 140. Тогда получаем: 1V1 (k1 )  2V2 (k 2 )  3V3 (k * 3 )  1V1 (k1 )  2V2 (k 2 )  3V3 (k 30 ) 3  1V 1(k1 )  1V1 (140) V1 (140) =(140-130)(0,5-0,25)/(150-130)+0,25 = 0,375 Получаем систему: 1  2  3  1 0,625 1  2  0 0,375 1  3  0 Решаем систему и получаем: 1  0,5; 2  0,3125; 3  0,1875. Определяем значение функции полезности для всех альтернатив U(100; 50; 20)=0,5*0+0,3125*1+(20-15)*0,5/(25x1 : 15)+0,25*0,1875=0,3828 x 2 : U(140,30,0)=0,3047 x3 : U(170,25,5)=0,6093 x 4 : U(130,15,40)=0,3125 x5 : U(140,40,10) =0,4139 Вывод: Наиболее благоприятное место работы – третье предприятие. АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ Методические указания по выполнению лабораторной работы Составитель: доцент, к.т.н. Кочегуров Александр Иванович Подписано к печати Формат 60х84/16. Бумага писчая №2. Плоская печать. Усл.печ.л. Уч.-изд.л. Тираж 50 экз. Заказ . Цена свободная. ИПФ ТПУ. Лицензия ЛТ №1 от 18.07.94. Типография ТПУ. 634034, Томск, пр.Ленина, 30.

АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ УТВЕРЖДАЮ Декан АВТФ

Products

Support

АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ УТВЕРЖДАЮ Декан АВТФ

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib