Структура предпочтений и многоатрибутная полезность

Предположим, что имеются п атрибутов, каждый из которых имеет d различных возможных значений. Чтобы определить полную функцию полезности и(х1,...,хп), в худшем случае требуется сТ значений. Итак, наихудший случай соответствует ситуации, в которой предпочтения агента вообще не отличаются какой-либо регулярностью. Теория многоатрибутной полезности основана на гипотезе о том, что предпочтения типичных агентов более структурированы по сравнению с указанной ситуацией. Основной подход состоит в том, что следует выявлять регулярные структуры в том поведении агента по отношению к предпочтениям, которое, по всей вероятности, будет наблюдаться в действительности, и использовать так называемые теоремы представления для обоснования того, что агент со структурой предпочтений определенного рода имеет следующую функцию полезности:
I7(Xi,...,Xn) = f [fi(Xi) , fn(Xn) ]
где f, в соответствии с оптимистическим предположением, представляет собой простую функцию, такую как сложение. Обратите внимание на то, что попытка определить структуру предпочтений аналогична использованию байесовских сетей для декомпозиции совместного распределения вероятностей нескольких случайных переменных.
Предпочтение без неопределенности
Начнем с детерминированного случая. Напомним, что для детерминированных вариантов среды у агента имеется функция значений V(xlf..., хп); цель состоит втом, чтобы представить эту функцию в более краткой форме. Основное свойство регулярности, которое наблюдается в детерминированных структурах предпочтений, называется независимостью предпочтений. Два атрибута, хг и Х2, являются независимыми по предпочтениям от третьего атрибута, Х3, если предпочтение между результатами Возвращаясь к примеру с аэропортом, в котором нужно было рассмотреть (кроме других атрибутов) атрибуты Noise (Шум), Cost (Стоимость) и Deaths (Количество смертных случаев), можно предположить, что атрибуты Noise и Cost независимы по предпочтениям от атрибута Deaths. Например, если мы предпочтем состояние с 20 ООО людей, проживающих в районах, над которыми выполняются полеты, и стоимостью строительства 4 миллиарда долларов, состоянию с 70 ООО людей, проживающих в районах полетов, и стоимостью 3,7 миллиарда долларов, притом что уровень безопасности в обоих случаях равен 0,06 смертей в расчете на миллионный пассажирооборот, то будем иметь одни и те же предпочтения, когда уровень безопасности равен 0,13 и когда он равен 0,01. Такие же отношения независимости имеют место для предпочтений между любыми другими парами значений атрибутов Noise и Cost. Очевидно также, что атрибуты Cost и Deaths независимы по предпочтениям от Noise, a Noise и Deaths независимы по предпочтениям от Cost. В этих случаях принято считать, что множество атрибутов {Noise, Cost, Deaths] обнаруживает свойство взаимной независимости по предпочтениям (Mutual Preferential Independence — MPI). Согласно свойству MPI, вне зависимости от того, насколько важен каждый атрибут, он не влияет на отношения, в которых другие атрибуты сопоставляются друг с другом.
Свойство взаимной независимости по предпочтениям в определенной степени представляет собой идеализацию, но благодаря замечательной теореме, предложенной экономистом Дебре [365], на его основе можно вывести очень простую форму для функции стоимости агента: если атрибуты xlt..., Хп являются взаимно независимыми по предпочтениям, то поведение агента в отношении его предпочтений можно описать как максимизацию следующей функции, где каждое слагаемое Vi представляет собой функцию значения, ссыпающуюся только на атрибут xL. Например, вполне допустима такая возможность, что решение по размещению аэропорта может быть принято на основе следующей функции значения:
V(noise, cost, deaths) = -noise x 104 - cost - deaths x 1012
Функция значения такого типа называется аддитивной функцией значения. Аддитивные функции представляют собой исключительно естественный способ описания любой функции значения агента и действительно правильно описывают многие реальные ситуации. И даже если свойство MPI, строго говоря, не соблюдается, что может иметь место при крайних значениях атрибутов, аддитивная функция значения все еще может предоставлять хорошую аппроксимацию для предпочтений агента. Такое утверждение особенно полно оправдывается, когда нарушения свойства MPI возникают в тех частях диапазонов атрибутов, которые редко встречаются на практике.
Предпочтения с неопределенностью
Если в рассматриваемой проблемной области присутствует неопределенность, то необходимо также рассмотреть структуру предпочтений между лотереями и понять результирующие свойства функций полезности, а не просто функций значения. Математические основы решения этой проблемы могут оказаться весьма сложными, поэтому здесь мы представим только один из основных результатов, чтобы дать понять, как может быть решена эта проблема. Для ознакомления с исчерпывающим обзором работ в этой области рекомендуем читателю обратиться к [788].
Основное понятие независимости полезностей позволяет расширить понятие независимости предпочтений так, чтобы оно охватывало лотереи: множество атрибутов х является независимым по полезности от множества атрибутов Y, если предпочтения между лотереями по атрибутам х независимы от конкретных значений атрибутов Y. Множество атрибутов является взаимно независимым по полезностям (Mutually Utility-Independent — MUI), если каждое из его подмножеств является независимым по полезностям от остальных атрибутов. Опять-таки предположение о том, что атрибуты задачи с аэропортом обладают свойством MUI, кажется вполне резонным.
Из свойства MUI следует, что поведение агента может быть описано с помощью .мультипликативной функции полезности [787]. С общей формой мультипликативной функции полезности можно проще всего ознакомиться, рассмотрев случай с тремя атрибутами. В целях сокращения мы будем использовать запись и± для обозначения Ui (Xi):
U = JaUi + k2U2 + k3U3 + kUM + k2k3U2U3 + kikiUiU! + k{k2k3\J\J2\J3
Хотя это соотношение на первый взгляд не кажется очень простым, оно содержит лишь три одноатрибутных функции полезности и три константы. Вообще говоря, любую n-атрибутную задачу, характеризующуюся наличием свойства MUI, можно промоделировать с использованием п одноатрибутных полезностей и п констант. Каждая из одно-атрибутных функций полезности может быть разработана независимо от других атрибутов, а применение комбинации этих функций гарантирует формирование правильных общих предпочтений. Для получения чисто аддитивной функции полезности необходимо ввести некоторые дополнительные предположения.
В этом разделе рассматривается общий механизм принятия рациональных решений. Описанную здесь систему обозначений часто называют диаграммами влияния [695], но мы будем использовать более описательный термин сети принятия решений. В сетях принятия решений байесовские сети комбинируются с узлами дополнительных типов, которые обозначают действия и полезности. В качестве примера будет рассматриваться задача выбора площадки для строительства аэропорта.
Способы представления задачи принятия решений с помощью сети принятия решений
В своей наиболее общей форме любая сеть принятия решений представляет информацию о текущем состоянии агента, его возможных действиях, о состоянии, которое станет результатом данного действия агента, и о полезности этого состояния. Таким образом, данная сеть может служить основой для реализации агентов, действующих с учетом полезности, такого типа, который был впервые представлен в разделе 2.4. На рис. 16.5 показана сеть принятия решений в задаче выбора площадки для строительства аэропорта. Этот рисунок может служить иллюстрацией того, как используются узлы трех описанных ниже типов.







Материалы

Яндекс.Метрика