ОСНОВЫ ТЕОРИИ ПОЛЕЗНОСТИ

Интуитивно ясно, что принцип максимальной ожидаемой полезности (Maximum Expected Utility — MEU) может стать основой приемлемого способа принятия решений, но нет никаких оснований полагать, что это — единственный рациональный способ. В конечном итоге, на каком основании следует придавать такое значение подходу, в котором предусматривается максимизация средней полезности? Почему бы не попытаться максимизировать сумму кубов возможных полезностей или не рассмотреть подход с минимизацией наихудшей возможной потери? Кроме того, может ли агент рационально организовать свои действия, лишь выразив отношение предпочтения между состояниями и не присваивая им числовых значений? Наконец, почему вообще должна существовать функция полезности с требуемыми свойствами? Вполне допустимо такое предположение, что рациональный агент может иметь структуру предпочтений, являющуюся слишком сложной для того, чтобы ее можно было представить с помощью такого простого метода, как присваивание единственного действительного числового значения каждому состоянию.
Ограничения, налагаемые на рациональные предпочтения
Ответы на эти вопросы можно получить, записав некоторые ограничения, распространяющиеся на предпочтения, которые должен иметь рациональный агент, а затем показав, что принцип MEU можно вывести из этих ограничений. Для описания предпочтений агента будут использоваться приведенные ниже обозначения.
А У В. Вариант А предпочтительнее, чем В
А ~ В. Агент безразличен к выбору между вариантами А и В
А В. Агент предпочитает вариант А варианту В или безразличен к выбору между ними
Теперь напрашивается очевидный вопрос, к какого рода понятиям относятся А и в? Если действия агента являются детерминированными, то А и в обычно представляют собой конкретные, полностью заданные результирующие состояния этих действий. В более общем, недетерминированном случае А и В представляют собой лотереи. Лотерея по сути является распределением вероятностей по множеству фактических результатов ("призов" в лотерее). Лотерея L с возможными результатами Ci,...,Cn, которые могут возникать с вероятностями plf...,pn, записывается следующим образом:
L = [pi,Ci;p2,C2;...;Pn/Cn]
(Лотерея только с одним результатом может быть записана либо как А, либо как [1,А].) Вообще говоря, каждым результатом лотереи может быть атомарное состояние или другая лотерея. Основная проблема теории полезности состоит в том, чтобы понять, как предпочтения между сложными лотереями связаны с предпочтениями между основополагающими состояниями в этих лотереях.
Для этого мы должны наложить на это отношение предпочтения приемлемые ограничения, во многом аналогично тому, как были наложены ограничения рациональности на степени уверенности для получения аксиом вероятностей в главе 13. Одно из разумных ограничений состоит в том, что предпочтение должно быть транзитивным, т.е. если А У В и В У С, то следует ожидать, что А >- С. Свойство
транзитивности можно обосновать, показав, что агент, предпочтения которого не соответствуют свойству транзитивности, будет вести себя нерационально. Предположим, например, что агент имеет нетранзитивное предпочтение А У В У С У А,
где А, в и С— товары, которые могут свободно обмениваться друг на друга. Если агент в настоящее время имеет товар А, то можно предложить обменять С на А и немного наличных. Агент предпочитает товар С и поэтому должен быть готов предос-
После этого мы вернемся к такому же положению, с которого начинали, за исключением того, что теперь агент имеет меньше денег (рис. 16.1, а). Такое движение по циклу может продолжаться до тех пор, пока у агента больше не останется денег. Очевидно, что в этом случае агент не действовал рационально.
Приведенные ниже шесть ограничений известны как аксиомы теории полезности. Они определяют самые очевидные семантические ограничения, которые распространяются на предпочтения и лотереи.
• Упорядочиваемость. Если даны два состояния, то рациональный агент должен либо предпочесть одно другому, либо рассматривать их оба как в равной степени предпочтительные. Это означает, что агент не может избежать принятия решений. Как было сказано на с. 637, отказ сделать ставку аналогичен тому, что агент отказывается предпринимать активные действия и предоставляет все дальнейшее естественному течению событий.
{А У В) v (В У A) v {А П В)
• Транзитивность. Если даны три состояния, такие, что агент предпочитает состояние А состоянию В и предпочитает состояние в состоянию С, то агент должен предпочесть состояние А состоянию С.
(А У В) Л (В У С) => (А У С)
• Непрерывность. Если некоторое состояние В находится в порядке предпочтений между А и С, то существует некоторая вероятность р того, что рациональный агент будет безразличен к тому, чтобы определенно выбрать в или лотерею, результатом которой является состояние А, с вероятностью р, и состояние С, с вероятностью 1-р.
лотерею, результатом которой является состояние А, с вероятностью р, и состояние С, с вероятностью 1-р.
А У В У С => Зр [р, А; 1-р, С] ~ В
• Заменяемость. Если агент безразличен к выбору между двумя лотереями, А и В, то агент безразличен и к выбору между двумя более сложными лотереями, которые являются одинаковыми, за исключением того, что в одной из них подставлена лотерея в вместо А. Такое свойство сохраняется независимо от вероятностей и от других результатов лотерей.
А ~ В => [р,А;1-р,С] ~ [р,В;1-р,С]
• Монотонность. Предположим, что две лотереи имеют два одинаковых результата, АЙВ. Если агент предпочитает состояние А состоянию в, то агент должен предпочесть лотерею, которая имеет более высокую вероятность для состояния А (и наоборот).
А У В => (р > g [р,А;1-р, В] ? [q,A;l-q,B])
• Декомпонуемость. Сложные лотереи можно свести к простым, используя законы вероятностей. Это свойство получило название правила "экономии количества ставок", поскольку согласно ему две последовательные лотереи могут быть сжаты в одну эквивалентную лотерею1 (см. рис. 16.1, б).
[p,A;l-p, [q,B;l-q,C]] ~ [р, А; (1-р) q, В; (1-р) (1-д) , С]







Материалы

Яндекс.Метрика