Неопределенность и рациональные решения

Из-за наличия неопределенности способ принятия решений агентом изменяется коренным образом. В обычных условиях логический агент ставит перед собой цель и выполняет любой план, который гарантирует ее достижение. Действие в этом плане может быть выбрано или отвергнуто с учетом того, способствует ли оно достижению цели, независимо от наличия или отсутствия каких-либо иных действий, способствующих ее достижению. А если в ситуацию вмешивается неопределенность, такой подход становится неосуществимым. Снова рассмотрим план прибытия в аэропорт, А90. Предположим, что этот план имеет 95%-ные шансы на успех. Означает ли это, что решение по выбору данного плана является рациональным? Не обязательно: могут существовать другие планы, такие как А120, с большими вероятностями успеха. Если для пассажира жизненно важно успеть на самолет, то стоит рискнуть тем, что ему придется дольше ждать в аэропорту. А что можно сказать о плане А1440, который предусматривает заблаговременный выезд из дома за 24 часа до отправления самолета? В большинстве обстоятельств это — не лучший выбор, поскольку он предусматривает невыносимо долгое ожидание, даже несмотря на то, что почти полностью гарантирует своевременное прибытие в аэропорт.
Чтобы иметь возможность выбирать среди подобных вариантов, агент должен вначале получить информацию о предпочтениях между различными возможными результатами разных планов. Каждый конкретный результат представляет собой полностью определенное состояние, включая такие факторы, как своевременное прибытие агента и продолжительность ожидания в аэропорту. Для представления и формирования рассуждений с учетом предпочтений мы будем использовать теорию полезности. (Термин "полезность" имеет англоязычный эквивалент "utility", который в данном контексте обозначает "свойство быть полезным", а не электростанцию или предприятие, предоставляющее коммунальные услуги.) Теория полезности указывает, что каждое состояние имеет определенную степень полезности (или просто полезность) для агента и что агент предпочитает состояние с более высокой полезностью.
Полезность состояния является относительной для агента, предпочтения которого должна описывать функция полезности. Например, функции вознаграждения для игр, описанные в главе 6, представляют собой функции полезности. Полезность состояния, в котором белые могут победить в ходе какой-то шахматной партии, безусловно, высока для агента, играющего белыми, но низка для агента, играющего черными. Еще один пример состоит в том, что некоторые игроки (включая авторов этой книги) будут счастливы, сыграв вничью против чемпиона мира, а о других игроках (включая бывшего чемпиона мира) этого сказать нельзя. При этом не учитываются личные вкусы или предпочтения: читатель может подумать, что агент, который предпочитает шоколадным чипсам мороженое "Халапеньо" с добавлением компонентов жевательной резинки, — странный или даже бестолковый тип, но не сможет утверждать, что этот агент нерационален. В функции полезности может быть даже учтена польза от альтруистического поведения просто путем включения оценки благополучия других как одного из факторов, которые вносят вклад в полезность для самого агента.
Предпочтения, будучи выраженными в виде полезности, комбинируются с вероятностями в общей теории рациональных решений, называемой теорией решений, следующим образом:
Теория решений = Теория вероятностей + Теория полезности
Фундаментальная идея теории решений состоит в том, что любой агент является рациональным тогда и только тогда, когда он выбирает действие, позволяющее достичь наибольшей ожидаемой полезности, усредненной по всем возможным результатам данного действия. Это — так называемый принцип максимальной ожидаемой полезности (Maximum Expected Utility — MEU). Мы наблюдали этот принцип в действии в главе 6, когда кратко рассматривали оптимальные решения в нардах, а ниже будет показано, что это — действительно полностью общий принцип.







Материалы

Яндекс.Метрика