Структура предпочтений и многоатрибутная полезность

Предположим, что имеются п атрибутов, каждый из которых имеет d различных возможных значений. Чтобы определить полную функцию полезности и(х1,...,хп), в худшем случае требуется сТ значений. Итак, наихудший случай соответствует ситуации, в которой предпочтения агента вообще не отличаются какой-либо регулярностью. Теория многоатрибутной полезности основана на гипотезе о том, что предпочтения типичных агентов более структурированы по сравнению с указанной ситуацией. Основной подход состоит в том, что следует выявлять регулярные структуры в том поведении агента по отношению к предпочтениям, которое, по всей вероятности, будет наблюдаться в действительности, и использовать так называемые теоремы представления для обоснования того, что агент со структурой предпочтений определенного рода имеет следующую функцию полезности:
I7(Xi,...,Xn) = f [fi(Xi) , fn(Xn) ]
где f, в соответствии с оптимистическим предположением, представляет собой простую функцию, такую как сложение. Обратите внимание на то, что попытка определить структуру предпочтений аналогична использованию байесовских сетей для декомпозиции совместного распределения вероятностей нескольких случайных переменных.
Предпочтение без неопределенности
Начнем с детерминированного случая. Напомним, что для детерминированных вариантов среды у агента имеется функция значений V(xlf..., хп); цель состоит втом, чтобы представить эту функцию в более краткой форме. Основное свойство регулярности, которое наблюдается в детерминированных структурах предпочтений, называется независимостью предпочтений. Два атрибута, хг и Х2, являются независимыми по предпочтениям от третьего атрибута, Х3, если предпочтение между результатами Возвращаясь к примеру с аэропортом, в котором нужно было рассмотреть (кроме других атрибутов) атрибуты Noise (Шум), Cost (Стоимость) и Deaths (Количество смертных случаев), можно предположить, что атрибуты Noise и Cost независимы по предпочтениям от атрибута Deaths. Например, если мы предпочтем состояние с 20 ООО людей, проживающих в районах, над которыми выполняются полеты, и стоимостью строительства 4 миллиарда долларов, состоянию с 70 ООО людей, проживающих в районах полетов, и стоимостью 3,7 миллиарда долларов, притом что уровень безопасности в обоих случаях равен 0,06 смертей в расчете на миллионный пассажирооборот, то будем иметь одни и те же предпочтения, когда уровень безопасности равен 0,13 и когда он равен 0,01. Такие же отношения независимости имеют место для предпочтений между любыми другими парами значений атрибутов Noise и Cost. Очевидно также, что атрибуты Cost и Deaths независимы по предпочтениям от Noise, a Noise и Deaths независимы по предпочтениям от Cost. В этих случаях принято считать, что множество атрибутов {Noise, Cost, Deaths] обнаруживает свойство взаимной независимости по предпочтениям (Mutual Preferential Independence — MPI). Согласно свойству MPI, вне зависимости от того, насколько важен каждый атрибут, он не влияет на отношения, в которых другие атрибуты сопоставляются друг с другом.
Свойство взаимной независимости по предпочтениям в определенной степени представляет собой идеализацию, но благодаря замечательной теореме, предложенной экономистом Дебре [365], на его основе можно вывести очень простую форму для функции стоимости агента: если атрибуты xlt..., Хп являются взаимно независимыми по предпочтениям, то поведение агента в отношении его предпочтений можно описать как максимизацию следующей функции, где каждое слагаемое Vi представляет собой функцию значения, ссыпающуюся только на атрибут xL. Например, вполне допустима такая возможность, что решение по размещению аэропорта может быть принято на основе следующей функции значения:
V(noise, cost, deaths) = -noise x 104 - cost - deaths x 1012
Функция значения такого типа называется аддитивной функцией значения. Аддитивные функции представляют собой исключительно естественный способ описания любой функции значения агента и действительно правильно описывают многие реальные ситуации. И даже если свойство MPI, строго говоря, не соблюдается, что может иметь место при крайних значениях атрибутов, аддитивная функция значения все еще может предоставлять хорошую аппроксимацию для предпочтений агента. Такое утверждение особенно полно оправдывается, когда нарушения свойства MPI возникают в тех частях диапазонов атрибутов, которые редко встречаются на практике.
Предпочтения с неопределенностью
Если в рассматриваемой проблемной области присутствует неопределенность, то необходимо также рассмотреть структуру предпочтений между лотереями и понять результирующие свойства функций полезности, а не просто функций значения. Математические основы решения этой проблемы могут оказаться весьма сложными, поэтому здесь мы представим только один из основных результатов, чтобы дать понять, как может быть решена эта проблема. Для ознакомления с исчерпывающим обзором работ в этой области рекомендуем читателю обратиться к [788].
Основное понятие независимости полезностей позволяет расширить понятие независимости предпочтений так, чтобы оно охватывало лотереи: множество атрибутов х является независимым по полезности от множества атрибутов Y, если предпочтения между лотереями по атрибутам х независимы от конкретных значений атрибутов Y. Множество атрибутов является взаимно независимым по полезностям (Mutually Utility-Independent — MUI), если каждое из его подмножеств является независимым по полезностям от остальных атрибутов. Опять-таки предположение о том, что атрибуты задачи с аэропортом обладают свойством MUI, кажется вполне резонным.
Из свойства MUI следует, что поведение агента может быть описано с помощью .мультипликативной функции полезности [787]. С общей формой мультипликативной функции полезности можно проще всего ознакомиться, рассмотрев случай с тремя атрибутами. В целях сокращения мы будем использовать запись и± для обозначения Ui (Xi):
U = JaUi + k2U2 + k3U3 + kUM + k2k3U2U3 + kikiUiU! + k{k2k3\J\J2\J3
Хотя это соотношение на первый взгляд не кажется очень простым, оно содержит лишь три одноатрибутных функции полезности и три константы. Вообще говоря, любую n-атрибутную задачу, характеризующуюся наличием свойства MUI, можно промоделировать с использованием п одноатрибутных полезностей и п констант. Каждая из одно-атрибутных функций полезности может быть разработана независимо от других атрибутов, а применение комбинации этих функций гарантирует формирование правильных общих предпочтений. Для получения чисто аддитивной функции полезности необходимо ввести некоторые дополнительные предположения.
В этом разделе рассматривается общий механизм принятия рациональных решений. Описанную здесь систему обозначений часто называют диаграммами влияния [695], но мы будем использовать более описательный термин сети принятия решений. В сетях принятия решений байесовские сети комбинируются с узлами дополнительных типов, которые обозначают действия и полезности. В качестве примера будет рассматриваться задача выбора площадки для строительства аэропорта.
Способы представления задачи принятия решений с помощью сети принятия решений
В своей наиболее общей форме любая сеть принятия решений представляет информацию о текущем состоянии агента, его возможных действиях, о состоянии, которое станет результатом данного действия агента, и о полезности этого состояния. Таким образом, данная сеть может служить основой для реализации агентов, действующих с учетом полезности, такого типа, который был впервые представлен в разделе 2.4. На рис. 16.5 показана сеть принятия решений в задаче выбора площадки для строительства аэропорта. Этот рисунок может служить иллюстрацией того, как используются узлы трех описанных ниже типов.

Материалы

Обновление гауссовых распределений

Области применения калмановской фильтрации

ДИНАМИЧЕСКИЕ БАЙЕСОВСКИЕ СЕТИ

Процедура создания сетей DBN

Точный вероятностный вывод в сетях DBN

Приближенный вероятностный вывод в сетях DBN

РАСПОЗНАВАНИЕ РЕЧИ

Звуки речи

Слова

Предложения

БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ ЗАМЕТКИ

УПРАЖНЕНИЯ

ПРИНЯТИЕ ПРОСТЫХ РЕШЕНИЙ

ОСНОВЫ ТЕОРИИ ПОЛЕЗНОСТИ

В начале была Полезность

ФУНКЦИИ ПОЛЕЗНОСТИ

Полезность денег

СУБЪЕКТИВНЫЕ СУЖДЕНИЯ И ПРИСУЩЕЕ ЧЕЛОВЕКУ СВОЙСТВО ОШИБАТЬСЯ

Шкалы полезности и оценка полезности

МНОГОАТРИБУТНЫЕ ФУНКЦИИ ПОЛЕЗНОСТИ

Доминирование

Структура предпочтений и многоатрибутная полезность

СЕТИ ПРИНЯТИЯ РЕШЕНИЙ

Вычисления с помощью сетей принятия решений

СТОИМИСТЬ ИНФОРМАЦИИ

Общая формула

Свойства показателей стоимости информации

ЭКСПЕРТНЫЕ СИСТЕМЫ, ОСНОВАННЫЕ А ИСПОЛЬЗОВАНИИ ТЕОРИИ ПРИНЯТИЯ РЕШЕНИЙ

БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ ЗАМЕТКИ

УПРАЖНЕНИЯ

ПРИНЯТИЕ СЛОЖНЫХ РЕШЕНИЙ

Оптимальность в задачах последовательного принятия решений

ИТЕРАЦИЯ ПО ЗНАЧЕНИЯМ

Алгоритм итерации по значениям

Сходимость итерации по значениям

ИТЕРАЦИЯ ПО СТРАТЕГИЯМ

МАРКОВСКИЕ ПРОЦЕССЫ ПРИНЯТИЯ РЕШЕНИЙ В ЧАСТИЧНО НАБЛЮДАЕМЫХ ВАРИАНТАХ СРЕДЫ

АГЕНТЫ, ДЕЙСТВУЮЩИЕ НА ОСНОВЕ ТЕОРИИ РЕШЕНИЙ

ПРИНЯТИЕ РЕШЕНИЙ ПРИ НАЛИЧИИ НЕСКОЛЬКИХ АГЕНТОВ: ТЕОРИЯ ИГР

ПРОЕКТИРОВАНИЕ МЕХАНИЗМА

БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ ЗАМЕТКИ

ОБУЧЕНИЕ НА ОСНОВЕ НАБЛЮДЕНИЙ

ИНДУКТИВНОЕ ОБУЧЕНИЕ

ФОРМИРОВАНИЕ ДЕРЕВЬЕВ РЕШЕНИЙ НА ОСНОВЕ ОБУЧЕНИЯ

Выразительность деревьев решений

Индуктивный вывод деревьев решений на основе примеров

Выбор проверок атрибутов

Оценка производительности обучающего алгоритма

Шум и чрезмерно тщательная подгонка

Расширение области применения деревьев решений

ОБУЧЕНИЕ АНСАМБЛЯ

ПРИНЦИПЫ ФУНКЦИОНИРОВАНИЯ АЛГОРИТМОВ ОБУЧЕНИЯ: ТЕОРИЯ ВЫЧИСЛИТЕЛЬНОГО ОБУЧЕНИЯ

Оценка количества необходимых примеров

Разделы

Поцелуй по расчету
Поэма Содди
Задача о сферах
Многомерность
Гость из четвертого измерения
Четырехмерный симплекс
Возможности нового измерения
Эксперимент Цельнера
Геометрия - это интуиция
Ущербность нашего восприятия
Объем - в плоскость
Наш плоский объемный мир
Мебиусиана
Односторонность листа Мебиуса
Топология - из листа Мебиуса
Число Бетти
Хроматический номер
Справа, где сердце
Бутылка Клейна
Мебиус и микромир
Левый и Правый Мебиусы
Эксперимент By Цзянь-сюн
Двухкомпонентная теория нейтрино
Зеркальные двойники
Роль формы
Вселенная искривляется
Тензорный анализ
Теория Вселенной Эйнштейна
Пульс Вселенной
Великолепная пятерка
О божественной пропорции
«Начала» Евклида
Доказательство Эйлера
Символы Шлефли
Гамильтонова линия
Изопиранная задача
Интуиция царицы Дидоны
Как управляется мир
Серьезные игры
Искусство орнамента
Федоровские группы
Игры Эсхера
Симметрии Эсхера
Нефедоровская кристаллография
Мировая гармония
Удавшаяся провокация
«Колючий» ёж Кеплера
Фигура Петри
Теория многогранников
Правильные и почти правильные тела
Песок расширяется!
Кубическая плотная упаковка
Плотность упаковки
Дома на песке
Тайные связи
Музыка сфер
Подкупающая простота
Модели Дончияна
Полезные политопы
Организация пространства
Радость видеть и понимать
Теории Земли
Бейсбольный мяч планеты
Катенаны
Вечный Геометр
Цепь причин и следствий
Счастливый случай
Метод Монте-Карло
Вероятностные методы
Бросаем песчинку
Сходство схем
Задачи распространения тепла
Случайные траектории
Возможности равны
Случай в игре
Игры с таблицей
Новые осложнения
Хуже-лучше
Расшифровка кодов
Роль элемента случайности
Обучение и случайность
Обучение автоматов
«Школьная» схема обучения
Обучение — самообучение
Шаблон поведения
Уметь пользоваться памятью
Опыты И. П. Павлова
Условный рефлекс
Связь между нейронами
Носитель памяти
Механизм образования условного рефлекса
Механизм «вспоминания»
Структура нервной сети
Простой эксперимент
Проблема опознания
Что такое опознание
Зрительные образы
Персептрон
Различаемые образы
Что умеет персептрон
Свойства персептрона
Залог опознания образов
Роль случайности в эволюции
К чему приводят мутации
Естественный отбор
«Безжалостность» законов природы
Приспособление вида
Схема гомеостата
Идея Эшби
Усилитель отбора
Усилитель мыслительных способностей
Схема искусственного отбора
Самонастраивающиеся системы и случайность
Непохожесть систем
Критерий близости к совершенству
Самонастраивающиеся системы
Наладчик сложных систем
Метод компенсации
Как настроить
Устройство автомата
Держим точный размер
Анализ станка-автомата
Обратное воздействие
Способ Гаусса — Зейделя
Анализ настроек
Метод градиента
Метод случайной настройки
Метод случайного поиска
Программа случайного поиска
Схема случайного поиска
Самонастраивающаяся система
Источник неограниченных возможностей

Искусственный интеллект. Современный подход