Неопределенность и рациональные решения

Из-за наличия неопределенности способ принятия решений агентом изменяется коренным образом. В обычных условиях логический агент ставит перед собой цель и выполняет любой план, который гарантирует ее достижение. Действие в этом плане может быть выбрано или отвергнуто с учетом того, способствует ли оно достижению цели, независимо от наличия или отсутствия каких-либо иных действий, способствующих ее достижению. А если в ситуацию вмешивается неопределенность, такой подход становится неосуществимым. Снова рассмотрим план прибытия в аэропорт, А90. Предположим, что этот план имеет 95%-ные шансы на успех. Означает ли это, что решение по выбору данного плана является рациональным? Не обязательно: могут существовать другие планы, такие как А120, с большими вероятностями успеха. Если для пассажира жизненно важно успеть на самолет, то стоит рискнуть тем, что ему придется дольше ждать в аэропорту. А что можно сказать о плане А1440, который предусматривает заблаговременный выезд из дома за 24 часа до отправления самолета? В большинстве обстоятельств это — не лучший выбор, поскольку он предусматривает невыносимо долгое ожидание, даже несмотря на то, что почти полностью гарантирует своевременное прибытие в аэропорт.
Чтобы иметь возможность выбирать среди подобных вариантов, агент должен вначале получить информацию о предпочтениях между различными возможными результатами разных планов. Каждый конкретный результат представляет собой полностью определенное состояние, включая такие факторы, как своевременное прибытие агента и продолжительность ожидания в аэропорту. Для представления и формирования рассуждений с учетом предпочтений мы будем использовать теорию полезности. (Термин "полезность" имеет англоязычный эквивалент "utility", который в данном контексте обозначает "свойство быть полезным", а не электростанцию или предприятие, предоставляющее коммунальные услуги.) Теория полезности указывает, что каждое состояние имеет определенную степень полезности (или просто полезность) для агента и что агент предпочитает состояние с более высокой полезностью.
Полезность состояния является относительной для агента, предпочтения которого должна описывать функция полезности. Например, функции вознаграждения для игр, описанные в главе 6, представляют собой функции полезности. Полезность состояния, в котором белые могут победить в ходе какой-то шахматной партии, безусловно, высока для агента, играющего белыми, но низка для агента, играющего черными. Еще один пример состоит в том, что некоторые игроки (включая авторов этой книги) будут счастливы, сыграв вничью против чемпиона мира, а о других игроках (включая бывшего чемпиона мира) этого сказать нельзя. При этом не учитываются личные вкусы или предпочтения: читатель может подумать, что агент, который предпочитает шоколадным чипсам мороженое "Халапеньо" с добавлением компонентов жевательной резинки, — странный или даже бестолковый тип, но не сможет утверждать, что этот агент нерационален. В функции полезности может быть даже учтена польза от альтруистического поведения просто путем включения оценки благополучия других как одного из факторов, которые вносят вклад в полезность для самого агента.
Предпочтения, будучи выраженными в виде полезности, комбинируются с вероятностями в общей теории рациональных решений, называемой теорией решений, следующим образом:
Теория решений = Теория вероятностей + Теория полезности
Фундаментальная идея теории решений состоит в том, что любой агент является рациональным тогда и только тогда, когда он выбирает действие, позволяющее достичь наибольшей ожидаемой полезности, усредненной по всем возможным результатам данного действия. Это — так называемый принцип максимальной ожидаемой полезности (Maximum Expected Utility — MEU). Мы наблюдали этот принцип в действии в главе 6, когда кратко рассматривали оптимальные решения в нардах, а ниже будет показано, что это — действительно полностью общий принцип.

Материалы

МУЛЬТИАГЕНТНОЕ ПЛАНИРОВАНИЕ

Многотельное планирование

Механизмы координации

Конкуренция

БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ ЗАМЕТКИ

УПРАЖНЕНИЯ

НЕОПРЕДЕЛЕННЫЕ ЗНАНИЯ И РАССУЖДЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

Учет наличия неопределенных знаний

Неопределенность и рациональные решения

Проект агента, действующего в соответствии с теорией решений

ОСНОВНАЯ ВЕРОЯТНОСТНАЯ СИСТЕМА ОБОЗНАЧЕНИЙ

Атомарные события

Условная вероятность

ИСТОКИ ПОНЯТИЯ ВЕРОЯТНОСТИ

АКСИОМЫ ВЕРОЯТНОСТЕЙ

Теоретическое обоснование аксиом вероятностей

ЛОГИЧЕСКИЙ ВЫВОД С ИСПОЛЬЗОВАНИЕМ ПОЛНЫХ СОВМЕСТНЫХ РАСПРЕДЕЛЕНИЙ

НЕЗАВИСИМОСТЬ

ПРАВИЛО БАЙЕСА И ЕГО ИСПОЛЬЗОВАНИЕ

Использование правила Байеса: комбинирование свидетельств

ЕЩЕ ОДНО ВОЗВРАЩЕНИЕ В МИР ВАМПУСА

БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ ЗАМЕТКИ

УПРАЖНЕНИЯ

ВЕРОЯТНОСТНЫЕ РАССУЖДЕНИЯ

СЕМАНТИКА БАЙЕСОВСКИХ СЕТЕЙ

Компактность сети и упорядочение вершин

Отношения условной независимости в байесовских сетях

ЭФФЕКТИВНОЕ ПРЕДСТАВЛЕНИЕ РАСПРЕДЕЛЕНИЙ УСЛОВНЫХ ВЕРОЯТНОСТЕЙ

ТОЧНЫЙ ВЕРОЯТНОСТНЫЙ ВЫВОД В БАЙЕСОВСКИХ СЕТЯХ

Алгоритм устранения переменной

Сложность точного вероятностного вывода

Алгоритмы кластеризации

ПРИБЛИЖЕННЫЙ ВЕРОЯТНОСТНЫЙ ВЫВОД В БАЙЕСОВСКИХ СЕТЯХ

Формирование выборок с исключением в байесовских сетях

Оценка веса с учетом правдоподобия

Вероятностный вывод по методу моделирования цепи Маркова

Обоснование правильности работы алгоритма МСМС

РАСПРОСТРАНЕНИЕ ВЕРОЯТНОСТНЫХ МЕТОДОВ НА ПРЕДСТАВЛЕНИЯ В ЛОГИКЕ ПЕРВОГО ПОРЯДКА

ДРУГИЕ ПОДХОДЫ К ФОРМИРОВАНИЮ РАССУЖДЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

Методы на основе правил для формирования рассуждений в условиях неопределенности

Представление незнания: теория Демпстера—Шеффера

Представление неосведомленности: нечеткие множества и нечеткая логика

БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ ЗАМЕТКИ

УПРАЖНЕНИЯ

ВЕРОЯТНОСТНЫЕ РАССУЖДЕНИЯ ВО ВРЕМЕНИ

ВРЕМЯ И НЕОПРЕДЕЛЕННОСТЬ

Стационарные процессы и марковское предположение

ВЕРОЯТНОСТНЫЙ ВЫВОД ВО ВРЕМЕННЬТХ МОДЕЛЯХ

Фильтрация и предсказание

Сглаживание

Поиск наиболее вероятной последовательности

СКРЫТЫЕ МАРКОВСКИЕ МОДЕЛИ

ФИЛЬТРЫ КАЛМАНА

Разделы

Поцелуй по расчету
Поэма Содди
Задача о сферах
Многомерность
Гость из четвертого измерения
Четырехмерный симплекс
Возможности нового измерения
Эксперимент Цельнера
Геометрия - это интуиция
Ущербность нашего восприятия
Объем - в плоскость
Наш плоский объемный мир
Мебиусиана
Односторонность листа Мебиуса
Топология - из листа Мебиуса
Число Бетти
Хроматический номер
Справа, где сердце
Бутылка Клейна
Мебиус и микромир
Левый и Правый Мебиусы
Эксперимент By Цзянь-сюн
Двухкомпонентная теория нейтрино
Зеркальные двойники
Роль формы
Вселенная искривляется
Тензорный анализ
Теория Вселенной Эйнштейна
Пульс Вселенной
Великолепная пятерка
О божественной пропорции
«Начала» Евклида
Доказательство Эйлера
Символы Шлефли
Гамильтонова линия
Изопиранная задача
Интуиция царицы Дидоны
Как управляется мир
Серьезные игры
Искусство орнамента
Федоровские группы
Игры Эсхера
Симметрии Эсхера
Нефедоровская кристаллография
Мировая гармония
Удавшаяся провокация
«Колючий» ёж Кеплера
Фигура Петри
Теория многогранников
Правильные и почти правильные тела
Песок расширяется!
Кубическая плотная упаковка
Плотность упаковки
Дома на песке
Тайные связи
Музыка сфер
Подкупающая простота
Модели Дончияна
Полезные политопы
Организация пространства
Радость видеть и понимать
Теории Земли
Бейсбольный мяч планеты
Катенаны
Вечный Геометр
Цепь причин и следствий
Счастливый случай
Метод Монте-Карло
Вероятностные методы
Бросаем песчинку
Сходство схем
Задачи распространения тепла
Случайные траектории
Возможности равны
Случай в игре
Игры с таблицей
Новые осложнения
Хуже-лучше
Расшифровка кодов
Роль элемента случайности
Обучение и случайность
Обучение автоматов
«Школьная» схема обучения
Обучение — самообучение
Шаблон поведения
Уметь пользоваться памятью
Опыты И. П. Павлова
Условный рефлекс
Связь между нейронами
Носитель памяти
Механизм образования условного рефлекса
Механизм «вспоминания»
Структура нервной сети
Простой эксперимент
Проблема опознания
Что такое опознание
Зрительные образы
Персептрон
Различаемые образы
Что умеет персептрон
Свойства персептрона
Залог опознания образов
Роль случайности в эволюции
К чему приводят мутации
Естественный отбор
«Безжалостность» законов природы
Приспособление вида
Схема гомеостата
Идея Эшби
Усилитель отбора
Усилитель мыслительных способностей
Схема искусственного отбора
Самонастраивающиеся системы и случайность
Непохожесть систем
Критерий близости к совершенству
Самонастраивающиеся системы
Наладчик сложных систем
Метод компенсации
Как настроить
Устройство автомата
Держим точный размер
Анализ станка-автомата
Обратное воздействие
Способ Гаусса — Зейделя
Анализ настроек
Метод градиента
Метод случайной настройки
Метод случайного поиска
Программа случайного поиска
Схема случайного поиска
Самонастраивающаяся система
Источник неограниченных возможностей

Искусственный интеллект. Современный подход