Проект агента, действующего в соответствии с теорией решений

Набросок структуры агента, который использует теорию решений для выбора действий, приведен в листинге 13.1. На некотором уровне абстракции этот агент идентичен логическому агенту, описанному в главе 7. Основное различие состоит в том, что знания о текущем состоянии агента, действующего в соответствии с теорией решений, являются неопределенными; .доверительное состояние этого агента является представлением вероятностей всех возможных фактических состояний мира. Со временем агент накапливает больше свидетельств и его доверительное состояние изменяется. На основании своего доверительного состояния агент может делать вероятностные предсказания результатов действий и поэтому выбирать действие с наивысшей ожидаемой полезностью. В настоящей и следующей главах изложение в основном сосредоточивается на задаче представления и вычисления с учетом вероятностной информации в целом. Глава 15 посвящена описанию методов решения конкретных задач представления и обновления доверительного состояния, а также задач предсказания обстановки в среде. В главе 16 более подробно рассматривается теория полезности, а в главе 17 разрабатываются алгоритмы, применяемые для принятия сложных решений.
Листинг 13.1. Агент, действующий на основании теории решений, который выбирает рациональные действия. Этапы работы этого алгоритма подробно описываются в следующих пяти главах
function DT-Agent{percept) returns действие action
static: belief_state, доверительное состояние - вероятностные
убеждения, касающиеся текущего состояния мира action, действие агента
обновить доверительное состояние belief_state с учетом действия
action и восприятия percept вычислить результирующие вероятности для действий actions
на основании описаний действий action и текущего доверительного
состояния belief_state выбрать действие action с наивысшей ожидаемой полезностью
с учетом вероятностей результатов и информации о полезности return action







Материалы

Яндекс.Метрика