Свойства показателей стоимости информации

Напрашивается очевидный вопрос— возможно ли, чтобы информация была вредной, иными словами, может ли она фактически иметь отрицательную ожидаемую стоимость? Интуитивно ясно, что такая ситуация невозможна. В конечном итоге в наихудшем случае можно просто проигнорировать ненужную информацию и сделать вид, как будто она так и не была получена. Данное интуитивное представление подтверждается приведенной ниже теоремой, которая относится к любому агенту, действующему на основе теории принятия решений.
Стоимость информации является неотрицательной:
\/j,E VPIE{Ej)> О
Эта теорема следует непосредственно из определения свойства VPI, и мы оставляем доказательство этой теоремы читателю в качестве упражнения (упр. 16.12). Важно помнить, что свойство VPI зависит от текущего состояния информации, именно поэтому в формулировке данной теоремы это свойство обозначено подстрочным индексом. Значение VPI по мере получения дополнительной информации может изменяться. В крайнем случае оно может стать равным нулю, если рассматриваемая переменная уже имеет известное значение. Таким образом, свойство VPI не аддитивно. Это означает, что справедливо следующее соотношение:
VPIE{Ej, Ek) * VPIE{Ej) + VPIE(Ek) (в общем случае)
Но свойство VPI не зависит от порядка рассматриваемых в нем переменных, что должно быть интуитивно ясно. Это означает, что справедливо такое соотношение:
VPIE(Ej,Ek) = VPIE(Ej) + VPIElE.(Ek) = VPIE(Ek) + VPIEfEk(Ej)
В силу того, что действия по восприятию не зависят от последовательности их выполнения, они отличаются от обычных действий, а задача вычисления значения последовательности действий по восприятию упрощается.
Реализация агента, действующего на основе сбора информации
Успешно действующий агент должен задавать вопросы пользователю в приемлемом порядке, не требовать ответов на вопросы, не относящиеся к делу, учитывать важность каждого фрагмента информации применительно к стоимости его получения и прекращать задавать вопросы, когда сложившаяся обстановка требует перехода к другим действиям. Все эти возможности можно воплотить в проекте агента, используя в качестве критерия стоимость информации.
В листинге 16.1 показан общий проект агента, который способен осуществлять интеллектуальный сбор информации, прежде чем приступать к действиям. На данный момент мы будем предполагать, что с каждой наблюдаемой переменной свидетельства Ej связана соответствующая стоимость Cost (Ej), которая отражает стоимость получения этого свидетельства с помощью проведения тестов, организации консультаций, получения ответов на дополнительные вопросы или других подобных действий. Агент запрашивает фрагменты информации, которые представляются для него наиболее ценными по сравнению с их стоимостью. Предполагается, что результатом действия по осуществлению запроса Request (Ej) является то, что следующий результат восприятия предоставляет значение Ej. А если ни одно наблюдение не оправдывает его стоимость, агент выбирает "реальное" действие.
Листинг 16.1. Проект простого агента, действующего на основе сбора информации. Этот агент функционирует, снова и снова выбирая наблюдение с наивысшим информационным значением, до тех пор, пока стоимость следующего наблюдения не станет выше по сравнению с ожидаемой от него пользой
function Information-Gathering-Agent(percept) returns действие action static: D, сеть принятия решений
включить данные о восприятии percept в сеть D
j <— значение, максимизирующее выражение VPJ(Ej)-Cost(Ej)
if VPI{Ej) > Cost(Ej)
then return Request(Ej) else return наилучшее действие из D
Описанный здесь алгоритм агента реализует один из подходов к сбору информации, называемый близоруким. Это связано с тем, что в данном подходе формула VPI используется без дальновидных расчетов и значение информации определяется так, как будто было бы достаточно получить значение единственной переменной свидетельства. А если нет ни одной переменной свидетельства, которая оказала бы значительную помощь, близорукий агент может преждевременно приступить к действиям, тогда как было бы лучше вначале запросить значения еще двух или нескольких переменных и только после этого начинать действовать. Близорукие методы управления основаны на той же эвристической идее, что и жадный поиск, и часто хорошо работают на практике (например, было показано, что подобные системы управления превосходят по своей производительности опытных врачей, когда речь идет о подборе необходимых диагностических тестов). Но агент, действующий на основе сбора информации, который является идеально рациональным, должен рассматривать все возможные последовательности информационных запросов, приводящие к внешнему действию, а также все возможные результаты этих запросов. Поскольку содержание второго запроса зависит от результатов первого запроса, агент должен исследовать пространство условных планов.







Материалы

Яндекс.Метрика