МИР ВАМПУСА

Мир вампуса — это пещера, состоящая из залов, соединенных проходами. Где-то по этой пещере бродит вампус — страшный зверь, который поедает всех, кто входит в зал, где он находится. Вампус может быть убит агентом, но у агента есть только одна стрела. В некоторых залах есть бездонные ямы, в которые попадают все, кто проходит через эти залы (все кроме вампуса, который слишком велик для того, чтобы в них провалиться). Единственное, что утешает живущих в этой среде, — это возможность найти кучу золота. Хотя мир вампуса является довольно скромным с точки зрения современных стандартов компьютерных игр, он представляет собой превосходную испытательную среду для интеллектуальных агентов. Первым, кто предложил использовать мир вампуса для такой цели, был Майкл Генезерет.
Пример мира вампуса показан на рис. 7.1. Точное определение среды этой задачи, соответствующее требованиям, которые приведены в главе 2, дано с помощью следующего описания PEAS.
• Показатели производительности. За то, что агент находит золото, он получает + 1000 очков, за то, что агент попадает в яму или его съедает вампус, ему назначается -1000 очков, он отдает -1 очко за каждое выполненное действие и -10 очков — за использование стрелы.
• Среда. Залы расположены в виде решетки 4x4. Агент всегда начинает движение с квадрата, обозначенного как [1,1], и смотрит вправо. Местонахождения золота и вампуса выбираются случайным образом с равномерным распределением из числа квадратов, отличных от начального квадрата. Кроме того, в каждом квадрате, отличном от начального, с вероятностью 0,2 может находиться яма.
• Исполнительные механизмы. Агент может двигаться вперед, поворачиваться влево и вправо на 9 0°. Агент погибает жалкой смертью, если входит в квадрат, где имеется яма или живой вампус. (Входить в квадрат с мертвым вампусом безопасно, но при этом приходится чувствовать неприятный запах.) Попытка продвижения вперед остается безрезультатной, если перед агентом находится стена. Чтобы схватить объект, находящийся в том же квадрате, где находится агент, можно воспользоваться действием Grab. С помощью действия Shoot можно пустить стрелу по прямой линии в том направлении, куда смотрит агент. Стрела продолжает движение до тех пор, пока она либо не попадет в вампуса (и убьет его), либо не ударится в стену. У агента имеется только одна стрела, поэтому какой-либо эффект оказывает лишь первое действие Shoot.
• Датчики. У агента имеется пять датчиков, каждый из которых сообщает только один элемент информации:
• в квадрате, где находится вампус, а также в квадратах, непосредственно (а не по диагонали) соседних по отношению к этому квадрату, агент чувствует неприятный запах (восприятие Stench);
• в квадратах, непосредственно соседних с ямой, агент будет чувствовать ветерок (восприятие Breeze);
• в квадрате, где находится золото, агент видит блеск (восприятие Glit ter);
• когда агент наталкивается на стену, он чувствует удар (восприятие Bump).
• перед тем как пораженный стрелой вампус умирает, он испускает жалобный крик, который разносится по всей пещере (восприятие Scream).
Результаты актов восприятия передаются агенту в форме списка из пяти символов; например, если есть неприятный запах и ветерок, но нет блеска, удара или крика, агент воспринимает результаты акта восприятия [Stench, Breeze, None, None, None].
В упр. 7.1 предлагается определить среду вампуса в соответствии с различными измерениями, приведенными в главе 2. Основная сложность для данного агента состоит в том, что он с самого начала не знает конфигурацию своей среды; по-видимому, для преодоления этого незнания нельзя обойтись без логических рассуждений. В большинстве экземпляров мира вампуса для агента существует возможность безопасно получить золото. Но иногда агенту приходится выбирать: вернуться ли домой с пустыми руками или рисковать жизнью, чтобы найти золото. Около 21% вариантов среды являются совершенно неблагоприятными, поскольку золото находится в яме или окружено ямами.
Проследим за агентом для мира вампуса, действующим на основе знаний, который изучает среду, показанную на рис. 7.1. Первоначальная база знаний агента содержит правила существования в этой среде, которые были описаны выше; в частности, агент знает, что находится в квадрате [1,1] и что квадрат [1,1] является безопасным. Мы увидим, как расширяются знания агента по мере того, как поступают результаты новых актов восприятия и выполняются действия.
Первым восприятием является [None, None, None, None, None], на основании которого агент может сделать вывод, что соседние по отношению к нему квадраты являются безопасными. На рис. 7.2, а показано состояние знаний агента в этот момент. Мы будет перечислять (некоторые) высказывания из базы знаний с использованием буквенных обозначений, таких как В (чувствуется ветерок) и ОК (безопасно — ни ямы, ни вампуса), проставленных в соответствующих квадратах. С другой стороны, на рис. 7.1 изображен сам этот мир.
На основании того факта, что в квадрате [1,1] не было ни неприятного запаха, ни ветерка, агент может сделать вывод, что квадраты [1,2] и [2,1] свободны от опасности. Для указания этого они отмечены обозначением ОК. Осторожный агент переходит только в такой квадрат, о котором известно, что в нем есть отметка ОК Предположим, что агент решил двинуться вперед, в квадрат [2,1], и была создана сцена, показанная на рис. 7.2, б.
Агент обнаруживает ветерок в квадрате [2,1], поэтому в одном из соседних квадратов должна быть яма. По правилам игры яма не может находиться в квадрате [1,1], поэтому она должна быть в квадрате [2,2], или [3,1], или в том и другом. Обозначение Р? на рис. 7.2, б указывает на возможность наличия ямы в этих квадратах. В данный момент известен только один квадрат с отметкой ОК, который еще не был посещен. Поэтому благоразумный агент поворачивается кругом и возвращается в квадрат [ 1,1 ], а затем переходит в квадрат [1,2].
Новым восприятием в квадрате [1,2] является [ Stench, None, None, None, None], что приводит к состоянию знаний, показанному на рис. 7.3, а. Наличие неприятного запаха в квадрате [1,2] означает, что где-то рядом есть вампус. Но вампус не может находиться в квадрате [1,1] по правилам игры и не может быть в квадрате [2,2] (поскольку агент обнаружил бы неприятный запах, находясь в квадрате [2,1]). Поэтому агент может сделать вывод, что вампус находится в квадрате [1,3]. На это указывает обозначение W!. К тому же из отсутствия восприятия Breeze в квадрате [1,2] следует, что в квадрате [2,2] нет ямы. Тем не менее мы уже пришли к выводу, что яма должна быть в квадрате [2,2] или [3,1], а это означает, что она действительно находится в квадрате [3,1]. Это — весьма сложный логический вывод, поскольку в нем объединяются знания, полученные в разное время в различных местах, и в нем решение о выполнении важного шага сделано на основании отсутствия определенного восприятия. Такой логический вывод превосходит способности большинства животных, но является типичным для рассуждений такого рода, которые выполняются логическими агентами.
Теперь агент доказал сам себе, что в квадрате [2,2] нет ни ямы, ни вампуса, поэтому может обозначить этот квадрат меткой ОК, чтобы в него перейти. Мы не показываем состояние знаний агента в квадрате [ 2, 2 ], а просто предполагаем, что агент повернулся и перешел в квадрат [2 , 3 ], в результате чего было получено состояние, показанное на рис. 7.3, о'. В квадрате [2,3] агент обнаруживает блеск, поэтому должен схватить золото и тем самым закончить игру.
В каждом случае, когда агент выводит заключение из доступной ему информации, гарантируется правильность этого заключения, если доступная информация является правильной. В этом состоит фундаментальное свойство логических рассуждений. В оставшейся части данной главы будет показано, как создавать логических агентов, которые могут представлять необходимую информацию и делать выводы, описанные в предыдущих абзацах.
В этом разделе приведен краткий обзор всех фундаментальных понятий, касающихся логических представлений и рассуждений. Описание конкретных сведений о какой-либо определенной форме логики откладывается до следующего раздела. Вместо этого в данном разделе используются неформальные примеры из мира вампуса и из знакомой всем области арифметики. Авторы приняли такой довольно необычный подход, поскольку идеи логики являются гораздо более универсальными и привлекательными, чем обычно предполагается.
В разделе 7.1 было указано, что базы знаний состоят из высказываний. Эти высказывания выражаются в соответствии с синтаксисом языка представления, который определяет форму всех высказываний, рассматриваемых как построенные правильно. Понятие синтаксиса является достаточно очевидным в обычной арифметике: "х+у=4" — правильно построенное высказывание, а "х2у+=" — нет. Синтаксис логических языков (и арифметики в том числе) обычно формируется так, чтобы с его помощью было удобно писать статьи и книги. Существуют буквально десятки различных форм представления синтаксиса; в некоторых из них используются греческие буквы и сложные математические символы, а в других — довольно привлекательные на вид схемы со стрелками и кружками. Однако во всех случаях высказывания в базе знаний агента представляют собой реальные физические конфигурации (части) агента. Формирование рассуждений сводится к выработке этих конфигураций и манипулированию ими.
Логика должна также определять семантику языка. Говоря неформально, семантика касается "смысла" высказываний. В логике это определение становится более точным. Семантика языка определяет истинность каждого высказывания применительно к каждому из возможных миров. Например, обычная семантика, принятая в арифметике, определяет, что высказывание "х+у=4" истинно в мире, где хравно 2 и у равно 2, но ложно в мире, где хравно1 1 и у равно 1. В стандартной логике каждое высказывание должно быть либо истинным, либо ложным в каждом из возможных миров — в ней не может быть2 каких-либо "промежуточных состояний".
В дальнейшем, если потребуется уточнить какое-то определение, то вместо выражения один из "возможных миров" будет использоваться термин модель. (Кроме того, для указания на то, что высказывание а является истинным в модели т9







Материалы

Яндекс.Метрика