МУЛЬТИАГЕНТНОЕ ПЛАНИРОВАНИЕ

До сих пор нам приходилось иметь дело только с одноагентными вариантами среды, в которых рассматриваемый агент действует в одиночестве. А если в этой среде есть также другие агенты, наш агент может просто включить их в свою модель среды, не изменяя своих основных алгоритмов. Но во многих случаях такой подход приводит к низкой производительности, поскольку взаимодействие с другими агентами во многом отличается от взаимодействия с природой. В частности, природа (как обычно принято считать) безразлична к намерениям агента15, а другие агенты — нет. В данном разделе приведены основные сведения о мультиагентном планировании, которое предназначено для решения указанных проблем.
Как было показано в главе 2, мультиагентные варианты среды могут быть кооперативными или конкурентными. Начнем с простого кооперативного примера: планирование действий команды в парном теннисе. Для определения действий обоих игроков в команде могут быть составлены планы; в этом разделе будут описаны методы эффективного формирования таких планов. Эффективно сформированный план полезен, но не гарантирует успеха; прежде всего агенты должны согласиться использовать один и тот же план! Для этого требуется определенная форма координации, которая может быть достигнута с помощью общения.
Кооперация: совместные цели и планы
Два агента, играющие в одной команде в парный теннис, имеют единую цель — выиграть матч, что приводит к возникновению различных подцелей. Предположим, что в какой-то момент игры они имеют общую цель — отбить мяч, который направлен на их половину поля, и обеспечить, чтобы по меньшей мере один из них играл под сеткой. Мы можем представить это общее намерение в виде задачи мультиагентного планирования, как показано в листинге 12.7.
Листинг 12.7. Задача игры в парный теннис. Два агента играют в одной команде и могут присутствовать в одном из четырех мест: [Left,Baseline] (слева, у задней линии), [Right, Baseline] (справа, у задней линии), [Left, Net] (слева, под сеткой) и [Right, Net] (справа, под сеткой). Мяч может быть отбит, если в нужном месте находится один и только один игрок
Agents(А, В)
Init(At(A, [Left, Baseline]) л At(В, [Right, Net]) л
Approaching{Ball, [Right, Baseline])) л Partner(A,B) л Partner(B,A) Goal(Returned(Ball) л At(agent, [x, Net]))
Action(Hit(agent, Ball),
Precond: Approaching (Ball, [x, у] ) л At(agent, [x, у] ) л Partner (agent, partner) л —At (partner, [x,y] ) ,
Effect: Returned(Ball)) Action(Go(agent, [x, y] ) ,
Precond: At(agent, [a, b]),
Effect: At(agent, [x,y]) л —At(agent, [a, b]))
В этой постановке задачи применяются два новых средства. Во-первых, в высказывании Agents {А, В) объявляется, что в плане участвуют два агента, Аи В (по условиям данной задачи противостоящие им игроки не рассматриваются как агенты). Во-вторых, в каждом действии в качестве формального параметра упоминается агент, поскольку нам необходимо следить за тем, что делает каждый агент.
Решением мультиагентной задачи планирования является совместный план (joint plan), состоящий из действий для каждого агента. Совместный план представляет собой решение, если цель будет достигнута при условии, что каждый агент выполнит назначенные ему действия. Решением данной задачи игры в теннис является приведенный ниже план.
Plan 1:
A: [Go{A, [Right, Baseline]), Hit{A, Ball)] В: [NoOp{В), NoOp(В)]
Если оба агента имеют одинаковую базу знаний и если это решение является единственным, то все сложится идеально; каждый из агентов сможет определить это решение, а затем совместно выполнить его. Но к большому сожалению для этих агентов (и мы вскоре увидим, почему им приходится об этом сожалеть), существует другой план, позволяющий так же успешно достичь цели, как и первый:
Plan 2:
A: [Go(A, [Left, Net]),, NoOp(A)]
В: [Go{B, [Right, baseline]), Hit(B, Ball)]
Если агент А выберет план 2, а агент В — план 1, то никто из них не отобьет мяч. И наоборот, если агент А выберет план 1, а агент В— план 2, то они, вероятно, столкнутся друг с другом; ни один из них не отобьет мяч, и к тому же пространство под сеткой может остаться неприкрытым. Поэтому само существование правильных совместных планов еще не означает, что цель будет достигнута. Агентам нужен некоторый механизм координации для достижения одного и того же совместного плана; более того, оба агента должны обладать общими знаниями (см. главу 10) о том, что должен быть выполнен некоторый конкретный совместный план.

Материалы

МУЛЬТИАГЕНТНОЕ ПЛАНИРОВАНИЕ

Многотельное планирование

Механизмы координации

Конкуренция

БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ ЗАМЕТКИ

УПРАЖНЕНИЯ

НЕОПРЕДЕЛЕННЫЕ ЗНАНИЯ И РАССУЖДЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

Учет наличия неопределенных знаний

Неопределенность и рациональные решения

Проект агента, действующего в соответствии с теорией решений

ОСНОВНАЯ ВЕРОЯТНОСТНАЯ СИСТЕМА ОБОЗНАЧЕНИЙ

Атомарные события

Условная вероятность

ИСТОКИ ПОНЯТИЯ ВЕРОЯТНОСТИ

АКСИОМЫ ВЕРОЯТНОСТЕЙ

Теоретическое обоснование аксиом вероятностей

ЛОГИЧЕСКИЙ ВЫВОД С ИСПОЛЬЗОВАНИЕМ ПОЛНЫХ СОВМЕСТНЫХ РАСПРЕДЕЛЕНИЙ

НЕЗАВИСИМОСТЬ

ПРАВИЛО БАЙЕСА И ЕГО ИСПОЛЬЗОВАНИЕ

Использование правила Байеса: комбинирование свидетельств

ЕЩЕ ОДНО ВОЗВРАЩЕНИЕ В МИР ВАМПУСА

БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ ЗАМЕТКИ

УПРАЖНЕНИЯ

ВЕРОЯТНОСТНЫЕ РАССУЖДЕНИЯ

СЕМАНТИКА БАЙЕСОВСКИХ СЕТЕЙ

Компактность сети и упорядочение вершин

Отношения условной независимости в байесовских сетях

ЭФФЕКТИВНОЕ ПРЕДСТАВЛЕНИЕ РАСПРЕДЕЛЕНИЙ УСЛОВНЫХ ВЕРОЯТНОСТЕЙ

ТОЧНЫЙ ВЕРОЯТНОСТНЫЙ ВЫВОД В БАЙЕСОВСКИХ СЕТЯХ

Алгоритм устранения переменной

Сложность точного вероятностного вывода

Алгоритмы кластеризации

ПРИБЛИЖЕННЫЙ ВЕРОЯТНОСТНЫЙ ВЫВОД В БАЙЕСОВСКИХ СЕТЯХ

Формирование выборок с исключением в байесовских сетях

Оценка веса с учетом правдоподобия

Вероятностный вывод по методу моделирования цепи Маркова

Обоснование правильности работы алгоритма МСМС

РАСПРОСТРАНЕНИЕ ВЕРОЯТНОСТНЫХ МЕТОДОВ НА ПРЕДСТАВЛЕНИЯ В ЛОГИКЕ ПЕРВОГО ПОРЯДКА

ДРУГИЕ ПОДХОДЫ К ФОРМИРОВАНИЮ РАССУЖДЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

Методы на основе правил для формирования рассуждений в условиях неопределенности

Представление незнания: теория Демпстера—Шеффера

Представление неосведомленности: нечеткие множества и нечеткая логика

БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ ЗАМЕТКИ

УПРАЖНЕНИЯ

ВЕРОЯТНОСТНЫЕ РАССУЖДЕНИЯ ВО ВРЕМЕНИ

ВРЕМЯ И НЕОПРЕДЕЛЕННОСТЬ

Стационарные процессы и марковское предположение

ВЕРОЯТНОСТНЫЙ ВЫВОД ВО ВРЕМЕННЬТХ МОДЕЛЯХ

Фильтрация и предсказание

Сглаживание

Поиск наиболее вероятной последовательности

СКРЫТЫЕ МАРКОВСКИЕ МОДЕЛИ

ФИЛЬТРЫ КАЛМАНА

Разделы

Поцелуй по расчету
Поэма Содди
Задача о сферах
Многомерность
Гость из четвертого измерения
Четырехмерный симплекс
Возможности нового измерения
Эксперимент Цельнера
Геометрия - это интуиция
Ущербность нашего восприятия
Объем - в плоскость
Наш плоский объемный мир
Мебиусиана
Односторонность листа Мебиуса
Топология - из листа Мебиуса
Число Бетти
Хроматический номер
Справа, где сердце
Бутылка Клейна
Мебиус и микромир
Левый и Правый Мебиусы
Эксперимент By Цзянь-сюн
Двухкомпонентная теория нейтрино
Зеркальные двойники
Роль формы
Вселенная искривляется
Тензорный анализ
Теория Вселенной Эйнштейна
Пульс Вселенной
Великолепная пятерка
О божественной пропорции
«Начала» Евклида
Доказательство Эйлера
Символы Шлефли
Гамильтонова линия
Изопиранная задача
Интуиция царицы Дидоны
Как управляется мир
Серьезные игры
Искусство орнамента
Федоровские группы
Игры Эсхера
Симметрии Эсхера
Нефедоровская кристаллография
Мировая гармония
Удавшаяся провокация
«Колючий» ёж Кеплера
Фигура Петри
Теория многогранников
Правильные и почти правильные тела
Песок расширяется!
Кубическая плотная упаковка
Плотность упаковки
Дома на песке
Тайные связи
Музыка сфер
Подкупающая простота
Модели Дончияна
Полезные политопы
Организация пространства
Радость видеть и понимать
Теории Земли
Бейсбольный мяч планеты
Катенаны
Вечный Геометр
Цепь причин и следствий
Счастливый случай
Метод Монте-Карло
Вероятностные методы
Бросаем песчинку
Сходство схем
Задачи распространения тепла
Случайные траектории
Возможности равны
Случай в игре
Игры с таблицей
Новые осложнения
Хуже-лучше
Расшифровка кодов
Роль элемента случайности
Обучение и случайность
Обучение автоматов
«Школьная» схема обучения
Обучение — самообучение
Шаблон поведения
Уметь пользоваться памятью
Опыты И. П. Павлова
Условный рефлекс
Связь между нейронами
Носитель памяти
Механизм образования условного рефлекса
Механизм «вспоминания»
Структура нервной сети
Простой эксперимент
Проблема опознания
Что такое опознание
Зрительные образы
Персептрон
Различаемые образы
Что умеет персептрон
Свойства персептрона
Залог опознания образов
Роль случайности в эволюции
К чему приводят мутации
Естественный отбор
«Безжалостность» законов природы
Приспособление вида
Схема гомеостата
Идея Эшби
Усилитель отбора
Усилитель мыслительных способностей
Схема искусственного отбора
Самонастраивающиеся системы и случайность
Непохожесть систем
Критерий близости к совершенству
Самонастраивающиеся системы
Наладчик сложных систем
Метод компенсации
Как настроить
Устройство автомата
Держим точный размер
Анализ станка-автомата
Обратное воздействие
Способ Гаусса — Зейделя
Анализ настроек
Метод градиента
Метод случайной настройки
Метод случайного поиска
Программа случайного поиска
Схема случайного поиска
Самонастраивающаяся система
Источник неограниченных возможностей

Искусственный интеллект. Современный подход