ВОСПРИЯТИЕ, ОСУЩЕСТВЛЯЕМОЕ РОБОТАМИ

Робототехническое восприятие — это процесс, в ходе которого роботы отображают результаты сенсорных измерений на внутренние структуры представления среды. Задача восприятия является сложной, поскольку информация, поступающая от датчиков, как правило, зашумлена, а среда является частично наблюдаемой, непредсказуемой и часто динамической. В качестве эмпирического правила можно руководствоваться тем, что качественные внутренние структуры представления обладают тремя свойствами: содержат достаточно информации для того, чтобы робот мог принимать правильные решения, построены так, чтобы их можно было эффективно обновлять, и являются естественными в том смысле, что внутренние переменные соответствуют естественным переменным состояния в физическом мире.
В главе 15 было показано, что модели перехода и восприятия для частично наблюдаемой среды могут быть представлены с помощью фильтров Калмана, скрытых марковских моделей и динамических байесовских сетей; кроме того, в указанной главе были описаны и точные, и приближенные алгоритмы обновления доверительного состояния — распределения апостериорных вероятностей по переменным состояния среды. К тому же в главе 15 было приведено несколько динамических моделей байесовских сетей для этого процесса. А при решении робототехнических задач в модель в качестве наблюдаемых переменных обычно включают собственные прошлые действия робота (пример такой сети см. на рис. 17.7). На рис. 25.5 показана система обозначений, используемая в данной главе: xt — это состояние среды (включая робот) во время t; zt — результаты наблюдений, полученные во время t; At — действие, предпринятое после получения этих результатов наблюдения.
Задача фильтрации, или обновления доверительного состояния, по сути является такой же, как и в главе 15. Эта задача состоит в том, что должно быть вычислено новое доверительное состояние Р (xt+11 z1:tAl, a1:t) на основании текущего доверительного состояния Р (xt I z1:t, a1:t-1) и нового наблюдения zt+1. Принципиальные различия по сравнению с указанной главой состоят в следующем: во-первых, результаты вычислений явно обусловлены не только действиями, но и наблюдениями, и, во-вторых, теперь приходится иметь дело с непрерывными, а не с дискретными переменными. Таким образом, необходимо следующим образом откорректировать рекурсивное уравнение фильтрации (15.3) для использования в нем интеграции, а не суммирования:
Это уравнение показывает, что апостериорное распределение вероятностей по переменным состояния х во время t+1 вычисляется рекурсивно на основании соответствующей оценки, полученной на один временной шаг раньше.
В этих вычислениях участвуют данные о предыдущем действии at и о текущих сенсорных измерениях zt+1. Например, если цель заключается в разработке робота, играющего в футбол, то xt+1 может представлять местонахождение футбольного мяча относительно робота. Распределение апостериорных вероятностей Р (Xt | z1:t, а1: t_i) — это распределение вероятностей по всем состояниям, отражающее все, что известно о прошлых результатах сенсорных измерений и об управляющих воздействиях. Уравнение 25.1 показывает, как рекурсивно оценить это местонахождение, инкрементно развертывая вычисления и включая в этот процесс данные сенсорных измерений (например, изображения с видеокамеры) и команды управления движением робота. Вероятность Р (xt+11 xt, at) называется моделью перехода, или моделью движения, а вероятность Р (zt+11 xt+i) представляет собой модель восприятия.







Материалы

Яндекс.Метрика