Бинокулярные стереоданные

Большинство позвоночных имеют два глаза. Это не только удобно в качестве резерва на случай потери одного глаза, но и дает также некоторые другие преимущества. У многих травоядных глаза расположены по обе стороны головы, что позволяет им иметь более широкий обзор. С другой стороны, у хищников глаза находятся в передней части головы, благодаря чему они используют бинокулярные стереоданные. Принцип бинокулярного зрения аналогичен принципу, в котором используется параллакс, возникающий во время движения, за тем исключением, что вместо использования изображений, сменяющихся во времени, применяются два изображения (или, в случае систем машинного зрения, и большее количество изображений), которые разделены в пространстве; например, такие изображения передают в мозг глаза человека, смотрящего прямо вперед. Поскольку данная конкретная характеристика в сцене будет находиться в различных местах по отношению к оси z каждой плоскости изображения, то после совмещения двух изображений будет обнаруживаться рассогласование в местонахождениях этой характеристики в двух изображениях. Такое явление можно наблюдать на рис. 24.10, где ближайшая точка пирамиды сдвинута влево на правом изображении и вправо на левом изображении.
Проанализируем геометрические соотношения между рассогласованием и глубиной. Прежде всего рассмотрим случай, в котором оба глаза (или обе видеокамеры) направлены прямо вперед, поэтому их оптические оси параллельны. В таком случае связь между изображением в правой и в левой видеокамере состоит в том, что для преобразования одного изображения в другое достаточно выполнить сдвиг вдоль оси х на величину Ь (расстояние между камерами, или опорная линия). Для вычисления рассогласований по горизонтали и вертикали, которые выражаются в виде H=vxAt, V=vyAt, можно использовать уравнения оптического потока из предыдущего раздела, при условии, что ТХ=Ь/Д t и Ty=Tz = 0. Параметры вращательного сдвига ю*, % и ooz равны нулю. Таким образом, Н=Ь/Z, V=0. Иными словами, рассогласование по горизонтали равно отношению длины опорной линии к глубине, а рассогласование по вертикали равно нулю.
При нормальных условиях наблюдения люди фиксируют свой взгляд; это означает, что они выбирают в качестве объекта наблюдения некоторую точку в сцене, и в этой точке пересекаются оптические оси двух глаз. На рис. 24.11 показана ситуация, в которой взгляд человека, смотрящего двумя глазами, зафиксирован в точке Р0, находящейся на расстоянии z от средней точки между глазами. Для удобства мы будем вычислять угловое рассогласование, измеряемое в радианах. Рассогласование в точке фиксации р0 равно нулю. Для некоторой другой точки р в сцене, которая находится дальше на величину 5z, можно вычислить угловые смещения левого и правого изображений точки р, которые будут обозначаться соответственно PL и PR. Если каждое из этих изображений смещено на угол 50/2 относительно р0, то смещение между PL и PR, которое представляет собой рассогласование в точке Р, выражается величиной 50. Простые геометрические преобразования позволяют получить следующее выражение:
У людей величина Ь базисная линия) составляет около 6 см. Предположим, что расстояние z примерно равно 100 см. В таком случае наименьшее доступное обнаружению значение 50 (соответствующее размеру светочувствительного элемента глаза) составляет около 5 угловых секунд, а это означает, что разность расстояний 5z равна 0,4 мм. При Z=3 0 см получим значение 5z=0.036 мм, которое на удивление мало. Это означает, что на расстоянии 30 см люди способны различать значения глубины, которые отличаются друг от друга на столь малую величину, как 0,036 мм, что позволяет им продевать нитку через ушко иголки и выполнять другие тонкие операции.







Материалы

Яндекс.Метрика