ОПЕРАЦИИ, ВЫПОЛНЯЕМЫЕ НА ПЕРВОМ ЭТАПЕ ОБРАБОТКИ ИЗОБРАЖЕНИЯ
Как было указано выше, свет, отражаясь от объектов в сцене, формирует изображение, состоящее, скажем, из пяти миллионов трехбайтовых пикселов. Как и при использовании датчиков всех других типов, полученный сигнал содержит шум, но в данном случае ситуация усугубляется тем, что объем полученных данных очень велик. В этом разделе будет показано, что можно сделать с данными изображения для того, чтобы упростить их обработку. Вначале рассмотрим операции сглаживания изображения, позволяющие уменьшить шум, а также операции, позволяющие обнаруживать края участков на изображении. Эти операции называются операциями "предварительной обработки" или операциями "низкого уровня", поскольку они стоят на первом месте в конвейере операций. Визуальные операции предварительной обработки характеризуются тем, что выполняются локально (они могут применяться лишь к одному участку изображения без учета того, что есть еще какие-то другие участки изображения, пусть даже находящиеся на расстоянии всего нескольких пикселов), а также тем, что в них не требуются знания: для сглаживания изображения и обнаружения краев не нужно задумываться над тем, какие объекты представлены на изображениях. Благодаря этому операции низкого уровня вполне могут быть реализованы с помощью параллельных обрабатывающих средств либо в живом организме, либо в электронном устройстве. Затем мы рассмотрим одну операцию среднего уровня — операцию сегментации изображения на участки. Операции на этом этапе все еще применяются к изображению, а не ко всей сцене, но уже появляются элементы нелокальной обработки.
Как было указано в разделе 15.2, под сглаживанием подразумевается предсказание значения переменной состояния в некоторый момент времени t в прошлом при наличии свидетельств, полученных, начиная с момента времени t и заканчивая всеми другими значениями времени вплоть до настоящего момента. Теперь мы применим такую же идею, но не во временной проблемной области, а в пространственной, и будем трактовать процесс сглаживания как предсказание значения данного конкретного пиксела, если известны значения окружающих его пикселов. Следует отметить, что необходимо четко понимать, каково различие между наблюдаемым значением, измеренным для какого-то пиксела, и истинным значением, которое в действительности должно было быть измерено в этом пикселе. Они могут быть разными из-за случайных ошибок измерений или из-за систематического отказа, поскольку может оказаться, что в этой точке неисправен элемент матрицы CCD.
Один из способов сглаживания изображения состоит в том, чтобы каждому пикселу присваивалось среднее значение характеристик его соседних пикселов. Такой способ обработки, как правило, исключает экстремальные значения. Но остается открытым вопрос: сколько нужно рассмотреть соседних пикселов — один, два или больше? Ответ на этот вопрос заключается в том, что для исключения гауссова шума следует рассчитать взвешенное среднее с использованием фильтра с гауссовой характеристикой. Напомним, что гауссова функция со среднеквадратичным отклонением а выражается следующими формулами:
Под применением фильтра с гауссовой характеристикой подразумевается замена значения интенсивности Т(х0/у0) суммой по всем (х,у) пикселам значений I(х,у) Ga{d), где d— расстояние от (х0/у0) до {х,у). Такого рода взвешенная сумма применяется так часто, что для нее предусмотрено особое название и обозначение. Считается, что функция h представляет собой свертку двух функций, f ид (обозначается как h=f*g), если имеют место следующие соотношения:
Поэтому операция сглаживания осуществляется путем формирования свертки изображения и гауссова распределения, l*GCT. Значение а, равное 1 пикселу, является достаточным для сглаживания шума с небольшой интенсивностью. Если же значение а соответствует 2 пикселам, то происходит сглаживание шума с большей интенсивностью, но теряются некоторые мелкие детали. Поскольку влияние гауссова распределения уменьшается с расстоянием, на практике можно заменить пределы ±оо в суммах значениями, примерно равными ±3а.