+ -
0
Текстура поверхности
В течение последних тридцати лет существенное внимание уделялось представлению о том, что текстура поверхности может служить источником важной информации о геометрических свойствах видимых поверхностей. Основным стимулом, вызвавшим интерес к этой идее, возможно, послужила гипотеза, сформулированная Гибсоном и утверждавшая, что с математиеской и психологической точек зрения текстура является стимулом, достаточным для восприятия поверхности. Утверждая это, он имел в виду, что монокулярное изображение некоторой текстурированной поверхности содержит достаточно информации, для того чтобы можно было однозначно определять расстояние до точек поверхности и устанавливать ее локальную ориентацию. Более того, он утверждал, что такая информация может использоваться и действительно используется в зрительной системе человека для получения указанной информации о поверхности.
+ -
0
Контуры, определяющие очертания
Обсуждая физические основы построения первоначального эскиза, мы отмечали, что существуют четыре основные причины возникновения контуров на изображении: 1) нарушения непрерывности расстояния, с которого ведется наблюдение; 2) нарушения непрерывности ориентации поверхности;
3) изменения отражательной способности поверхности; 4) эффекты, связанные с освещением, такие как тени, собственно источники света, блики. Выше в этой главе мы уже установили, как отдельные аспекты первоначального эскиза могут использоваться в качестве исходного представления для процессов, основанных на стереопсисе или движении и обеспечивающих определение границ по различиям, зафиксированных на двух или нескольких изображениях одной и той же сцены. Сейчас мы займемся более сложным случаем, когда имеется только одно монокулярное изображение, и попытаемся выяснить, каким образом его контуры могут нести однозначную информацию о форме. Загадка состоит в том, что контуры изображения двухмерны, хотя часто мы видим их в трех измерениях. Проблема, следовательно, сводится к тому, каким способом и зачем мы получаем подобную трехмерную интерпретацию.
+ -
0
Видимое движение | Часть 2
Теория Уллмана, посвященная процессу установления соответствия, имеет исключительную ценность в качестве первого шага в правильном направлении: после 50 лет путаницы и недоразумений она вносит немного долгожданной и живительной ясности. Ее значение состоит в том, что она позволяет нам формулировать ряд экспериментальных проблем, которые не возникли бы при иных обстоятельствах, и открывает путь рациональному исследованию явления в качестве альтернативы несистематизированной регистрации его феноменологии.
+ -
0
Видимое движение ? Часть 1
В последнем разделе мы рассмотрели, каким образом очень ограниченную информацию о движении в поле зрения можно использовать на достаточно ранней стадии обработки для получения некоторой довольно приближенной информации о разбиении сцены на отдельные поверхности. Мы убедились также в том, что эту задачу можно решить достаточно быстро. Однако, затратив больше времени и усилий, можно превратить наблюдаемое движение в значительно более богатый источник информации. Хотя эксперименты Майлса и Уоллака и О’Коннелла проведены раньше, демонстрационный эксперимент с цилиндрами, поворачивающимися в противоположных направлениях, который был предложен Уллманом (см. рис. 3.52),является пока наиболее ярким и показывает, что зрительная система человека может почерпнуть из наблюдаемого движения.
+ -
0
Избирательность по направлению
Видимый мир преисполнен движения, и это обстоятельство оказало существенное воздействие на процесс эволюции. Изучение наблюдаемого движения — это изучение того, каким образом информацию только об организации движения на изображении можно использовать для получения результатов, которые отражают структуру реального мира и перемещения, происходящие в нем. И снова проблема включает две основные части: каким образом осуществляются исходные измерения изменений, порожденных движением, и используется ли такая информация? Ни одна из задач не является легкой. И, быть может, именно потому, что первая столь трудна, вторая в определенной степени сводится к исследованию проблемы минимальной информации, имеющей место при решении первой задачи и необходимой для того, чтобы в процессе дальнейшей обработки можно было бы получить какие бы то ни было разумные результаты.
+ -
0
Стереопсис ? Часть 3.
Восприятие глубины при больших значениях диспаратности. Мы предполагаем, что зона Панума соответствует процессу слияния изображений стереопары в чистом виде. За пределами диапазона значений диспаратности некоторая возможность восприятия глубины все еще сохраняется, хотя это восприятие не соответствует точно истинному значению диспаратности. В этой связи целесообразно рассмотреть два следующих интересных случая.
+ -
0
Стереопсис. Часть 2.
Процесс установления соответствий между изображениями стереопары. Выбор исходного представления приводит к алгоритму установления соответствий между изображениями стереопары, работа которого проиллюстрирована рис. 3.13 и 3.14. На них приведены результаты обработки на ЭВМ (работа выполнена Э. Гримсоном) пары стереограмм, образованных случайными конфигурациями точек — такие стереограммы являются одним из наиболее трудных для данного алгоритма видов представления исходных данных.
+ -
+1
Стереопсис. Часть 1.
Мы отмечали выше, что изображения внешнего мира, формируемые каждым из глаз по отдельности, несколько отличаются друг от друга. Относительное различие положений объектов на таких изображениях называется диспаратностью, которая вызывается различиями в расстоянии до наблюдателя. Мозг человека в состоянии измерять эту диспаратность и использовать ее для оценивания относительных расстояний, отделяющих объекты от наблюдателя. Мы будем использовать термин диспаратность для обозначения угловой невязки положений изображения некоторого объекта в двух глазах, термин расстояние — для обозначения реального физического расстояния между наблюдателем и объектом, которое измеряется обычно по одному из двух глаз, термин глубина — для обозначения субъективного расстояния до объекта, определяемого восприятием наблюдателя.
+ -
0
Модульная организация системы обработки зрительной информации у человека
Наша конечная цель — понять феномен зрения в целом, т. е. то, каким образом можно эффективно и надежно извлекать описания реального мира из его изображений. Зрительная система человека представляет собой пример работающего механизма, который может вырабатывать такие описания. Как мы уже убедились, одной из наших целей является достижение полного понимания этого механизма на всех уровнях: какого рода информация представляется в зрительной системе человека? Какого рода обработку информации эта система осуществляет и зачем? Каким образом информация представляется в зрительной системе человека? Каким образом осуществляется в ней обработка информации и с помощью каких алгоритмов? Получив ответы на эти вопросы, можно задать последний вопрос: как эти специфические представления и алгоритмы реализуются на нейрофизиологическом уровне?
+ -
0
Пространственная организация изображения
Сейчас мы перейдем к проблеме представления пространственных отношений. До сих пор нас вполне устраивало допущение о том, что каждый объект — каждое пересечение нулевого уровня и каждый элемент описания, входящий в необработанный первоначальный набросок, — характеризуется координатами, определяющими его положение на изображении. При переходе к обработке на вычислительной машине согласно этому допущению для представления позиционной информации использовалось двоичное отображение изображения. Это означает, что при появлении любого лемента описания в двухмерном массиве, размеры которого соответствуют размерам отображаемого изображения, определенному элементу приписывается значение ”1”. Кроме того, такому элементу массива ставится в соответствие некоторый указатель, связывающий его с реальным описанием непроизводного элемента. Как и многие, я обнаружил, что это довольно ”механическое” представление изображения, напоминающее топографически структурированные проекции, которые используются на начальных участках зрительного пути, является наиболее подходящим для изучения геометрических отношений, действующих на изображении.
+ -
0
Определение точек пересечения сигналом нулевого уровня и исходный первоначальный эскиз
Первый из описанных выше трех этапов посвящен обнаружению изменений яркости. Основу этого процесса составляют два следующих положения: 1) поскольку изменения яркости изображения могут относиться к различным масштабным уровням, для того, чтобы оптимизировать процесс их обнаружения, необходимо применять операторы, обрабатывающие фрагменты изображения различных размеров; 2) резкое изменение яркости приводит к возникновению пика или впадины первой производной, что эквивалентно пересечению нулевого уровня второй производной, как это показано на рис. 2.8 (пересечением сигналом нулевого уровня называется та точка, в которой соответствующая функция меняет свое значение с положительного на отрицательное).
+ -
0
Физические основы предварительной обработки изображения в зрительной системе
Мы не можем развивать строгую теорию предварительной обработки изображений в зрительной системе — теорию первых этапов зрительного процесса — до тех пор, пока не будет определено назначение этой теории. Как уже отмечалось, цель в самом общем виде состоит в синтезе полезных стандартизированных описаний форм и поверхностей, образующих Изображение. Пришло время сформулировать наши цели более определенно.