Яркость, освещенность и свет
Содержание:
Описание
Во всех процессах, рассматривающихся нами до сих пор, изображение изменений отражательной способности поверхности и ее освещенности использовалось для восстановления информации о геометрических свойствах поверхности. При этом ничего не говорилось о собственно природе поверхности. Тем не менее отражательная способность поверхности (светлая поверхность или темная, хорошо или плохо она отражает красный цвети т. д.) содержит информацию, которая часто имеет важный биологический смысл. Так, например, только взглянув, мы можем сразу сказать, зрелый ли плод, достаточно ли крепка ветка, чтобы выдержать вес человека, свеж и мягок ли лист, похоже ли на то, что это насекомое ядовито, и многое, многое другое.Следовательно, определение отражательной способности поверхности — важная задача и мы действительно достигли немалых успехов в ее решении. Поразительно, сколь сильно воспринимаемый цвет зависит от отражательной способности поверхности и сколь мало он зависит от спектральных характеристик света, попадающего человеку в глаз. Согласно данным Хелсона источник света может на 93 % быть хроматическим, но когда он содержит по меньшей мере 7 % дневного света, освещаемая поверхность, если ее спектральный коэффициент отражения постоянен (т. е. отражение на всех длинах волн одинаково), остается ахроматической. Обратная сторона этой же проблемы — это сколь широк диапазон раздражителей, которые способны ввести нас в заблуждение, заставив говорить о наличии различий яркости в тех случаях, когда на самом деле их нет; этот диапазон простирается от решетки Геринга и кольца Бинасси, с одной стороны, до явления субъективных контуров — с другой. Несколько примеров таких раздражителей приведено на рис. 3.81.
Рис. 3.81. Примеры хорошо известных иллюзий яркости: а — решетка Геринга; б — иллюзия Р. Спрингера, порождающая впечатление нечетко выраженных диагональных пиний; в, г — кольцо Бинасси (обратите внимание на то, как просто с помощью введения контура в изображение, приведенное на рис. 3.81, г, можно создать впечатление, что две серые области выглядят по-разному) ; д — треугольник Канижа
Теория цветового зрения находится в незавершенной и интересной стадии развития. С одной стороны, в течение длительного промежутка времени мы располагаем достаточно адекватным феноменологическим описанием, предложенным Хелсоном и Джаддом. Их уравнения можно использовать для прогноза восприятия человеком цвета, который будет почти столь же точен, насколько точно человек в состоянии описать этот цвет. Эти же уравнения без всяких изменений описывают известные эксперименты Ланда с двухцветной проекцией, где изображения, при воспроизведении которых использовались только два цвета, обеспечивали нормальное цветовосприятие. Как отмечали, однако, сами Хелсон и Джадд, вероятно, с тем же успехом восприятие цвета можно было бы описать и целым рядом каких-то других уравнений; и действительно, Ричардс и Паркс предложили более простую модель, обладающую почти такой же точностью.
Проблема состоит в том, что все эти модели являются описаниями цветового зрения, но не его теориями. Исследователи не объясняют, почему их уравнения хорошо подходят для разделения эффектов освещения и эффектов, связанных с отражательной способностью поверхности. Возможно, что теории цветового зрения вообще не существует и эти описания — это все, чего мы в состоянии достичь; я, однако, надеюсь, что это не так. Единственной попыткой создать истинную теорию цветового зрения можно считать теорию ретинекса, предложенную Ландом и Макканном. Эта теория подвергалась критике в связи с тем, что она не могла объяснить ничего, выходящего за пределы поддающегося объяснению в рамках модели Хелсона — Джадда, и, вероятно, это действительно так. Эта критика, однако, проходит мимо того, что в контексте нашей книги составляет наиболее важное различие между этими двумя теориями, а именно что модель Хелсона — Джадда является феноменологическим описанием, в то время как теория ретинекса представляет собой информационную теорию, основанную на вполне определенных допущениях о свойствах реального мира. Для того чтобы прояснить эти моменты, рассмотрим обе модели более подробно.
↑ Подход Хелсона — Джадда
В основе подхода Хелсона — Джадда к цветовому зрению лежит освещенная временем точка зрения, согласно которой цвет объекта определяется соотношением световых потоков, отражаемых от различных частей зрительного поля, а не их абсолютными значениями Хелсон и Джадд пытались получить некоторую формулу, позволяющую прогнозировать, какой цвет данный лист бумаги примет при определенных условиях освещения и определенном фоне Таким образом, их интересовала не столько собственно цветовая константность, сколько количественная оценка степени нарушения этой константности при изменениях освещения и фона Их подход включает два этапа Во-первых, определение того, что следует считать ’’белым” применительно к условиям, характеризующим данную сцену, и, во-вторых, ’’вычисление” цвета, который примет этот лист бумаги, исходя из полученного на первом этапе оценки белого цвета Принцип, лежащий в основе получения оценки белого цвета, состоит в следующем 1) стандартный белый цвет при дневном свете в соответствующих координатах задается как (rw, gw); 2) измеряется ’’средний” цвет по всему зрительному полю (задается как (rf, gf)), 3) предполагается, что скорректированный белый цвет (rn, gn) располагается в интервале между цветами, определенными в соответствии с пп 1) и 2) Так, например, можно было бы записать следующие выражения
из которых следует, что скорректированный цвет располагается на прямой, соединяющей белый цвет при дневном свете со средним по соответствующему зрительному полю цветом.
Затем этот основной принцип был модифицирован Хелсоном и Джаддом посредством учета ряда экспериментальный наблюдений в уравнении цветового прогноза, которое в результате утратило линейный характер. Иначе говоря, эти изменения удалили скорректированный белый цвет с прямой, соединяющей белый цвет при дневном свете со средним по соответствующему зрительному полю цветом, чтобы обеспечить возможность учета ряда специфических эффектов, обнаруженных Хелсоном и Джаддом экспериментально. Наиболее важная модификация связана с понятием, названным ими адаптивной отражательной способностью и характеризующей, в сущности, уровень серого тона, соответствующий рассматриваемой сцене Листы бумаги, более светлые, чем этот уровень серого тона, принимают цветовой тон источника света, а более темные листы бумаги — цветовой тон дополнительного цвета Линейные зависимости, естественно, не обеспечивают учет этого эффекта. Другие модификации связаны с усилением интенсивности адаптационных эффектов по мере удаления от белого цвета, так, специфические эффекты возникают при большой яркости синей составляющей источника света и т. п. В результате построено длинное и сложное выражение, в котором в основные уравнения, приведенные выше, добавляется ряд нелинейных членов второго порядка (каждый из этих членов представляет какие-то конкретные экспериментальные данные). Вторая часть этой схемы, связанная с определением цвета исходя из оценки белого цвета, получаемой описанным выше методом, формализуется просто Для определения цветового тона, который должен быть поставлен в соответствие точке (r , g), следует лишь установить направление линии, соединяющей эту точку с точкой, характеризующей скорректированный белый цвет (rn, gn), длина этой линии определяет насыщенность цвета
В связи с этим подходом интересным является то обстоятельство, что введенные допущения обеспечивают успешный прогноз воспринимаемого цвета. Отсутствует же в нем объяснение того, почему можно вводить также допущения и почему они обеспечивают правильный прогноз восприятия цвета в таком широком диапазоне условий
↑ Светлота и цвет в теории ретинекса
Ланд и Макканн положили в основу своей теории именно допущения о свойствах реального мира. Она относится к плоскому миру так называемых мондрианов, который состоит из прямоугольных накладок, прикрепленных к большому куску плотного картона, который может освещаться различными способами. Первая часть этой теории посвящена качеству, которое Ланд и Макканн назвали светлотой, и в ней рассматриваются монохроматические изображения как раз такого рода. Центральной они считают проблему разделения эффектов, связанных с отражательной способностью поверхности, и эффектов, связанных с источником света, поскольку, как давно известно, воспринимаемый человеком цвет поверхности в значительно большей степени отражает спектральные характеристики функции отражательной способности поверхности, чем спектральные характеристики света, попадающего в глаза человека
[banner_centerrs] {banner_centerrs} [/banner_centerrs]
Как же можно разделить эти эффекты? Какие именно характеристики могли бы иметь решающее значение, для того чтобы стало возможным разделение эффектов, вызванных изменениями освещения, и эффектов, вызванных изменениями отражательной способности? Ланд и Макканн предложили следующее изменения, связанные с освещением, в целом имеют постепенный характер, проявляясь обычно в виде гладких градиентов освещенности, в то время как изменения, связанные с вариациями отражательной способности, проявляют тенденцию к резкости Эти дихотомия явно имеет место в изучавшемся ими мире мондрианов, и, следовательно, если можно разделить эти два типа изменений, то можно разделить также эффекты, связанные с изменениями освещения, и эффекты, связанные с изменениями отражательной способности, работая с такими изображениями.
На рис. 3.82
Рис. 3.82. Яркости двух отмеченных стрелками квадратов абсолютно одинаковы, и тем не менее одни из них воспринимается как значительно более темный по сравнению с другим
приведен пример, иллюстрирующий теорию Ланда и Макканна: это изображение монохроматического мондриана, освещенного сверху. Яркость двух накладок, отмеченных стрелками, абсолютно одинакова, однако одна из них выглядит более темной, чем другая. Если устранить эффекты, порожденные градиентом освещенности, то одна накладка действительно станет намного темнее другой. Утверждается, что именно эта информационная задача и решается в зрительной системе человека, а соответствующий процесс назван обработкой информации в ретинексе.
Алгоритмы
Обработка информации в ретинексе реализуется по меньшей мере двумя способами. Сами Ланд и Макканн придерживались одномерного подхода, иллюстрация которого дана на рис. 3.83, а.
Рис. 3.83. Схемы, иллюстрирующие алгоритмы работы ретинекса: а — одномерный алгоритм, предложенный Ландом и Макканом; б двухмерный вариант алгоритма, предложенный Хорном. Оба алгоритма основаны на одном и том же принципе, согласно которому плавные изменения яркости не учитываются, а во внимание принимаются лишь нарушения непрерывности
Если на изображении вдоль некоторого пути, соединяющего точки А и В, зарегистрировать значения яркостей, то их можно представить в виде первого графика, на котором медленные изменения перемежаются с большими скачками, соответствующими границам, на которых происходят изменения отражательной способности. Использовав некоторое пороговое значение, можно исключить медленные изменения; в результате возникает второй график, отражающий лишь эффекты, связанные с изменениями отражательной способности. Поскольку система консервативна, не имеет значения, какой именно путь между точками А и В выбирается - получаемые в результате описания эффектов, вызванных изменениями отражательной способности, будут всегда одними и теми же. Ланд и Макканн использовали этот метод, задавая достаточное число случайно выбираемых путей на изображении, с тем чтобы был обеспечен учет всех точек изображения.
Хорн предложил двухмерной вариант этого же алгоритма, состоящий фактически из все тех же трех шагов (этот алгоритм проиллюстрирован рис. 3.83, б). Первый шаг состоит в применении оператора вычисления последовательных разностей, который в данном случае имеет двухмерную центрально-периферическую организацию. После этого удаляются все малые значения и для дальнейшего рассмотрения оставляются лишь большие - соответствующие изменениям отражательной способности. И наконец, на основе лишь этих больших изменений проводится восстановление изображения, целью которого является построение двухмерного аналога второго из приведенных на рис. 3.83, а графиков. Для реализации этих процедур Хорном предложен интересный итерационный алгоритм, основанный на методе ближайшего соседа и обеспечивающий воспроизведение уравнений, представленных на рис. 3.83, б.
Обобщение на случай цветового зрения
Операции, схема выполнения которых приведена на рис. 3.83, иллюстрируют работу ретинекса в случае монохроматического зрения. Ланд и Макканн, обобщая идею ретинекса на случай цветового зрения, ввели условие независимости его работы по каналам красного, зеленого и синего цвета. В этом случае, как они предполагали, на выходе каждого из каналов воспроизводится сигнал, зависящий не от освещения, а исключительно от отражательной способности поверхности. Объединение этих сигналов могло бы позволить добиться восприятия цвета, благополучно основывающегося исключительно на особенностях отражательной способности поверхности, а не на неверной природе источника освещения. При этом, естественно, требуется попарная калибровка сигналов, поступающих по этим трем каналам, однако в этой связи Ланд и Макканн предложили назначать самую яркую точку сцены белой.
Макканн, Макки и Тейлор опубликовали результаты сравнения прогнозов, полученных с помощью этого алгоритма при предъявлении в качестве раздражителей мондрианов, и психофизических оценок цвета, данных испытуемыми, которым эти раздражители предъявлялись. Они установили, что согласие между оценками испытуемых и прогнозами было столь же хорошим, как и согласие между самими испытуемыми.
Комментарии по поводу теории ретинекса
Работа Ланда и Макканна кажется мне привлекательной в трех отношениях. Во-первых, они предприняли попытку создать подлинную теорию цветового зрения, а не просто предложили некоторое описание процесса восприятия цвета. Во-вторых, они обратили внимание на значение границ и описали один из возможных способов распространения граничных эффектов по изображению. Такие эффекты известны давно, например иллюзия Крейка - Корнсуита или кольцо Бинасси, однако в явном виде граничные эффекты в уравнения Хелсона - Джадда не входят. В-третьих, в своей более ранней работе Ланд сформулировал интересный принцип, на важность которого обратил внимание Джадд, а именно: если цвета освещенных участков, образующих сцену, могут претерпевать только одномерные изменения, наблюдатель обычно воспринимает объекты такой сцены как фактически лишенные преобладающего цветового тона.
Возражения против теории ретинекса, судя по всему, сводятся к одному главному и нескольким второстепенным аргументам. Главный аргумент состоит в том, что за явлением одновременного контраста стоит больше, чем содержится в теории ретинекса, т. е. модели, подобно модели Хелсона - Джадда основанные на явлении одновременного контраста, позволяют давать объяснение эффектам Ланда и Макканна, а теория ретинекса, предусматривающая исключение из рассмотрения градиента освещенности, не позволяет объяснять все эффекты, связанные с одновременным контрастом, поскольку последние проявляются особенно четко в случае равномерного освещения, когда градиенты освещенности отсутствуют. Кроме того, Ланд и Макканн явно не всегда в своих экспериментах уделяли достаточное внимание эффектам одновременного контраста. Так, в частности, на рис. 3.82 один из квадратов окружен более темными ’’соседями”, чем другой, так что можно предположить, что как раз на таком фоне они будут выглядеть по-разному. Во всяком случае восприятие яркости и восприятие цвета, очевидно, связаны по меньшей мере с несколькими эффектами, не укладывающимися в рамки подхода Ланда и Макканна.
Одно из возможных объяснений этого заключается в том, что ’’дополнительные” эффекты определяются теми аспектами проблемы, которые Ландом и Макканном не рассматривались. Скажем, например, их теория относится только к плоским поверхностям, а эти дополнительные эффекты могут вводиться лишь для того, чтобы можно было рассматривать и более сложные варианты задачи, связанные с различными ориентациями поверхности в различных частях зрительного поля. Это, однако, маловероятно. Несомненно, трехмерность оказывает воздействие на восприятие яркости, но влияние ее, возможно, не очень велико. Гилкрист указывал, что коэффициенты, учитывающие влияние воспринимаемой ориентации на восприятие яркости, могут доходить до 0,3, однако Икэути, повторив его эксперименты, не смог получить коэффициенты, значения которых намного превышали бы 0,05 — 0,1.
Первый из второстепенных доводов против идеи ретинекса имеет информационный характер: теория ретинекса предполагает наличие некоторого порогового значения (уровня градиента, при котором производится селекция изменений яркости), но не указывает, каким должно быть это пороговое значение. Однако печальный опыт говорит нам, что каждый раз, когда в задаче обработки изображений приходится задавать некоторое пороговое значение, возникают, как правило, проблемы (это одна из причин того, почему столь привлекательна идея пересечений нулевого уровня). В данном случае проблема заключается в том, что при слишком низком значении порог не позволит исключить градиент освещенности; если же значение порога будет слишком велико, то это будет приводить к утрате ценной информации о затенении. Плавные изменения ориентации поверхности также порождают плавные изменения яркости на изображении, которые могут представлять слишком большой интерес, для того чтобы непринужденно жертвовать ими. Могут быть важными также и плавные изменения окраски поверхности. В конце концов, радугу мы можем наблюдать, даже если она ’’увеличена” с помощью бинокля. Изменения цвета не исключаются посредством селекции по порогу.
Второй второстепенный аргумент является плодом нейрофизиологических наблюдений. Согласно теории ретинекса информация в красном, зеленом и синем каналах обрабатывается независимо, причем каждый канал работаете соответствии со схемами,приведенными на рис. 3.83, и объединение происходит лишь впоследствии. Это, однако, не соответствует тому, что наблюдается. Обработка на нейронном уровне, очевидно, основывается на принципе дополнительных цветов - выходные значения определяются разностью результатов, получаемых по двум цветовым каналам - непосредственно с самого начала. Даже в сетчатке большинство цветочувствительных клеток имеет оппонентную (в смысле реакции на дополнительные цвета) организацию; кроме того, де Валуа и его сотрудники обнаружили существенную связь психофизических процессов, обеспечивающих различные цвета, с обнаруженными в эксперименте нейрофизиологическими свойствами оппонентных нервных клеток наружного коленчатого тела.
Эти данные не опровергают той точки зрения, что функция ретинекса определяется обработкой информации в зрительном пути. Можно было бы возразить, как это сделал Хорн, что ретинене может реализовываться на любой из трех линейных комбинаций выходов красного, зеленого и синего каналов с тем же успехом, что и на выходах отдельных каналов, причем такая модификация могла бы сделать теорию ретинекса совместимой с данными нейрофизиологических экспериментов. Этот довод, однако, не очень убедителен, особенно из-за того, что данная теория не дает достаточно убедительных объяснений тому, почему операции над линейными комбинациями сигналов предпочтительнее операций над отдельными сигналами.
↑ Некоторые физические обоснования важности явления одновременного контраста
Широко распространена и освещена временем точка зрения (она восходит по меньшей мере к Эрнсту Маху), согласно которой цвет объекта определяется соотношением световых потоков, отражаемых от различных частей зрительного поля, а не их абсолютными значениями. Естественно, это и должно быть так, поскольку, несмотря на то что освещение сцены, сильно влияющее на спектральный состав ее изображения, время от времени и от одной ее части к другой резко изменяется, человек сравнительно нечувствителен к этим изменениям. Диапазон контрастности цвета, несомненно, ограничен — покупая одежду, мы стараемся увидеть вещи при дневном свете или при свете обычных электрических лампочек, если магазин освещается лампами дневного света. Важно, однако, что, хотя механизмы зрительного восприятия позволяют человеку лишь аппроксимировать реально существующее отражение, они делают это значительно более точно, чем воспроизводят количественный спектральный состав света, попадающего на сетчатку.
Освещенность может изменяться очень резко даже в пределах одной сцены, например от освещенности, создаваемой солнечным светом, до тени или от освещенности, создаваемой в большом зале вблизи источников света, до полумрака, царящего в самых дальних укромных уголках. Спектральные характеристики также изменяются, но обычно не столь существенно. Поддеревом свет зеленее, чем на открытом пространстве, а в устье пещеры он может приобрести бурый оттенок. Таким образом, хотя основные изменения спектрального состава имеют временной характер, они могут происходить и в пределах одной сцены, причем это не оказывает заметного воздействия на человека.
Каким же образом можно было бы учесть столь широкое разнообразие эффектов? Явление одновременного контраста, по-видимому, могло бы найти отражение в анализе следующей ситуации. Допустим, вы идете по насыпи, на которой среди зеленой травы и клевера растут желтые или синие цветы. И хотя собственно спектральные характеристики света, отраженного от цветка, отнюдь нельзя использовать в качестве основы для определения характеристик отражения его поверхности (ни в части ее светлоты, ни в части ее спектральных свойств), тем не менее на эти спектральные характеристики можно опираться, вероятно проводя сравнение с другими поверхностями, расположенными поблизости от данного цветка. Если кажется, что цветок светлее травы, то это, наверное, происходит в силу характеристик цветка, а не освещения (несмотря на то что головка цветка может даже поворачиваться, следуя за солнцем). Если цветок выглядит более синим, чем трава, то, возможно, это действительно так.
Более того, особенно замечательное свойство эффектов, связанных с одновременным контрастом (даже столь простых, что представлены на рис. 3.81, б и в), — это ’’серьезность”, с которой, по-видимому, зрительная система к ним относится. Это выражается в том, что мы выбираем решения, оказывающиеся неправильными, в ситуациях столь простых, как кольцо Бинасси (см рис. 3.81, в), когда, как следует предполагать, практически любая разумная схема должна приводить к решению, отражающему объективное содержание ситуации. Я нахожу это положение столь поразительным, что у меня возникает искушение рассматривать сравнительные наблюдения как единственное, на что полагается человек.
Даже и в этих обстоятельствах, для того чтобы схема решения, основанная лишь на сравнительных данных, действовала успешно, необходимо полностью разделить изменения, возникающие на изображении в результате изменений отражательной способности (типа различий между цветком и травой) , и изменения, возникающие на изображении в результате изменений освещения (типа тени, отбрасываемой расположенным поблизости деревом). Известно, что лужайка в тени выглядит темнее лужайки, лишенной тени, а маргаритка на солнце выглядит ярче маргаритки, находящейся в тени, однако затенение не влияет существенно на цвет лужайки или маргаритки И залитая солнцем, и находящаяся в тени маргаритки выглядит белыми, а находящаяся в тени маргаритка (совершенно определенно) не выглядит серой.
Для человека естественно воспринимать как более яркую маргаритку, залитую солнцем, чем находящуюся в тени. Из этого следует, что яркость является субъективным качеством, связанным с интенсивностью основного источника света. В то же время отражательная способность поверхностей более тесно связана с качественными характеристиками светлоты и цвета. Изменения светлоты — это в идеальном случае чисто скалярные изменения отражательной способности поверхностей, не предполагающие каких-либо изменений спектральных характеристик этих поверхностей (поддающихся обнаружению с помощью трех цветовых каналов), в то время как изменения цвета в идеальном случае связаны с изменениями спектральных характеристик поверхности и могут описываться двумя характеристиками — цветовым тоном и насыщенностью. Хелсон и Джадд определили термины яркость, светлота и цвет с чисто психофизических позиций, но я считаю, что данным ими определениям не противоречит отношение к ним как к перцептивным приближениям освещенности, а также абсолютного значения и спектрального распределения коэффициента отражения поверхности.
Следовательно, в информационном смысле проблема сводится к тому, каким образом можно разумно определить физические предпосылки для оценивания яркости, светлоты и цвета по изображению. В первую очередь следует обратить внимание на то, что ориентация поверхности может влиять на яркость (согласно нашему определению) , но, как правило, не на светлоту или цвет поверхности, поскольку при некоторых ориентациях поверхности свет будет достигать ее более непосредственным образом, чем при других. Таким образом, окончательное определение значений яркости приходится откладывать до тех пор, пока не будет оценена ориентация поверхности. Однако, как мы уже отмечали, до сих пор окончательно не установлено влияние трехмерности на восприятие яркости.
Основным источником изменений яркости служат тени, они поддаются независимому обнаружению с помощью приемов, реализацией которых является оператор ?I/I Эти два явления — изменения ориентации поверхности и тени — служат основными источниками нарушения непрерывности по яркости, и поэтому при условии, что они учитываются должным образом, мы можем быть абсолютно уверены в том, что все остальные изменения источника света являются в основном гладкими, а не резкими.
Обратимся к нашим очередным наблюдениям: 1) локально измеримые градиенты освещенности могут возникать на плоской поверхности только тогда, когда источник света находится не очень далеко; 2) эти градиенты освещенности малы, за исключением случаев, когда источник света находится очень близко, 3) эти градиенты близки к линейным, за исключением, быть может, случаев, когда речь идет об участке поверхности, расположенном непосредственно под источником. Наши наблюдения проиллюстрированы рис. 3.84.
Рис. 3.84. Градиенты освещенности, порождаемые исключительно освещением, обычно невелики и почти линейны
Освещенность в точке Р равна I/r2, а в расположенной рядом точке Q она равна I/r2 — 2х ?х/r4 + 0(1/r4). Если значение ?х/х мало, то изменение освещенности при переходе из точки Р в точку Q пропорционально —2 ?х/ и существенно линейно относительно ?х — расстояния между точками Р и Q при условии, что значение ?х мало по сравнению со значением х. Это, быть может, и служит одной из причин того, почему зрительная система человека нечувствительна к малым линейным изменениям интенсивности света.
↑ Гипотеза обусловленности нелинейных изменений яркости свойствами поверхности
Приведенные выше замечания позволяют предположить, что может оказаться конструктивным следующий подход к установлению физических предпосылок цветового зрения: при отсутствии резких изменений яркости, идентифицируемых как границы тени или изменения ориентации поверхности, все нелинейные изменения яркостей могут быть поставлены в соответствие свойствам поверхности - либо ее ориентации, либо ее отражательной способности. Другими словами, при отсутствии явных эффектов, связанных с освещением (типа теней), все измеримые локальные различия в яркостях или спектральных характеристиках изображения определяются изменениями светлоты или цвета поверхности. Такой подход позволяет пренебрегать малыми линейными изменениями яркости и дает обоснование представлению о том, что светлота и цвет могут определяться по измерениям нелинейных локальных изменений яркости и спектральных характеристик, выполняемых, например, посредством сравнения соответствующих значений в каждой точке изображения со значениями этих же величин в локальной окрестности точки.
↑ Следствия, касающиеся измерений на трехцветных изображениях
Согласно физиологическим данным некоторые оппонентные цветочувствительные клетки сетчатки обезьяны обладают рецептивными полями ’’комбинированного” характера, например с красночувствительной центральной частью и зеленочувствительной периферией. Судя по всему, нет оснований для того, чтобы оспаривать собственно эти данные, однако мне в принципе очень трудно представить существование подобных нервных клеток и включить их в ?2 G-схему.
Дело в том, что нервная клетка, обладающая таким рецептивным полем (пример подобного рецептивного поля для удобства приведен на рис. 3.85, а),
Рис. 3.85. Возможные варианты организации цветовых рецептивных полей. Предполагается, что пространственная организация полей соответствует разности двух гауссовских распределений: a — так называемое красно-зеленочувствительное оппонентное рецептивное поле; б — рецептивное поле с красночувствительной центральной частью и красночувствительной периферийной частью; в — красно-зеленочувствнтельное оппонентное рецептивное поле с идентичными пространственными распределениями для обоих цветов; г — рецептивное поле, воспринимающее только яркость (сумму красного и зеленого сигналов) ; д — рецептивное поле, воспринимающее только разность цветов (разность красного и зеленого сигналов) ; е — двухмерное рецептивное поле, организация которого соответствует представленной на рис. 3.85, г; ж — двухмерное рецептивное поле, организация которого соответствует представленной на рис. 3.85, д. (Обозначения : R — красный, G — зеленый.)
воспроизводит сложную комбинацию пространственной и цветовой информации. Ее выходом не служит ни собственно результат ?2 G-процедуры для одного цветового канала (как это имеет место в случае, представленном на рис. 3.85, б, где рецептивное поле реализует ?2 G-пpoцедуру для красного канала), ни чисто цветовая информация, характеризующая соотношение значений сигналов, получаемых по двум каналам для одной точки изображения, как это происходит в случае рецептивного поля, представленного на рис. 3.85, в. В сущности, на рис. 3.85, в представлен даже не оператор, реализующий метод нулевого среднего: выходной сигнал не похож на вторую производную, а его пересечения нулевого уровня бессмысленны. При использовании такого рецептивного поля необходимо особое внимание обращать на изменения значений выходного сигнала. Так, например, если подобному рецептивному полю с зеленочувствительной центральной частью и красночувствительной периферийной частью предъявляется лужайка, то разряд будет происходить по всей лужайке, причем несколько более интенсивным он будет в наиболее насыщенных зеленых участках. Мне кажется, что такой способ плох не только с чисто "технической” точки зрения, но и противоречит нашему опыту в той части, что в нервной системе обычно кодируются не собственно абсолютные значения, а их изменения. Другими словами, этот способ является нарушением второго принципа Барлоу, предусматривающего экономичное кодирование информации, содержащейся в раздражителях в нервной системе.
Для того чтобы сформулировать разумное предположение относительно того, какую информацию воспроизводят эти нервные клетки, мне кажется целесообразным объединить соображения двух типов. Во-первых, следует учесть, что для использования анализа, основанного на ?2 G-преобразовании, требуется идентичность спектральных характеристик центральной и периферийной частей рецептивного поля, за исключением того, что их знаки должны быть противоположны. Это необходимо для того, чтобы имело смысл использовать пересечения нулевого уровня.
Во-вторых, следует воспользоваться идеей разделения обработки информации о светлоте и яркости и информации о цвете. Яркостные границы точно соответствуют изменениям суммы сигналов, поступающих по красному и зеленому каналам (мы можем записать ее как (R + G) ). Для обнаружения этих границ следует применить к суммарному сигналу оператор ?2 G, как это показано на рис. 3.85, г. Кроме того, согласно гипотезе, выдвинутой нами в предыдущем разделе, для обнаружения цветовых изменений следует выделять относительные количественные изменения красного и зеленого цвета. Это может быть осуществлено с помощью применения ?2 G-процедуры к разности красного и зеленого сигналов (R - G), как это показано на рис. 3.85, д.
Нервная клетка первого типа, рецептивное поле которой приведено на рис. 3.85, е, обладает не очень высокой цветочувствительностью, поскольку раздражителем, вызывающим максимальный ответ, для нее служит белое пятно, расположенное в центре, а заторможена эта клетка может быть с помощью любой комбинации красного и зеленого раздражителей в центральной и периферийной частях рецептивного поля. Единственным требованием при этом является уравновешенность эффективных яркостей.
Второй тип клетки обладает совершенно иными свойствами. Для нее оптимальным раздражителем служит красное в центральной части рецептивного поля в сочетании с зеленым в его периферийной части, и, следовательно, эта клетка принимает облик оппонентной цветочувствительной клетки. Такая клетка наилучшим образом будет отвечать на изменения цвета и не будет давать вообще никакого ответа на предъявление чисто белого пятна в центре рецептивного поля при условии, что красная и зеленая составляющие сбалансированы в белом цвете должным образом. Такая клетка будет отвечать на появление цветовых границ и не будет отвечать на появление никаких иных границ. Для того чтобы такая клетка не реагировала на небелые границы светлоты (например, на границу между двумя красными участками, различающимися лишь долями, но не качеством отражаемого ими света), величины R и G должны выражаться в логарифмических единицах. Эта клетка, таким образом, будет действовать как детектор чисто цветовых изменений. Отметим также, что и операторы ?2 G нечувствительны к линейным градиентам.
↑ Резюме
Итак, изложенный подход основывается на отделении яркости от светлоты и цвета, за которым следует разделение оценивания светлоты (доли отражаемого света в среднем) и цвета (спектрального распределения). Локальные изменения можно определять по пересечениям нулевого уровня на светлотном изображении (R + G) и цветовом изображении (используя (R - G) и (В - G), где В — синий цвет).
Основные нейрофизиологические выводы, следующие из этого, состоят в том, что ни в каких рецептивных полях не должны объединяться цветовые и пространственные изменения, как это показано на рис. 3.85, а; наоборот, должны существовать рецептивные поля типов, представленных на рис. 3.85, г (для восприятия изменений светлоты и яркости) и на рис. 3.85, д (для восприятия цветовых изменений). Отрезки пересечений нулевого уровня могут затем выделяться аналогичным образом по результатам измерений обоих типов, что дает возможность определять яркостные контуры по данным первого типа и контуры цветовых переходов по данным второго типа.
↑ ЗАКЛЮЧЕНИЕ
В данной главе мы познакомились с некоторыми из поразительно разнообразных способов кодирования в изображениях информации о поверхностях и рассмотрели, каким образом такую информацию можно реально извлекать из изображений (насколько это сегодня представляется возможным) . Как мы в настоящее время полагаем, в различных процессах, обеспечивающих восстановление информации о поверхностях по изображениям, используются различные представления исходных данных. Простейшие из этих процессов (например, процесс, основанный на принципе избирательности по направлению) используют в качестве представления исходной информации пересечения нулевого уровня, а для более сложных (например, оперирующих текстурой поверхности), возможно, требуются самые сложные варианты полного первоначального эскиза. Итоги нашего обсуждения подведены в табл. 3.2.
Т а б л и ц а 3.2. Процессы, механизмы и объекты, обеспечивающие получение информации о поверхности на основе информации, содержащейся в изображении, и возможные представления исходной информации, используемые ими
Примечание. КГ — контуры границы, полученные с помощью процессов разделения и нелинейного укрупнения характерных объектов изображения; ППЭ — полный первоначальный эскиз = НПЭ + СХОИ + КО + КГ; СХОИ — сгруппированные характерные объекты изображения, полученные в результате применения процесса объединения к полному первоначальному эскизу; КО — контуры освещенности (тени, блики и источники света); НПЭ — необработанный первоначальный эскиз (яркостные переходы, пятна, тонкие полосы, нарушения непрерывности и концы) ; ПНУ - пересечения нулевого уровня, нарушения непрерывности и концы.
Другой интересной особенностью этих процессов, помимо того, что все они используют несколько отличающиеся друг от друга представления исходной информации, является то, что для их благополучного функционирования необходимо введение несколько отличающихся друг от друга допущений о внешнем мире. Как мы имели возможность убедиться, при использовании информации, содержащейся лишь в изображении, структура поверхности всегда оказывается существенно недоопределенной и искусство задания соответствующего процесса заключается именно в точном указании того, какую именно дополнительную информацию можно безболезненно привлечь в форме допущений о свойствах внешнего мира; это и порождает достаточно сильные ограничения, необходимые для успешного функционирования процесса (скажем, условия единственности и непрерывности в стереопсисе, требование жесткости при анализе движения и т.д.). Значительная доля искусства, требующегося для определения таких процессов, необходима для того, чтобы точно и правильно сформулировать эти дополнительные ограничения.
В нашем обзоре речь шла и о процессах, которые мне кажутся определенными удачно, и о процессах, остающихся загадочными и довольно плохо определенными. Основные допущения, использование которых предполагается в отдельных процессах, сведены в табл. 3.3,
Т а б л и ц а 3.3. Примеры вспомогательных допущений, неявно используемых в процессах, обеспечивающих извлечение информации о поверхностях из изображений
но читатель должен иметь в виду, что лишь немногие из них очевидны. Эту таблицу, следовательно, надо рассматривать, скорее, как некоторый указатель, позволяющий ориентироваться в современных представлениях, чем как перечень точных формулировок, указывающих, что именно дает этим процессам возможность функционировать.
И наконец, еще несколько слов относительно стратегии исследований в данной области. Как мы видели, наблюдается поразительная разница в том, с какой ясностью и точностью мы в состоянии определять различные процессы. Некоторые из них, подобно стереопсису, восстановлению структуры по движению и избирательности по направлению, отличаются простотой и четкостью, в то время как другие, подобно зрительному восприятию текстур и анализу контуров поверхности, по-видимому, запутаны в силу своей природы. Это положение не объясняется тем, что процессы первого типа требуют для понимания меньших интеллектуальных затрат — в целом это не так. Скажем, математический аппарат, используемый в связи с процессами стереопсиса или восстановления структуры по движению, не столь прост, как аппарат, связанный со зрительным восприятием текстур. Аналитические трудности возникают, скорее, при попытках установить, какие допущения о внешнем мире можно безболезненно вводить, чтобы облегчить процесс интерпретации изображений этого внешнего мира. В тех случаях, когда это удается сделать аккуратно, более или менее на основе изучения реального мира, в целом оказывается возможным построить хорошую теорию. В тех же случаях, когда этого сделать не удается, по моему мнению, не следует надеяться на достижение должного понимания этих процессов, до тех пор пока не будут обнаружены какие-то иные средства устанавливать, какие допущения о внешнем мире можно вводить безболезненно, а какие — нельзя, а также не будет разрешен связанный с этой проблемой вопрос о надежности различных разновидностей информации.
В конечном счете все эти проблемы носят эмпирический характер и относятся не столько к зрительной системе человека (хотя ответы на них должны быть отражены в структуре ее конструкции), сколько к статистической структуре видимого мира. Я думаю, что с этим придется согласиться, если, пытаясь разрешить эти проблемы, занять несколько более ’’техническую” позицию. По мере того как наши знания о способах реализации этих процессов предварительной обработки информации будут расти, мы будем создавать быстродействующие устройства, на которых эти процессы будут реализовываться в истинном масштабе времени, и получим возможность таким достаточно прямым способом получать более точные сведения о том, какие приемы практически оправданны, а какие — нет. Изучение зрения представляет собой комбинацию изучения процессов и изучения внешнего мира, проводимых с таких довольно специфических позиций. Нечто в этом роде уже с очень давних пор делает естественная эволюция.
Первым шагом должно стать построение некой единой системы, в которой были бы использованы все те процессы, которые в настоящее время нам понятны, однако очень многое еще предстоит сделать, до того как приступить к попыткам достижения даже такой ограниченной цели. Прежде всего реализация процессов типа построения необработанного первоначального эскиза требует значительных вычислительных возможностей. Даже наиболее быстродействующие универсальные вычислительные машины работают на несколько порядков медленнее, чем требуется для воспроизведения зрения в истинном масштабе времени. И хотя развивающиеся сейчас технологии изготовления сверхбольших интегральных схем в конечном счете позволят использовать необходимые для этого вычислительные мощности, соответствующие датчики и технология в настоящее время отсутствуют, и такое положение будет сохраняться еще в течение некоторого времени. Кроме того, естественно, остается еще одна проблема: что делать с информацией, появляющейся на выходе некоторого устройства, позволяющего реализовывать процессы, подобные описанным в данной главе. Именно этой проблемой мы сейчас и займемся.
----
Статья из книги: Зрение | Д. Марр
Комментариев 0