Кодирование зрительной информации

4-11-2012, 16:57

+ -

Содержание:

Описание

↑ Взаимодействие двух глаз

Оптическая система каждого глаза создает на сетчатке картину, соответствующую проекции объектов внешнего мира на сферическую поверхность дна глаза. Различия в яркости объектов и их деталей передаются в виде различий в освещенности разных мест изображения. В другом глазе получается картина, похожая на первую, но не совпадающая с ней из-за того, что другой глаз находится на некотором расстоянии от первого. В паре изображений содержится информация о величине, форме и взаимном расположении предметов по всем трем координатам пространства. Эту информацию нужно передать в мозг и рационально обработать.

Попробуем сначала построить грубую модель такой передачи. Фоторецепторы возбуждаются тем сильнее, чем больше их освещенность. Все фоторецепторы, связанные с одним нервным волокном, посылают по нему в мозг сигнал, интенсивность которого зависит от степени возбуждения рецепторов, т. е. в конечном счете от их освещенности. Окончание зрительного волокна в мозгу передает определенной клетке мозга сведения об освещенности на соответствующем месте сетчатки, а все волокна — о распределении освещенности по всей сетчатке, т. е. обо всем изображении.

Аналогичным образом другой группе клеток передаются сведения об изображении на сетчатке другого глаза. Взаимодействие клеток этих двух полей мозга вырабатывает информацию об объемности видимых предметов.

↑ Закон Вебера — Фехнера

Хотя интенсивность сигнала, передаваемого в мозг, тем больше, чем больше освещенность группы рецепторов, трудно допустить наличие прямой пропорциональности между этими величинами. Как известно, глаз может работать в диапазоне яркости, простирающемся на 10 порядков. Невероятно, чтобы максимальный сигнал мог быть в десять миллионов раз сильнее минимального.

Представление о возможном соотношении между различием в яркости ?L двух участков поля зрения и различием в сигналах от этих полей дают результаты экспериментов. Еще в XVIII в. Бугер установил, что в широком интервале яркостей соблюдается закономерность, выражаемая формулой

где ?Ln — пороговая разность яркостей, а ? — постоянная величина— пороговый контраст.

Закономерность, выражаемая формулой (55), была подтверждена экспериментом Кенига, который нашел, что в довольно широком интервале яркостей ? = 0,02. В действительности ? отнюдь не постоянная величина, она зависит, в частности, от яркости фона и от размера тест-объекта. Более подробно о пороговом контрасте мы будем говорить позже. Сейчас формула (55) нужна нам для самой общей оценки зависимости между воздействующей на глаз яркостью и сигналом, посылаемым в мозг, или между яркостью L и ощущением яркости. Однако сразу возникает вопрос: чем измерять ощущение яркости?

Ощущение яркости иначе называют светлотой В и измеряют в порогах. Если, например, при увеличении яркости от L1 до L ощущение возросло на n ступеней — n порогов, считают, что ?В = n.

Для определения связи между L и В воспользуемся формулой (55), считая, что яркость возросла не на ?Ln, а на бесконечно малую величину dL. Тогда и В возрастает не на один порог, а на бесконечно малую величину dB. Перепишем формулу (55) в виде

или

Пусть яркость изменилась от до L. Найдем соответствующее изменение светлоты:

Считая, что для пороговой яркости Ln светлота B = 1, получим

Для дневных яркостей светлота имеет порядок тысячи, т. е. В ? 1, и можно пренебречь единицей:

Светлота (ощущение яркости) пропорциональна логарифму яркости, выраженной в относительных единицах. Эту зависимость называют обычно законом Вебера — Фехнера.

Однако все преобразования при переходе от формулы (56) к формуле (60) оправданы только при соблюдении двух условий: ? ? 1 и ? = const. Оба условия приближенно соблюдаются в довольно широком диапазоне дневных яркостей (? = 0,02), но при уменьшении яркости пороговый контраст перестает быть постоянным и при низких яркостях сильно возрастает. Поэтому формула (60) для практических расчетов непригодна. Ее можно применять только для качественной оценки связи между яркостью и светлотой: при передаче в мозговые центры яркость кодируется приблизительно по логарифмической шкале, благодаря чему светлота возрастает гораздо медленнее воздействующей на глаз яркости.
[banner_centerrs] {banner_centerrs} [/banner_centerrs]

Учет зависимости ? от L приводит к формулам значительно более сложным, чем формула (60). По одной из них можно рассчитать, что для яркости 10 кд/м2 светлота В = 760. Увеличим яркость в 1000 раз, до L = 104 кд/м2. По формуле (58) получим, что В увеличилась на 350 единиц, т. е. только в полтора раза.

Таким образом, предположение, что зависимость между L и В близка к логарифмической, приводит к весьма правдоподобному результату: к не очень большому диапазону возможных изменений ощущения яркости.

↑ Электрические явления в зрительной системе

Приблизиться к пониманию механизма образования сигнала, передаваемого по волокну нерва, можно, изучив электрические явления, связанные со зрительным процессом.

Нужно сказать, что передача сигнала по нерву отнюдь не сводится только к электрическому сигналу. Это чрезвычайно сложный физико-химический процесс, далеко еще не изученный полностью. Но электрические явления всегда его сопровождают, а они сравнительно легко поддаются регистрации.

Различают три основных типа электрических явлений:

изменения в электроэнцефалограмме, вызываемые световыми воздействиями на глаз,— так называемый вызванный потенциал (ВП);
изменение разности потенциалов внутри самого глаза — электроретинограмма (ЭРГ);
импульсы, получаемые от отдельных волокон зрительного нерва или от хорошо локализованных малых участков сетчатки.

При исследовании ВП электроды прикладывают к голове вблизи зрительной (затылочной) области мозга. Запись снимаемой с электродов разности потенциалов называется электроэнцефалограммой. Для нее характерны постоянные колебания — так называемый a-ритм. При освещении глаза возникают изменения в электроэнцефалограмме, которые и называют вызванным потенциалом. Корреляцию между ВП и световым воздействием на глаз в последнее время изучают и даже делают попытки определять с помощью ВП остроту зрения или аметропию глаза.

Наибольшее число исследований электрофизиологии зрительной системы посвящено изучению электроретинограммы. Для снятия ЭРГ один электрод прикладывают к роговице обычно с помощью специальной линзы, а другой — к коже головы. Разность потенциалов ?V (обычно говорят, просто потенциал), снимаемая с этих электродов, записывается с помощью самописца. Пример ЭРГ представлен на рис. 29.

Рис. 29. Электроретинограмма

Изменение потенциала происходит в результате воздействия на сетчатку светового стимула, который начинается при t = 0 и заканчивается при t = 0,5 с. После небольшого отрицательного изменения (волна я) отмечается быстрый подъем потенциала (волна b), которую обычно считают основной характеристикой степени возбуждения рецепторов световым раздражением. После быстрого спада волны b следуют медленный подъем и спуск (волна с) и наконец при выключении света — опять небольшой подъем (волна d). Заметим, что между слоями сетчатки 1 и 10 всегда существует некоторая разность потенциалов, т. е. электрическое поле, направленное нормально к поверхности сетчатки. Световой стимул вызывает изменение напряженности поля, которое и регистрируется в ЭРГ как изменение разности потенциалов.

Запись импульсов в отдельном волокне зрительного нерва, т. е. реакцию очень малого элемента сетчатки, можно получать с помощью микроэлектродов, вводимых в сетчатку, или с помощью выделения отдельного волокна зрительного нерва. Поэтому такие опыты производятся только на животных. Однако есть все основания полагать, что в зрительной системе человека происходят в общем такие же явления. Типичные записи импульсов в отдельном волокне зрительного нерва приведены на рис. 30.

Рис. 30. Импульсы в отдельных волокнах зрительного нерва

На рис. 30, а нижняя белая линия — отметка времени дает расстояние между ее разрывами 0,2 с. Разрыв белой линии, проведенной немного выше, соответствует времени действия света на сетчатку (более 1 с). Гребенка черных вертикальных линий—отметки электрических сигналов в волокне зрительного нерва. Частота электрических импульсов в первом приближении пропорциональна логарифму освещенности того места сетчатки, от которого идет исследуемое волокно. Но коэффициент пропорциональности — отнюдь не постоянная величина. Он зависит от многих факторов, прежде всего от состояния адаптации глаза. Кроме того, можно видеть, что в течение времени воздействия света частота не остается постоянной, а снижается, что можно считать следствием локальной адаптации освещенного элемента сетчатки под действием освещения, вызывающего появление импульсов.

Других особенностей электрических явлений в сетчатке мы коснемся несколько позже.

↑ Модель зрительной системы

Теперь модель зрительной системы можно несколько конкретизировать. Оптика глаза создает на сетчатке изображение картины внешнего мира, причем освещенность каждого рецептора пропорциональна яркости проецируемого на него элемента картины. Имеются данные, что светочувствительные вещества сетчатки обладают фотопроводимостью. Появляющиеся благодаря освещенности заряды движутся под влиянием электрического поля сетчатки. Через сетчатку протекает ток по нормали к ее слоям. Плотность тока пропорциональна освещенности данного элемента сетчатки, т. е. яркости изображаемого на нем элемента внешней картины. Когда на окончании волокна зрительного нерва накапливается достаточный ионный заряд, по волокну в мозг направляется сигнал — один из тех импульсов, которые зарегистрированы в виде пиков на рис. 30. Но тут уже наблюдается большое усложнение процесса: частота импульсов отнюдь не пропорциональна плотности тока. Как мы уже указывали, частота примерно пропорциональна логарифму яркости, а следовательно, логарифму плотности тока. Где-то в сетчатке, в системе амакриновых клеток, биполяров и ганглиозных клеток происходит сложная переработка информации — логарифмирование плотности тока и преобразование логарифма в частоту импульсов. Последняя операция напоминает введение цифрового отсчета, который получает все более широкое распространение в современных измерительных приборах. Итак, информация о яркости, кодированная частотой импульсов, по волокну зрительного нерва передается в мозг. Напоминаем, однако, что по нерву проходит не просто ток, а сложный процесс возбуждения, некоторое сочетание электрических и химических явлений. Отличие от электрического тока подчеркивается тем, что скорость распространения сигнала по нерву очень мала. Она лежит в пределах от 20 до 70 м/с.

Закодированная частотами импульсов информация о распределении яркости в наблюдаемой картине приходит в мозг, который должен ее декодировать, т. е. расшифровать. Декодирование — очень сложный процесс, в который втягивается значительная часть коры мозга. Ведь нужно, сопоставив изображения в обоих глазах, получить сведения о рельефе наблюдаемой картины. Нужно осмыслить картину, т. е. узнать в ней знакомые предметы независимо от их угловых размеров и ракурса. И самое главное — изображение нужно спроецировать обратно в пространство предметов. Ведь мы воспринимаем не какую-то картину в наших глазах или в нашем мозгу, а непосредственно видим все предметы на тех местах, где они находятся.

↑ Соотнесенность

До сих пор существуют люди, которые удивляются тому, что мы видим предметы не вверх ногами, несмотря на отсутствие оборачивающей системы в глазу. Но нужно принять во внимание, что изображение на сетчатке — это лишь первый процесс в цепи сложнейших физиологических и психологических преобразований световых сигналов, происходящих в организме. Аналогия с более простым устройством — передающей телевизионной трубкой, в которой процесс передачи тоже начинается с перевернутого изображения, помогает уяснению вопроса.

Вопрос о перевернутости изображения в глазу волновал многих ученых. В 1038 г. Ибн Хайтам, по-видимому, впервые упоминает о камере-обскуре. Затем ее вновь изобретает Леонардо да Винчи. Он указывает, что такое же изображение может получиться в глазу. Маврикиус (1575 г.) сравнивал хрусталик с линзой, но отрицал перевернутость изображения в глазу, раз мы не видим все перевернутым. Но уже Кеплер (1602 г.) допускал, что изображение в глазу перевернуто. «Опыт и активное вмешательство души — вот что выправляет изображение»,— говорил он.

Именно опыт и действие сознания не только выправляют изображение, но и приводят к гораздо более чудесному и удивительному результату: исторгают изображение из недр наших глаз и возвращают его на место предметов, правильное расположение которых вокруг нас мы непосредственно воспринимаем.

Впрочем, Сеченов считал, что не только выправление (поворот) изображения, но и вынесение его в пространство предметов (Сеченов называет это соотнесенностью) не требуют жизненного опыта. Соотнесенность — врожденное свойство зрения, закрепленное наследственностью в силу его огромного биологического значения. Проведенные в последнее время опыты по изучению зрения грудных младенцев говорят в пользу этого провидения великого русского физиолога.

↑ Некоторые детали процесса кодирования

Итак, мы описали модель действия зрительной системы, уже более близкую к экспериментальным данным. Но и она еще слишком упрощена. В действительности зрение работает по гораздо более сложной (и гораздо более рациональной) схеме.

На рис. 30 изображены реакции на свет волокон, отличающихся по своим свойствам от волокна, дающего реакцию типа 30, а. У волокит типа б всплески импульсов появляются только после выключения света. У волокна типа в — только после включения. Наконец, волокна типа г реагируют и на включение, и на выключение. Итак, от сетчатки в зрительном нерве идут четыре типа волокон:

а — волокно, непрерывно генерирующее импульсы, пока связанный с ним элемент сетчатки освещен;
б — off - волокно, реагирующее несколькими импульсами на выключение света или на уменьшение освещенности соответствующего элемента сетчатки;
в — оn-волокно, реагирующее на включение света или на увеличение освещенности;
г — on — off - волокно, реагирующее и на включение, и на выключение света, на любое изменение освещенности.

Оказывается, волокон типа б, в и г в сетчатке гораздо больше, чем волокон типа а. Волокна, передающие сведения о неизменной освещенности, одни не могут передавать в мозг зрительную информацию, что доказывается опытами Дичберна и Ярбуса. Нервные волокна передают в основном сведения об изменении освещенности каждого элемента сетчатки, т. е. регистрируют первую производную освещенности по времени. Для этого совсем не нужно, чтобы изменялась яркость наблюдаемой картины: движение глаз превращает различие в яркости различных частей картины в различие в освещенности каждого из элементов сетчатки. Когда мы обращаем взгляд к какой-нибудь картине внешнего мира, совместная работа рецепторов и всех видов волокон дает нам возможность воспринять и осознать эту картину. Затем (через 2—3 с) большая часть волокон прекращает передачу. Нет смысла передавать, что ничего не изменяется. Но если никаких изменений во всей картине не происходит 2—3 с, она уходит из сознания и замещается пустым полем. Однако в реальных условиях какие-то изменения происходят всегда, хотя бы для небольшой части рецепторов. Предположим, при постоянном освещении мы непрерывно фиксируем взгляд на середине серого квадрата, видимого на белом фоне. При движении глаз некоторые колбочки постоянно переходят с белого поля на серое и обратно. Это колбочки, лежащие на границах изображения квадрата. Пограничные колбочки сигнализируют о наличии перепада яркостей, поэтому контур остается непрерывно видимым. Но ведь и середину квадрата мы непрерывно видим серой, а любую точку фона — белой, между тем как оттуда никаких сигналов не поступает. Сигналы с этих мест поступили в первый момент, когда мы взглянули на квадрат. В дальнейшем отсутствие сигналов означает, что ничего не меняется. И мы продолжаем видеть то, о чем было просигнализировано в первый момент. Значит, в зрительной системе существует запоминающее устройство, которое в сознании поддерживает неизменным впечатление, создавшееся в первый момент. Сигналы с контура квадрата подтверждают наличие перепала яркостей на его границах, показывая тем самым, что система работает исправно и запоминающее устройство дает правильную информацию. Однако, если по всему полю зрения нигде ничего не меняется, запоминающее устройство выключается. Но в реальных условиях так никогда не бывает. Ученым пришлось немало потрудиться, чтобы искусственно стабилизировать изображение на сетчатке.

Но в чем смысл такой системы передачи информации? Смысл и преимущества ее очевидны. Когда передаются только сигналы об изменениях, значительно разгружается канал передачи. В нашем примере с серым квадратом десятки тысяч колбочек, на которые падало изображение средних частей квадрата, и десятки тысяч колбочек, на которые падало изображение фона, не передавали никаких сообщений. Десятки тысяч волокон зрительного нерва и десятки тысяч клеток в мозгу были освобождены от бесполезной работы приема сообщений о том, что ничего не произошло.

Замечательно, что многие изобретатели стараются сейчас внедрить этот принцип в технику телевидения. Дело сводится к тому, чтобы не передавать полмиллиома сигналов на каждый кадр, а ограничиться только передачей сигналов об изменении яркости в тех местах, где они происходят, возложив обязанность воспроизведения неменяющейся яркости на запоминающие устройства. Вспомним, что именно чрезмерная загрузка канала заставляет вести телепередачи на столь высоких частотах. Разгрузка канала открывает перед техникой телевидения весьма заманчивые перспективы.

↑ Полосы Маха

Замечательно, что в некоторых случаях по нервным волокнам передается информация и о второй производной яркости. Существует явление, которое называют полосами Маха. Если две яркости L1 и L2 разделены на плоскости областью, в которой яркость плавно повышается от L1 до L2 (рис. 31),

Рис. 31. Схема полос Маха

то глаз видит (символом S обозначено ощущение яркости) две полосы, идущие по краям области перехода: вблизи большой яркости — полосу, еще более светлую, а вблизи малой — более темную. Полосы Маха относят к числу иллюзий, оптических обманов. Однако следует сказать, что такой «обман» помогает заметить реально существующий, но размытый в переходной области контраст, подчеркивает нечеткий контур объекта,что безусловно биологически полезно.

↑ Кооперация рецепторов

Зрительная система проявляет замечательную гибкость в смысле способности объединять или наоборот разъединять отдельные рецепторы. Мы уже говорили об объединении рецепторов при переходе к малым яркостям. Но такое объединение происходит в процессе темповой адаптации, когда времени на перестройку кодирующих механизмов вполне достаточно. Гораздо более удивительна практически мгновенная перестройка при неизменном уровне адаптации. При высокой яркости фона, когда нужно и возможно различать отдельные объекты большого контраста, но малых угловых размеров, каждая фовеальная колбочка действует, очевидно, отдельно. Но уже при различении минимального сдвига штрихов по шкале нониуса помогает кооперация многих колбочек, расположенных вдоль изображения штрихов. Еще яснее проявляется объединение колбочек при уменьшении контраста.

Известно, например, что даже при большой яркости мы не видим кружка, контраст которого с фоном равен 0,03, если диаметр кружка составляет 1'. Но при диаметре 30' кружок виден. Значит, колбочки, размер каждой из которых не более 1', как-то объединяются, чтобы воспринять малый контраст, не воспринимаемый каждой из них. А почему одна колбочка, точнее, каждая из двух соседних, лежащих на границе раздела контрастирующих областей, не может воспринять малый контраст? Потому что за время сохранения зрительного впечатления (время инерции ?) она активно поглощает слишком малое число фотонов и относительные флуктуации этого числа слишком велики. Сигнал тонет во флуктуациях, заглушается шумом. А на площадь, соответствующую тридцати минутам, попадает в 900 раз больше квантов, и относительные флуктуации уменьшаются в 30 раз. Теперь сигнал может уже преобладать над шумом.

↑ Осмысление изображений и опознание образов

Над детальным изучением механизмов передачи информации в зрительной системе работают многие ученые. Многое сделано, но, пожалуй, возникло еще больше новых нерешенных вопросов. Зрительная система слишком сложна и вместе с тем чудесно приспособлена для решения жизненно важных задач. В результате кодирования, передачи и расшифровки полученных сведений до сознания доходит то, что существенно и жизненно важно, и исключается все, что мешает осмыслению увиденного. Мы можем видеть то, чего нет в объекте, но что помогает нам лучше его воспринять (например, оконтуривание объекта полосами Маха). Мы можем не видеть того, что реально существует, но что помешало бы правильному восприятию. Мы не замечаем радужных полос, которые связаны с хроматической аберрацией глаза. Не замечаем в поле зрения и темного пятна даже при монокулярном зрении, хотя место вхождения в сетчатку зрительного нерва не воспринимает света — слепое пятно. Оно существует, но для его обнаружения необходимо ставить специальный опыт.

Для автоматических систем весьма трудной оказывается задача опознания образа. Зрение легко справляется с такой задачей. Мы сразу узнаем, скажем, букву А независимо от того, какого она размера и как повернута. Нам не кажется, что человек стал меньше ростом, если он отошел от нас на 20 шагов. При движении глаз изображение скользит но сетчатке, однако мы не считаем, что предметы, на которые мы смотрим, движутся. И, пожалуй, самое удивительное то, что, как уже было упомянуто, мы видим все предметы на тех местах, где они действительно находятся, т. е. объективизируем зрительный образ.

↑ Зрение и кибернетика

Разработка технического устройства, способного воспроизводить некоторые функции зрения — одна из важнейших (и труднейших) задач бионики и кибернетики. В некоторых случаях представляет интерес также математическое моделирование зрения — составление алгоритмов, позволяющих рассчитать (обычно на ЭВМ), будет ли в заданных условиях решена поставленная зрительная задача. Часто математическую модель удается построить без проникновения в сущность зрительных процессов, по методу кибернетического черного ящика. Черным ящиком может быть любой прибор (в частности, живой орган), о механизме работы которого нам заранее ничего не известно. Не пытаясь проникнуть внутрь, мы прилагаем к прибору— подаем на его вход — измеренные воздействия и измеряем ответы на выходе прибора. Проделав ряд экспериментов, стараемся найти функцию, устанавливающую соотношение между интенсивностью воздействия и ответом. Найденную зависимость можно принять за переходную функцию, пригодную для формального описания процессов, происходящих внутри прибора. В сущности, такой подход к изучению зрения в зародыше наметился уже давно, можно сказать, со времени Бугера. Начиная с 1947 г. публикуются работы, в которых уже последовательно используется принцип черного ящика, хотя еще без такого названия, поскольку кибернетика в то время только зарождалась. В последующие годы метод кибернетического черного ящика широко использовался как для экспериментального изучения зрительных функций, так и для математического моделирования работы зрения.

----

Статья из книги: Глаз и свет | Луизов А.В.