Константность зрительного направления
Описание
Несмотря на движения глаз и соответствующие им смещения ретинального образа воспринимаемый нами мир остается стабильным: не «прыгает» во время саккад и не «сплывает» во время дрейфа. Относительное постоянство эгоцентрической локализации объектов непосредственно до, во время и после завершения поворота глаз — это явление получило название константности зрительного направления, или стабильности видимого мира — характеризует один из основных каналов включения окуломоторной активности в процесс зрительного восприятия.Существует несколько подходов к объяснению константности зрительного направления.
Наибольшей популярностью пользуется «эфферентная» (outflow) теория, которая рассматривает стабильное восприятие как результат взаимокомпенсации (вычитания, констелляции, элиминирования)сигналов, поступающих в гипотетический нервный центр по каналам прямой (команда о повороте глаз на целевой стимул) и обратной (смещение ретинального образа целевого стимула, вызываемое поворотом глаз) связи ГДС (Мах, 1907; Миттельштадт, 1960; Грегори, 1970; Джемс, 1991; Sperry, 1943; Holst, 1954; Teuber, 1960; Helmholtz, 1962; Mack, 1970; Festinger, 1970, 1971; Epstein, 1973; Holst, Mittelstaedt, 1973, Jung, 1973; Mackay, Mittelstaedt, 1974; Jeannerod, Kennedy, Magnin, 1979; Stark, Bridgeman, 1983; Gruesser, 1986; Mittelstaedt, 1990). Согласно теории, перед поворотом глаз в ЦНС формируется негативный информационный слепок предполагаемого движения— «эфферентная копия» (шире: состояние готовности зрительной системы—см. Mackay, Mittelstaedt, 1974), которая в ходе поворота глаз элиминируется положительной информацией о смещении проекции объекта по сетчатке (Рис. 3.5).
Рис. 3.5. Восприятие как результат взаимокомпенсации «эфферентной копии» и «зрительной реафферентации» (Holst, 1957).
Соответствие эфферентации и зрительной реафферентации порождает стабильное восприятие действительности, несоответствие—восприятие ее движения (Holst, Mittelstaedt, 1973). Тот или иной перцептивный эффект и его характеристики (скорость, направление и амплитуда переживаемого движения) являются результатом сложения векторов целенаправленного движения глаз и смещения ретинального образа (Whipple, Wallach, 1978; Wallach, O’Leary MacMahon, 1982; Mateeff, Yakimoff, Hornshbein, Ehrenstein, 1991). В несколько иных терминах данный процесс можно пред. ставить как взаимное торможение альтернативных систем восприятия: изображение/сетчатка и глаз/голова, когда последняя активируется не реальным поворотом глаз, а командой к движению (Грегори, 1970).
Константное восприятие зрительного направления требует выполнения двух условий: 1) активного (целенаправленного) перемещения глаз и 2) ретино-окуломоторного соответствия (совпадение амплитуды, скорости и направления смещения ретинального образа и вызывающего его движения глаз). Поэтому при пассивном повороте глазного яблока (Мах, 1907) или при стабилизации изображения объектов относительно сетчатки (Mack, Bechant, 1969), когда хотя бы одно из условий нарушается, наблюдатель воспринимает кажущееся движение объектов. Напротив, во время саккадических движений глаз, когда выполняются оба условия, объекты окружающей наблюдателя действительности воспринимаются неподвижными.
В зависимости от возможного использования информации об амплитуде поворота глаз относительно головы перцептивная стабильность может быть обеспечена двумя путями: а) непрерывным—в виде компенсации перемещения ретинального образа относительно сетчатки и б) дискретным—в виде компенсации разности положений ретинального образа до и после поворота глаз. Первый предполагает механизм детекции изменений проксимальной стимуляции, второй—механизм измерения амплитуды (угла) поворота глаз отностительно головы (Stoper ,1967; 1973; Shebilske, 1977).
Точный эфферентный прогноз и оценка визуальной ситуации касаются преимущественно саккадических движений; эфферентная информация о плавных прослеживающих движениях носит общий, не всегда адекватный характер, вызывая разнообразные иллюзии восприятия движения (Луук, Барабанщиков, Белопольский, 1977; Mack, Herman, 1972, 1973; Mack, Fendrich, Sirigatti, 1973; Festinger, Easton, 1974; Coren, Bradly, Hoenig, Girgus, 1975; Festinger, Sedwick, Holtzman, 1976; Bradly, 1977), возникающее рассогласование между относительно точным направлением поворота глаз на целевой стимул и его ложной локализацией (аконстантностью зрительного направления) позволяет наряду с «эфферентной» дифференцировать «афферентную копию»1 (Hershberger, 1976). Если первая контролирует (monitoring) позицию глаз в орбите, то вторая—задает их желаемую ориентацию, в терминах будущей оптической афферентации. Данное представление неплохо согласуется с известными моделями регуляции движений глаз (Андреева, Вергилес, Ломов, 1975; Robinson, 1975). Как показывают исследования, организация саккад предполагает наличие обеих копий, в то время как психофизическая оценка зрительного направления зависит только от «афферентной копии «(Hershberger, 1987).
[banner_centerrs] {banner_centerrs} [/banner_centerrs]
В отличие от «эфферентной» «афферентная» (inflow) теория полагает, что информация о движении/направленности глаз обеспечивается проприоцепцией наружных мышц (Джемс, 1991; Sherington, 1918; Ludwigh, 1952; Skavenski, 1972; Shebilske, 1978; Steinbach, 1987) (Рис. 3.6).
Рис. 3.6. Различие способов интеграции зрительного и окуломоторного сигналов, допускаемых афферентной (А) и эфферентной (Б) теориями стабильного видимого мира (Грегори, 1970).
Подобно скелетной мускулатуре мышечный аппарат глаза снабжен рецепторами, которые информируют соответствующие инстанции ЦНС о направленности или перемещении глазного яблока (Гранит, 1973; Whitteridge, 1960; Bach-Y-Rita, 1972). Проприоцептивная обратная связь позволяет контролировать не только произвольные, но и непроизвольные формы окуломоторной активности, как на свету (при участии зрения), так и в темноте (при закрытых глазах) в условиях различного положения головы, наклонов туловища или ходьбе. Самим наблюдателем проприоцептивная афферентация может не осознаваться (Brindley, Merton, 1960; см. также Skavenski, 1972, 1976).
Выделяют два относительно независимые источника информации о состоянии экстраокулярных мышц: 1) изменение длины мышечных веретен (условия изотонии) и 2) изменение напряжения мышц (условия изометрии); последнее опосредствуется ?-эфферентацией интрафузальных мышечных волокон и представляет своего рода «гибридный механизм» (Matin, 1976) константности зрительного направления. Благодаря двойственности проприоцептивной афферентации при парализации экстрафузальных волокон, интрафузальные сохраняют активность и могут принять участие в образовании различных перцептивных эффектов (Matin, 1976; Stevens, Emerson, Gerstein, Nenfeld, Nichols, Rosengnist, 1976; Shebilske, 1977). Б обычных условиях, по-видимому, напряжение мышц и их длина связаны инвариантными отношениями.
Для обозначения информации о позиции, перемещении и интенции к движению глаз, несводимой непосредственно к положению проекции целевого объекта на сетчатке, чаще всего используется понятие экстраретинального сигнала (Matin, Pola, Pearce, 1968; Matin, 1972; Skavenski, Haddad, Steinman, 1972; cm-также Matin, 1986; Mack, 1986; Bedell, Klopfenstein, Yuan, 1989)-Оно допускает сосуществование «эфферентных» и «афферентных» (проприоцептивных) источников, позволяя использовать принцип реафферентации—исключение из целостного потока зрительной афферентации той его части, которая связана с перемещениями глаз наблюдателя—в наиболее общей форме.
Механизм соотнесения ретинального и экстраретинального сигналов также представляется по-разному. Базовая модель конселляции (взаимокомпенсации сигналов, поступающих из различных источников), предложенная Е. Хольстом и Г. Миттельштадтом (Миттельштадт, 1960; Holst, Mittelstaedt, 1974), имеет по крайней мере два ограничения. Во-первых, в ней отсутствуют средства адаптации к кардинально новым условиям функционирования ГДС. Например, при изменении знака зрительной обратной связи окуломоторной системы объяснить возможность появления перцептивных приспособительных эффектов, в том числе восстановление стабильного восприятия, довольно трудно. Во-вторых, модель конселляции предполагает высокую точность совпадения сигналов. Как известно, зрительная система очень чувствительна к малым смещениям и способна регистрировать (без визуальной системы отсчета) изменения положения объекта в 20”(Basler, 1906; Henderson, 1971). Это означает, что команда на перемещение глаз, амплитудой в 10° должна вызывать движение с ошибкой не более 0,06%. В действительности же саккада на заданную цель может выполняться с ошибкой в 10% и более (см. Раздел II). Правда, упрек в неточности непосредственно касается теории компенсации положения и, частично, афферентной теории (Ludwidh, 1952; Mackay, 1962; Wallach, Lewis, 1966; Stoper, 1968, 1973).
Согласно P. Хелду (Хейн, Хелд, 1965; Held, 1961) приспособление к измененным условиям восприятия, а также развитие зрительно-моторных координаций, предполагает не только взаимовычитание ретинального и экстраретинального сигналов, но и их хранение в памяти. Он вводит промежуточный блок операций— коррелятивный накопитель, в котором содержатся следы предшествующих комбинаций эфферентных и реафферентных сигналов. Каждый новый эфферентный сигнал (команда о повороте глаз) актуализирует комбинацию, содержащую идентичную с ним эфферентную часть, извлекая, тем самым, соответствующий след реафферентного сигнала. Последний посылается в компаратор и сравнивается с текущим реафферентным сигналом; исход сравнения определяет восприятие окружающего как движущегося или неподвижного. В тех случаях, когда возможна актуализация различных комбинаций сигналов, их выбор из накопителя производится с разными весами в зависимости от свежести следов. Если же актуализируются сразу невольно разновероятных следов, в компаратор одновременно поступает ряд возобновленных реафферентных сигналов, что ведет к неопределенности и ненадежности перцептивного результата. С этим связано, например, ухудшение координации движений, вызываемое изменением привычной обстановки.
Роль мнемических элементов, в частности, иконической памяти, в образовании стабильности воспринимаемого мира подчеркивается многими исследователями (Сперлинг, 1967; Зинченко, 1968; Haber, 1969; Dick, 1974 и др.). Проблема сводится к реконструкции стабильного и непрерывного восприятия из стабильных же, но дискретно данных кусков зрительной (ретинальной) информации—«икон», которые образуются за время одной фиксации. В этом случае эфферентным сигналам (окуломоторным командам) отводится роль средств, обеспечивающих транспозицию следов иконической памяти (Назаров, Гордеева, Романюта, 1972; Гордеева, Назаров, Романюта, Яровинский, 1972). Данный контекст предполагает тесную связь стабильности восприятия с феноменами саккадического и парасаккадического подавления (Рис. 3.7)
Рис. 3.7. Эффективность обнаружения локальных вспышек света до-, во время и после выполнения саккады (Volkmaim, Schik, Riggs, 1968). Отрезок прямой указывает среднюю продолжительность саккады.
—повышением порогов зрения непосредственно до, во время и после скачка глаз (см. Луук, Романюта, 1972; Volkman, 1962; Schick, Riggs, 1968; Volkman, Schick, Riggs, 1968; Richards, 1969; Matin, 1974).
По мнению Д. Маккея (Mackay, 1962; 1972; 1973; Mackay, Mittelstaedt, 1974) модель биологических процессов не должна включать завышенных требований, таких, как сверхвысокая точность сравнения ретинального и экстраретинального сигналов. Вводимый им постулат предельно прост: мир всегда воспринимается как стабильный до тех пор, пока не появляются основания, убеждающие в обратном (принцип информационной линерцин). Стабильность восприятия представляет собой «нулевую гипотезу», которая «выдвигается» до получения новой визуальной информации и становится опорой в организации самих фиксационных поворотов глаз. Поэтому роль компаратора заключается не в конселляции, а в оценке ретинального сигнала. Произвольные движения глаз—своего рода вопросы о состоянии воспринимаемого мира, которые задаются зрительной системой. В зависимости от формы вопроса (амплитуды, скорости, направления движений), ответы на них (смещения ретинального образа) будут меняться, сохраняя некий инвариант, на котором основывается конечный перцептивный эффект. Для того, чтобы интерпретировать тот или иной отдельный ответ, надо знать, какому вопросу он соответствует, Иначе говоря, информация, представленная в форме ответа (зрительная реафферентация) должна быть сопоставлена с информацией, представленной в форме вопроса (окуломоторная эфферентация). Взаимодействие между ними является логической операцией, которая легко может быть автоматизирована, но включает в себя нечто большее, чем «вычитание» или «подавление».
Несмотря на, казалось бы, радикальный шаг, теория Д. Маккея сохраняет парадигму Е. Хольста и Г. Миттелынтадта. Так как ни ретинальный, ни экстраретинальный сигналы сами по себе не способны отвергнуть «нулевую гипотезу» стабильности, единственным источником фальсификации оказывается их соотношение (линейная комбинация). Это означает, что и ретинальная, и экстраретинальная информация выступают в качестве предельных детерминант внутренней репрезентации эгоцентрического направления, а существование «нулевой гипотезы» не всегда оправдано.
Учитывая позицию Д. Маккея, модель Е. Хольста и Г. Миттельштадта можно дополнить следующими положениями: (1) стабильность восприятия нарушается лишь в том случае, если Ретинальный и экстраретннальный (эфферентный) сигналы отличаются на некоторую пороговую величину; (2) величина порога (шире; критерий соответствия сигналов) определяется во вРемя перемещения глаз. В модельной форме они реализуются через введение дополнительного ограничителя, контролируемого эфферентным сигналом. Отметим, однако, что данное представление не приложимо к теории конселляции положения (Stoper 1967). В отличие от базовой, данная модель наделяет компаратор функцией контроля за перемещением глаз: допускается, что характеристики эфферентного сигнала, воздействующего на наружные мышцы глаза, зависят от рассогласования актуального и ожидаемого местоположений ретинального образа.
Из сказанного следует, что центральный блок модели Э. Хольста и Г. Миттельштадта можно представить как относительно самостоятельную систему регистрации, хранения, оценки и использования информации, поступающей в ЦНС из самых различных источников (см. Kolers, 1972). Это не только акцептор, но и интерпретатор зрительных данных, и регулятор исследовательских (произвольных) движений глаз. Он имеет иерархическое строение, предполагает сложный узел интермодальных взаимодействий и выполняет роль ключевого механизма перцептивного процесса в целом.
Рассмотренная группа теорий базируется на допущении, что восприятие зрительного направления опосредствуется абсолютной локализацией проекции фиксируемого объекта на сетчатке. Только в этом случае становится необходимым экстраретинальный сигнал, учитывающий позицию глаз в орбитах. Другим допущением модели является способность наблюдателя выполнять «бессознательные умозаключения» (Helmholtz, 1962; Hochberg, 1974) о состоянии окружающей среды. Но возможен и альтернативный подход, в соответствии с которым зрительное направление того или иного элемента среды презентируется наблюдателю через его отношение к направлениям других воспринимаемых элементов. С этой точки зрения существенной оказывается структура проксимальной стимуляции (ретинального сигнала), а наблюдатель непосредственно вычленяет оптические переменные «высшего порядка», которые при движении глаз остаются инвариантными (Бауэр, 1979; Гибсон, 1988; Linksz, 1952; Gibson, 1954; 1957; 1968; Gibson, Spelke, 1983). Здесь также можно выделить несколько теорий, которые в отличие от предыдущих не получили пока широкой экспериментальной проверки. Так, Linksz (1952) высказал предположение, что константность зрительного направления задается статической перспективой. По Бауэру (1979) естественной системой отсчета, в координатах которой определяется локализация объекта, являются видимые части носа (Рис. 3.8).
Рис. 3.8. Неизменность относительного положения воспринимаемых объектов и носа во время поворота глаз (Бауэр, 1979).
И в том, и в другом случае зрительное направление оценивается безотносительно к абсолютной позиций (направлению) глазного яблока, однако статическая перспектива влияет не столько на перцептивный, сколько на когнитивный процесс в целом, причем нередко оказывается неэффективной (Gibson, 1966); а нос выполняет функцию системы отсчета лишь тогда, когда он находится в непосредственной близости от плоскости воспринимаемого предмета (эффект Пиннокио) (Shebilske, 1978).
Наиболее проработанной выглядит теория непосредственного восприятия, предложенная Дж. Гибсоном (Gibson, 1954; 1957; 1966; 1968; 1979). По его мнению, положение глаз определяется относительно объемлющего наблюдателя оптического строя. Животные «видят», куда направлены их глаза, а не «чувствуют» или «знают» их направление по отношению к черепу или какой-нибудь другой поверхности организма. Любое изменение в направлении глаз, головы или туловища вызывает трансформации оптического строя, инварианты которых несут информацию о состоянии окружающей среды (принцип зрительных кинестезий). Так как оптический строй воспроизводит характеристики объективно стабильного мира, инварианты, специфицирующие его движение, отсутствуют (Рис. 3.9).
Рис. 3.9. Объемлющий оптический строй, исходящий от волнистой поверхности земли в условиях солнечного освещения (Gibson, 1988). На рисунке показано, что поверхность земли неровная, на ней есть складки или бугры, но она не заграждена. Пунктирные линии обозначают не лучи, а образующие зрительных телесных углов. Контрасты на диаграмме отражают разницу в освещенности бугров на поверхности земли. Это оптический строй в одной фиксированной точке наблюдения. На рисунке отображены основные инварианты естественной перспективы: разделение объемлющего строя на две полусферы у горизонта и возрастающая до максимума плотность оптической текстуры. Они остаются инвариантными даже тогда когда строй течет при перемещении точки наблюдения.
Поэтому с самого начала он воспринимался неподвижным. Инвариантом перцептивной стабильности среды во время собственных движений наблюдателя является наличие текстурного фона, множественность и полнота элементов, воздействующих на рецепирующую поверхность сетчатки. В частности, чем больше телесный угол проксимальной стимуляции (чем полнее заполнено зрительное поле), тем выше вероятность стабильного восприятия. Трансформация зрительного поля в целом создает впечатление собственного движения наблюдателя или его глаз, причем вид этого движения зависит от вида трансформаций. Например, резкий сдвиг зрительного поля служит информационным коррелятом саккады; расширение или сжатие—коррелятом перемещения наблюдателя вперед или назад. Существенным в данном случае является тот факт, что эффективная точка наблюдения («точка зрения») не совпадает с центром вращения глаза (Nakayama, Loomis, 1974). В отличие от последнего она вынесена к переднему полюсу глазного яблока и локализуется у входа в зрачок. С изменением точки фиксации меняется и точка зрения, вызывая соответствующие преобразования оптического строя (Bingham, 1993). Поэтому, например, то, что остается скрытым поверхностью носа при фиксации объектов, расположенных прямо перед наблюдателем, становится видимым при переводе взора влево или вправо (Марр, Oho, 1986), а моментальная скорость относительно смещения объектов в ходе движения глаз оказывается функцией не только их удаленности, но и текущей позиции наблюдения (Koenderink, 1986). Внутренние изменения оптического строя, сопровождающие окуломоторную активность (двигательный параллакс, загораживание одних элементов среды другими), оказываются важными источниками информации о перцептивной стабильности или движении.
Утверждение относительности зрительного направления исключает или, по крайней мере, ограничивает использование представлений об эфферентной копии, экстраретинальном сигнале и других понятий парадигмы опосредствованного восприятия. Излишними оказываются и обращения к квазиинтеллектуальным процессам, таким как оценка, сравнение или бессознательный вывод (умозаключение). К сожалению, многие положения теории непосредственного восприятия остаются на уровне гипотез, не всегда приложимых к решению проблемы константности зрительного направления. Так, из-за высокой скорости перемещения глаз во время саккады и сопровождающих ее эффектов подавления и смазывания, выделение переменных высокого порядка (оптических инвариантов) оказывается практически невозможным (Brigemen, Hendry, Stark, 1975; Swanston, Wade, 1988).
Наконец, целесообразно упомянуть теории, подчеркивающие ведущую роль опыта в восприятии человеком стабильности или движения окружающей среды (Митрани, 1973; Надирашвили, 1976; Рок, 1980; Найссер, 1981; Vernon, 1937; Piaget, 1969; Teylor, 1962; Kolers, 1972; Rock, 1983). Согласно этим теориям, переживаемое состояние среды определяется содержанием когнитивных структур (перцептивной схемы, карты, сценария, внутренней модели мира, программы, установки), актуализируемых наблюдателем в данный момент времени. Если, допустим, перцептивная схема, в которой презентирована система отношений наблюдателя и среды, исключает возможность перемещения элементов ситуации, их движение не воспринимается (Vernon, 1937). По мнению Дж. Тейлора (Taylor, 1962; см, также Festinger, Burnham, Ono, Bamber, 1967; Festinger, 1971) восприятие той или иной информации всегда опосредствуется соответствующей программой, или готовностью к действию. В тех случаях, когда такая готовность отсутствует, восприятия не происходит. Так, мы не переживаем смещения окружающих объектов во время саккад потому, что ответ на подобный стимул не несет содержательной нагрузки, а его программа не сформирована. Кажущееся же движение объектов при внешнем смещении глазного яблока обусловлено новизной и необычностью этого явления (Митрани, 1973), Данная группа теорий представлена в литературе имплицитно и требует существенной эмпирической проработки. Как показывает анализ, «готовность к восприятию», «программа действия» и подобные им образования сравнительно легко могут быть описаны и в терминах эфферентного сигнала (Festinger, Canon, 1966; Festinger, 1971).
Таким образом, константность зрительного направления представляет собой достаточно сложное явление, которое охватывает процессы, протекающие на разных уровнях организации зрительной системы, предполагает активное взаимодействие субъекта с окружающей его действительностью, требует привлечения полимодальной информации и прошлого опыта наблюдателя. Можно полагать, что каждая из рассмотренных концепций специфицирует отдельные стороны, или измерения единого целого, и потому не столько конкурирует, сколько дополняет другие. Но на какой основе могут быть объединены принципы реафферентации, информационной инерции, зрительной кинестезии и др.? Как синтезировать экспериментальные парадигмы, ведущие порой к разноречивым эмпирическим данным? Например, теории «бессознательных умозаключений « («эфферентная», «афферентная», «гибридная», «оценки») опираются преимущественно на эффекты восприятия точечных источников света в темноте, а теории «высших переменных»—на восприятие экологически валидных событий. Какая парадигма могла бы учесть оба типа экспериментальных фактов? На сегодняшний день эти вопросы остаются открытыми. Ведущая же роль в разработке проблемы принадлежит эфферентным теориям, допускающим в большей степени, чем другие, выдвижение строгих эмпирически проверяемых гипотез.
За многомерностью феномена константности зрительного направления открывается многозначность возможных способов включения движений глаз в процесс зрительного восприятия. Так или иначе в нем могут участвовать все узловые механизмы функциональной организации окуломоторного акта: афферентный синтез, принятие решения, программа, акцептор результатов, собственно выполнение движений, зрительная, вестибулярная и проприоцептивная обратная афферентация.
----
Статья из книги: Окуломоторные структуры восприятия | Барабанщиков В.А.
Комментариев 0