Обоснование правильности информационного подхода к проблеме зрения ? Часть 2

+ -
0
Обоснование правильности информационного подхода к проблеме зрения ? Часть 2

Описание

Что Вы могли бы сказать о памяти человека? Вы высказали предположение, что и в этой области направление исследований было выбрано неправильно. Что Вы имели в виду?

Я упоминал о работе Нормана и Румелхарта, посвященной возможному способу организации информации в долговременной памяти. Опасность в данном случае снова заключается в том, что проблемы ставятся без относительно четко определенной задачи обработки информации. Как раз наоборот, проблемы ставятся и их решения находятся в категориях механизмов — в данном случае речь идет о механизме, названном ’’активной структурной сетью”, причем он столь прост и универсален, что лишен теоретического смысла. Норман и Румелхарт могли бы заметить, что подобная ’’ассоциация”, возможно, существует, но они не в состоянии были ни указать, из чего эта ’’ассоциация” состоит, ни утверждать, что для решения задачи х (с которой человек может справиться) память должна быть организована некоторым конкретно определенным образом, причем, если подобная организация имеет место, в качестве побочных эффектов должны возникать некоторые поддающиеся идентификации ’’ассоциации” определенного типа.

Феноменологическое крыло экспериментальной психологии может выполнить важную работу, состоящую в отыскании нуждающихся в объяснении фактов, в том числе относящихся к долговременной памяти, и, как мне кажется, скажем, Шепард, Роск и Уоррингтон весьма преуспели в этом отношении. Экспериментальная психология, однако, подобно экспериментальной нейрофизиологии, будет не в состоянии объяснять эти факты до тех пор, пока в рамках исследований, посвященных обработке информации, не будут выявлены и решены отражаемые этими фактами задачи обработки информации. Я думаю, что это именно то направление, которому нам следует посвятить свою энергию.

Что в таком случае Вы скажете о работе Гантера Стента, посвященной пиявкам? Разве в ее основе не лежит также изучение механизма?

Это подразумевалось. Работа посвящена детальному исследованию механизма, с помощью которого пиявка может плавать. Я очень высоко оцениваю эту работу, так же как и работу тюбингенской группы, посвященную домашней мухе, но считаю, что существовавшие в свое время надежды получить на основе эти результатов очень существенные обобщения не увенчались успехом, причем объясняется это снова проблемой уровней. Задачи обработки информации, которые должны решаться нервной системой, определяют то, что она должна делать. Возможно, человек снабжен какими-либо простыми осцилляторами, действующими подобно пиявке, и с очень большой натяжкой можно было бы рассчитывать использовать их в конце концов для понимания некоторых особенностей дыхания. Тем не менее результаты такого рода не объяснят нам, каким образом человек видит.

Наблюдается явно выраженное стремление устанавливать в конечном счете связь объяснения со структурой - в этом, несомненно, проявляется влияние молекулярной биологии. Не думаете ли Вы, что это было достигнуто в данном случае? Или Вы считаете все это предприятие совершенно безнадежным ?

Да, я согласен с тем, что это следует сделать для центральной нервной системы, но сомневаюсь в том, что это вообще осуществимо в целом. Барьер сложности слишком высок. Не забывайте, однако, что мы уже приступили к этой работе! Обнаружение пересечений нулевого уровня и избирательность по направлению тематически очень близки к нейронному уровню. Проявляйте больше терпения в ожидании дальнейших результатов! Как уже отмечалось выше, я держу пари, что невозможно понять быстрое преобразование Фурье, рассматривая, каким образом оно реализуется на уровне транзисторов в ЭВМ IBM 370. Только на понимание выражающих его формул мне требуется около 10 минут, не говоря уже о принципиальной схеме, реализующей их. И еще одно замечание в заключение: я не думаю, что эволюционные и генетические программы будут поддаваться пониманию непосредственно в терминах соответствующих механизмов, составляющих их основу. Я предполагаю, что для понимания процесса развития в силу его сложности потребуется в конечном счете некоторая многоуровневая структура.

Есть ли надежда вернуться к непосредственному анализу зрительного восприятия и того, что в действительности происходит, когда Вы используете зрение?

Хорошо, не устроят ли Вас идеи, связанные с первоначальным эскизом?

Я думаю, что удовлетворят. Важнейшим представляется то, что предварительная обработка изображений в зрительной системе в высшей степени связана с манипулированием символами. Действительно, используются утверждения, указывающие, где оканчиваются линии (да, да - я даже принимаю этот язык и меня в данном случае даже не очень беспокоят нейроны!), а также и такие, которые указывают, что искомые линии и допустимые линии столь же ”реальны ”, как и любые другие. Можно, например, определять ориентацию и тех и других и оперировать ими. Не в этом ли состоит идея ?

В очень значительной степени именно в этом, и если говорить еще об одной ключевой идее, то следует упомянуть локально-характерные объекты и способность пользоваться приближенными критериями выбора при группировке подобных локально-характерных объектов и отыскании образов-конфигураций.

У меня еще осталась легкая неудовлетворенность в связи с представлением пространственных отношений - на изображении, естественно. Я помню обсуждение систем координат, однако убедило оно меня не до конца. Каким образом мы можем убедиться в том, что важная пространственная информация не утрачивается ?

Да, в этом отношении следует проявлять осторожность, поскольку я не думаю, что значительная часть информации, заключенной в пространственных отношениях, переводится в явную форму на очень ранней стадии обработки. Так, например, совершенно очевидно, что отсутствуют врожденные структуры для информации типа ’’угол, образованный двумя линиями”. Этот вид информации не появляется в явном виде в полном первоначальном эскизе; в 2,5-мерном эскизе также отсутствует информация об угле, образованном двумя поверхностями. Эти величины не относятся к восприятию. Их область действия — представление 3-мерной модели. С другой стороны, всего лишь нескольких пространственных отношений (типа допустимых линий, заключенных между соседними локально-характерными объектами) часто оказывается достаточно для неявной передачи геометрии фигуры в целом. Это может оказаться справедливым даже в случае чрезвычайно неточных измерений длин (допустимо, что они просто упорядочены по значениям).

Яркий пример богатства информации, которую могут дать всего лишь несколько признаков сходства, являют археологические данные Флиндерза Питри. Он оценивал подобие захоронений, обнаруженных в верхнем течении Нила, на основе числа совпадающих характеристик осколков гончарных изделий, найденных в этих захоронениях. Опираясь лишь на эту информацию о сходстве и используя методы типа многомерного шкалирования, удается довольно точно определять время погребения. Этот случай получил очень интересную интерпретацию. Мы же хотим лишь заметить, что в двухмерном случае ситуация характеризуется даже еще большими ограничениями. Я не считаю, что угроза потери информации велика, но я уверен в том, что лишь сравнительно небольшая часть пространственной информации переводится в явную форму на ранних этапах обработки изображений в зрительной системе.

Итак, мы получаем полный первоначальный эскиз, после чего вступают в действие все процессы, для того чтобы снабдить нас информацией о поверхности ? И, грубо говоря, все это действие разворачивается в полярных координатах, привязанных к сетчатке, быть может, с небольшими различиями в зависимости от того, какой именно процесс реализуется?
[banner_centerrs] {banner_centerrs} [/banner_centerrs]

Да, это действительно так, причем информация о поверхности, приносимая каждым из этих процессов, объединяется в 2,5-мерном эскизе, по-прежнему используется система координат, привязанная к сетчатке, причем, возможно, более удобная, чем полярные координаты. В истинном смысле чистое восприятие на этом заканчивается. К этому моменту информация уже подготовлена для преобразования в представление в виде 3-мерной модели реального объекта, т. е. в описание, которое затем можно хранить в памяти.

Меня все еще беспокоят этот процесс объединения-увязывания, а также мысль о том, что изо всего богатства подробностей Вы оставляете всего лишь некоторое описание. Это выглядит как-то чересчур умозрительно.

Ну, во-первых, данное описание может отличаться произвольной степенью подробности — это просто вопрос времени и усилий, затрачиваемых на его получение. Другая проблема связана с утверждением о том, что зрительное восприятие сводится к формированию подобных описаний. Да, здесь действительно происходит концептуальный скачок, который я прошу Вас принять. Лично мне не удается обнаружить каких-либо существенных последствий, возникающих из-за того, что эту точку зрения не удается обосновать в общем случае, и, поскольку мы уже достигли, вероятно, понимания 20 — 25% процесса в целом, я искренне считаю, что остальная часть процесса имеет такой же характер. Несомненно, это концептуальный скачок, но я полагаю, что пока эта идея заслуживает право на существование, поскольку анализ зрительного восприятия применительно к формированию конкретных разновидностей описаний позволяет объяснять столь многое столь просто. Не пытайтесь, однако, всегда думать о зрении применительно к нейронному уровню! Это просто невозможно: структура зрения достаточно сложна на верхнем уровне и она исключительно сложна на уровне монтажной схемы.

Оканчивается ли этап непосредственного восприятия воплощением в 2,5-мерном эскизе результатов тех процессов?

Я думаю, что это подходящий момент для проведения раздела, поскольку вплоть до него факторы, относящиеся к высшим уровням, очень незначительно влияли на эти процессы или вообще не оказывали на них никакого влияния. Эти процессы воспроизводили только ту информацию, которую они порождали — ни больше, ни меньше. Понятие непосредственное восприятие несколько дезориентирующе, так как реализация процессов, о которых идет речь, может требовать определенного времени (возьмите, например, слияние стереограммы, образованной случайными конфигурациями точек), но она не предусматривает досконального анализа (в стиле Джулеса), т.е. активного осмысленного изучения изображения и сопоставления его частей. Это соответствует случаю стереограммы, образованной случайными конфигурациями точек, поскольку, как мы считаем, при большой продолжительности времени, затрачиваемого на восприятие такой стереограммы, задержка в основном определяется случайными движениями глаз, связанными с попытками обнаружить отправную точку слияния.

Если 2,5-мерный эскиз изменяется при каждом движении глаз, то он утрачивается при каждом таком движении (за исключением, быть может, малых перемещений исключительно по глубине). Не кажется ли все это Вам ужасно расточительным?

Это, несомненно, расточительство, но если имеется механизм, позволяющий заново обработать соответствующую сцену в естественном масштабе времени, то такая расточительность уже не имеет значения. В сущности, она чуть ли не обязательна, поскольку смысл существования 2,5-мерного эскиза заключается в объединении и представлении поступающей в процессе восприятия информации, но не в ее хранении, и поэтому возможность сэкономить на вычислительной мощности за счет использования большей памяти здесь реально не используется. Допустим, например, что 2,5-мерный эскиз всегда имеет разрешение, соответствующее центральной ямке сетчатки, и управляется, как обычно, центральной ямкой сетчатки. В результате память немедленно оказалась бы почти полностью загружена устаревшей информацией (или ничем не загружена). Память же предназначена вовсе не для этого. Прежде чем происходит обращение к чуть ли не любой реальной памяти, должен быть осуществлен переход к какому-то представлению типа 3-мерной модели, обладающему значительно большей устойчивостью, чем привязанный к наблюдателю образ объекта быстротечного мира. Таким образом, представление, объединяющее информацию, поступающую из различных источников, должно быть привязано к сетчатке и должно изменяться, оно должно располагать областью центральной ямки сетчатки, отличающейся высоким разрешением, и точно отображать только поступающую в данный момент информацию.

Эти требования выглядят разумными, однако у меня возникают затруднения, когда я соотношу их с собственным опытом. Проблема заключается в том, что в этой модели восприятия происходит столько разнообразных событий, в то время как мое собственное восприятие отличается определенной цельностью, единством, которое, как мне кажется, не согласуется с этими идеями или, по меньшей мере, в них не отражается. Каким образом вся эта информация связывается в единое целое? Каким образом можно объяснить цельность зрительного опыта?

Основная идея действительно предполагает, что очень многое осуществляется с помощью практически независимых процессов. На уровне 2,5-мерного эскиза между этими событиями устанавливается связь, однако только неявная, в то время как следующий шаг посвящается построению привязанных к объекту описаний наблюдаемых форм объектов (которые могут быть представлены с помощью системы координат, привязанной к наблюдателю); описание в данном случае представляет собой некоторый единый объект, построенный просто добавлением соответствующих свойств к основному описанию формы объекта — это делается примерно так же, как при работе писателя, которому нужно расцветить свое изложение (он вводит в текст качественные прилагательные).

Что Вы имеете в виду, говоря о наличии ’’лишь неявной”связи?

Не более того, что, несмотря на разное действие различных процессов, имеется возможность установить, когда результаты их реализации относятся к одному и тому же видимому объекту.

Вы имеете в виду, что если некоторый процесс, относящийся к необработанному первоначальному эскизу, привел к обнаружению яркостного переходами процесс, относящийся к цвету, привел к определению его цвета, то связь между этими двумя видами информации существует лишь в неявном виде? Мне не совсем ясен этот момент.

Это всецело вопрос адресации. В большинстве вычислительных машин информация адресуется посредством указания о том, где ее следует искать. В некоторых вычислительных машинах обращение к порциям данных основывается на указании этих порций. Такая память называется ассоциативной; ее нетрудно организовывать. В нашем случае мы, возможно, имеем дело с комбинацией этих двух способов адресации, т. е. с чем-то вроде ’’яркостный переход, расположение которого в зрительном поле приблизительно определяется координатами (х, у), ориентация составляет, скажем, 30° и его яркость соответствует некоторому заданному значению”. Такое описание полностью определяет рассматриваемый яркостный переход как применительно к представлению в виде необработанного первоначального эскиза, так и применительно к процессам, относящимся к цвету. Таким способом можно уста-носить связь между этими двумя разновидностями информации, по крайней мере в принципе.

А что, осмелюсь спросить, Вы можете сказать по поводу всех этих полей коры головного мозга? Разве не естественно было бы предполагать, что каждое из них имеет дело с отдельным процессом?

Меня это не удивило бы.

В таком случае то, что Вы говорите, сводится, в сущности, к следующему: вплоть до данного момента каждый из процессов развивается независимо, причем, возможно, в различных полях коры головного мозга (к настоящему времени обнаружено по меньшей мере 10 таких полей, неправда ли?), и, снабдив каждый из них приближенной информацией, в качестве которой могут использоваться приближенные значения координат и ориентации, Вы точно устанавливаете, о каком видимом объекте идет речь.

Да, это проблема адресации.

И затем Вы, кроме того, получаете точную информацию, соответствующую специализации конкретного поля или процесса - значение цвета или диспаратности, например.

Именно так. Кроме того, я считаю в этой связи важнейшим то обстоятельство, что объединение информации производится с помощью операций над символами.

Что собственно Вы имеете в виду ?

Это не похоже на наложение трех отпечатков, используемое в полиграфии для получения цветной иллюстрации. Мы никогда не воспринимаем цвет объекта как нечто, размазанное в пределах его границ. Дело в том, что приближенная информация о положении и ориентации используется в качестве адреса. Если необходимо установить точное расположение границы объекта, следует обратиться к необработанному первоначальному эскизу. Если необходимо установить цвет объекта, следует обратиться к процессу, дающему информацию о цвете.

Понятно. Эта идея предполагает, что процесс объединения информации должен быть очень активным, не так ли? До тех пор пока некий механизм не обратит специально внимания на то, что пересечение нулевого уровня х стереоизображения представляет собой коричневую границу, эти две порции информации будут продолжать оставаться разделенными.

Да, я думаю, что пришлось бы специально поинтересоваться цветом пересечения нулевого уровня х. Очевидно, многие из этих операций осуществляются автоматически в процессе движения глаз. В конечном счете именно для этого, в частности, предназначен 2,5-мерный эскиз, т. е. для преобразования информации о геометрических свойствах поверхности, поступающей от множества процессов, привязанных к сетчатке, в некоторую единую, более удобную для использования и привязанную к наблюдателю форму. В то же время связи с описаниями других свойств поверхности устанавливаются таким образом, чтобы доступ к ним осуществлялся проще; это связано с подготовкой к построению трехмерного описания, привязанного к объекту.

Таким образом, Вы считаете, что подлинное объединение не осуществляется, вероятно, до того момента, пока не начинается построение 3-мерной модели ?

Да.

Это выглядит так, как будто бы все цепочки символов, соответствующие всей необходимой информации, тщательно подготовлены и размечены, но их объединение не начинается до тех пор, пока не начинается построение 3-мерной модели.

Причем эти порции информации могут быть очень приближенными либо являться составными элементами очень точной информации. Таким же образом можно предполагать, что и другие свойства задаются приближенно (например, цвет — зеленоватый) или очень точно (например, точно указывается оттенок зеленого цвета).

Каким образом, однако, это согласуется с моим личным опытом восприятия ? Он говорит мне о том, что восприятие целостно, а не половинчато, плохо определено и фрагментарно, каким оно предстает в Вашем описании.

Ну, хорошо. Вспомним, во-первых, что зрительные процессы, свойственные человеку, могут протекать чрезвычайно быстро. Время, проходящее между запросом информации, характеризующей какой-то участок зрительного поля, и переводом на него глаз, получением необходимой информации и установлением ее связи с 3-мерной моделью, обычно не превышает половины секунды. Во-вторых, насколько точно Вы в состоянии воспроизвести незнакомую Вам сцену, если взглянули на нее лишь мельком? Довольно неточно! Ее общую организацию и, возможно, одну-две детали. И как только Вы закрываете глаза, все богатство восприятия исчезает, не так ли? Я считаю, что богатство восприятия соответствует доступному в текущий момент, на уровней чистого восприятия, причем то, что Вы в состоянии воспроизвести мгновенно, значительно теснее связано с описанием 3-мерной модели, которое Вы формируете, пока Ваши глаза открыты.

Я начинаю лучше осознавать продуктивность идеи о том, что восприятие -это построение некоторого описания.

Да, именно в этом и состоит суть всей проблемы, и очень важно достичь согласия именно по этому пункту.

Давайте допустим, что Вы правы и, следовательно, 2,5-мерный эскиз привязывается к сетчатке и человек, обрабатывая его, строит небольшие 3-мерные модели и помещает их в пространственную систему координат, привязанную к наблюдателю. Что происходит, если Вы существенно смещаете взгляд?

Во-первых, точно определенные очертания объекта, который Вы только что рассматривали (допустим, что это была фарфоровая кошка) и для которого Вы только что построили детальное описание, превращаются в пятно на изображении, как только Вы переводите взгляд, для того чтобы рассмотреть соседнюю фигурку (фарфоровую собаку). Если это пятно удается надежно идентифицировать в 2,5-мерном эскизе, то я должен допустить существование некоторого процесса, поддерживающего связь между ним и 3-мерной моделью, построение которой Вами только что завершено, в результате чего, если пятно перемещается, Вам немедленно становится известно, что именно перемещается.

Но как же, наконец, все это выполняется с помощью нейронов?

Потерпите, пожалуйста, —сейчас мы к этому приступим. Обратите, однако, внимание на то, что с точки зрения информационных процессов принципиальных затруднений это не вызывает.

Трудно, однако, увязать все это с тем, что, как мне представляется, значит "видеть” - непросто все это принять.

Постепенно Вы войдете во вкус. Решающее значение имеет первый шаг: если Вы согласитесь с тем, что зрение - это обработка информации, выполняемая ради построения некоторого описания, то дальше Вы сможете перейти к изучению того, что такое описание на самом деле и как именно его можно строить.

И все-таки мне нелегко согласиться с тем, что Вы столь много внимания уделяете обработке информации. Мозг в конечном счете состоит из нейронов, а не из кремниевых кристаллов. Очевидно, однако, я к этому привыкну. Кроме того, если зрение - это построение описаний, то реализовываться они должны на нейронном уровне, не так ли?Поэтому нельзя ли рассчитывать на установление нейрофизиологических коррелятов 2,5-мерного эскиза или какого-то фрагмента 3-мерной модели? Это было бы убедительно.

Было бы просто замечательно, если бы реализация оказалась столь проста — соответствовала бы постулату Барлоу об активности нейронов! Лично мне кажется, что она больше соответствует последнему, чем теории клеточного ансамбля Хебба.

Меня продолжает беспокоить еще одно общее положение - оно относится к временной непрерывности перцептивного опыта. Мне вполне понятно Ваше представление о том, каким образом может поддерживаться непрерывность при движении глаз и т. п., однако Вы оставляете в стороне более крупную проблему чисто временной непрерывности. Почему, когда я смотрю на дерево, я все время вижу его как одно и то же дерево? Вероятно, в каждый момент времени я мог бы начинать строить для него новую 3-мерную модель и в этом случае я должен был бы воспринимать пятно, представлявшее старое дерево как новое. Тем не менее этого не происходит. Можете ли Вы это прокомментировать ?

Неизменность видимого мира (непрерывность объектов во времени) является исключительно важным аспектом зрения; я думаю, допущение этой неизменности стало просто одним из наших рефлексов, сформировавшихся в процессе развития. В сущности, вся обработка зрительной информации в целом основывается на выявлении и использовании условий непрерывности (одним из примеров здесь служат процессы установления соответствий).

Возьмем еще одно общее положение. Вы рассматриваете лишь форму. Как в таком случае обстоят дела с распознаванием в случае, когда задача состоит в отнесении к одному классу двух объекте, имеющих различную форму, но выполняющих одну и ту же функцию (например, два стула различной конструкции) ?

Наша теория не может сказать ничего относительно распознавания на семантической основе, присвоения объектам имен или функций, хотя, несомненно, это направление имеет для распознавания в реальном мире почти столь же большое значение, как и определение формы. Я считаю, что проблема понимания того, что имеется в виду, когда говорят о семантике некоторого объекта, исключительно интересна, но я считаю также, что она действительно чрезвычайно сложна и в настоящее время в значительно меньшей степени поддается решению, чем проблемы, возникающие в связи со зрительным восприятием.

Если общая схема, описываемая Вами, верна, нельзя ли сделать какие бы то ни было заключения, касающиеся живописи и рисования, опираясь на знания о юм, что делает зрительная система с изображениями, поступающими на ее вход? Могут ли эти знания, например, помочь при обучении живописи и рисованию?

Возможно, хотя мне бы очень не хотелось сейчас связывать себя какой-то определенной точкой зрения. Тем не менее было бы интересно обратить внимание на то, какие представления предпочитают, а иногда и разрушают различные художники. Пуантилисты, например, экспериментируют в основном с образом; остальная часть схемы обработки зрительной информации остается неизменной, причем во всех других отношениях картина имеет самый обычный вид. Пикассо же, с другой стороны, совершенно определенно разрушает почти полностью уровень 3-мерных моделей. Трехмерность его фигур не имеет реалистического характера. Пример художника, работающего в основном на этапе представления поверхности, найти несколько труднее — быть может, это Сезанн?

Если обратиться к другим задачам, например типа тех, которые возникают в связи с естественным языком, насколько универсален оказывается проповедуемый Вами подход? Насколько широко он может применяться? Каковы задачи, при решении которых он может не сработать ?

Системы, не обладающие модульностью. Процессы типа тех, с помощью которых собираются цепочки аминокислот, с тем чтобы получить белок, т. е., иначе говоря, сложные системы, элементы которых взаимодействуют между собой, испытывающие многообразные влияния, которыми нельзя пренебрегать. Самой острой проблемой изучения понимания естественного языка является, несомненно, вопрос о степени его модульности и о том, что собственно эти модули собой представляют.

Хорошо, я допускаю, что модульность может оказаться ключевым моментом, но ведь важно, чтобы обеспечивалась и некоторого рода беглость, не так ли? Если некоторый процесс не в состоянии развиваться легко, гладко, без постороннего вмешательства, если его течение постоянно требует сознательного вмешательства, то может оказаться, что для такого процесса отсутствует ”прозрачная ” теория и эти свойства приведут его в класс процессов типа формирования белков, теории которых трудны для понимания. Если,однако, возвратиться к естественному языку, то какие модули обнаружены для него?

Этот вопрос неясен; некоторые специалисты утверждают, что естественный язык по своей природе не обладает модульностью и потому должен анализироваться в значительно большей мере гетерархически.

Не напоминает ли это положение ситуацию, существовавшую в период, когда исследования зрения только начинались?

Да, боюсь, что это так. Представляется, однако, что действительно существуют модели, а также и соответствующие правила, возникающие на нижнем уровне, — правила слогообразования, правила просодии и пользующийся наибольшей известностью анализ синтаксиса, выполненный Хомским.

Насколько, однако, можно считать синтаксис отдельным модулем? Разве не утверждают специалисты в области искусственного интеллекта, как, например, Шенк, что синтаксис вовсе не является отдельным модулем?

Согласен, причем очевидно, что синтаксическая расшифровка предложения не может проводиться совершенно независимо от семантического анализа этого предложения. Постепенно, однако, возникает представление о том, что необходимая степень взаимодействия между двумя этими видами анализа мала, а вопросы относительно синтаксиса, на которые требуется получать ответы, оказываются самого простого рода, скажем: относится ли некоторая часть предложения к первой именной составляющей или ко второй? Маркус первым подробно исследовал эти проблемы и показал, что система синтаксического анализа может составить очень хороший модуль. На высших относительно синтаксиса уровнях, однако, в настоящее время имеется лишь самое незначительное число сведений о том, что представляет собой модульность, но я уверен, что такие сведения должны появиться.

Почему специалисты в области искусственного интеллекта столь упорно отвергают традиционные (в стиле Хомского) подходы к синтаксическому анализу? Создается впечатление, что лишь один Маркус принимает их?

Я думаю, что происходит это по двум причинам. Во-первых, легко привести примеры, в которых синтаксический анализ невозможен без сопутствующего семантического анализа. Таким образом, поскольку оказывается, что синтаксис не является подлинно независимым модулем, то исходя из этого специалисты в области искусственного интеллекта хватаются за противоположную точку зрения, согласно которой синтаксис вообще не является модулем. Это неверно: на самом деле синтаксис, очевидно, представляет собой почти модуль, нуждающийся в некотором взаимодействии с семантикой, однако число видов такого взаимодействия чрезвычайно мало.

Вторая причина связана с нашим старым приятелем — проблемой уровней. Теория трансформационных грамматик Ноама Хомского относится к теориям первого уровня, а это означает, что она не имеет никакого отношения к тому, каким образом должно реализовываться структурное распознавание. Эта теория просто определяет правила, указывающие, что должно представлять собой разбиение некоторого произвольного предложения. Хомский выразил эту идею, сформулировав свою теорию как теорию владения языком.

Идея уровней не была, однако, по-настоящему понята специалистами в области вычислительной лингвистики. В самом деле, одно из возражений Винограда против подхода Хомского состояло в том, что трансформационную структуру нельзя инвертировать для того, чтобы превратить ее в систему синтаксического анализа! Такое замечание может принадлежать лишь человеку, которому не удается понять разницу между первым (что и зачем) и вторым (каким образом) уровнями. Эта ошибка не выделяет Винограда из общего ряда, однако все, кто работает в области искусственного интеллекта, совершили ее, а сейчас, по мере того, как использование вычислительной техники становится для лингвистов привычным, они попадают в ту же ловушку. В результате, как я опасаюсь, программы вычислительных машин, предназначенные для работы с естественным языком, дают довольно мало для понимания естественного языка, за исключением работ Маркуса, приступившего к созданию настоящей теории второго уровня, описывающей используемый человеком алгоритм синтаксического анализа.

Какие подходы к семантике Вам кажутся наиболее перспективными?

Вероятно, это подход, который я называю проблемой множественности описаний объектов, и подход, связанный с решением проблем референции, вносимых проблемой множественности описаний.

Не можете ли Вы осветить эту тему подробнее?

Хорошо. Подобно многим другим, работающим в этой области, я думаю, что наше понимание мышления должно основываться по меньшей мере на одном, а возможно, и на нескольких главных принципах, касающихся организации и представления знаний и определяющих, в некотором смысле, что именно важно в общей природе интеллектуальных способностей человека. Эти принципы, которые как будто бы начинают выкристаллизовываться, хотя они еще несколько неопределенны, можно сформулировать следующим образом.

1. Сферы мышления, языка, памяти и восприятия должны быть шире, чем это допускается самыми последними психологическими теориями. Они должны отличаться также очень высокой эластичностью, причем будет нелегко точно учесть это требование.

2. Восприятие некоторого события или объекта должно предусматривать одновременное построение нескольких различных описаний его, охватывающих различные аспекты использования, назначения и сопутствующих обстоятельств соответствующего события или объекта.

3. Различные описания, упоминающиеся в принципе 2, включают как приближенные, так и точные описания. Первые составляют существенный элемент выбора адекватных общих сценариев, необходимых в соответствии с принципом 1, и правильного назначения ролей, выполняемых теми объектами и операциями, которые определяют выбор сценария.

Для того чтобы лучше уяснить эти принципы, рассмотрим пример. Если Вы читаете следующий отрывок:

’’Муха яростно билась в оконное стекло.
Джон поднял газету.”,

то немедленно заключаете, что намерения Джона в отношении этой мухи явно злонамеренны. Если бы он взялся за телефон, то вывод не был бы столь определенным. Все согласны с тем, что ’’угрожающий насекомому” сценарий, возникающий каким-то образом при чтении этих предложений, в самой приближенной форме порождается информацией о том, что муха яростно бьется в оконное стекло. Подобный сценарий содержит референцию к какому-то предмету, с помощью которого можно раздавить муху на хрупкой поверхности, т. е. описание, указывающее, что газета здесь годится, а телефон — нет. Можно, следовательно, прийти к заключению, что при упоминании газеты (или, в случае зрения, при виде газеты) не только строится ее внутреннее описание (как газеты) и задается приближенное описание 3-мерной модели газеты, определяющее ее форму и оси, но эта газета описывается также и как некоторый легкий и гибкий объект, имеющий протяженность в длину и ширину. Поскольку второе предложение могло бы иметь продолжение: ”и сел читать”, газета должна быть описана и как предмет чтения; аналогичным образом она должна быть описана как легковоспламеняющийся предмет, как шуршащий предмет и т. д. Поскольку обычно нам заранее неизвестно, какой именно аспект объекта или действия важен, то из этого следует, что на протяжении большей части времени рассматриваемый объект будет служить источником ряда различных приближенных внутренних описаний. То же самое относится и к действиям. Вероятно, важно отметить, что газете не обязательно ставится в соответствие описание, раскрывающее прихлопывание мухи, чтение или зажигание огня, — просто используется то описание газеты, которое соответствует ее роли согласно действующему сценарию.

Почему Вы считаете, что все должно происходить именно так?

Важность каталога простых приближенных описаний событий и объектов определяется ролью, которую такие приближенные описания играют в построении конкретных сценариев, возможно весьма искусно разработанных, и в обращении к ним, причем роль эта осуществляется примерно тем же способом, каким некоторая универсальная 3-мерная модель животного может в результате соответствующего взаимодействия между изображением информации, заключенной в каталоге моделей, превратиться в конечном счете в очень конкретного Чеширского Кота. То, что выглядит после появления первого предложения немногим более чем враждебные намерения относительно невинной мухи, после появления дополнительной информации о газете превращается во вполне конкретную ситуацию прихлопывания мухи. Еще неизвестно, каким образом это достигается лучше всего и какие именно описания должны ставиться в соответствие различным словам или воспринимаемым объектам.

Что Вы могли бы сказать о других видах обработки информации, осуществляемой мозгом, о таких, например, как планирование поведения и реализация выработанных планов? Не окажется ли проще отыскивать модули на этих направлениях? В конце концов, семантика — это одна из тех областей, в которой способности человека достигли наибольшего развития, и поэтому не столь уж беспочвенно предполагать, что она может оказаться сложной. Я бы попробовал что-нибудь попроще.

Я полагаю, что, вероятно, это отличный совет, и в этой связи мне вспоминается замечательный эксперимент, поставленный Стаммом. Речь идет о так называемой задаче с отсроченной реакцией (см. рис. 7.2):



Рис. 7.2. Иллюстрация эксперимента с отсроченной реакцией. На виду у животного кусочек пищи помещается в одно из углублений, после чего между животными и этими углублениями на время помещается экран. После того как экран убирается, животное должно выбрать одно из двух углублений. Если оно делает правильный выбор, то получает пищу


кусочек пищи помещается в одно из двух углублений, опускается экран, после того как время задержки заканчивается, экран поднимается, и животное имеет возможность направиться к тому углублению, в котором, по его мнению, спрятана пища. Известно, что в решении этой задачи участвуют некоторые участки префронтальной коры; при их удалении животное не в состоянии справиться с этой задачей. Стамм воспользовался методом деполяризации, с помощью которого ему удавалось эффективно ’’отключать” эти участки коры на необходимый ему период времени. Он задался вопросом: когда соответствующий участок префронтальной коры должен находиться в работоспособном состоянии, для того чтобы задание могло быть выполнено? Оказалось, что животному необходимо, чтобы префронтальная кора работала, когда экран опускается и начинается отсчет времени задержки. Если же соответствующий участок префронтальной коры оказывается выведенным из строя в любой другой момент времени, то это сказывается на выполнении задания во много меньшей степени либо вообще не сказывается!

Результаты этого эксперимента можно интерпретировать, например, следующим образом. Любая вычислительная машина, работающая в реальном масштабе времени, должна быть способна формировать планы, подготавливать их к выполнению при определенных условиях и подготавливать пусковые схемы, обеспечивающие их реализацию. Невозможно каждый раз повторять заново все операции обработки информации, и действительно, структура личности отчасти состоит из тысяч подобных микропланов, каждый из которых предназначен для реализации одного из паттернов поведения человека в соответствии с возникновением определенных условий. Для разработки таких планов должен, однако, существовать какой-то механизм; возможно, в эксперименте Стамма мы встретились с простым примером того, как это происходит. Когда углубления исчезают из поля зрения животного, оно включает в свой набор планов задание двигаться к соответствующему углублению после того, как такая возможность появится. Это простой план, но тем не менее это — план.

Если несколько развить эту идею, то мы убедимся в том, что она подразумевает разделение центральной нервной системы на две части, которые можно определить как орган планирования и исполнительный орган соответственно. Орган планирования вводит планы и их пусковые схемы в исполнительный орган, который, когда приходит время и возникают необходимые условия, реализует эти Планы. Так ли уж абсурдно предполагать, что в процессе гипноза исполнительный орган становится доступен программированию извне и именно благодаря этому оказывается возможным задавать человеку, находящемуся в гипнотическом состоянии, планы, которые будут реализовываться позже при наступлении предписанных условий? Идея заслуживает обсуждения, по меньшей мере.

Это интересная мысль. Мне до сих пор вообще не приходилось встречать объяснений возможности ”программировать” кого бы то ни было, а Ваше предположение выглядит вполне правдоподобным. Что, однако, Вы могли бы сказать относительно ”шаблонной" природы программирования? Ведь поведение человека чрезвычайно гибко, не так ли? Несколько затруднительно привести эту особенность в соответствие с возможностью существования некоего набора запрограммированных реакций.

Я думаю, что это полностью зависит от того, сколь велико, разнообразно и искусно организовано сформированное множество паттернов поведения. Если оно содержит широкий набор паттернов и обеспечивает возможность действовать по-разному в лишь слегка различающихся ситуациях, то можно считать, что имеется возможность демонстрировать гибкое поведение и, между прочим, более свободно выбирать паттерны, поскольку при этом будет учитываться соответствующим образом более широкий спектр адекватной информации. Если информация не используется (случайные паттерны) либо используется лишь какая-то отдельная порция информации (форсированные паттерны), то, естественно, нельзя считать, что наше поведение характеризуется гибкостью или свободой.

Очевидно, здесь действительно наблюдается существенная разница. По мере того, однако, как мы приближаемся к утверждению о том, что мозг — это некоторая вычислительная машина, меня все больше и больше тревожит проблема сути человеческих ценностей.

Утверждение о том, что мозг — это некоторая вычислительная машина, верно, но оно вводит в заблуждение. Мозг действительно является высокоспециализированным устройством для обработки информации или, скорее, множеством таких устройств. Отношение к мозгу человека как к устройствам для обработки информации ни в коей мере не выхолащивает и не отрицает человеческие ценности. Если уж поднимать эту проблему, то именно данная точка зрения отражает тенденцию к поддержке этих ценностей и может в конце концов помочь нам понять, что собой в действительности представляют человеческие ценности с информационной точки зрения, почему их природа избирательна и каким образом они вплетены в потенциальную способность человека к социальному поведению и организации, которой оделяют нас наши гены.


----

Статья из книги: Зрение | Д. Марр

Похожие новости


Добавить комментарий

Автору будет очень приятно узнать обратную связь о своей новости.

Комментариев 0