СЕНСОРНО- ПЕРЦЕПТИВНЫЕ ПЮЦЕССЫ 8 страница



Относительно слабо изученными остаются механизмы узнавания событий и сложных трансформаций биологических объектов. Более или менее правдоподобные объяснения разработаны здесь лишь для част­ных случаев, например, упоминавшейся выше походки (см. 3.1.2). Осо­бенно большое внимание уделялось исследованию узнавания наиболее важного «стимула» в нашем окружении — человеческого лица и его эмо­циональных выражений. Эти результаты выявляют асимметрическую зависимость: знакомость (например, в случае фотографий известных политических деятелей) улучшает узнавание эмоционального выраже­ния, но варьирование выражения не оказывает какого-либо однознач-214  ного влияния на узнавание лиц.


Рис. 3.14. Иллюзия Тэтчер." можно сначала сравнить оба изображения при данной ори­ентации, а затем в нормальном и снова в перевернутом положении

Изучение признаков, обеспечивающих узнавание лиц, привело и в этой области к разделению целостных (конфигурационных, связанных со взаимным положением) и локальных признаков, определяемых спе­цификой деталей. В отличие от восприятия обычных предметов и объек­тов в нашем окружении (и в отличие от процессов чтения в культурах с алфавитной письменностью — см. 7.2.1), узнавание лица в большей сте­пени определяется именно целостными характеристиками, так что даже если в действительности речь идет об изменении некоторого локального признака, испытуемые воспринимают его глобально. Например, изме­нение диаметра зрачка обычно не воспринимается как таковое, а интер­претируется глобально, скажем, как увеличение привлекательности. Це­лостное узнавание возможно только при нормальной пространственной ориентации, как это демонстрирует иллюзия Тэтчер (по имени главы британского правительства, сократившей в свое время финансирование научных исследований). Хотя мы легко можем установить, что изображе­ния на рис. 3.14 не совпадают между собой в деталях, мы даже отдаленно не можем себе представить, в какой степени на самом деле различаются между собой выражения этих лиц.

Зависимость восприятия «внутренней геометрии» лица от его ори­ентации в пространстве ведет к тому, что при необычной ориентации мы, в известном смысле, становимся функционально слепыми к целостным фигуративным признакам. Эта зависимость имеет общий характер, но в случае лиц она выражена особенно сильно. Особый статус восприятия лиц доказывается существованием прозопагнозии — нейропсихологичес-кого синдрома, который связан с селективным выпадением узнавания преимущественно именно этого класса объектов. Интересно, что воз-  215


можны варианты этого синдрома, когда пациенты не могут зрительно узнавать даже своих близких родственников и знакомых, но, тем не ме­нее, вполне успешно определяют «по выражению лица» эмоциональное состояние. Как показывают данные клинических наблюдений и мозго­вого картирования, эти формы восприятия, по-видимому, преимуще­ственно связаны с нижневисочными отделами правого полушария.

В нижневисочных отделах коры тоже локализуются процессы, су­щественные для узнавания, а также, что интересно, даже для простой детекции (Grill-Spector, 2004) других категорий сложных зрительных стимулов (см 3 3 3 и 3 4 2) Продолжительные споры относительно того, до какой степени могут быть специализированы процессы вос­приятия формы объектов и как это связано с межполушарными разли­чиями, привели в последнее время к возникновению представления о своеобразной полуспециализации полушарий. Правополушарные меха­низмы вентрального потока переработки зритетьной информации обеспечивают целостное восприятие лиц, а также участвуют в обработ­ке формы и узнавании повседневных предметов Однако они не вовле­чены сколько-нибудь существенно в процессы восприятия формы букв (в культурах алфавитной письменности) Левополушарные механизмы, напротив, работают скорее с отдельными признаками объектов Они обеспечивают процессы побуквенного чтения и частично участвуют в узнавании повседневных предметов, но не в узнавании лиц Это пред­варительное объяснение подтверждается, в частности, анализом основ­ных синдромов дислексии — нарушения чтения при локальных пора­жениях мозга (см 7 2 2)

3.3.2 Влияние нейронаук и информатики

Многие из числа известных современных теорий распознавания опира­ются, как мы только что видели, на данные и модели, заимствованные из становящейся все более обширной области нейронаук — нейрофизи­ологии, нейропсихологии и нейроинформатики. Начало переориента­ции психологических описаний восприятия на физиологическую тер­минологию и нейросетевые объяснительные модели было положено открытием нейронов-детекторов признаков стимуляции. Особую изве­стность получила основанная на данных микроэлектродного отведения активности отдельных нейронов модель Нобелевских лауреатов 1981 года Д. Хьюбела и Т. Визела. Согласно этой модели, на разных уровнях зрительной системы последовательно выделяются пятна, линии, углы, а затем и более сложные комбинации элементов контура («вплоть до детектора моей бабушки», как иронически заметила однажды амери­канская исследовательница восприятия Науми Уайсстейн)

Эти данные, полученные при изучении зрительной системы кура-

ризированных кошек, были использованы в дальнейшем для моделиро-

216  вания различных аспектов зрительного восприятия. Если нейроны вы-


деляют соединения контуров, то почему разные соединения, например типов «Y», «X», «L» или «Т», выделяются с различной частотой? Мате­матическое моделирование описаний трехмерных сцен показало, что такие соединения могут выполнять разные функции, связанные с отне­сением участков, ограниченных контурами, к одним и тем же или к раз­ным предметам Так, особенно часто выделяемое соединение типа «Y» с высокой степенью вероятности представляет собой вершину (впадину) единого объекта с тремя гранями. Напротив, соединение «Т» скорее свидетельствует о перекрытии одного предмета другим, причем верхняя «перекладина» принадлежит перекрывающему предмету, а центральная «ось» разделяет две поверхности перекрываемого предмета. Как в таком случае быть с участками объектов, не имеющими контуров, но, тем не менее, явно демонстрирующими «телесность», подобно изображенному на рис. 3.15А торсу? Возможно, что в этом случае используется некото­рое сочетание детекции пространственных частот и ориентации Участ­ки гладких поверхностей moi ут моделироваться путем выделения оваль­ных теней и бликов различной величины и ориентации в пространстве (рис. 3.15Б).

На развитие формальных моделей распознавания в последние годы оказывают особенно сильное влияние идеи, возникшие в рамках работ




 


 


Рис. 3.15. Гладкие изменения телесных поверхностей (А) можно аппроксимировать (Б) с помощью множества овальных участков, разной ориентации (по Koendennk & van Doom, 2003)


217


218


по машинному зрению, компьютерной графике и нейроинформатике. Пожалуй, наиболее известной в психологии и за ее пределами до сих пор остается возникшая свыше двух десятилетий назад в этом контексте вы­числительная модель зрительного восприятия Дэвида Марра (Магг, 1982). Эта модель постулирует три этапа переработки зрительной инфор­мации. На первом этапе вычисляется грубое, но полное описание изме­нений яркости в локальных участках изображения (в вариантах модели используется также информация о движении и бинокулярной диспарат-ности). Описание строится в терминах алфавита типов изменения ярко­сти: КРАЙ, ТЕНИ-КРАЙ, ЛИНИЯ, ПЯТНО и т.д., дополненных пара­метрами ПОЛОЖЕНИЕ, ОРИЕНТАЦИЯ, КОНТРАСТ, РАЗМЕР и РАЗМЫТОСТЬ. Марр назвал такое описание первичным наброском, по­скольку оно выделяет контур и подчеркивает слабые изменения яркости, подобно тому как это мог бы сделать художник, делая набросок карти­ны. По отношению к первичному наброску последовательно применя­ются операции группировки и различения, результатом чего является выделение фигуры (объектов) из фона.

Описание формы выделенных из фона объектов осуществляется лишь на более поздних этапах восприятия. Эти этапы были пояснены в рабо­тах Марра значительно менее подробно, чем первичная сенсорная обра­ботка. Первоначально строится так называемая «двух-с-половиной-мер- ная» (2'/2D) репрезентация предметов. Речь идет о том, что предметы отчасти приобретают телесность, третье измерение, но при этом воспри­ятие остается ограниченным определенным углом зрения, под которым мы их наблюдаем. Собственно трехмерная (3D) репрезентация предметов, не зависящая от специфической точки зрения, строится в последнюю очередь и связана с эффективной «упаковкой» информации в памяти. Характер такой упаковки позволяет понять предложенная Марром и Ни-шихарой гипотеза обобщенных цилиндров. Согласно этой гипотезе, уни­версальными элементами «ментального конструктора» служат обобщен­ные цилиндры — цилиндрические элементы разных пропорций, размеров и ориентации. Спецификация формы предметов примерно соответству­ет микрогенетическому принципу перехода рт глобальных к локальным системам отсчета. Примером служит репрезентация формы человеческо­го тела, показанная на рис. 3.16. Незначительная модификация парамет­ров составляющих тело цилиндров позволяет описать общие очертания других похожих биологических существ и их движений (см. 3.1.2).

К этой же группе моделей примыкает теория американского психо­лога Ирвина Бидермана (Biederman, 1987), предположившего, что зри­тельная система располагает целым алфавитом таких базовых элементов, которые он называет геонами. Наряду с цилиндрами, этот алфавит вклю­чает еще несколько других простых форм, таких как конусы и паралле­лепипеды. Различные предметы могут составляться из разных элемен­тов. Психофизиологическая реальность подобных элементов не вполне очевидна. Эксперименты с использованием так называемого прайминга (см. 5.1.3), при которых гипотетические элементы предмета предъявля­лись в некотором иррелевантном контексте непосредственно перед опы­тами на его прямое опознание, не выявили в общем случае ожидавшего­ся ускорения опознания. Поэтому вопрос о возможности некоторой


человек



кисть


 


Рис. 3.16. Описание сложного объекта с помощью иерархии «обобщенных цилиндров» (по: Магг, 1982).

универсальной, основанной на геометрии декомпозиции предметов ос­тается открытым. Скорее всего такая декомпозиция может быть только результатом развернутого во времени обучения, позволяющего посте­пенно выявить компоненты предмета, которые обладают наибольшей автономной вариабильностью и, таким образом, заслуживают статуса «частей».

С помощью компьютерной графики и других, например акустичес­ких и тактильных, средств предъявления новой информации и обратной связи о собственных движениях, у наблюдателя можно создать живую иллюзию взаимодействия с динамическим предметным окружением — виртуальную реальность {virtual reality, VR)25. Кроме таких полностью искусственных моделей среды и объектов на практике (в частности, в ус­тройствах отображения информации) широко используется промежу­точная форма представления среды, расширенная реальность {augmented reality, AR). В этом случае восприятие реального окружения совмещается с элементами искусственного окружения, созданного средствами компь­ютерной графики, что дает возможность воспринимать скрытые харак­теристики объектов, такие как внутреннее устройство автомобильного двигателя, положение анатомических структур во время эндоскопичес­кой операции, детальный рельеф местности в тумане и т.д. (см. 9.2.3).


25 Значительный прогресс наблюдается сегодня в создании тактильных (гаптических) компонентов виртуальной реальности. С их помощью сапер может за сотни метров от эпицентра событий почувствовать сопротивление проржавевшего металла обезврежива­емой роботом мины, хирург — пластичность обрабатываемых на расстоянии тканей и т.д.


219


Последней разновидностью является так называемая расширенная вир­ туальность (augmented virtuality, AV), которая представляет собой искус­ственное окружение для реальных объектов и, например, используется для проведения VR -видеоконференций с обсуждением и проверкой реаль­ных технических изделий (Величковский, 2003).

Все эти сенсорные технологии разрабатываются при участии пси­хологов. Они начинают оказывать заметное влияние и на сами психо­логические исследования, прежде всего психологию восприятия. В ча­стности, системы виртуальной реальности используются для создания условий экспериментов, которые, с одной стороны, экологически ва­лидны, а с другой, позволяют контролировать независимые перемен­ные (как, например, в исследованиях восприятия опасных ситуаций и реагирования на них при поездках по виртуальному городу — см. 3.4.2). Наряду с этим вкладом в методологию эксперимента, компьютерная графика может служить источником аналогий для теоретических пред­ставлений о восприятии. При создании виртуального окружения снача­ла строится схематическая (или «проволочная») модель среды, которая затем «облачается» участками различных текстур. Можно предполо­жить, что восприятие решает обратную задачу, а именно задачу перехо­да от информационно богатого внешнего окружения к обедненной схе­матической модели среды. Понятно, что на ранних этапах микрогенеза важную рель должны играть не только контуры, но и в особенности текстуры.

Именно при обработке текстур, выделении границ объектов и кон­туров обнаруживается особая компетентность разрабатываемых в ней-роинформатике коннекционистских моделей (см. 2.3.3). На рис. 3.17 показаны примеры того, как самоорганизующаяся нейронная сеть справляется с соответствующими тестовыми заданиями. В первом случае (А) сеть различает участки достаточно похожих текстур. Во втором (Б) — выделяет и подчеркивает контурные компоненты сложного изображения. Методы параллельной обработки используются также при распознавании пластических трансформаций биологических объектов, таких как движе­ния губ при речи и мимика эмоций. Значительный практический интерес представляет собой и обратная задача — продуцирование правдоподоб­ной мимики и эмоционального выражения лица виртуальных персона­жей (аватаров). Соответствующие технологии необходимы для создания антропоморфных интерфейсов, например, систем «видимой речи», по­зволяющих глухим людям пользоваться для общения обычным телефо­ном с соответствующей компьютерной приставкой (см. 7.4.3 и 9.4.2).

Методы нейроинформатики могут использоваться и в значитель­но более глобальном плане — для так называемого эволюционного моде­лирования механизмов восприятия. Для этого первоначально совершен­но гомогенная нейронная сеть (то есть сеть с одинаковыми весовыми коэффициентами синаптических связей) начинает подвергаться много-220       кратному (десятки тысяч раз) воздействию разнообразных, возникаю-



 


Рис. 3.17. Примеры сенсорно-перцептивных задач, успешно решаемых нейронными се­тями А. Дифференциация текстур; Б. Выделение контуров в составе сложного изобра­жения


щих в различных участках «поля зрения» сети объектов. Успешность ра­боты сети определяется ее способностью распознавать эти объекты. Та­кого рода идеализированные компьютерные эксперименты обычно де­монстрируют любопытный эффект постепенной «модуляризации сети»: нейронная сеть начинает распадаться на две автономные подсистемы, одна из которых занимается преимущественно выделением параметров местоположения объектов, а другая — анализом их фигуративных ха­рактеристик, критических для собственно распознавания (Calabretta & Parisi, 2005).

Вырисовывающееся различение соответствует изложенным выше фактам об уровневой организации восприятия и прямо напоминает два гипотетических механизма построения движений, а именно уровни пространственного поля С и предметного действия D, описанные в 1947 году H.A. Бернштейном (см. 1.4.2). В современной нейропсихоло­гии предположение о существовании в восприятии приматов и челове­ка двух, филогенетически различных зрительных систем одним из пер-


221


вых высказал, в 1968 году, шотландский исследователь Колуин Тривар-зен (Trevarthen, 1968). Специализацией более древней системы, или так называемого «амбьентного зрения» (от фр. ambiance = окружение), по его мнению, является динамическая пространственная локализация. Вторая система, или «фокальное зрение», занимается идентификацией объектов. На основании экспериментов с перерезкой мозолистого тела (корпус коллозум), связывающего между собой полушария большого мозга, Триварзен и Сперри пришли к выводу, что первая система рас­положена преимущественно в субкортикальных структурах, тогда как вторая система находится в коре и поэтому зависит от сохранности межполушарных связей (Trevarthen & Sperry, 1973).

В последующем нейропсихологический поиск субстрата этих двух форм зрительной обработки надолго сместился в кору (отчасти потому, что процессы в коре проще наблюдать, чем в субкортикальных структу­рах). В этом контексте различают дорзальный (ведущий в заднетеменные зоны коры) и вентральный (нижние височные зоны) «потоки» зритель­ной информации, хотя постепенно накапливается все больше данных, подтверждающих мнение Бернштейна и Триварзена, что филогенети­чески более древний дорзальный поток {амбьентное зрение, или уро­вень С) включает и субкортикальные компоненты. Различие механиз­мов локализации и идентификации было установлено в последнее время также в слуховом восприятии (см. 4.1.2). Аналогичные взаимо­действия выявляются и при выполнении мануальных движений: при схватывании предмета сначала задается общее направление и расстоя­ние (локализация), и лишь затем осуществляется приспособление паль­цев к его форме и размерам (идентификация). Мы более подробно оста­новимся на дискуссиях об уровневой организации восприятия в последнем разделе этой главы (см. 3.4.2) после рассмотрения взаимоот­ношений восприятия и семантики.

3.3.3 Роль предметности и семантический контекст

Недостаток большинства нейрофизиологических моделей распознава­ния состоит в том, что они односторонне подчеркивают геометрические признаки конфигурации, игнорируя предметный контекст. Предмет­ ность восприятия представляет собой не просто абстрактный философ­ский или, например, идеологический принцип26, а фактор, оказываю-

26 По известному замечанию Курта Коффки, мы воспринимаем «предметы, а не проме­жутки между ними». Согласно Брентано и последующим феноменологическим направле­ниям философии и психологии, предметность и интенциональность (в смысле «интенцио-нальной направленности психических актов на предметы») лежат в основе феноменов со­знания. В марксистской философии предметность восприятия («чувственного отражения») 222   выводилась из предметного характера внешней практической деятельности (см. 9.3.1).


Дата добавления: 2019-07-17; просмотров: 21;