СЕНСОРНО- ПЕРЦЕПТИВНЫЕ ПЮЦЕССЫ 8 страница
Относительно слабо изученными остаются механизмы узнавания событий и сложных трансформаций биологических объектов. Более или менее правдоподобные объяснения разработаны здесь лишь для частных случаев, например, упоминавшейся выше походки (см. 3.1.2). Особенно большое внимание уделялось исследованию узнавания наиболее важного «стимула» в нашем окружении — человеческого лица и его эмоциональных выражений. Эти результаты выявляют асимметрическую зависимость: знакомость (например, в случае фотографий известных политических деятелей) улучшает узнавание эмоционального выражения, но варьирование выражения не оказывает какого-либо однознач-214 ного влияния на узнавание лиц.
Рис. 3.14. Иллюзия Тэтчер." можно сначала сравнить оба изображения при данной ориентации, а затем в нормальном и снова в перевернутом положении
Изучение признаков, обеспечивающих узнавание лиц, привело и в этой области к разделению целостных (конфигурационных, связанных со взаимным положением) и локальных признаков, определяемых спецификой деталей. В отличие от восприятия обычных предметов и объектов в нашем окружении (и в отличие от процессов чтения в культурах с алфавитной письменностью — см. 7.2.1), узнавание лица в большей степени определяется именно целостными характеристиками, так что даже если в действительности речь идет об изменении некоторого локального признака, испытуемые воспринимают его глобально. Например, изменение диаметра зрачка обычно не воспринимается как таковое, а интерпретируется глобально, скажем, как увеличение привлекательности. Целостное узнавание возможно только при нормальной пространственной ориентации, как это демонстрирует иллюзия Тэтчер (по имени главы британского правительства, сократившей в свое время финансирование научных исследований). Хотя мы легко можем установить, что изображения на рис. 3.14 не совпадают между собой в деталях, мы даже отдаленно не можем себе представить, в какой степени на самом деле различаются между собой выражения этих лиц.
|
|
Зависимость восприятия «внутренней геометрии» лица от его ориентации в пространстве ведет к тому, что при необычной ориентации мы, в известном смысле, становимся функционально слепыми к целостным фигуративным признакам. Эта зависимость имеет общий характер, но в случае лиц она выражена особенно сильно. Особый статус восприятия лиц доказывается существованием прозопагнозии — нейропсихологичес-кого синдрома, который связан с селективным выпадением узнавания преимущественно именно этого класса объектов. Интересно, что воз- 215
можны варианты этого синдрома, когда пациенты не могут зрительно узнавать даже своих близких родственников и знакомых, но, тем не менее, вполне успешно определяют «по выражению лица» эмоциональное состояние. Как показывают данные клинических наблюдений и мозгового картирования, эти формы восприятия, по-видимому, преимущественно связаны с нижневисочными отделами правого полушария.
|
|
В нижневисочных отделах коры тоже локализуются процессы, существенные для узнавания, а также, что интересно, даже для простой детекции (Grill-Spector, 2004) других категорий сложных зрительных стимулов (см 3 3 3 и 3 4 2) Продолжительные споры относительно того, до какой степени могут быть специализированы процессы восприятия формы объектов и как это связано с межполушарными различиями, привели в последнее время к возникновению представления о своеобразной полуспециализации полушарий. Правополушарные механизмы вентрального потока переработки зритетьной информации обеспечивают целостное восприятие лиц, а также участвуют в обработке формы и узнавании повседневных предметов Однако они не вовлечены сколько-нибудь существенно в процессы восприятия формы букв (в культурах алфавитной письменности) Левополушарные механизмы, напротив, работают скорее с отдельными признаками объектов Они обеспечивают процессы побуквенного чтения и частично участвуют в узнавании повседневных предметов, но не в узнавании лиц Это предварительное объяснение подтверждается, в частности, анализом основных синдромов дислексии — нарушения чтения при локальных поражениях мозга (см 7 2 2)
|
|
3.3.2 Влияние нейронаук и информатики
Многие из числа известных современных теорий распознавания опираются, как мы только что видели, на данные и модели, заимствованные из становящейся все более обширной области нейронаук — нейрофизиологии, нейропсихологии и нейроинформатики. Начало переориентации психологических описаний восприятия на физиологическую терминологию и нейросетевые объяснительные модели было положено открытием нейронов-детекторов признаков стимуляции. Особую известность получила основанная на данных микроэлектродного отведения активности отдельных нейронов модель Нобелевских лауреатов 1981 года Д. Хьюбела и Т. Визела. Согласно этой модели, на разных уровнях зрительной системы последовательно выделяются пятна, линии, углы, а затем и более сложные комбинации элементов контура («вплоть до детектора моей бабушки», как иронически заметила однажды американская исследовательница восприятия Науми Уайсстейн)
|
|
Эти данные, полученные при изучении зрительной системы кура-
ризированных кошек, были использованы в дальнейшем для моделиро-
216 вания различных аспектов зрительного восприятия. Если нейроны вы-
деляют соединения контуров, то почему разные соединения, например типов «Y», «X», «L» или «Т», выделяются с различной частотой? Математическое моделирование описаний трехмерных сцен показало, что такие соединения могут выполнять разные функции, связанные с отнесением участков, ограниченных контурами, к одним и тем же или к разным предметам Так, особенно часто выделяемое соединение типа «Y» с высокой степенью вероятности представляет собой вершину (впадину) единого объекта с тремя гранями. Напротив, соединение «Т» скорее свидетельствует о перекрытии одного предмета другим, причем верхняя «перекладина» принадлежит перекрывающему предмету, а центральная «ось» разделяет две поверхности перекрываемого предмета. Как в таком случае быть с участками объектов, не имеющими контуров, но, тем не менее, явно демонстрирующими «телесность», подобно изображенному на рис. 3.15А торсу? Возможно, что в этом случае используется некоторое сочетание детекции пространственных частот и ориентации Участки гладких поверхностей moi ут моделироваться путем выделения овальных теней и бликов различной величины и ориентации в пространстве (рис. 3.15Б).
На развитие формальных моделей распознавания в последние годы оказывают особенно сильное влияние идеи, возникшие в рамках работ
Рис. 3.15. Гладкие изменения телесных поверхностей (А) можно аппроксимировать (Б) с помощью множества овальных участков, разной ориентации (по Koendennk & van Doom, 2003)
217
218
по машинному зрению, компьютерной графике и нейроинформатике. Пожалуй, наиболее известной в психологии и за ее пределами до сих пор остается возникшая свыше двух десятилетий назад в этом контексте вычислительная модель зрительного восприятия Дэвида Марра (Магг, 1982). Эта модель постулирует три этапа переработки зрительной информации. На первом этапе вычисляется грубое, но полное описание изменений яркости в локальных участках изображения (в вариантах модели используется также информация о движении и бинокулярной диспарат-ности). Описание строится в терминах алфавита типов изменения яркости: КРАЙ, ТЕНИ-КРАЙ, ЛИНИЯ, ПЯТНО и т.д., дополненных параметрами ПОЛОЖЕНИЕ, ОРИЕНТАЦИЯ, КОНТРАСТ, РАЗМЕР и РАЗМЫТОСТЬ. Марр назвал такое описание первичным наброском, поскольку оно выделяет контур и подчеркивает слабые изменения яркости, подобно тому как это мог бы сделать художник, делая набросок картины. По отношению к первичному наброску последовательно применяются операции группировки и различения, результатом чего является выделение фигуры (объектов) из фона.
Описание формы выделенных из фона объектов осуществляется лишь на более поздних этапах восприятия. Эти этапы были пояснены в работах Марра значительно менее подробно, чем первичная сенсорная обработка. Первоначально строится так называемая «двух-с-половиной-мер- ная» (2'/2D) репрезентация предметов. Речь идет о том, что предметы отчасти приобретают телесность, третье измерение, но при этом восприятие остается ограниченным определенным углом зрения, под которым мы их наблюдаем. Собственно трехмерная (3D) репрезентация предметов, не зависящая от специфической точки зрения, строится в последнюю очередь и связана с эффективной «упаковкой» информации в памяти. Характер такой упаковки позволяет понять предложенная Марром и Ни-шихарой гипотеза обобщенных цилиндров. Согласно этой гипотезе, универсальными элементами «ментального конструктора» служат обобщенные цилиндры — цилиндрические элементы разных пропорций, размеров и ориентации. Спецификация формы предметов примерно соответствует микрогенетическому принципу перехода рт глобальных к локальным системам отсчета. Примером служит репрезентация формы человеческого тела, показанная на рис. 3.16. Незначительная модификация параметров составляющих тело цилиндров позволяет описать общие очертания других похожих биологических существ и их движений (см. 3.1.2).
К этой же группе моделей примыкает теория американского психолога Ирвина Бидермана (Biederman, 1987), предположившего, что зрительная система располагает целым алфавитом таких базовых элементов, которые он называет геонами. Наряду с цилиндрами, этот алфавит включает еще несколько других простых форм, таких как конусы и параллелепипеды. Различные предметы могут составляться из разных элементов. Психофизиологическая реальность подобных элементов не вполне очевидна. Эксперименты с использованием так называемого прайминга (см. 5.1.3), при которых гипотетические элементы предмета предъявлялись в некотором иррелевантном контексте непосредственно перед опытами на его прямое опознание, не выявили в общем случае ожидавшегося ускорения опознания. Поэтому вопрос о возможности некоторой
человек
кисть |
Рис. 3.16. Описание сложного объекта с помощью иерархии «обобщенных цилиндров» (по: Магг, 1982).
универсальной, основанной на геометрии декомпозиции предметов остается открытым. Скорее всего такая декомпозиция может быть только результатом развернутого во времени обучения, позволяющего постепенно выявить компоненты предмета, которые обладают наибольшей автономной вариабильностью и, таким образом, заслуживают статуса «частей».
С помощью компьютерной графики и других, например акустических и тактильных, средств предъявления новой информации и обратной связи о собственных движениях, у наблюдателя можно создать живую иллюзию взаимодействия с динамическим предметным окружением — виртуальную реальность {virtual reality, VR)25. Кроме таких полностью искусственных моделей среды и объектов на практике (в частности, в устройствах отображения информации) широко используется промежуточная форма представления среды, расширенная реальность {augmented reality, AR). В этом случае восприятие реального окружения совмещается с элементами искусственного окружения, созданного средствами компьютерной графики, что дает возможность воспринимать скрытые характеристики объектов, такие как внутреннее устройство автомобильного двигателя, положение анатомических структур во время эндоскопической операции, детальный рельеф местности в тумане и т.д. (см. 9.2.3).
25 Значительный прогресс наблюдается сегодня в создании тактильных (гаптических) компонентов виртуальной реальности. С их помощью сапер может за сотни метров от эпицентра событий почувствовать сопротивление проржавевшего металла обезвреживаемой роботом мины, хирург — пластичность обрабатываемых на расстоянии тканей и т.д.
219
Последней разновидностью является так называемая расширенная вир туальность (augmented virtuality, AV), которая представляет собой искусственное окружение для реальных объектов и, например, используется для проведения VR -видеоконференций с обсуждением и проверкой реальных технических изделий (Величковский, 2003).
Все эти сенсорные технологии разрабатываются при участии психологов. Они начинают оказывать заметное влияние и на сами психологические исследования, прежде всего психологию восприятия. В частности, системы виртуальной реальности используются для создания условий экспериментов, которые, с одной стороны, экологически валидны, а с другой, позволяют контролировать независимые переменные (как, например, в исследованиях восприятия опасных ситуаций и реагирования на них при поездках по виртуальному городу — см. 3.4.2). Наряду с этим вкладом в методологию эксперимента, компьютерная графика может служить источником аналогий для теоретических представлений о восприятии. При создании виртуального окружения сначала строится схематическая (или «проволочная») модель среды, которая затем «облачается» участками различных текстур. Можно предположить, что восприятие решает обратную задачу, а именно задачу перехода от информационно богатого внешнего окружения к обедненной схематической модели среды. Понятно, что на ранних этапах микрогенеза важную рель должны играть не только контуры, но и в особенности текстуры.
Именно при обработке текстур, выделении границ объектов и контуров обнаруживается особая компетентность разрабатываемых в ней-роинформатике коннекционистских моделей (см. 2.3.3). На рис. 3.17 показаны примеры того, как самоорганизующаяся нейронная сеть справляется с соответствующими тестовыми заданиями. В первом случае (А) сеть различает участки достаточно похожих текстур. Во втором (Б) — выделяет и подчеркивает контурные компоненты сложного изображения. Методы параллельной обработки используются также при распознавании пластических трансформаций биологических объектов, таких как движения губ при речи и мимика эмоций. Значительный практический интерес представляет собой и обратная задача — продуцирование правдоподобной мимики и эмоционального выражения лица виртуальных персонажей (аватаров). Соответствующие технологии необходимы для создания антропоморфных интерфейсов, например, систем «видимой речи», позволяющих глухим людям пользоваться для общения обычным телефоном с соответствующей компьютерной приставкой (см. 7.4.3 и 9.4.2).
Методы нейроинформатики могут использоваться и в значительно более глобальном плане — для так называемого эволюционного моделирования механизмов восприятия. Для этого первоначально совершенно гомогенная нейронная сеть (то есть сеть с одинаковыми весовыми коэффициентами синаптических связей) начинает подвергаться много-220 кратному (десятки тысяч раз) воздействию разнообразных, возникаю-
Рис. 3.17. Примеры сенсорно-перцептивных задач, успешно решаемых нейронными сетями А. Дифференциация текстур; Б. Выделение контуров в составе сложного изображения
щих в различных участках «поля зрения» сети объектов. Успешность работы сети определяется ее способностью распознавать эти объекты. Такого рода идеализированные компьютерные эксперименты обычно демонстрируют любопытный эффект постепенной «модуляризации сети»: нейронная сеть начинает распадаться на две автономные подсистемы, одна из которых занимается преимущественно выделением параметров местоположения объектов, а другая — анализом их фигуративных характеристик, критических для собственно распознавания (Calabretta & Parisi, 2005).
Вырисовывающееся различение соответствует изложенным выше фактам об уровневой организации восприятия и прямо напоминает два гипотетических механизма построения движений, а именно уровни пространственного поля С и предметного действия D, описанные в 1947 году H.A. Бернштейном (см. 1.4.2). В современной нейропсихологии предположение о существовании в восприятии приматов и человека двух, филогенетически различных зрительных систем одним из пер-
221
вых высказал, в 1968 году, шотландский исследователь Колуин Тривар-зен (Trevarthen, 1968). Специализацией более древней системы, или так называемого «амбьентного зрения» (от фр. ambiance = окружение), по его мнению, является динамическая пространственная локализация. Вторая система, или «фокальное зрение», занимается идентификацией объектов. На основании экспериментов с перерезкой мозолистого тела (корпус коллозум), связывающего между собой полушария большого мозга, Триварзен и Сперри пришли к выводу, что первая система расположена преимущественно в субкортикальных структурах, тогда как вторая система находится в коре и поэтому зависит от сохранности межполушарных связей (Trevarthen & Sperry, 1973).
В последующем нейропсихологический поиск субстрата этих двух форм зрительной обработки надолго сместился в кору (отчасти потому, что процессы в коре проще наблюдать, чем в субкортикальных структурах). В этом контексте различают дорзальный (ведущий в заднетеменные зоны коры) и вентральный (нижние височные зоны) «потоки» зрительной информации, хотя постепенно накапливается все больше данных, подтверждающих мнение Бернштейна и Триварзена, что филогенетически более древний дорзальный поток {амбьентное зрение, или уровень С) включает и субкортикальные компоненты. Различие механизмов локализации и идентификации было установлено в последнее время также в слуховом восприятии (см. 4.1.2). Аналогичные взаимодействия выявляются и при выполнении мануальных движений: при схватывании предмета сначала задается общее направление и расстояние (локализация), и лишь затем осуществляется приспособление пальцев к его форме и размерам (идентификация). Мы более подробно остановимся на дискуссиях об уровневой организации восприятия в последнем разделе этой главы (см. 3.4.2) после рассмотрения взаимоотношений восприятия и семантики.
3.3.3 Роль предметности и семантический контекст
Недостаток большинства нейрофизиологических моделей распознавания состоит в том, что они односторонне подчеркивают геометрические признаки конфигурации, игнорируя предметный контекст. Предмет ность восприятия представляет собой не просто абстрактный философский или, например, идеологический принцип26, а фактор, оказываю-
26 По известному замечанию Курта Коффки, мы воспринимаем «предметы, а не промежутки между ними». Согласно Брентано и последующим феноменологическим направлениям философии и психологии, предметность и интенциональность (в смысле «интенцио-нальной направленности психических актов на предметы») лежат в основе феноменов сознания. В марксистской философии предметность восприятия («чувственного отражения») 222 выводилась из предметного характера внешней практической деятельности (см. 9.3.1).
Дата добавления: 2019-07-17; просмотров: 120; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!