ИНСТИНКТ ОВЛАДЕНИЯ МАСТЕРСТВОМ 25 страница

⇐ ПредыдущаяСтр 25 из 32Следующая ⇒

Благодаря избыточности в языке вх мхжхтх пхнхть, чтх х пхшх, дхжх хслх х зхмхнх вех глхенхх нх «х» (ел в н знт, гд етт глен, т бдт нмнг трдн)¹⁹*. При понимании речи избыточность, обеспечиваемая фонологическими правилами, может компенсировать двусмысленность, вызванную звуковой волной. Например, слушающий может быть уверен, что «thisrip» это this rip, а не the srip, поскольку в английском сочетание согласных sr невозможно.

* * *

Так почему же нация, которая может запустить человека на Луну, не может сконструировать компьютер, который будет воспринимать диктовку? В соответствии с тем, что я до сих пор объяснял, каждая фонема должна иметь свидетельствующее о ней акустическое выражение: набор резонансов для гласных, вызывающая шум преграда для фрикативных, и последовательность «тишина — взрыв — переход» для смычных. Последовательности фонем обрабатываются предсказуемым образом идущими

' «Вы можете понять, что я пишу, даже если я заменю все гласные на „х" (если вы не знаете, где стоят гласные, это будет немного труднее)». — Прим. перев.

172

Глава 6. Звуки тишины

по порядку фонологическими правилами, результаты действия которых были бы, очевидно, сведены на нет, если бы правила применялись в обратном порядке.

Причина, по которой понимание речи вызывает такие трудности, в том, что на пути между мозгом и губами много раз можно поскользнуться. Нет двух совершенно одинаковых человеческих голосов, различаться будут и формы голосового тракта, формирующего звуки, и индивидуальная манера артикуляции. Фонемы также звучат очень по-разному, в зависимости от того, насколько они напряженные и как быстро их произносят; в быстрой речи многие просто проглатываются.

Но главная причина того, почему электронная стенографистка не ждет вашего вызова за дверью, связана с общим явлением, возникающим при управлении мускулатурой, и называемым коартикуляцией. Поставьте перед собой блюдце и на расстоянии около полуметра от нее — кофейную чашку. Теперь быстро дотроньтесь до блюдца и схватите чашку. Вы наверняка дотронулись до края блюдца, ближнего к чашке, а не ровно посредине. Ваши пальцы наверняка пришли в позицию, удобную для хватания, вто время, как рука двигалась по направлению к чашке, но прежде, чем достигла цели. Такой плавный переход от одного жеста к другому и накладывание жестов повсеместно встречаются при осуществлении моторных функций. Это экономит силы, необходимые для движения частей тела и уменьшает нагрузку на суставы. Язык и гортань не являются исключением. Когда мы намереваемся артикулировать фонему, наш язык не может немедленно занять требуемую позицию: это увесистый кусок мяса, которому нужно время, чтобы переместиться. Поэтому пока мы его перемещаем, наш мозг планирует траекторию, уже представляя себе следующее положение, совсем как в случае с блюдцем и чашкой. Изо всех возможных позиций в полости рта, которые могут определить фонему, мы помещаем язык в ту, при которой наибыстрейшим образом может быть артикулирована следующая фонема. Если фонемой, которую мы сейчас произносим, не задано, где в точности должен находиться орган речи, мы предугадываем, где он должен находиться для произнесения следующей фонемы, и помещаем его туда заранее. Большинство из нас находится в полном неведении об этих аккомодациях, пока к ним не привлекут внимания. Произнесите Cape Cod [keip kt>d]. До сих пор вы наверняка не замечали, что корпус языка занимает разные позиции для произнесения этих двух звуков к. В слове horseshoe [ho:/-/u:] первое s становится sh, при произнесении NPR п становится т, в словах month и width место образования звуков п и d — возле зубов, а не у края десен, как обычно.

Поскольку звуковые волны мгновенно реагируют на форму полостей, по которым они проходят, то коартикуляция сеет смуту среди звуков речи. Индивидуальная звуковая реализация той или иной фонемы «подкрашена» теми фонемами, которые идут перед ней и после нее, иногда до такой степени, что эта звуковая реализация не имеет ничего общего с фонемой благодаря компании других фонем. Вот почему невозможно отрезать кусок пленки с записью звучащего слова cat и надеяться найти в нем от-

Речь и звуки, из которых она складывается

173

носящуюся к началу часть, которая содержала бы один звук к. Чем ближе и ближе к началу будут эти отрезки, их звучание будет варьироваться от чего-то, напоминающего ка, до чириканья или свиста. Такое «смазывание» фонем в речи могло бы в принципе иметь преимущество для оптимально сконструированного опознавателя речи. Согласные и гласные реализуются в речи синхронно, значительно увеличивая количество фонем, произносимых в секунду, как было замечено в начале этой главы, и существует много избыточных звуковых подсказок о том, что за фонема имеется в виду. Но этим преимуществом может воспользоваться только высоко технологичный распознаватель речи, тот, что имеет некоторое представление о принципах смешения звуков речевым аппаратом.

Конечно, человеческий мозг — это высоко технологичный распознаватель речи, однако, никто не знает, как ему удается быть таковым. Поэтому психологи, изучающие восприятие речи, и инженеры, конструирующие механизмы для распознавания речи, пристально наблюдают за работой друг друга. Возможно, распознавание речи — настолько сложный процесс, что существует всего несколько способов того, как оно в принципе может быть реализовано. Если так, то способ, которым пользуется мозг, может подсказать, как наилучшим образом сконструировать машину для распознавания речи, а способ, каким это удастся сделать машине, может предложить гипотезу о том, как это удается мозгу.

* * *

Уже на ранних этапах истории исследований речи стало ясно, что слушающие способны с выгодой для себя использовать свои представления о речевых намерениях говорящего. Последние сужают круг вариантов, возможных при акустическом анализе речевых сигналов. Мы уже заметили, что фонологические правила обеспечивают один вид избыточности, который можно использовать, но люди в состоянии пойти еще дальше. Психолог Джордж Миллер проиграл записи предложений, произносимых на фоне шума, и попросил людей в точности повторить, что они слышали. Некоторые предложения соответствовали правилам английского синтаксиса и имели смысл:

Furry wildcats fight furious battles 'Пушистые дикие кошки ведут яростные бои'.

Respectable jewelers give accurate appraisals 'Уважаемые ювелиры высказывают сдержанное одобрение'.

Lighted sigarrets create smoky fumes 'Облегченные сигареты создают клубы дыма'.

Gallant gentlemen save distressed damsels 'Галантные кавалеры спасают опечаленных дам'.

Soapy detergents dissolve greasy stains 'Мыльные моющие средства растворяют жирные пятна'.

Другие предложения были получены «перемешиванием» слов из разных синтаксических групп, что дало бесцветно-зелено-мысленные предложения, грамматически правильные, но бессмысленные:

174

Глава 6. Звуки тишины

Furry jewelers create distressed stains 'Пушистые ювелиры создают опечаленные пятна'.

Respectable cigaretts save greasy battles 'Уважаемые сигареты спасают жирные бои'.

Lighted gentlemen dissolve furious appraisals 'Облегченные кавалеры растворяют яростные одобрения'.

Gallant detergents fight accurate fumes 'Галантные моющие средства ведут сдержанные клубы дыма'.

Soapy wildcats give smoky damsels 'Мыльные дикие кошки спасают дымных

дам'.

Третий вид предложений был получен «перемешиванием» непосредственно составляющих в структуре при сохранении в предложении одних и тех же слов:

Furry fight furious wildcat battles 'Пушистые ведут яростные дикие кошки бои'.

Jewelers respectable appraisals accurate give 'Ювелиры уважаемые одобрения сдержанно высказывают'.

И наконец, некоторые предложения были просто словесным винегретом, как например:

Furry create distressed jewelers stains 'Пушистые создают опечаленные ювелиры пятна'.

Cigaretts respectable battles greasy save 'Сигареты уважаемые бои жирные спасают'.

Люди лучше всего справились с имеющими смысл грамматически правильными предложениями, хуже — с грамматически правильной бессмыслицей и грамматически неправильным смыслом, а хуже всего — с грамматически неправильной бессмыслицей. Несколько лет спустя психолог Ричард Уоррен записал на пленку предложения типа: The state governors met with their respective legislatures convening in the capital city 'Губернаторы штатов встретились с представителями соответствующих законодательных органов, заседающими в столице', изъял s из слова legislatures и заменил его покашливанием. Слушающие сказали, что ни одного звука не было пропущено.

Вы можете подумать, что звуковая волна находится на нижнем уровне иерархии «звуки — фонемы — слова — синтаксические группы — значения предложений — знание вообще». Но то, что было продемонстрировано выше, явно подразумевает, что восприятие человеком речи осуществляется сверху вниз скорее, чем снизу вверх. Возможно, мы постоянно пытаемся догадаться, что собирается сказать говорящий, используя каждую находящуюся в нашем распоряжении крупицу осознанного и неосознанного знания, начиная со знания о том, как коартикуляция «смазывает» звуки, до знания правил английской фонологии, английского синтаксиса, знаний о производителях и объектах действия, и о том, что в данный момент на уме у собеседника. Если наши предположения достаточно точны, то акустический анализ может быть очень поверхност-

Речь и звуки, из которых она складывается 175

ным: то, чего не достает звуковой волне, заполнит контекст. Например, если вы слушаете дискуссию о разрушении экологических сред обитания, вы можете заранее настроиться на слова, относящиеся к исчезающим животным и растениям, и тогда, когда вы слышите звуки, в которых невозможно разобрать фонемы, например: eesees[i:si:z], вы сможете правильно воспринять это слово как spec/es[spi:Jl:z] 'биологический вид', если только вы не Эмили Лителла — тугой на ухо персонаж «Сэтердей найт лайв», яростно выступавшая против кампании по защите поставленных под угрозу feces [fi:si:z] 'каловые массы'. (И действительно, юмор, связанный с Гильдой Рэднер, которая также отчаянно боролась против спасения «советской бижутерии», «остановки скрипок» на улице и сохранения естественных «скаковых лошадей», вызван не проблемами на нижнем уровне обработки звука, но тупостью на верхнем уровне, там, где нужно было бы не допустить саму возможность таких интерпретаций) ²⁰\

Теория восприятия речи «сверху вниз» производит на некоторых людей сильное эмоциональное впечатление. Она подтверждает философию релятивистов о том, что мы слышим то, что надеемся услышать, что наше знание определяет наше восприятие и, наконец, что мы не находимся в прямом контакте с объективной реальностью. В каком-то смысле восприятие, упрямо идущее сверху вниз, может стать едва управляемой галлюцинацией, в этом-то и проблема. Человек, воспринимающий речь и вынужденный полагаться на свои ожидания, находится в очень невыигрышном положении в том мире, который непредсказуем даже при самых благоприятных обстоятельствах. Есть основания полагать, что восприятие человеческой речи в сильной степени определяется на акустическом уровне. Если у вас есть готовый к сотрудничеству друг, вы можете проделать следующий эксперимент: выберите наугад из словаря десять слов, позвоните другу и четко произнесите эти слова. Весьма вероятно, что друг легко сможет их воспроизвести, полагаясь только на данные звуковой волны и на свое знание английского словаря и фонологии. Ваш друг не мог использовать никаких относящихся к высокому уровню предположений относительно структуры высказывания, контекста, или связанной с ним истории, поскольку у множества слов, выбранного наугад, их нет. Хотя при плохой слышимости или на фоне помех мы и можем сослаться на теоретическое знание, относящееся к высокому уровню (но даже и здесь не совсем ясно, действительно ли знание воздействует на восприятие, или оно позволяет нам сделать адекватную догадку постфактум), наш мозг кажется устроенным так, чтобы до последней капли выжимать фонетическую информацию из самой звуковой волны. Наше шестое чувство может воспринимать речь как язык, а не как просто звук, но это — чувство — то, что связывает нас с миром, а не просто форма внушаемости.

' Игра слов связана с тем, что Тильда Рэднер воспринимает слова Soviet Jewry 'советские евреи' — как Soviet jewelry 'советская бижутерия', stopping violence 'прекращение насилия' — как stopping violins 'остановка скрипок', resources 'ресурсы' — как racehorses 'скаковые лошади'. — Прим. перев.

176

Глава 6. Звуки тишины

Другой пример того, что восприятие речи не есть точное воплощение наших ожиданий, дает нам иллюзия, которую журналист Джон Кэрролл назвал «мондегрин» после того, как неправильно воспринял строку из народной баллады «The Bonny Earl O'Moray»:

Oh, ye highlands and ye lowlands, Oh, where hae ye been? They have slain the Earl of Moray And laid him on the green.

О, вы, горы, и вы, долины,

Где же вы были?

Убит граф Морей

И положен на зеленую траву.

Кэрролл всегда думал, что строки звучали так: They have slain the Earl of Moray, And Lady Mondegreen 'Убит граф Морей и леди Мондегрин'. «Мондегрины» чрезвычайно распространены (они являются крайними вариантами вышеупомянутых Pullet Surprise и Pencil Vanea), вот несколько примеров:

A girl with colitis goes by. [A girl with kaleidoscopic eyes.]

'Вот идет девушка, больная колитом. [Девушка с калейдоскопическими

глазами.]'

(Из песни Битлз «Lucy in the Sky with Diamonds».)

Our father wishart in heaven; Harold be they name... Lead us not into Penn Station. [Our father which art in Heaven; hallowed be thy name... Lead us not into temptation.]

'Отче наш и иже с ним на небеси, Харольд будет их имя... Не приведи нас на станцию Пени. [Отче наш, иже еси на небеси, да святится имя твое... Не введи нас во искушение.]'

(Из молитвы «Отче наш»)

Не is trampling out the vintage where the grapes are wrapped and stored. [... grapes of wrath are stored.]

'Он выжимает сок из винограда там, где гроздья упаковываются и хранятся. [... хранятся гроздья гнева.]'

(Из «The Battle Hymn of the Republic»)

Gladly the cross-eyed bear. [Gladly the cross I'd bear.] 'Радостно косоглазый медведь. [С радостью я понесу крест.]'

I'll never be your pizza burning'. [... your beast of burden]

'Я никогда не буду твоей подгоревшей пиццей. [... твоей тяжелой ношей]'

(Из песни группы «Роллинг Стоунз»)

It's a happy enchilada, and you think you're gonna drown. [It's a half an inch of water...]

'Это радостная дюна, и ты думаешь, что утонешь в ней. [Здесь полдюйма воды...]'

(Из песни Джона Прайна «That's the Way the World Goes Round»)

Речь и звуки, из которых она складывается

111

«Мондегрины» интересны тем, что послышавшиеся слова, как правило, менее уместны в контексте, чем реальные. Они никоим образом не выражают ожиданий здравомыслящих слушателей относительно того, что собирается сказать, или что имеет в виду говорящий. (Одному студенту, постоянно слышались слова «I'm Your Penis» 'Я твой пенис' вместо «I'm Your Venus» 'Я твоя Венера' в названии знаменитой песни группы «Блю Чиэр», и он удивлялся, как такое можно было пропустить на радио.) «Мондегрины» соответствуют английской фонологии, английскому синтаксису (иногда) и английской лексике (хотя и не всегда, как, например, в случае с самим словом «мондегрин»). Очевидно, слушатели замыкаются на каком-то наборе слов, которые соответствуют звуку и появление которых рядом друг с другом в качестве английских слов и синтаксических групп более или менее возможно; но бал правят не уместность в контексте и не общие ожидания слушателя.

Об этом же свидетельствует и история искусственных распознавателей речи. В 1970-х гг. группа исследователей искусственного интеллекта при университете Карнеги-Меллон, возглавляемая Раджем Редци, создала компьютерную программу под названием HEARSAY, которая использовала голосовые команды, чтобы перемещать шахматные фигуры. Находясь под влиянием теории восприятия речи «сверху — вниз», они создали эту программу как «содружество» «экспертных» субпрограмм, действующих сообща с целью дать наиболее вероятную интерпретацию сигнала. Там были субпрограммы, специализирующиеся на акустическом анализе, на фонологии, на синтаксисе, на лексике, на правилах перемещения шахматных фигур, даже на шахматной стратегии применительно к развитию игры. Рассказывают, что на демонстрацию программы явился генерал из министерства обороны, спонсировавшего исследования. Пока ученые обливались холодным потом, генерала усадили напротив шахматной доски и микрофона, соединенного с компьютером. Генерал откашлялся. Программа напечатала: «Пешка — король 4».

Недавно созданная программа DragonDictate, упомянутая ранее в этой главе, делает больший упор на акустический, фонологический и лексический анализ, и, похоже, что этим объясняется ее больший успех. В программе имеется словарь, где слова представлены так же как последовательности фонем. Чтобы помочь предвидеть результаты действия фонологических правил и коартикуляции, в программе задано, как звучит каждая английская фонема в окружении любых возможных предшествующих и последующих фонем. Для каждого слова эти сопутствующие фонемы объединены в цепочку и при каждом переходе от одной звучащей единицы к другой заложена вероятностная характеристика. Цепочка выполняет функции среднестатистической модели говорящего человека, и когда эту систему использует реальный говорящий, вероятностные характеристики в цепочке варьируются таким образом, чтобы приспособиться к манере речи данного человека. Самому слову также присваивается процент вероятности, зависящий от его частотности в языке и от привычек говорящего. В некоторых версиях

178

Глава 6. Звуки тишины

программы значение вероятности для слова варьируется в зависимости от того, какое слово ему предшествует; это единственный вид информации «сверху—вниз», используемый программой. Все вышеупомянутое позволяет программе вычислить, какое слово с наибольшей вероятностью произнес говорящий, исходя из имеющихся звуковых данных. Но даже при этом DragonDictate больше полагается на ожидания, чем нормально слышащий человек. Когда я присутствовал при демонстрации программы, ее пришлось упрашивать отличить слово word [w3:d] 'слово' от worm [w3:m] 'червь', хотя они оба и произносились яснее ясного, потому что программа продолжала делать ставку на вероятность и угадывала в этих звукосочетаниях высокочастотное слово were [\уз:] 'были'.

* * *

Теперь, когда вы знаете, как продуцируются единицы речи, как они представлены в ментальном словаре, как они перестраиваются и обрабатываются прежде, чем появиться из наших губ, в конце этой главы вас ждет награда: вы узнаете, почему английское правописание не столь ненормально, как кажется на первый взгляд.

Конечно, на английское правописание можно пожаловаться за то, что оно якобы отражает звуки слов, но не делает этого в действительности. В жанре шутливых стихов этот факт обыгрывается с незапамятных времен, примером чему служат следующие вирши:

Дата добавления: 2019-01-14; просмотров: 120; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 20 21 22 23 242526 27 28 29 Следующая ⇒

Мы поможем в написании ваших работ!