ИНСТИНКТ ОВЛАДЕНИЯ МАСТЕРСТВОМ 24 страница



Поскольку звуковые волны мгновенно реагируют на форму полостей, по которым они проходят, то коартикуляция сеет смуту среди звуков речи. Индивидуальная звуковая реализация той или иной фонемы «подкрашена» теми фонемами, которые идут перед ней и после нее, иногда до такой степени, что эта звуковая реализация не имеет ничего общего с фонемой благодаря компании других фонем. Вот почему невозможно отрезать кусок пленки с записью звучащего слова cat и надеяться найти в нем относящуюся к началу часть, которая содержала бы один звук k. Чем ближе и ближе к началу будут эти отрезки, их звучание будет варьироваться от чего‑то, напоминающего ka, до чириканья или свиста. Такое «смазывание» фонем в речи могло бы в принципе иметь преимущество для оптимально сконструированного опознавателя речи. Согласные и гласные реализуются в речи синхронно, значительно увеличивая количество фонем, произносимых в секунду, как было замечено в начале этой главы, и существует много избыточных звуковых подсказок о том, что за фонема имеется в виду. Но этим преимуществом может воспользоваться только высоко технологичный распознаватель речи, тот, что имеет некоторое представление о принципах смешения звуков речевым аппаратом.

Конечно, человеческий мозг – это высоко технологичный распознаватель речи, однако, никто не знает, как ему удается быть таковым. Поэтому психологи, изучающие восприятие речи, и инженеры, конструирующие механизмы для распознавания речи, пристально наблюдают за работой друг друга. Возможно, распознавание речи – настолько сложный процесс, что существует всего несколько способов того, как оно в принципе может быть реализовано. Если так, то способ, которым пользуется мозг, может подсказать, как наилучшим образом сконструировать машину для распознавания речи, а способ, каким это удастся сделать машине, может предложить гипотезу о том, как это удается мозгу.

 

* * *

 

Уже на ранних этапах истории исследований речи стало ясно, что слушающие способны с выгодой для себя использовать свои представления о речевых намерениях говорящего. Последние сужают круг вариантов, возможных при акустическом анализе речевых сигналов. Мы уже заметили, что фонологические правила обеспечивают один вид избыточности, который можно использовать, но люди в состоянии пойти еще дальше. Психолог Джордж Миллер проиграл записи предложений, произносимых на фоне шума, и попросил людей в точности повторить, что они слышали. Некоторые предложения соответствовали правилам английского синтаксиса и имели смысл:

 

Furry wildcats fight furious battles ‘Пушистые дикие кошки ведут яростные бои’.

Respectable jewelers give accurate appraisals ‘Уважаемые ювелиры высказывают сдержанное одобрение’.

Lighted sigarrets create smoky fumes ‘Облегченные сигареты создают клубы дыма’.

Gallant gentlemen save distressed damsels ‘Галантные кавалеры спасают опечаленных дам’.

Soapy detergents dissolve greasy stains ‘Мыльные моющие средства растворяют жирные пятна’.

 

Другие предложения были получены «перемешиванием» слов из разных синтаксических групп, что дало бесцветно‑зелено‑мысленные предложения, грамматически правильные, но бессмысленные:

 

Furry jewelers create distressed stains ‘Пушистые ювелиры создают опечаленные пятна’.

Respectable cigaretts save greasy battles ‘Уважаемые сигареты спасают жирные бои’.

Lighted gentlemen dissolve furious appraisals ‘Облегченные кавалеры растворяют яростные одобрения’.

Gallant detergents fight accurate fumes ‘Галантные моющие средства ведут сдержанные клубы дыма’.

Soapy wildcats give smoky damsels ‘Мыльные дикие кошки спасают дымных дам’.

 

Третий вид предложений был получен «перемешиванием» непосредственно составляющих в структуре при сохранении в предложении одних и тех же слов:

 

Furry fight furious wildcat battles ‘Пушистые ведут яростные дикие кошки бои’.

Jewelers respectable appraisals accurate give ‘Ювелиры уважаемые одобрения сдержанно высказывают’.

 

И наконец, некоторые предложения были просто словесным винегретом, как например:

 

Furry create distressed jewelers stains ‘Пушистые создают опечаленные ювелиры пятна’.

Cigaretts respectable battles greasy save ‘Сигареты уважаемые бои жирные спасают’.

 

Люди лучше всего справились с имеющими смысл грамматически правильными предложениями, хуже – с грамматически правильной бессмыслицей и грамматически неправильным смыслом, а хуже всего – с грамматически неправильной бессмыслицей. Несколько лет спустя психолог Ричард Уоррен записал на пленку предложения типа: The state governors met with their respective legislatures convening in the capital city ‘Губернаторы штатов встретились с представителями соответствующих законодательных органов, заседающими в столице’, изъял s из слова legislatures и заменил его покашливанием. Слушающие сказали, что ни одного звука не было пропущено.

Вы можете подумать, что звуковая волна находится на нижнем уровне иерархии «звуки – фонемы – слова – синтаксические группы – значения предложений – знание вообще». Но то, что было продемонстрировано выше, явно подразумевает, что восприятие человеком речи осуществляется сверху вниз скорее, чем снизу вверх. Возможно, мы постоянно пытаемся догадаться, что собирается сказать говорящий, используя каждую находящуюся в нашем распоряжении крупицу осознанного и неосознанного знания, начиная со знания о том, как коартикуляция «смазывает» звуки, до знания правил английской фонологии, английского синтаксиса, знаний о производителях и объектах действия, и о том, что в данный момент на уме у собеседника. Если наши предположения достаточно точны, то акустический анализ может быть очень поверхностным: то, чего не достает звуковой волне, заполнит контекст. Например, если вы слушаете дискуссию о разрушении экологических сред обитания, вы можете заранее настроиться на слова, относящиеся к исчезающим животным и растениям, и тогда, когда вы слышите звуки, в которых невозможно разобрать фонемы, например: eesees [i:si:z], вы сможете правильно воспринять это слово как species [spɪːʃɪːz] ‘биологический вид’, если только вы не Эмили Лителла – тугой на ухо персонаж «Сэтердей найт лайв», яростно выступавшая против кампании по защите поставленных под угрозу feces [fiːsiːz] ‘каловые массы’. (И действительно, юмор, связанный с Гильдой Рэднер, которая также отчаянно боролась против спасения «советской бижутерии», «остановки скрипок» на улице и сохранения естественных «скаковых лошадей», вызван не проблемами на нижнем уровне обработки звука, но тупостью на верхнем уровне, там, где нужно было бы не допустить саму возможность таких интерпретаций)[91].

Теория восприятия речи «сверху вниз» производит на некоторых людей сильное эмоциональное впечатление. Она подтверждает философию релятивистов о том, что мы слышим то, что надеемся услышать, что наше знание определяет наше восприятие и, наконец, что мы не находимся в прямом контакте с объективной реальностью. В каком‑то смысле восприятие, упрямо идущее сверху вниз, может стать едва управляемой галлюцинацией, в этом‑то и проблема. Человек, воспринимающий речь и вынужденный полагаться на свои ожидания, находится в очень невыигрышном положении в том мире, который непредсказуем даже при самых благоприятных обстоятельствах. Есть основания полагать, что восприятие человеческой речи в сильной степени определяется на акустическом уровне. Если у вас есть готовый к сотрудничеству друг, вы можете проделать следующий эксперимент: выберите наугад из словаря десять слов, позвоните другу и четко произнесите эти слова. Весьма вероятно, что друг легко сможет их воспроизвести, полагаясь только на данные звуковой волны и на свое знание английского словаря и фонологии. Ваш друг не мог использовать никаких относящихся к высокому уровню предположений относительно структуры высказывания, контекста, или связанной с ним истории, поскольку у множества слов, выбранного наугад, их нет. Хотя при плохой слышимости или на фоне помех мы и можем сослаться на теоретическое знание, относящееся к высокому уровню (но даже и здесь не совсем ясно, действительно ли знание воздействует на восприятие, или оно позволяет нам сделать адекватную догадку постфактум), наш мозг кажется устроенным так, чтобы до последней капли выжимать фонетическую информацию из самой звуковой волны. Наше шестое чувство может воспринимать речь как язык, а не как просто звук, но это – чувство – то, что связывает нас с миром, а не просто форма внушаемости.

Другой пример того, что восприятие речи не есть точное воплощение наших ожиданий, дает нам иллюзия, которую журналист Джон Кэрролл назвал «мондегрин» после того, как неправильно воспринял строку из народной баллады «The Bonny Earl O’Moray»:

 

Oh, ye highlands and ye lowlands,

Oh, where hae ye been?

They have slain the Earl of Moray

And laid him on the green.

 

О, вы, горы, и вы, долины,

Где же вы были?

Убит граф Морей

И положен на зеленую траву.

 

Кэрролл всегда думал, что строки звучали так: They have slain the Earl of Moray, And Lady Mondegreen ‘Убит граф Морей и леди Мондегрин’. «Мондегрины» чрезвычайно распространены (они являются крайними вариантами вышеупомянутых Pullet Surprise и Pencil Vanea ), вот несколько примеров:

 

A girl with colitis goes by . [A girl with kaleidoscopic eyes . ]

‘Вот идет девушка, больная колитом. [Девушка с калейдоскопическими глазами.]’

(Из песни Битлз «Lucy in the Sky with Diamonds».)

 

 

Our father wishart in heaven; Harold be they name… Lead us not into Penn Station . [Our father which art in Heaven; hallowed be thy name… Lead us not into temptation . ]

‘Отче наш и иже с ним на небеси, Харольд будет их имя… Не приведи нас на станцию Пенн. [Отче наш, иже еси на небеси, да святится имя твое… Не введи нас во искушение.]’

(Из молитвы «Отче наш»)

 

 

He is trampling out the vintage where the grapes are wrapped and stored. [… grapes of wrath are stored. ]

‘Он выжимает сок из винограда там, где гроздья упаковываются и хранятся. [… хранятся гроздья гнева.]’

(Из «The Battle Hymn of the Republic»)

 

 

Gladly the cross‑eyed bear . [Gladly the cross I’d bear . ]

‘Радостно косоглазый медведь. [С радостью я понесу крест.]’

 

 

I’ll never be your pizza burning’ . [… your beast of burden  ]

‘Я никогда не буду твоей подгоревшей пиццей. [… твоей тяжелой ношей]’

(Из песни группы «Роллинг Стоунз»)

 

 

It’s a happy enchilada , and you think you’re gonna drown. [It’s a half an inch of water ]

‘Это радостная дюна, и ты думаешь, что утонешь в ней. [Здесь полдюйма воды…]’

(Из песни Джона Прайна «That’s the Way the World Goes Round»)

 

«Мондегрины» интересны тем, что послышавшиеся слова, как правило, менее уместны в контексте, чем реальные. Они никоим образом не выражают ожиданий здравомыслящих слушателей относительно того, что собирается сказать, или что имеет в виду говорящий. (Одному студенту, постоянно слышались слова «I’m Your Penis» ‘Я твой пенис’ вместо «I’m Your Venus» ‘Я твоя Венера’ в названии знаменитой песни группы «Блю Чиэр», и он удивлялся, как такое можно было пропустить на радио.) «Мондегрины» соответствуют английской фонологии, английскому синтаксису (иногда) и английской лексике (хотя и не всегда, как, например, в случае с самим словом «мондегрин»). Очевидно, слушатели замыкаются на каком‑то наборе слов, которые соответствуют звуку и появление которых рядом друг с другом в качестве английских слов и синтаксических групп более или менее возможно; но бал правят не уместность в контексте и не общие ожидания слушателя.

Об этом же свидетельствует и история искусственных распознавателей речи. В 1970‑х гг. группа исследователей искусственного интеллекта при университете Карнеги‑Меллон, возглавляемая Раджем Редди, создала компьютерную программу под названием HEARSAY, которая использовала голосовые команды, чтобы перемещать шахматные фигуры. Находясь под влиянием теории восприятия речи «сверху – вниз», они создали эту программу как «содружество» «экспертных» субпрограмм, действующих сообща с целью дать наиболее вероятную интерпретацию сигнала. Там были субпрограммы, специализирующиеся на акустическом анализе, на фонологии, на синтаксисе, на лексике, на правилах перемещения шахматных фигур, даже на шахматной стратегии применительно к развитию игры. Рассказывают, что на демонстрацию программы явился генерал из министерства обороны, спонсировавшего исследования. Пока ученые обливались холодным потом, генерала усадили напротив шахматной доски и микрофона, соединенного с компьютером. Генерал откашлялся. Программа напечатала: «Пешка – король 4».

Недавно созданная программа DragonDictate, упомянутая ранее в этой главе, делает больший упор на акустический, фонологический и лексический анализ, и, похоже, что этим объясняется ее больший успех. В программе имеется словарь, где слова представлены так же как последовательности фонем. Чтобы помочь предвидеть результаты действия фонологических правил и коартикуляции, в программе задано, как звучит каждая английская фонема в окружении любых возможных предшествующих и последующих фонем. Для каждого слова эти сопутствующие фонемы объединены в цепочку и при каждом переходе от одной звучащей единицы к другой заложена вероятностная характеристика. Цепочка выполняет функции среднестатистической модели говорящего человека, и когда эту систему использует реальный говорящий, вероятностные характеристики в цепочке варьируются таким образом, чтобы приспособиться к манере речи данного человека. Самому слову также присваивается процент вероятности, зависящий от его частотности в языке и от привычек говорящего. В некоторых версиях программы значение вероятности для слова варьируется в зависимости от того, какое слово ему предшествует; это единственный вид информации «сверху–вниз», используемый программой. Все вышеупомянутое позволяет программе вычислить, какое слово с наибольшей вероятностью произнес говорящий, исходя из имеющихся звуковых данных. Но даже при этом DragonDictate больше полагается на ожидания, чем нормально слышащий человек. Когда я присутствовал при демонстрации программы, ее пришлось упрашивать отличить слово word [wɜːd] ‘слово’ от worm [wɜːm] ‘червь’, хотя они оба и произносились яснее ясного, потому что программа продолжала делать ставку на вероятность и угадывала в этих звукосочетаниях высокочастотное слово were [wɜː] ‘были’.

 

* * *

 

Теперь, когда вы знаете, как продуцируются единицы речи, как они представлены в ментальном словаре, как они перестраиваются и обрабатываются прежде, чем появиться из наших губ, в конце этой главы вас ждет награда: вы узнаете, почему английское правописание не столь ненормально, как кажется на первый взгляд.

Конечно, на английское правописание можно пожаловаться за то, что оно якобы отражает звуки слов, но не делает этого в действительности. В жанре шутливых стихов этот факт обыгрывается с незапамятных времен, примером чему служат следующие вирши:

 

Beware of heard, a dreadful word

That looks like beard and sounds like bird,

And dead: it’s said like bed, not bead

For goodness sake don’t call it «deed»!

Watch out for meat and great and threat

(They rhyme with suite and straight and debt ).

 

Бойтесь слова услышал – ужасного слова,

Похожего на бороду и звучащего как птица;

И слова мертвец, оно звучит как постель, а не бусина,

Ради Бога не говорите о нем, как о «подвиге»!

Остерегайтесь слов мясо, великий, угроза

Они рифмуются с апартаментами, прямым, и долгом.

 

Джордж Бернард Шоу вел решительную борьбу за реформу английского алфавита, системы, по его словам, настолько нелогичной, что в соответствии с ней слово fish [fɪʃ] могло бы писаться как «ghoti» – gh как в слове tough   [tʌf ], о как в слове wo men [wɪ mən], ti как в слове nati on [neɪʃ ən]. (Таким же образом minute могло бы писаться «mnomnoupte», a mistake – «mnopspteiche».) Шоу завещал денежное вознаграждение тому, кто изобретет замену английского алфавита, где каждый звук разговорного языка будет опознаваем благодаря единственному символу. Он писал:

 

Чтобы осознать годовую положительную разницу от использования 42‑буквенного фонетического алфавита… нужно умножить количество минут в году на количество людей в мире, которые постоянно пишут английские слова, отливают шрифты, производят пишущие и печатающие механизмы, и к этому моменту общая сумма будет настолько астрономической, что вы осознаете, что стоимость написания даже одного звука двумя буквами обошлась нам в столетия ненужного труда. Новый английский алфавит в 42 буквы окупится в миллионы раз не только в течение часов, но в течение минут. Когда это будет уяснено, вся ненужная болтовня, касающаяся слов enough, cough, laugh и упрощенного правописания будет заброшена, и экономисты и статисты вместе сядут за работу в орфографической Голконде.

 

Защищая английское правописание, я буду испытывать противоречивые чувства. Поскольку, хотя язык и является инстинктом, письмо им не является. Оно изобреталось всего несколько раз на протяжении истории, а алфавитное письмо, где один знак соответствует одному звуку, кажется, было изобретено всего однажды. В большинстве человеческих сообществ письменный язык отсутствовал, а там, где он имелся, он был унаследован или заимствован у сообщества изобретателей. Научить ребенка читать и писать – это кропотливый труд, и умение писать не предполагает тех качественных скачков вперед от учебного материала, которые мы наблюдали в случаях с Саймоном, Майелой, Джаббой и мышеедом из экспериментов в главах 3 и 5. И обучение не обязательно приводит к успеху. Неграмотность – результат недостаточного обучения – обычное явление во всем мире, но даже при достаточном обучении у 5–10 % населения имеется дислексия, что порождает трудности с обучением чтению и создает серьезную проблему даже в индустриально развитых странах.

Но хотя письмо – это искусственное изобретение, связующее зрение и язык, оно должно быть внедрено в языковую систему в специально отведенных местах, что придает ему крупицу логики. Во всех известных системах письма символы выражают только три вида языковых структур: морфемы, слоги и фонемы. Месопотамская клинопись, египетские иероглифы, китайские логограммы и японское письмо кандзи[92] зашифровывают морфемы. Письмо чероки, древне‑кипрское и японское письмо кана[93] основаны на слогах. Все современные фонематические алфавиты, как выяснилось, происходят от системы, изобретенной жителями земли Ханаан около 1700 г. до н.э. Ни в одной системе письма нет символов для реальных звуковых единиц, которые могут быть идентифицированы на осциллоскопе или в спектрограмме, – фонем, произносимых в определенном контексте, или рассеченного пополам слога.


Дата добавления: 2019-02-12; просмотров: 139; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!