ИНСТИНКТ ОВЛАДЕНИЯ МАСТЕРСТВОМ 27 страница



Арбитр: Как долго тянется этот день! Но теперь, мне кажется, я готов немного поразвлечься. Погода сегодня не очень хорошая. Знаешь ли ты какие-нибудь шутки, которые могли бы разогнать облака?

Компьютер: Все говорят о погоде, но, похоже, никто ничего с ней не делает. Почему тебе обязательно нужно было мне сказать, что теперь ты готов немного поразвлечься? О-о-о-ох...

Арбитр: Ты хочешь запутать меня, да? Я просто объяснил, что готов поразвлечься!

Компьютер: Не лучше ли сказать, если бы это была неправда, что я пытаемся4' запутать тебя, да? Я просто объяснил, что готов поразвлечься! Я, следовательно, я вычисляю... Почему ты думаешь, что я пытаюсь запутать тебя, не правда ли?

Арбитр: Не могу сказать, что понимаю вопрос... Но эксцентричность поэта — это одно, а эксцентричность большинства из нас — другое.

Компьютер: Откуда ты знаешь, что не можешь сказать, что понял вопрос... Но эксцентричность поэта — это одно, а эксцентричность большинства из нас — другое.

По сути программист просто усовершенствовал технологию, изобретенную в 1965 г. ученым-компьютерщиком Джозефом Вейценбаумом. Вейценбаум написал туповатую программу, названную ELIZA в честь героини Бернарда Шоу; эта программа искала несколько ключевых слов во вводимой строке, извлекала фиксированный ответ из списка и вставляла фрагменты вводимой строки в ответ (с некоторыми небольшими изменениями, например «ты» вместо «я»). Таким образом в примитивной форме имитировалась беседа. Один вариант программы под названием Doctor копировал поведение психотерапевта — приверженца философии Карла Роджерса, считавшего, что терапевт должен повторять пациенту его же собственные утверждения для их осмысливания. Эта версия программы позже продавалась как компьютерная игра в магазинах «Рейдио Шэк»5', а другая версия поступает в комплекте с моим текстовым редактором GNU Emacs. (В документации сказано: «Если при использовании

' Грамматические и синтаксические ошибки в речи компьютера присутствуют и в оригинальном тексте. — Прим. перев.

'Сеть магазинов, специализирующихся на продаже бытовых товаров радиоэлектроники и компьютеров. — Прим. ред.

Как мы понимаем язык и используем его в речи             185

Emacs что-то не получается, и ни один из указанных выше приемов не решает проблему, Emacs все же может вам помочь. Наберите: „М-х doctor RET"».) Вот типичный диалог:

Пользователь: В последнее время я чувствую себя порядком подавленным.

Компьютер: Вы часто чувствуете себя подавленным?

Пользователь: Да, почти все время.

Компьютер: Почему вы говорите «да, почти все время»?

Пользователь: Вот сейчас я чувствую, что готов заплакать.

Компьютер: Вы пришли ко мне потому, что сейчас чувствуете, что готовы заплакать?

К ужасу Вейценбаума, однажды он увидел, как его секретарша припала к терминалу и изливает душу программе.

У большинства ученых-компьютерщиков конкурс на премию Лобне-ра вызывает раздражение. Они считают его не имеющим научной ценности рекламным трюком, задача которого — обвести вокруг пальца непрофессионала, а не научить компьютер речи. (Разработчикам искусственного интеллекта и другим профессионалам, разбирающимся в проблемах языка, не разрешили быть арбитрами, но ни один из них и не рвался участвовать в конкурсе, заявки поступали от любителей.) Этот конкурс примерно так же продуктивен, как будет продуктивна реклама биологических исследований, если на премию выдвинуть создателя искусственного цветка из шелка, самого похожего на естественный; или как будет продуктивна работа над космической программой, где высадка на Луну осуществится на съемочной площадке Голливуда. Была проведена интенсивная работа по созданию компьютерных систем, понимающих язык, но ни у одного серьезного инженера не хватит дерзости утверждать, что система, дублирующая языковые способности человека, появится в недалеком будущем.

В действительности, с точки зрения ученого, люди не имеют права так хорошо понимать предложения, как они это делают. Они не просто решают до абсурда сложную задачу, но еще и делают это быстро. Понимание, как правило, происходит в режиме «реального времени». Слушающий действует синхронно с говорящим, а не ждет конца отрезка речи, чтобы истолковать его через соразмерный промежуток времени, подобно критику, пишущему рецензию на книгу. А временной промежуток между тем, что произнес говорящий, и тем, что воспринял слушающий, чрезвычайно короток: один или два слога за половину секунды. Некоторые люди могут понимать и повторять предложения, следуя за речью говорящего с отставанием на четверть секунды!

Понимание процесса понимания имеет и иное практическое применение, помимо создания машин-собеседников. Понимание предложений людьми происходит быстро и эффективно, но не идеально. Оно работает, когда воспринимаемый поток речи или текст определенным образом структурирован. В противном случае процесс может забуксовать, пойти

186

Глава 7. Говорящие головы

в обратном направлении, и возникнет неправильное понимание. Исследуя понимание языка в этой главе, мы выясним, какие виды предложений могут путаться в сознании человека, воспринимающего речь. Один из практических источников информации — это набор рекомендаций для написания ясной прозы, научное руководство по стилистике, например то, что написано Джозефом Уильямсом в 1990 г., — «Стиль: как добиться ясности и изящества», в нем содержатся многие лингвистические находки, которые мы будем рассматривать.

Другое практическое применение связано с областью права. Судьи часто сталкиваются с тем, что им приходится гадать, как среднестатистический человек воспримет двусмысленный отрывок текста, например, при изучении клиентом контракта, заслушивании инструкций присяжными и чтении представителем общественности потенциально клеветнической характеристики. Многие из человеческих привычек толкования текста были определены благодаря лабораторным исследованиям, а лингвист и юрист Лоренс Солэн объяснил связь между языком и правом в своей интересной книге 1993 г. «Язык судей», к которой мы еще обратимся.

* * *

Как происходит понимание предложения? Первый этап — это синтаксический разбор. Он не имеет отношения к тем упражнениям, которые вы, стиснув зубы, делали в начальной школе, и о которых у Дейва Барри, ведущего газетной рубрики «Спроси у Господина Языка», осталось такое воспоминание:

Вопрос: Пожалуйста, объясните, как составить схему предложения.

Ответ: Прежде всего расположите предложение на чистой ровной поверхности, например, на гладильной доске. Затем, используя остро отточенный карандаш или скальпель, вычлените «сказуемое», которое показывает, где произошло действие, и обычно расположено прямо за жабрами. Например, в предложении «ЛаМонт никогда не привести в порядок лесникам» действие, очевидно, происходит в лесу. Таким образом, ваша схема будет напоминать по форме деревце, с ветвями, выпирающими из него, чтобы указать на расположение различных частиц речи, таких как ваши герундии, провербы, второстепенности и т.д.

Но понимание действительно включает сходный с этим процесс нахождения подлежащего, сказуемого, дополнения и т.д., который происходит бессознательно. Если только вы не Вуди Аллен, в ускоренном темпе читающий «Войну и Мир», вам нужно сгруппировать слова в синтаксические группы, определить, что является группой подлежащего при каком сказуемом, и так далее. Например, чтобы понять предложение The cat in the hat came back 'Кошка в шляпе вернулась' нужно объединить в одну группу слова the cat in the hat 'кошка в шляпе', чтобы понять, что это кошка вернулась, а не шляпа. Чтобы отличить предложение Dog bites man 'Собака кусает человека' от Man bites dog 'Человек кусает собаку' нужно найти подлежащее и объект. А чтобы различить предложения Man bites dog 'Человек кусает собаку', Man is bitten by dog 'Человек искусан

Как мы понимаем язык и используем его в речи            187

собакой' и Man suffers dog bite 'Человек перенес укус собаки', нужно обратиться к словарным статьям упомянутых глаголов в ментальном словаре, чтобы определить, что происходит с подлежащим человек.

Сама грамматика является просто кодом или протоколом, статичной базой данных, определяющей, какие виды звуков соответствуют каким видам значения в определенном языке. Это не рецепт и не программа для говорения и понимания. Говорение и понимание основаны на одной и той же базе данных (язык, на котором мы говорим, это тот же язык, который мы понимаем), но им также необходимы процедуры, которые бы четко, шаг за шагом, обозначили, что необходимо делать сознанию, когда становятся слышимыми слова, или когда сам собираешься начать говорить. Ментальная программа, анализирующая структуру предложения во время восприятия речи, называется «синтаксическим анализатором» («parser»).

Наилучший способ понять, как работает процесс понимания, это проследить за синтаксическим разбором простого предложения, порожденного какой-нибудь простенькой грамматикой, например той, что упоминалась в главе 4, и которую я повторяю здесь:

S -» NP VP

«Предложение может состоять из именной группы и глагольной группы».

NP -* (det) N (РР)

«Именная группа может состоять из присутствующего факультативно де-

терминатора, имени существительного и присутствующей факультативно

предложной группы».

VP-> VNP(PP)

«Глагольная группа может состоять из глагола, именной группы и факультативно присутствующей предложной группы».

РР-> PNP

«Предложная группа может состоять из предлога и именной группы».

N -> boy 'мальчик', girl 'девочка', dog 'собака', cat 'кошка', ice-cream 'мороженое', candy 'конфета', hot dogs 'сосиски'

«К именам существительным в ментальном словаре относятся слова: мальчик, девочка, ...»

V -> eats 'ест', likes 'любит', bites 'кусает'

«К глаголам в ментальном словаре относятся слова: eats 'ест', likes 'любит', bites 'кусает'».

Р -> with 'с', in 'в', near 'около'

«К предлогам относятся слова: with 'с', in 'в', near 'около'».

det -> а 'какой-то', the 'этот', one 'один какой-то'

«К детерминаторам относятся слова: а 'какой-то', the 'этот', one 'один какой-то'».

188

Глава 7. Говорящие головы

Возьмем предложение The dog likes ice-cream 'Эта собака любит мороженое'. Первое слово, с которым сталкивается ментальный синтаксический анализатор — это the. Синтаксический анализатор наводит о нем справки в ментальном словаре; это то же самое, что обнаружить данное слово в правой части правила и выяснить его категорию, указанную в левой части. Это детерминатор (determiner, det). Следовательно синтаксический анализатор может вырастить первую веточку предложения на дереве. (Правда, дерево, растущее сверху вниз от листьев к корням невозможно в ботанике.)

det

the...

Детерминаторы, как и все слова, должны быть частью какой-либо большей синтаксической группы. Синтаксический анализатор может вычислить, какая именно синтаксическая группа имеется в виду, проверив, в правой части какого правила имеется «det». Это будет правило, определяющее именную группу, NP. Дерево может быть продолжено:

Эта обособленная структура должна быть удержана в некой определенной памяти. Синтаксический анализатор запоминает, что находящееся в нашем распоряжении слово the является частью именной группы, которая скоро должна быть укомплектована словами, которые заполнили бы остальные слоты, в данном случае — по меньшей мере одним существительным.

Тем временем дерево продолжает расти, поскольку именные группы не могут оставаться ни к чему не присоединенными. Проверив, правая сторона каких правил содержит символ NP, синтаксический анализатор имеет несколько вариантов на выбор. Только что построенная именная группа может быть частью предложения, частью глагольной группы или частью предложной группы. Эту задачу выбора можно решить, исходя из главного: все синтаксические группы должны быть в итоге включены в предложение (S), а предложение должно начинаться с именной группы, поэтому, чтобы продолжить дерево, логично использовать правило построения предложения:

Как мы поншшем язык и используем его в речи           189

Обратите внимание, что теперь синтаксический анализатор удерживает в памяти две неукомплектованных ветви: именная группа, для укомплектования которой требуется имя существительное, и предложение, для укомплектования которого требуется глагольная группа.

Обособленная именная ветвь аналогична предсказанию того, что следующее слово должно быть именем существительным. И когда дело доходит до следующего слова dog 'собака', просмотр правил подтверждает такое предсказание: слово dog — это часть правила для имени существительного. Это позволяет слову dog быть включенным в дерево, укомплектовывая именную конструкцию:

Синтаксическому анализатору больше не нужно помнить, что следует укомплектовать NP, все, что нужно держать в памяти, — это неукомплектованное S.

На данном этапе можно в какой-то степени предположить значение предложения. Вспомните о том, что одно существительное в именной группе является ядром — вершиной (то, о чем говорит вся группа), а остальные синтаксические группы в составе именной могут определять это существительное. Найдя определения слов dod и the в их словарных статьях, синтаксический анализатор может отметить, что именная группа говорит о какой-то ранее упоминавшейся собаке.

Следующее слово likes 'любит' оказывается глаголом. Глаголу не откуда было взяться, кроме как из глагольной группы, VP, существование которой, к счастью, уже было предсказано, поэтому два этих элемента можно соединить друг с другом. Глагольная группа содержит больше, чем один глагол, она содержит также и именную группу (свое допол-

190

Глава 7. Рэворящие гоиговы

нение). Таким образом, синтаксический анализатор предсказывает, что следующее, с чем мы будем иметь дело — это именная группа:

the     dog likes...

Следующее на очереди — ice-cream 'мороженое' — существительное, которое может быть частью именной группы — в точности как предсказывает обособленная ветвь NP. Последние кусочки головоломки идеально укладываются на свое место:

ice-cream

Слово ice-cream 'мороженое' укомплектовало именную группу, поэтому ее нет необходимости больше держать в памяти; NP укомплектовала глагольную группу, поэтому и о ней тоже можно забыть, a VP укомплектовала предложение. Когда память освобождается от всех неукомплектованных обособленных ветвей, мы чувствуем в сознании «щелчок», который свидетельствует о том, что мы только что услышали полностью укомплектованное грамматически правильное предложение.

Одновременно с выращиванием ветвей дерева синтаксический анализатор также выстраивал значение предложения, используя определения в ментальном словаре и принципы их сочетаемости. Глагол является вершиной своей глагольной группы, поэтому VP говорит о любви к чему-либо. NP ice-cream 'мороженое' в составе VP является дополнением глагола. Словарная статья для слова likes 'любит' говорит о том, что дополнением к этому глаголу будет нечто, вызывающее любовь; отсюда следует, что VP сообщает о любви к мороженому. NP слева от спрягаемого глагола — это

Как мы понимаем язык и исполмуем его в речи            191

подлежащее; словарная статья для likes говорит о том, что подлежащим при этом глаголе будет то, что может испытывать любовь. Совмещая семантику подлежащего с семантикой VP, синтаксический анализатор определил, что в предложении утверждается факт любви вышеупомянутого представителя семейства псовых к замороженным сладостям.

* * *

Почему же так сложно запрограммировать компьютер на выполнение такой же операции? Почему и для людей она тоже внезапно становится трудной при чтении бюрократических документов и других образцов плохого стиля? Пройдя по предложению в роли синтаксического анализатора, мы столкнулись с двумя трудностями на пути к получению результата. Первая — это память: нам нужно было удерживать в памяти неукомплектованные группы, которые требовали для комплектации определенные виды слов. Вторая — это принятие решения: когда синтаксическая группа находилась с правой стороны двух различных правил, нам нужно было принять решение, какое из них использовать, чтобы вырастить следующую ветвь дерева. В соответствии с первым правилом искусственного интеллекта о легкости сложных проблем и сложности легких выходит, что часть, относящаяся к памяти, легка для компьютеров и тяжела для людей, а часть, относящаяся к принятию решений, легка для людей (по крайней мере, если предложение было правильно построено) и тяжела для компьютеров.

Синтаксический анализатор предложения требует наличия многих видов памяти, но та, необходимость в которой очевиднее всего, — это память на неукомплектованные конструкции, запоминание того, что подвергается синтаксическому разбору. Компьютеры должны отвести для этой цели набор ячеек в своей памяти, так называемый «стеллаж»; ведь именно это и позволяет синтаксическому анализатору использовать грамматику структуры непосредственно составляющих, а не быть простым генератором цепочек слов. Люди также должны выделять некоторый объем своей оперативной памяти под неукомплектованные синтаксические группы. Но оперативная память — это и есть основное «узкое место» в процессе переработки человеком информации. Только несколько единиц — как правило — семь, плюс-минус две — могут одновременно удерживаться в сознании; и к тому же они немедленно начинают «растворяться», или их начинают вытеснять другие. На примере следующих предложений, вы можете увидеть, к чему приводит слишком долгое удерживание в памяти неукомплектованной группы:

Не gave the girl that he met in New York while visiting his parents for ten days around Christmas and New Year's the candy.

'Он подарил девушке, с которой он встретился в Нью-Йорке, гостя у своих родителей десять дней на рождественские и новогодние праздники, конфеты'.

192

Глава 7. Говорящие головы

Не sent the poisoned candy that he had received in the mail from one of his business rivals connected with the Mafia to the police.

'Он отправил отравленную конфету, полученную по почте от одного из своих связанных с мафией конкурентов, полиции'.

She saw the matter that had caused her so much anxiety in former years when she was

employed as an efficiency expert by the company through. 'Она подвергла вопрос, причинивший ей столько беспокойства в прошлые

годы, когда она была экспертом по оценке эффективности на своей

фирме, анализу'.


Дата добавления: 2019-01-14; просмотров: 137; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!