ИНСТИНКТ ОВЛАДЕНИЯ МАСТЕРСТВОМ 26 страница



Сама грамматика является просто кодом или протоколом, статичной базой данных, определяющей, какие виды звуков соответствуют каким видам значения в определенном языке. Это не рецепт и не программа для говорения и понимания. Говорение и понимание основаны на одной и той же базе данных (язык, на котором мы говорим, это тот же язык, который мы понимаем), но им также необходимы процедуры, которые бы четко, шаг за шагом, обозначили, что необходимо делать сознанию, когда становятся слышимыми слова, или когда сам собираешься начать говорить. Ментальная программа, анализирующая структуру предложения во время восприятия речи, называется «синтаксическим анализатором» («parser»).

Наилучший способ понять, как работает процесс понимания, это проследить за синтаксическим разбором простого предложения, порожденного какой‑нибудь простенькой грамматикой, например той, что упоминалась в главе 4, и которую я повторяю здесь:

 

S –> NP VP

«Предложение может состоять из именной группы и глагольной группы».

 

NP –> (det) N (РР)

«Именная группа может состоять из присутствующего факультативно детерминатора, имени существительного и присутствующей факультативно предложной группы».

 

VP –> V NP (PP)

«Глагольная группа может состоять из глагола, именной группы и факультативно присутствующей предложной группы».

 

РР –> P NP

«Предложная группа может состоять из предлога и именной группы».

 

N –> boy ‘мальчик’, girl ‘девочка’, dog ‘собака’, cat ‘кошка’, ice‑cream ‘мороженое’, candy ‘конфета’, hot dogs ‘сосиски’

«К именам существительным в ментальном словаре относятся слова: мальчик, девочка, …»

 

V –> eats ‘ест’, likes ‘любит’, bites ‘кусает’

«К глаголам в ментальном словаре относятся слова: eats ‘ест’, likes ‘любит’, bites ‘кусает’».

 

Р –> with ‘с’, in ‘в’, near ‘около’

«К предлогам относятся слова: with ‘с’, in ‘в’, near ‘около’».

 

det –> a ‘какой‑то’, the ‘этот’, one ‘один какой‑то’

«К детерминаторам относятся слова: a ‘какой‑то’, the ‘этот’, one ‘один какой‑то’».

 

Возьмем предложение The dog likes ice‑cream ‘Эта собака любит мороженое’. Первое слово, с которым сталкивается ментальный синтаксический анализатор – это the. Синтаксический анализатор наводит о нем справки в ментальном словаре; это то же самое, что обнаружить данное слово в правой части правила и выяснить его категорию, указанную в левой части. Это детерминатор (determiner, det). Следовательно синтаксический анализатор может вырастить первую веточку предложения на дереве. (Правда, дерево, растущее сверху вниз от листьев к корням невозможно в ботанике.)

 

 

Детерминаторы, как и все слова, должны быть частью какой‑либо большей синтаксической группы. Синтаксический анализатор может вычислить, какая именно синтаксическая группа имеется в виду, проверив, в правой части какого правила имеется «det». Это будет правило, определяющее именную группу, NP. Дерево может быть продолжено:

 

 

Эта обособленная структура должна быть удержана в некой определенной памяти. Синтаксический анализатор запоминает, что находящееся в нашем распоряжении слово the является частью именной группы, которая скоро должна быть укомплектована словами, которые заполнили бы остальные слоты, в данном случае – по меньшей мере одним существительным.

Тем временем дерево продолжает расти, поскольку именные группы не могут оставаться ни к чему не присоединенными. Проверив, правая сторона каких правил содержит символ NP, синтаксический анализатор имеет несколько вариантов на выбор. Только что построенная именная группа может быть частью предложения, частью глагольной группы или частью предложной группы. Эту задачу выбора можно решить, исходя из главного: все синтаксические группы должны быть в итоге включены в предложение (S), а предложение должно начинаться с именной группы, поэтому, чтобы продолжить дерево, логично использовать правило построения предложения:

 

 

Обратите внимание, что теперь синтаксический анализатор удерживает в памяти две неукомплектованных ветви: именная группа, для укомплектования которой требуется имя существительное, и предложение, для укомплектования которого требуется глагольная группа.

Обособленная именная ветвь аналогична предсказанию того, что следующее слово должно быть именем существительным. И когда дело доходит до следующего слова dog ‘собака’, просмотр правил подтверждает такое предсказание: слово dog – это часть правила для имени существительного. Это позволяет слову dog быть включенным в дерево, укомплектовывая именную конструкцию:

 

 

Синтаксическому анализатору больше не нужно помнить, что следует укомплектовать NP, все, что нужно держать в памяти, – это неукомплектованное S.

На данном этапе можно в какой‑то степени предположить значение предложения. Вспомните о том, что одно существительное в именной группе является ядром – вершиной (то, о чем говорит вся группа), а остальные синтаксические группы в составе именной могут определять это существительное. Найдя определения слов dog и the в их словарных статьях, синтаксический анализатор может отметить, что именная группа говорит о какой‑то ранее упоминавшейся собаке.

Следующее слово likes ‘любит’ оказывается глаголом. Глаголу неоткуда было взяться, кроме как из глагольной группы, VP, существование которой, к счастью, уже было предсказано, поэтому два этих элемента можно соединить друг с другом. Глагольная группа содержит больше, чем один глагол, она содержит также и именную группу (свое дополнение). Таким образом, синтаксический анализатор предсказывает, что следующее, с чем мы будем иметь дело – это именная группа:

 

 

Следующее на очереди – ice‑cream ‘мороженое’ – существительное, которое может быть частью именной группы – в точности как предсказывает обособленная ветвь NP. Последние кусочки головоломки идеально укладываются на свое место:

 

Слово ice‑cream ‘мороженое’ укомплектовало именную группу, поэтому ее нет необходимости больше держать в памяти; NP укомплектовала глагольную группу, поэтому и о ней тоже можно забыть, a VP укомплектовала предложение. Когда память освобождается от всех неукомплектованных обособленных ветвей, мы чувствуем в смзнании «щелчок», который свидетельствует о том, что мы только что услышали полностью укомплектованное грамматически правильное предложение.

Одновременно с выращиванием ветвей дерева синтаксический анализатор также выстраивал значение предложения, используя определения в ментальном словаре и принципы их сочетаемости. Глагол является вершиной своей глагольной группы, поэтому VP говорит о любви к чему‑либо. NP ice‑cream ‘мороженое’ в составе VP является дополнением глагола. Словарная статья для слова likes ‘любит’ говорит о том, что дополнением к этому глаголу будет нечто, вызывающее любовь; отсюда следует, что VP сообщает о любви к мороженому. NP слева от спрягаемого глагола – это подлежащее; словарная статья для likes говорит о том, что подлежащим при этом глаголе будет то, что может испытывать любовь. Совмещая семантику подлежащего с семантикой VP, синтаксический анализатор определил, что в предложении утверждается факт любви вышеупомянутого представителя семейства псовых к замороженным сладостям.

 

* * *

 

Почему же так сложно запрограммировать компьютер на выполнение такой же операции? Почему и для людей она тоже внезапно становится трудной при чтении бюрократических документов и других образцов плохого стиля? Пройдя по предложению в роли синтаксического анализатора, мы столкнулись с двумя трудностями на пути к получению результата. Первая – это память: нам нужно было удерживать в памяти неукомплектованные группы, которые требовали для комплектации определенные виды слов. Вторая – это принятие решения: когда синтаксическая группа находилась с правой стороны двух различных правил, нам нужно было принять решение, какое из них использовать, чтобы вырастить следующую ветвь дерева. В соответствии с первым правилом искусственного интеллекта о легкости сложных проблем и сложности легких выходит, что часть, относящаяся к памяти, легка для компьютеров и тяжела для людей, а часть, относящаяся к принятию решений, легка для людей (по крайней мере, если предложение было правильно построено) и тяжела для компьютеров.

Синтаксический анализатор предложения требует наличия многих видов памяти, но та, необходимость в которой очевиднее всего, – это память на неукомплектованные конструкции, запоминание того, что подвергается синтаксическому разбору. Компьютеры должны отвести для этой цели набор ячеек в своей памяти, так называемый «стеллаж»; ведь именно это и позволяет синтаксическому анализатору использовать грамматику структуры непосредственно составляющих, а не быть простым генератором цепочек слов. Люди также должны выделять некоторый объем своей оперативной памяти под неукомплектованные синтаксические группы. Но оперативная память – это и есть основное «узкое место» в процессе переработки человеком информации. Только несколько единиц – как правило – семь, плюс‑минус две – могут одновременно удерживаться в сознании; и к тому же они немедленно начинают «растворяться», или их начинают вытеснять другие. На примере следующих предложений, вы можете увидеть, к чему приводит слишком долгое удерживание в памяти неукомплектованной группы:

 

He gave the girl that he met in New York while visiting his parents for ten days around Christmas and New Year’s the candy.

‘Он подарил девушке, с которой он встретился в Нью‑Йорке, гостя у своих родителей десять дней на рождественские и новогодние праздники, конфеты’.

 

He sent the poisoned candy that he had received in the mail from one of his business rivals connected with the Mafia to the police.

‘Он отправил отравленную конфету, полученную по почте от одного из своих связанных с мафией конкурентов, полиции’.

 

She saw the matter that had caused her so much anxiety in former years when she was employed as an efficiency expert by the company through.

‘Она подвергла вопрос, причинивший ей столько беспокойства в прошлые годы, когда она была экспертом по оценке эффективности на своей фирме, анализу’.

 

That many teachers are being laid off in a shortsighted attempt to balance this year’s budget at the same time that the governor’s cronies and bureaucratic hacks are lining their pockets is appalling.

‘То, что многих учителей увольняют из‑за недальновидных попыток сбалансировать бюджет текущего года, в то время, как дружки губернатора и бюрократы набивают карман, возмутительно’.

 

Эти заставляющие память растягиваться предложения называются в пособиях по стилистике «предложениями с отягощенным началом». В языках, где о значении слов сообщают падежи, тяжелая составляющая может быть просто перенесена в конец предложения, чтобы слушатель мог переварить начало, не имея необходимости удерживать тяжелую составляющую в памяти. Английский язык деспотичен по отношению к порядку слов, но даже он предоставляет альтернативные варианты, в которых порядок составляющих будет изменен. Если внимательно подойти к составлению текста, то эти альтернативы можно использовать, чтобы отодвинуть самую тяжелую составляющую в конец, облегчая задачу для слушателя. Обратите внимание, насколько легче воспринимать эти предложения:

 

He gave the candy to the girl that he met in New York while visiting his parents for ten days around Christmas and New Year’s.

‘Он подарил конфеты девушке, с которой он встретился в Нью‑Йорке, гостя у своих родителей десять дней на рождественские и новогодние праздники’.

 

He sent to the police the poisoned candy that he had received in the mail from one of his business rivals connected with the Mafia.

‘Он отправил полиции отравленную конфету, полученную по почте от одного из своих конкурентов, связанных с мафией’.

 

She saw the matter through that had caused her so much anxiety in former years when she was employed as an efficiency expert by the company.

‘Она подвергла анализу вопрос, причинивший ей столько беспокойства в прошлые годы, когда она была экспертом по оценке эффективности на своей фирме’.

 

It is appalling that teachers are being laid off in a shortsighted attempt to balance this year’s budget at the same time that the governor’s cronies and bureaucratic hacks are lining their pockets.

‘Возмутительно, что многих учителей увольняют из‑за недальновидных попыток сбалансировать бюджет текущего года, в то время, как дружки губернатора и бюрократы набивают карман’.

 

Многие лингвисты полагают, что языки допускают перестановку составляющих или предоставляют выбор из более или менее синонимичных высказываний для того, чтобы облегчить нагрузку на память слушателя.

До тех пор, пока слова в предложении могут быть немедленно объединены в укомплектованные группы, предложение может быть довольно сложным, но тем не менее понятным:

 

Remarcable is the rapidity of the motion of the wing of the hummingbird.

‘Замечательна скорость движения крыла колибри’.

 

This is the cow with the crumpled horn that tossed the dog that worried the cat that killed the rat that ate the malt that lay in the house that Jack built.

‘Вот корова со сломанным рогом, что бодала собаку, что гонялась за кошкой, что убила ту крысу, что съела весь солод, лежавший в подвале в доме, который построил Джек’.

 

Then came the Holy One, blessed be He, and destroyed the angel of death that slew the butcher that killed the ox that drank the water that quenched the fire that burned the stick that beat the dog that bit the cat my father bought for two zuzim.

‘Затем явился Святой, будь Он благословен, и уничтожил ангела смерти, поразившего мясника, что зарезал быка, выпившего воду, что погасила огонь, спаливший палку, которой побили собаку, укусившую кошку, что мой отец купил за два зузима’.

 

Такие предложения называются «с ветвлением в правую сторону» из‑за строения своего синтаксического дерева. Обратите внимание на то, что при продвижении слева направо только одна ветвь в один момент времени остается неукомплектованной:

 

 

Предложения также могут иметь ветвление в левую сторону. Деревья с ветвлением в левую сторону больше всего распространены в языках с конечной позицией ядерного элемента, например, в японском, но также встречается и в некоторых английских конструкциях. Как и прежде, синтаксическому анализатору не нужно удерживать в памяти больше одной неукомплектованной ветви единовременно:

 

 

букв. ‘Колибриного крыла движения скорость замечательна’.

 

Есть и третий вид строения дерева, но он воспринимается гораздо тяжелее. Возьмите предложение:

 

The rapidity that the motion has is remarkable ‘Скорость, которую имеет движение, замечательна’.

 

Придаточное предложение that the motion has ‘которую имеет движение’ было вставлено в именную группу, содержащую The rapidity ‘Скорость’. То, что получилось в итоге, звучит немного неестественно, но легко поддается пониманию. Можно сказать и так:

 

The motion that the wing has is remarkable ‘Движение, которым обладает крыло, замечательно’.

 

Но если вставить группу motion that the wing has ‘движение, которым обладает крыло’ в группу rapidity that the motion has ‘скорость, которую имеет движение’, то результат будет на удивление трудно понять:

 

The rapidity that the motion that the wing has has is remarkable ‘Скорость, которую имеет движение, которым обладает крыло, замечательна’.

 

Если же вставить третью группу, например, the wing that the hummingbird has ‘крыло, имеющееся у колибри’, это приведет к появлению «предложения‑капусты» с тройным вставлением, что выльется в невозможность его понять[99]:

 

 

‘Скорость, которую имеет движение, которым обладает крыло, которое имеет колибри, замечательна’.

 

Когда синтаксический анализатор в голове у человека сталкивается с тремя has, идущими сразу друг за другом, он начинает буксовать, не зная, что с ними делать. Но проблема не в том, что составляющие, которые надо удерживать в памяти, слишком большие; даже короткие предложения не поддаются пониманию, если они содержат многочисленные вставления:

 

The dog the stick the fire burned beat bit the cat.

‘Собака, побитая палкой, сожженной огнем, укусила кошку’.

 

The malt that the rat that the cat killed ate lay in the house.

‘Солод, что съеден крысой, убитой кошкой, хранился в подвале’.

 

If if if it rains it pours I get depressed I should get help.

‘Мне нужна будет помощь из‑за того, что возникла депрессия, что началась из‑за дождя, что лил как из ведра’.

 

That that that he left is apparent is clear is obvious.

‘Очевидно, что это ясно, что налицо тот факт, что он ушел’.

 

Почему человек терпит абсолютное фиаско, пытаясь истолковать предложения с «капустной» или «матрешечной» структурой? Это одна из наиболее интригующих головоломок, связанных с устройством ментального синтаксического анализатора и ментальной грамматики. Вначале можно даже усомниться в том, что эти предложения грамматически правильны. Может быть, мы перепутали правила, а настоящие правила никак не позволили бы этим словам сочетаться? Может быть, помянутый недобрым словом генератор цепочек слов из 4‑й главы, отказывающийся помнить неукомплектованные составляющие, все же правильно имитирует человека? Никоим образом: эти предложения прекрасно выдерживают проверку. Именная группа может содержать определяющее ее придаточное предложение; если можно сказать the rat ‘та крыса’, то можно сказать и the rat that S ‘та крыса, что S ’, где S – это предложение, в котором отсутствует объект, определяющий the rat. А предложение the cat killed X ‘кошка убила X’ может содержать именную группу, такую как его подлежащее – the cat. Поэтому, когда мы говорим The rat that the cat killed ‘Крыса, которую убила кошка’, мы определяем именную группу через то, что в свою очередь содержит именную группу. При наличии хотя бы только двух возможностей это сделать и могут появиться «капустные» предложения: стоит только определить именную группу внутри придаточного предложения другим определяющим придаточным предложением. Единственное, чем можно было бы предотвратить появление «капустных» предложений – это заявить, что ментальная грамматика предусматривает существование двух разных типов именных групп: одни из них могут быть определяемыми, а другие могут присутствовать в составе определяющего. Но так быть не может: в этом случае и тому и другому виду именных групп пришлось бы позволить иметь в своем составе тысячи одних и тех же существительных, а артиклям, прилагательным и притяжательным формам – занимать идентичные позиции и т.д. Количество словарных единиц не должно множиться без необходимости, а подобная работенка приведет именно к такому результату. Поместить в ментальной грамматике различные виды групп только для того, чтобы объяснить, почему «капустные» предложения не поддаются пониманию, значило бы сделать грамматику существенно сложнее и дать ребенку для заучивания существенно большее количество правил в период усвоения языка. Проблема должна крыться в чем‑то другом.


Дата добавления: 2019-02-12; просмотров: 161; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!