Формализация лингвистических описаний



В лингвистике разработаны всевозможные методы формализации информации о языке.

Классическим формализмом таксономической лингвистики является представление системно противопоставленных языковых единиц в виде грамматической парадигмы, т. е. совокупности системно связанных форм — например, падежных и числовых форм существительного или личных форм глагола.

Для представления синтагматических и иерархических отношений языковых единиц используются различного типа графы, например, деревья зависимостей и деревья составляющих. Для формального представления семантических отношений используются семантические сети, семантические карты, фреймы. Иерархические отношения между синтаксическими составляющими представляются в виде скобочной записи. Различные свойства классов языковых единиц выражают иерархии. Иерархия есть упорядоченная последовательность единиц в классе. Порядок позиций в иерархии отражает степень возрастания/убывания степени некоторого признака, характеризующего единицы данного класса. Например, иерархия синтаксических предикатно-аргументных отношений

Субъект > Прямой объект > Непрямой объект > Косвенный объект > Обстоятельство

отражает степень ядерности / системного подобия / доступности синтаксическим процессам этих отношений. Наиболее ядерным является субъект, наименее ядерным — обстоятельство. Различные объединения синтаксических отношений таковы, что они распространяются только на непрерывные последовательности в этой иерархии. Так, ядерными отношениями являются субъект и прямой объект, неядерными — косвенный объект и обстоятельство, а непрямой (дативный) объект в разных языках или конструкциях относится либо к ядерным, либо к периферийным отношениям. С точки зрения способности участвовать в синтаксических процессах наиболее естественным отношением является субъект. Так, в языках с глагольным согласованием субъект обязательно является контролером согласования; иными словами, если глагол в языке в принципе согласуется (скажем, в лице или числе) с какими-либо синтаксически связанными с ним членами предложения, то среди последних обязательно окажется субъект. Часто он является и единственным контролером согласования, однако в некоторых языках имеется субъектно-объектное согласование, а иногда контролером согласования является также косвенное дополнение.

В динамических описаниях языка имеются различные методы представления языковых правил, например, алгоритмы и так называемые продукции.

Алгоритм формализует такую пошаговую процедуру, на вход которой поступает некоторое исходное представление, а на выходе получается результирующее представление. Алгоритм обеспечивает единообразное преобразование идентичных исходных представлений, т. е. правильный результат с точки зрения введенных в алгоритм правил. Иными словами, алгоритм вычисляет взаимно-однозначное соответствие между исходным и результирующим представлениями. Математическое понятие алгоритма нашло широкое применение в разработках по машинному переводу. Алгоритм мыслится как преобразователь текста на входном языке в текст на выходном языке.

Если алгоритм есть система жестких предписывающих правил, то продукции являются нежесткими правилами, указывающими на "дефолтную" связь между входом и выходом правила. Эта связь реализуется по умолчанию (англ. by default), если данное правило не вступает в конфликт с другими правилами. В противном случае вступают в действие специальные правила разрешения конфликта.

Формальные средства лингвистического описания могут быть классифицированы по разным основаниям. Так, с точки зрения области применения формализация используется для представления языковых данных, для обеспечения правильной аргументации и для построения правильных языковых выражений (метаязыки описания). С точки зрения используемых средств формализация может быть алгебраической (языковые единицы обозначаются знаками особого алфавита, например, таковы различные типы транскрипции, нотация типов предложения в Академической грамматике), геометрической (языковым сущностям ставятся в соответствие геометрические или топологические объекты — например, кубическое представление фонетических или грамматических оппозиций, различные типы древовидного представления синтаксической структуры), рисуночной (например, диаграммы в когнитивной грамматике Р.Лэнакера), или метаязыковой (в последнем случае в функции формального метаязыка выступает сам естественный язык, см., например, способ нотации смысла языковых выражений в теории А.Вежбицкой средствами специально отобранных и определяемых единиц естественного языка).

Формализмы используются не только для более компактного и наглядного представления о языковых феноменах — они могут обладать также и самостоятельной объяснительной силой. Так, синтаксические формализмы 1960-х годов позволили сфомулировать некоторые важные ограничения на порядок слов: представление синтаксической структуры в виде дерева составляющих способствовало обнаружению универсального ограничения на естественный язык, названного В.Ингве гипотезой глубины, а представление в форме дерева зависимостей — обнаружению универсальной тенденции естественного языка к проективности.


Дата добавления: 2018-04-15; просмотров: 461; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!