Автоматический поиск терминологии



Концептно-ориентированная модель памяти переводов

А. Г. Глазунов

В статье перечислены и кратко описаны основные типы технологий перевода. Изложены принципы организации систем памяти переводов, и охарактеризована сфера их применимости. Предложена новая модель памяти переводов, подразумевающая привлечение технологии машинного перевода. Кратко описан универсальный сетевой язык UNL, и обоснована целесообразность его использования для реализации предложенной модели.

Введение

Отвлекшись на секунду от всех тонкостей существующих ныне способов перевести текст с одного языка на другой, можно с уверенностью утверждать, что есть лишь три типа перевода: человеческий, машинный и человеко-машинный. Первый тип, вне всяких сомнений, является самым трудоемким, однако, на первый взгляд, он кажется наиболее надежным, поскольку кто, если не человек, способен адекватно передать смысл, заключенный в тексте? Тем не менее, более внимательный взгляд на проблему позволяет обнаружить, что человеческий перевод по-настоящему ценен или, если хотите, бесценен только в художественной литературе и, отчасти, в публицистике, где важными факторами являются разнообразие и творческий подход. В то же время, научные и технические тексты требуют строгих формулировок и точного следования терминологии, что, согласитесь, временами представляет для человека проблему. Идеальным средством для технического перевода мог бы оказаться компьютер, но в ближайшие годы чисто машинный перевод едва ли найдет серьезное практическое применение в силу сложности, многообразия и недостаточной "формализуемости" естественных языков. Выходом из положения является комбинированный, человеко-машинный перевод, выполняемый при доминирующей роли человека, но с привлечением возможностей вычислительной техники.

Полагаясь на справедливость вышесказанного, сконцентрируем свое внимание на задаче оптимального комбинирования процессов человеческого и компьютерного переводов технического текста. Дабы с первых же строк не отклоняться от пресловутого принципа точности терминологии, для начала введем ряд определений, заранее отметив, что все они даются исключительно в контексте поставленной задачи.

Основные определения

Концепт- не зависящее от конкретного языка понятие, соответствующее реальной или абстрактной сущности, свойству, действию, либо иному элементу, отражающему связь между другими понятиями.

Термин- слово или словосочетание на заданном языке, обозначающее в этом языке конкретный концепт.

Терминология- множество обозначающих один и тот же концепт терминов из различных языков.

Сегмент- непрерывный фрагмент текста, состоящего из терминов одного языка, обозначающих связанную по некоторому критерию группу концептов.

Вариант сегмента- сегмент, похожий на исходный по некоторому критерию.

Исходный язык- язык, с которого осуществляется перевод.

Целевой язык- язык, на который осуществляется перевод.

Языковая пара- упорядоченная пара сегментов, объявленных переводчиком эквивалентными по смыслу, первый из которых содержит термины на исходном языке, а второй- на целевом.

Восемь типов технологии перевода

В современных профессиональных средах перевода возможности вычислительной техники используются на различных этапах и уровнях. Всего можно выделить восемь способов применения компьютера при переводе (таблица 1).

Таблица 1

  Уровень терминов Уровень сегментов
До перевода Выделение терминов Анализ терминологии Сегментация текста
Во время перевода Автоматический поиск терминологии Поиск языковых пар в памяти переводов Машинный перевод
После перевода Проверка соответствия терминологии Проверка целостности сегментов, формата и грамматики

Выделение терминов и анализ терминологии

На этом этапе производится исследование текста с целью выяснения, какие слова или словосочетания могут быть взяты в качестве терминов. После того, как определен термин на исходном языке, осуществляется анализ терминологии на предмет того, какой термин на целевом языке следует выбрать для обозначения нужного концепта. Например, если в исходном тексте встретилось словосочетание "операционная система" то программа должна проанализировать его в качестве возможного термина, даже если в системе уже определены термины "операционный" и "система".

Автоматический поиск терминологии

Данный процесс может быть сравнен с машинным переводом на уровне отдельных терминов. Суть его заключается в том, что в процессе работы над текстом переводчик имеет возможность видеть варианты перевода для каждого термина, и быстро вставлять нужный перевод в текст на целевом языке, не рискуя допустить опечатку.


Дата добавления: 2019-07-15; просмотров: 124; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!