История машинного перевода. Основные идеи.



Впервые мысль о возможности автоматического перевода в начале 40-x годов XIX века высказал британский математик Чарльз Бэббидж. Он пытался убедить правительство в необходимости финансировать исследования по разработке механического прототипа ЭВМ и обещал, что его машина сможет переводить разговорную речь... Проекту Бэббиджа суждено было остановиться на стадии прототипа, и его идеи на сто лет легли под сукно.
В 1933 году изобретатель П.П.Смирнов-Троянский получил в СССР патент на механическую «машину для подбора и печатания слов при переводе с одного языка на другой». Огромная заслуга этого человека в том, что он предложил и автоматический двуязычный словарь, и схему кодирования межъязыковых грамматических соответствий; правда, только для «синтетического» языка эсперанто. «Лингвистический арифмометр» Смирнова-Троянского опередил время, но дошел до наших дней лишь в списке научных курьезов

Что такое машинный перевод?
Машинный (он же автоматический, компьютерный, электронный) перевод – действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом естественном языке, а также результат такого действия. Программный комплекс системы машинного перевода (СМП) включает в себя двуязычные словари, снабженные грамматической информацией (морфологической, синтаксической и семантической), необходимой для передачи переводных соответствий, а также средства грамматического анализ

40-е: первые шаги
В марте 1947 г. Уоррен Уивер (Warren Weaver) впервые сформулировал концепцию машинного перевода, которую несколько позже (в 1949 г.) развил в своем меморандуме, адресованном
Фонду. Аналогия между переводом и дешифрованием была естественной в контексте послевоенной эпохи, если учитывать успехи, которых достигла криптография в годы Второй мировой войны. Идеи Уивера легли в основу подхода к МП, основанного на концепции interlingva: стадия передачи информации разделена на два этапа; на первом этапе
исходное предложение переводится на язык-посредник (созданный на базе упрощенного английского языка), а затем результат этого перевода представляется средствами выходного языка.
В те годы довольно сильно отличались от современных. Это были очень большие и дорогие машины, которые занимали целые комнаты и требовали для своего обслуживания большой штат инженеров, операторов и программистов.

в 1954 г в Нью-Йорке была представлена первая система МП - IBM Mark II, разработанная компанией IBM совместно с Джоржтаунским университетом (это событие вошло в историю как Джорджтаунский эксперимент).
Была представлена очень ограниченная в своих возможностях программа (она имела словарь в 250 единиц и 6 грамматических правил), осуществлявшая перевод с русского языка на английский.
50е: первое разочарование
К началу 50-х годов целый ряд исследовательских групп в США и в Европе работали в области МП. В эти исследования были вложены значительные средства, однако результаты очень скоро разочаровали инвесторов. Одной из главных причин невысокого качества МП в те годы были ограниченные возможности аппаратных средств: малый объем памяти при медленном доступе к содержащейся в ней, в результате чего первые системы МП сводились к пословному (word-to-word) переводу текстов без какой-либо синтаксической (а тем более смысловой) целостности.
В 1959 г. философ Й. Бар-Хиллел (Yohoshua Bar-Hillel) выступил с утверждением, что высококачественный полностью автоматический МП (FAHQMT) не может
быть достигнут в принципе. В качестве примера он привел проблему нахождения правильного перевода для слова pen в следующем контексте: John was looking for his toy box. Finally he found it. The box was in the pen. John was very happy. (Джон искал свою игрушечную коробку. Наконец он ее нашел. Коробка была в манеже. Джон был очень счастлив.). Pen в данном случае должно переводиться не как "ручка" (инструмент для письма), а как "детский манеж" (play-pen). Выбор того или иного перевода в этом случае и в ряде других обусловлен знанием внеязыковой действительности, а это знание слишком обширно и разнообразно, чтобы вводить его в компьютер.
60-е: низкий старт
Следующие десять лет разработка систем МП осуществлялась в США университетом Brigham Young University в Прово, штат Юта (ранние коммерческие
системы WEIDNER и ALPS) и финансировалась Мормонской церковью, заинтересованной в переводе Библии; в Канаде группами исследователей, в числе
которых TAUM в Монреале с ее системой METEO; в Европе - группами GENA (Гренобль) и SUSY (Саарбрюкен). Особого упоминания заслуживают работа в
этой области отечественных лингвистов, таких, как И.А.Мельчук и Ю.Д.Апресян (Москва), результатом которой стал лингвистический процессор ЭТАП.
70-80-е: новый импульс
При этом несколько сместились акценты: исследователи теперь ставили целью развитие "реалистических" систем МП, предполагавших участие человека на различных стадиях процесса перевода. Системы МП из "врага" и "конкурента" профессионального переводчика
превращаются в незаменимого помощника, способствующего экономии времени и человеческих ресурсов.
Одной из новых разработок стала технология TM (translation memory), работающая по принципу накопления: в процессе перевода сохраняется исходный сегмент (предложение) и его перевод, в результате чего образуется лингвистическая база данных; если идентичный или подобный исходному сегмент обнаруживается во вновь переводимом тексте, он отображается вместе с переводом и указанием совпадения в процентах. Затем переводчик принимает решение (редактировать, отклонить или принять перевод), результат которого сохраняется системой. А в конечном итоге "не нужно дважды переводить одно и то же предложение!". В настоящее время разработчиком известной коммерческой системы, основанной на технологии TM, является система TRADOS (основана
в 1984 г.).
От 90-х к XXI веку
90-е годы принесли с собой бурное развитие рынка ПК (от настольных до карманных) и информационных технологий, широкое использование сети Интернет
(которая становится все более интернациональной и многоязыкой). Все это сделало возможным, а главное востребованным, дальнейшее развитие систем МП.
В настоящее несколько десятков компаний занимаются разработкой коммерческих систем МП, в их числе: Systran, IBM, L&H (Lernout & Hauspie),
Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Lingvistica b.v. и др.
Достоинства программ машинного перевода

1. Высокая скорость работы. Перевод многостраничного документа средствами СМП занимает секунды! Это позволяет быстро понять смысл текста, и нередко (в зависимости от характера переводимого текста) для получения удовлетворительного результата требуется лишь минимальная редакторская правка.

2. Низкая стоимость. Обращаясь к профессиональным переводчикам, приходиться платить немалые деньги – от $5 до $20 за каждую страницу переводимого текста. Делая выбор даже в пользу коммерческой СМП, вы раскошеливаетесь только один раз – при покупке программы. Согласно опросам обладателей продуктов компании ПРОМТ, при средней интенсивности использования PROMT 4U, например, окупается примерно за месяц!

3. Доступность сервиса. Программа-переводчик всегда под рукой – на стационарном и портативном компьютере, в интернет-кафе – в виде онлайнового сервиса,

4. Конфиденциальность. «Электронному переводчику», в отличие от живого, вы можете спокойно доверить личные, медицинские, деловые, финансовые сведения, не опасаясь ни разглашения, ни злоупотреблений.

Разведка боем
«Машинный перевод все еще далек от совершенства, но любой желающий с его помощью может, по крайней мере, понять основной смысл документа». Этот комментарий Луи Монье, технологического директорв портала Alta Vista, был и остается одной из наиболее точных характеристик ситуации с машинным переводом. Да, он не идеален.


Дата добавления: 2018-05-13; просмотров: 484; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!