МАШИННЫЙ ПЕРЕВОД


Машинным переводом называется автоматический перевод текста с одного естественного языка (исходного) на другой (целевой). Практика показала, что этот процесс может применяться для выполнения целого ряда задач, включая перечисленные ниже.
1. Грубый перевод, цель которого состоит в том, чтобы только определить смысл отрывка текста. В нем допускается наличие грамматически неправильных и неуклюжих предложений, при условии, что смысл этих предложений ясен. Например, в ходе Web-серфинга пользователю часто достаточно получить грубый перевод Web-страницы на иностранном языке. Иногда лицо, владеющее только родным языком, может успешно выполнить последующее редактирование результатов перевода без необходимости читать источник. Такого рода перевод с помощью машины позволяет сэкономить деньги, поскольку тем, кто занимается редактированием текста, полученного с помощью машинного перевода, можно платить меньше, чем тем, кто непосредственно переводит с иностранного языка.
2. Перевод источников с ограниченной тематикой, в котором тема и формат исходного текста строго ограничены. Одним из наиболее удачных примеров является система Taum-Meteo, которая переводит сообщения о погоде с английского языка на французский. Ее работа основана на том, что язык, используемый в сообщениях о погоде, является в высшей степени стилизованным и формализованным.
3. Перевод с предварительным редактированием, в котором исходный документ заранее редактируется перед машинным переводом людьми для того, чтобы он соответствовал ограниченному подмножеству английского или любого другого языка оригинала. Такой подход является особенно экономически эффективным, если есть необходимость перевести один документ на много языков, как в случае распространения юридических документов в Европейском экономическом сообществе или в случае тиражирования инструкций компаниями, которые продают один и тот же продукт во многие страны. Ограниченные языки иногда называют "Caterpillar English" (английским языком Caterpillar), поскольку впервые попытку оформлять свои инструкции в такой форме предприняла корпорация Caterpillar. Компания Xerox определила язык для своих инструкций по техническому обслуживанию, который является достаточно простым для того, чтобы его можно было перевести с помощью машины на языки всех стран, с которыми компания Xerox имеет деловые связи. Дополнительным преимуществом оказалось то, что оригинальные английские инструкции также стали более понятными.
4. Литературный перевод, в котором сохраняются все нюансы исходного текста. В настоящее время эта задача выходит за рамки возможностей машинного перевода.
В качестве примера грубого перевода в табл. 23.4 приведен первый абзац из оригинала данной главы, переведенный на итальянский язык, затем снова на английский с помощью службы перевода Systran.
Задача перевода является сложной, поскольку, вообще говоря, для ее решения требуется глубокое понимание текста, а для этого, в свою очередь, необходимо глубокое понимание ситуации, о которой идет речь. Это утверждение является справедливым применительно даже к очень простым текстам, в частности даже к "текстам", состоящим из одного слова. Рассмотрим слово "Open" на двери магазина4. Оно сообщает, что в данный момент магазин принимает покупателей. Теперь предположим, что такое же слово "Open" написано на большом плакате рядом с вновь открытым магазином. Оно означает, что магазин уже работает, но люди, прочитавшие это сообщение, не почувствуют себя обманутыми, узнав, что магазин закрыли на ночь, а плакат оставили висеть на стенде. Дело в том, что в этих двух сообщениях одно и то же слово использовалось дня передачи разных смысловых значений. С другой стороны, в тех магазинах, где с покупателями общаются на немецком языке, на дверях принято вешать табличку "Offen", а на соответствующих плакатах, сообщающих об открытии нового магазина, писать слова "Neu Eroffnet".
Проблема состоит в том, что в различных языках мир подразделяется на категории по-разному. Например, французское слово "doux" охватывает широкий диапазон смысловых значений, приблизительно соответствующих английским словам "soft", "sweet" и "gentle". Аналогичным образом, английское слово "hard" охватывает практически все области применения немецкого слова "hart" (физически стойкий, жесткий), а также области использования слова "schwierig" (трудный). Немецкий глагол "heilen" охватывает все области применения английского существительного "cure" в медицине, а также области применения английского глагола "heal" в качестве транзитивного и нетранзитивного в обычном языке. Поэтому задача представления смысла предложения для перевода сложнее по сравнению с той ситуацией, когда эта задача решается в целях понимания смысла предложения на одном языке. В системе синтаксического анализа текста на одном языке могут использоваться предикаты наподобие Ореп(х), а в случае перевода язык представления должен обеспечивать проведение более тонких различий, например, с учетом того, что предикат Орещ (х) должен представлять смысл надписи "Offen", а Ореп2 (х) — смысл надписи "Neu Eroffnet". Язык представления, в котором учитываются все различия, необходимые дня представления целого ряда языков, называется промежуточным языком.
Чтобы выполнить беглый перевод, переводчик (человек или машина) должен прочитать первоначальный текст, понять тему, к которой он относится, и составить соответствующий текст на целевом языке, достаточно качественно описывающий ту же или аналогичную тему. При этом часто приходится брать на себя определенную ответственность. Например, английское слово "you", обращенное к отдельному лицу, может быть переведено на французский язык либо как формальное обращение "vous", либо как неформальное "Ш". Дело в том, что просто не существует способа, позволяющего перевести обращение "you" на французский язык, не приняв вместе с тем решения о том, должно ли это обращение быть формальным или неформальным. Переводчики (и машины, и люди) иногда испытывают затруднения, принимая подобные решения.







Материалы

Яндекс.Метрика