Системы машинного перевода

Системы машинного перевода различаются по тому признаку, на каком уровне в них осуществляется анализ текста. В некоторых системах предпринимается попытка полностью проанализировать входной текст вплоть до получения представления на промежуточном языке (как было сделано в главе 22), а затем сформировать из этого представления предложения на целевом языке. Такая задача является сложной, поскольку она включает в качестве подзадачи проблему полного понимания языка, а к этому добавляются все сложности, связанные с применение промежуточного языка. К тому же такой подход является ненадежным, поскольку в случае неудачного завершения анализа не формируются также выходные данные. А его преимуществом является то, что нет таких частей системы, функционирование которых основано на знании одновременно двух языков. Это означает, что может быть создана система с промежуточным языком, позволяющая переводить тексты с одного из п языков на другой за счет трудозатрат, пропорциональных О (л), а не О (л2).
Другие системы основаны на так называемом методе передачи. В них имеется база данных, состоящая из правил перевода (или примеров), а перевод осуществляется непосредственно путем согласования текста с правилами (или примерами). Передача может осуществляться на лексическом, синтаксическом или семантическом уровне. Например, строго синтаксическое правило преобразует английское словосочетание [Adjective Noun] (adjective — имя прилагательное, noun — имя существительное) во французское словосочетание [Noun Adjective]. А, допустим, смешанное синтаксическое и лексическое правило устанавливает соответствие между французским выражением [Si "et puis" S2] и английским [S1 "and then" S2]. Передача, выполняемая с непосредственным преобразованием одного предложения в другое, известна под названием метода перевода с помощью памяти, поскольку она основана на запоминании большого множества пар (английский, французский). Метод передачи является надежным, поскольку он всегда обеспечивает выработку пусть даже каких-то выходных данных и при этом по меньшей мере хотя бы часть полученных слов обязательно оказывается правильной. На рис. 23.2 схематически показаны различные уровни передачи.







Материалы

Яндекс.Метрика