Главная arrow Справочник arrow Компьютерный перевод
Компьютерный перевод

Машинный перевод (компьютерный перевод, автоматический перевод)

     Машинный, а точнее, компьютерный перевод — это письменный перевод, поскольку в результате получается  письменный текст. Однако осуществляет его не переводчик, а особая компьютерная программа. Современные компьютерные программы перевода достаточно совершенны, но они до сих пор не могут разрешить самую сложную задачу процесса перевода: выбор контекстуально  необходимого варианта, который в каждом тексте обусловлен многими причинами. В настоящее время результат этого вида перевода может быть использован как черновой вариант будущего текста, который будет редактировать переводчик, а также как средство, чтобы в крайней ситуации отсутствия переводчика получить общее представление о теме и содержании текста.


     Еще более сложную задачу представляет перевод устного текста с помощью компьютерных программ, так как проблема распознавания устной речи находится лишь на начальном этапе своего решения. До сих пор непреодолимым препятствием является индивидуальная окраска звучания сегмента речи — на любом языке такая речь плохо формализуется.


     Машинный перевод в типологической классификации перевода противопоставлен переводу естественному (ручному), осуществляемому человеком.


     Практика машинного перевода связана с появлением компьютеров. В 1949 г. спустя пять лет после начала эксплуатации в США первого довольно мощного компьютера математик У. Вивер призвал ученое сообщество использовать ЭВМ для перевода.  Собственно автоматический перевод был одной из первых областей, в которых предполагалось применять компьютер. Вначале идея такого перевода была принята на ура. Достижение поставленной цели показалось очень простым. Первые проекты машинного перевода строились на перекодировании текста исходного языка (ИЯ) на текст языка перевода (ПЯ) без учета грамматики, более поздние и современные, однако, представляли собой уже более сложные системы, построенные с учетом грамматики, семантики и даже экстралингвистической информации.


     В машинном переводе используется трансформационный метод. В компьютерную программу закладываются слова и словосочетания ИЯ и ПЯ. Далее осуществляется так называемый пословно-пооборотный перевод. При этом неоднозначность соответствий единиц ИЯ и ПЯ заставила разработчиков программ машинного перевода предусмотреть алгоритм выбора правильного соответствия. Такие алгоритмы основаны на двух принципах: синтаксическом и семантическом. Программа, построенная на синтаксическом алгоритме, находит соответствия ИЯ и ПЯ, исходя из синтаксической роли, которую играет та или иная единица ИЯ в предложении. Семантический алгоритм позволяет определить, какое из значений многозначных слов реализуется в данном тексте. Оба алгоритма применяются в комплексе. В более сложных программах к ним подключается и алгоритм выбора значений слов и оборотов по экстралингвистической информации. Однако такие трехалгоритмовые программы находятся еще в стадии разработки.


     Основой любой программы машинного перевода является автоматический словарь. Некоторые словари снабжены функцией пополнения лексики. Автоматический словарь представляет собой программный модуль, который распознает слова и словосочетания, преобразует встречающиеся в тексте словоформы в словарный вид, истолковывает грамматическую информацию, содержит информацию о соответствиях данного слова / выражения в ПЯ, грамматических, семантических свойствах этих соответствий, формирует семантико-синтаксическое представление входного текста.


     Преобразование исходного текста в конечный в специальной литературе называется трансфер. В процессе трансфера анализируется синтаксис и семантика входного текста, уточняется его структура, затем происходит преобразование структуры данного входного предложения в ядерную структуру по правилам машинной грамматики. Наконец, осуществляется синтез синтаксической структуры соответствующего выходного предложения.


     В некоторых программах помимо схемы трансфера используется язык-посредник, представляющий собой некий универсальный код, объединяющий грамматическую и семантическую информацию о тексте на любом языке, через который происходит трансформация текста на ИЯ в текст на ПЯ.


     После трансфера осуществляется лексический синтез выходного предложения по синтаксическим и семантическим признакам, затем синтезируются нужные словоформы ПЯ (в нужных падежах, лицах, числах, временах и т.п.).


     Довольно популярными (в США и других странах) являются системы, базирующиеся на статистических моделях переводных соответствий. Принцип, стоящий за этими моделями, заключается в том, что любое слово одного языка может переводиться любым словом другого, но с разной вероятностью. При этом автомат с помощью параллельных текстов и сравнения оригинала с выполненными человеком переводами определяет вероятностные величины переводных соответствий. Регистрируются и синтаксические вероятностные величины переводных соответствий. В итоге создается словарь наиболее вероятных соответствий. На базе этого словаря и осуществляется автоматический перевод. Если словарь оказывается неполным, обрабатывается новый корпус параллельных текстов.


     После первоначальной эйфории в истории машинного перевода было осознано, что перевод связан с объектом чрезвычайной сложности — с естественным языком, что с первоначально поставленной задачей разработки полноценного перевода при помощи машины справиться не так легко. К тому же перевод — это творческая деятельность, и уже хотя бы поэтому он не может быть в полной мере заменен машиной.


     В результате начальную эйфорию сменили более уравновешенные взгляды на возможности машинного перевода. Стало ясно, что он, хотя и не заменил собой переводчика-человека, все же может быть ему полезен.


     Сфера использования машинного перевода сведена в настоящее время к промышленному переводу. Б. Сигурд  называет это направление переводом для специальных целей и добавляет, что машинный перевод не разрабатывается для перевода художественных текстов, поэзии, Шекспира или Библии. Он может помочь в рутинной переводческой работе, когда быстрота выполнения перевода важнее его качества. Например, машинный перевод может оказаться кстати для специалиста в какой-либо области, не владеющего тем или иным иностранным языком, на котором ему нужно прочитать интересующий его текст. Хотя машинный перевод, как правило, оказывается полным грамматических и лексических ошибок, синтаксических неувязок, человек вполне может получить общее представление о содержании текста и о том, насколько этот текст интересен для него. Это поможет ему, например, решить, стоит ли заказывать более качественный перевод или предпринять попытку отредактировать уже полученный. Таким образом, машинный перевод позволяет получить то, что мы условно назвали сигнальным переводом.


     Машинный перевод оказался очень интересным проектом с переводоведческой точки зрения, поскольку заставил ученых пристальнее всмотреться в то, как перевод осуществляется человеком.


     Обычно в качестве спонсоров проектов по разработке программ машинного перевода выступают такие организации, как Евратом и НАТО в Европе, НАСА и Пентагон в США. Например, в НАСА автоматический перевод на постоянной основе использовался для перевода рабочей документации при осуществлении совместного советско-американского космического проекта «Союз — Аполлон».


     В США вообще (особенно во времена «холодной войны») уделялось много внимания переводу с русского языка на английский.  Кроме того, разрабатывались программы перевода с китайского языка на английский (в Калифорнийском университете в Беркли).


     В Канаде с 1976 г. машинный перевод активно используется для перевода прогнозов погоды с английского языка на французский. Система работает со скоростью 1000 слов в минуту. При этом затраты составляют всего лишь треть от затрат на обеспечение естественного перевода того же объема материалов. Каждый день машины переводят до 30 000 слов, работая при этом всего полчаса в день. Успех программы объясняется тем, что в текстах метеорологических сводок используется ограниченная по тематике лексика, а также стандартные синтаксические конструкции.
                                              ( Изложено по И.С. Алексеева "Введение в переводоведение",  С.В.Тюленев "Теория перевода").

См. также:

1.Лагунов И.Некоторые проблемы машинного перевода http://pages.ykt.ru/kperevoda/conf1.html
2.Машинный перевод http://www.krugosvet.ru/articles/82/1008256/1008256a1.htm
3.Машинный перевод http://www.dialog-21.ru/directions_materials.asp?dir_id=1744&forum_id=1746#r
4.Михайлов М.Н. Черная кошка в темной комнате, или Можно ли автоматизировать поиск переводных эквивалентов в параллельном корпусе текстов? http://www.uta.fi/~mihail.mihailov/research/koshka.htm
5.Носов К. Машинный перевод: преодолевая языковые барьеры http://itc.ua/node/20029/
6.Чубуков А. Машинный перевод: новые решения нацелены на корпоративный рынок  http://www.pcweek.ru/themes/detail.php?ID=70577
7.Шаляпина З.М. Автоматический перевод : эволюция и современные тенденции http://www.dialog-21.ru/Archive/Directions/OBZOR_MP.htm.

 1. White, J., O’Connell, T., and Carlson, L. (1993) “Evaluation of Machine Translation.” In Human Language Technology: Proceedings of the Workshop (ARPA), pp 206–210.

2. Melamed, I.D. (1995) “Automatic Evaluation and Uniform Filter Cascades for Inducing N-Best Translation Lexicons.” In Third Workshop on Very Large Corpora (WVLC3), pp 184–198, Boston.

3. Brew, C., and Thompson, H. (1994) “Automatic Evaluation of Computer Generated Text: A Progress Report on the TextEval Project.” In Human Language Technology: Proceedings of the Workshop (ARPA/ISTO), pp 108–113.

4. Papineni, K., Roukos, S., Ward, T., and Zhu, W.-J.. (2002) “BLEU: a Method for Automatic Evaluation of Machine Translation.” In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL), pp 311–318, Philadelphia.

5. Doddington, G. (2002) “Automatic Evaluation of Machine Translation Quality Using N-gram Co-Occurrence Statistics.” In Human Language Technology: Notebook Proceedings, pp 128–132, San Diego.

6. Turian, J.P., Shen, L., and Melamed, I.D. (2003) ”Evaluation of Machine Translation and its Evaluation.” In Proceedings of MT Summit IX; New Orleans, USA, 23-28 September 2003.

7. http://en.wikipedia.org/wiki/Approximate_string_matching

8. http://en.wikipedia.org/wiki/Levenshtein_distance

9. Blatz, J., Fitzgerald, E., Foster, G., Gandrabur, S., Goutte, C., Kulesza, A., Sanchis, A., and Ueffing, N. (2004) “Confidence Estimation for Machine Translation.” In Proceedings of COLING, pp 315–321, Geneva.

10. http://en.wikipedia.org/wiki/Evaluation_of_machine_translation

11. http://www.lrec-conf.org/proceedings/lrec2008/pdf/785_paper.pdf

12. Cancedda, N., and Yamada, K. (2005). “Method and Apparatus for Evaluating Machine Translation Quality.” US Patent Application 20050137854.

13. http://www.intsys.msu.ru/invest/speech/articles/rus_lm.htm

14. http://www.languagestudio.com/TranslationQualityMetrics.aspx

15. Melamed, I.D., Green, R., and Turian, J.P. (2003) “Precision and Recall of Machine Translation.” In Proc. HLT-03, pp 61–63.

16. http://ru.wikipedia.org/wiki/Информационный_поиск

17. Lavie, A., Sagae, K., and Jayaraman, S. (2004) “The Significance of Recall in Automatic Metrics for MT Evaluation.” Proceedings of the Sixth Conference of the Association for Machine Translation in the Americas (AMTA'04), pp 134–143.

18. Banerjee, S., and Lavie, A. (2007) “METEOR: An Automatic Metric for MT Evaluation with Improved Correlation with Human Judgments.” In Proceedings of the Second Workshop on Statistical Machine Translation, pp 228–231, Prague.

19. Ulitkin, I. (2011) “Computer-assisted Translation Tools: A Brief Review.” Translation Journal, Vol. 15, No. 1, January 2011.

20. http://www.quantum-electron.ru/php/content_rus.phtml?jrnid=qe&year_id=2012&issue_id=2

21. http://ru.wikipedia.org/wiki/ПРОМТ

22. http://www.abbyy.ru/science/technologies/business/compreno/

 
пїЅпїЅпїЅпїЅпїЅпїЅпїЅпїЅ пїЅпїЅпїЅпїЅпїЅпїЅпїЅпїЅпїЅпїЅпїЅпїЅпїЅ пїЅпїЅ 0.017154 пїЅпїЅпїЅпїЅпїЅпїЅ
пїЅпїЅпїЅпїЅпїЅпїЅ.пїЅпїЅпїЅпїЅпїЅпїЅпїЅ