“ПЕРЕДНЯЯ ЧАСТЬ ПРАВОГО ТЕЛЕНКА”, ИЛИ ОШИБКИ МАШИННОГО ПЕРЕВОДА (НА ОСНОВЕ АНАЛИЗА АВТОМАТИЧЕСКИХ СУБТИТРОВ)

MACHINE TRANSLATION MISTAKES (BASED ON AUTOMATIC SUBTITLES ANALYSIS)

Ситдикова Фарида Бизяновна, Хисамова Венера Нафиковна, Усманов Тимур Равилевич

SITDIKOVA FARIDA BIZYANOVNA, HISAMOVA VENERA NAFIKOVNA, USMANOV TIMUR RAVILEVICH

Балтийский гуманитарный журнал, № 2(27) 31.05.2019

Аннотация:
Статья посвящена анализу ошибок, сделанных машинным переводчиком Google Translate при переводе с английского на русский. Проблема качества машинного перевода является крайне актуальной в настоящее время в связи с возрастающей интенсивностью интернет-коммуникаций. В статье рассматриваются как достоинства, так и недостатки машинного перевода. Решение поставленной задачи - оценка качества машинного перевода - проводилось на материале автоматических субтитров, переведенных машинным переводчиком. На основании большого количества языковых примеров проведен анализ наиболее характерных ошибок переводчика Google Translate. Ошибки были поделены на несколько типов. Лексико-семантические ошибки включали в себя следующие: 1) неспособность выбрать нужное по контексту значение; 2) перевод семантических конструкций; 3) перевод имен собственных; 4) перевод аббревиатур. Рассматривались также морфологические, синтаксические и стилистические ошибки. Собрана статистика по количеству ошибок каждого типа. Делается вывод по количеству ошибок каждого типа. На основании проведенного опроса делается вывод о возможности использовать машинный перевод субтитров в практических целях в качестве сигнальной версии перевода субтитров. Материалом для исследования послужили автоматические субтитры, переведенные на русский язык Google Translate, которые сравнивались с английским оригиналом. Статья может представлять интерес для исследователей, интересующихся проблемами и перспективами машинного перевода.

Ключевые слова:
КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА, МАШИННЫЙ ПЕРЕВОД (МП), МАШИННЫЙ ПЕРЕВОДЧИК, АВТОМАТИЧЕСКИЙ ПЕРЕВОД, АВТОМАТИЧЕСКИЙ ПЕРЕВОДЧИК, СТАТИСТИЧЕСКИЙ МП, НЕЙРОННЫЙ МП, СИСТЕМА МАШИННОГО ПЕРЕВОДА (СМП), ПОСТРЕДАКТИРОВАНИЕ, ОШИБКИ МАШИННОГО ПЕРЕВОДА
Description:
The article is devoted to the analysis of errors made by Google Translate when translating from English to Russian. The problem of the quality of machine translation is extremely urgent at present due to the increasing intensity of Internet communications. The article discusses both the advantages and disadvantages of machine translation. The solution of the problem posed - the evaluation of the quality of machine translation - was conducted on the material of automatic subtitles translated by a machine translator. Based on a large number of language examples, an analysis of the most characteristic mistakes of the Google Translate translator has been conducted. Errors were divided into several types. The lexico-semantic errors included the following: 1) inability to select the meaning required by context; 2) translation of semantic constructions; 3) translation of proper names; 4) translation of abbreviations. Morphological, syntactic and stylistic mistakes were also considered. Statistics collected on the number of errors of each type. The conclusion is made by the number of errors of each type. Based on the survey conducted, it is concluded that it is possible to use machine translation of subtitles for practical purposes as a signal version of the translation of subtitles. The material for the study were automatic subtitles translated into Russian by Google Translate, which were compared with the English original. The article may be of interest to researchers interested in the problems and prospects of machine translation.

Key words:
Mt, SMT, nmt, computational linguistics, machine translation (MT), machine translator, automatic translation, automatic translator, statistical MP, neural MT, machine translation system (SMP), post-editing, machine translation errors