Анализ существующих средств технического перевода

Обложка

Цитировать

Полный текст

Аннотация

Обоснование. Первые средства технического перевода текста появились достаточно давно и с тех пор преодолели большой путь, став не только вспомогательными инструментами, но и системами, способными самостоятельно переводить текст, аудиофрагменты и даже видео. Однако полученный таким образом перевод не может сравниться по качеству с тем, который сделает профессиональный переводчик. Всем средствам технического перевода свойственны одни и те же проблемы: неточность грамматических конструкций, ограниченность словарного запаса, недостаточная адаптация к контексту, ориентированность на определенный формат взаимодействия с пользователем. Анализ существующих средств технического перевода позволит оценить их эффективность в различных сценариях применения, а также выявить сильные и слабые стороны каждого из них.

Цель — выделить особенности каждого из существующих средств технического перевода и ситуации, наиболее подходящие для их применения.

Методы. Был проведен анализ трех самых популярных и технологичных средств технического перевода:

  • DeepL — представитель переводчика на основе нейронных систем;
  • Google Translate — переводчик, обладающий самой большой базой переводов;
  • GPT-4 — развитая языковая модель, с помощью которой, кроме всего прочего, можно осуществлять перевод.

Оценка перевода с английского языка на русский, полученного с их помощью, производилась 15 студентами, обучающимися на переводческих специальностях. Использовалась интегральная метрика — они оценивали перевод в целом, а не отдельных слов и словосочетаний. Для оценивания им были представлены 5 отрывков из различных по жанру текстов. Все варианты перевода от выбранных средств технического перевода сравнивались бок о бок — в одном блоке, без указания самого средства. Студентам предлагалось отдать переводу от 1 до 3 баллов в зависимости от его качества.

Результаты. Итогом проведенного исследования стал набор рекомендаций, которыми может воспользоваться переводчик для упрощения своего труда. Контекстуальные системы, к которым относится Google Translate, отлично подходят для перевода фразеологизмов и идиоматических выражений, однако при увеличении контекста могут появляться различные ошибки. В системах на основе искусственного интеллекта, представителем которого является DeepL, существуют проблемы с русской грамматикой и построением предложений. С генеративными языковыми моделями (представитель — GPT-4) стоит работать особенным способом — важнейшим моментом является правильное введение в контекст, благодаря которому качество перевода повышается в разы, что и было доказано в ходе исследования. При правильном взаимодействии с генеративной моделью: формировании полных запросов c объяснением необходимого результата, обозначении жанра переводимого текста, а также указании года создания и источника — были получены лучшие результаты, набравшие наибольшее количество баллов.

Также были сформулированы и общие рекомендации по применению всех видов средств технического перевода:

1) нельзя полагаться на технические средства при переводе имен собственных, часто именно в них они совершают ошибки;

2) при переводе технической документации многие термины могут быть переведены неверно;

3) редактирование текста, полученного с помощью средств технического перевода, может занять больше времени, чем его перевод, поэтому нужно грамотно оценивать возможности каждого из средств.

Выводы. Несмотря на значительные достижения в области технического перевода, идеальной системы, способной полностью заменить переводчика, пока не существует. Современные средства перевода могут значительно облегчить и ускорить процесс перевода, но их использование должно быть осознанным и связанным с конкретной ситуацией.

Разработанные благодаря исследованию рекомендации к существующим популярным средствам перевода могут быть полезны для переводчиков.

Благодаря метрикам и способам, описанным в работе, можно и в дальнейшем формировать рекомендации для переводчиков, с учетом развития существующих и появления новых средств технического перевода.

Полный текст

Обоснование. Первые средства технического перевода текста появились достаточно давно и с тех пор преодолели большой путь, став не только вспомогательными инструментами, но и системами, способными самостоятельно переводить текст, аудиофрагменты и даже видео. Однако полученный таким образом перевод не может сравниться по качеству с тем, который сделает профессиональный переводчик. Всем средствам технического перевода свойственны одни и те же проблемы: неточность грамматических конструкций, ограниченность словарного запаса, недостаточная адаптация к контексту, ориентированность на определенный формат взаимодействия с пользователем. Анализ существующих средств технического перевода позволит оценить их эффективность в различных сценариях применения, а также выявить сильные и слабые стороны каждого из них.

Цель — выделить особенности каждого из существующих средств технического перевода и ситуации, наиболее подходящие для их применения.

Методы. Был проведен анализ трех самых популярных и технологичных средств технического перевода:

  • DeepL — представитель переводчика на основе нейронных систем;
  • Google Translate — переводчик, обладающий самой большой базой переводов;
  • GPT-4 — развитая языковая модель, с помощью которой, кроме всего прочего, можно осуществлять перевод.

Оценка перевода с английского языка на русский, полученного с их помощью, производилась 15 студентами, обучающимися на переводческих специальностях. Использовалась интегральная метрика — они оценивали перевод в целом, а не отдельных слов и словосочетаний. Для оценивания им были представлены 5 отрывков из различных по жанру текстов. Все варианты перевода от выбранных средств технического перевода сравнивались бок о бок — в одном блоке, без указания самого средства. Студентам предлагалось отдать переводу от 1 до 3 баллов в зависимости от его качества.

Результаты. Итогом проведенного исследования стал набор рекомендаций, которыми может воспользоваться переводчик для упрощения своего труда. Контекстуальные системы, к которым относится Google Translate, отлично подходят для перевода фразеологизмов и идиоматических выражений, однако при увеличении контекста могут появляться различные ошибки. В системах на основе искусственного интеллекта, представителем которого является DeepL, существуют проблемы с русской грамматикой и построением предложений. С генеративными языковыми моделями (представитель — GPT-4) стоит работать особенным способом — важнейшим моментом является правильное введение в контекст, благодаря которому качество перевода повышается в разы, что и было доказано в ходе исследования. При правильном взаимодействии с генеративной моделью: формировании полных запросов c объяснением необходимого результата, обозначении жанра переводимого текста, а также указании года создания и источника — были получены лучшие результаты, набравшие наибольшее количество баллов.

Также были сформулированы и общие рекомендации по применению всех видов средств технического перевода:

1) нельзя полагаться на технические средства при переводе имен собственных, часто именно в них они совершают ошибки;

2) при переводе технической документации многие термины могут быть переведены неверно;

3) редактирование текста, полученного с помощью средств технического перевода, может занять больше времени, чем его перевод, поэтому нужно грамотно оценивать возможности каждого из средств.

Выводы. Несмотря на значительные достижения в области технического перевода, идеальной системы, способной полностью заменить переводчика, пока не существует. Современные средства перевода могут значительно облегчить и ускорить процесс перевода, но их использование должно быть осознанным и связанным с конкретной ситуацией.

Разработанные благодаря исследованию рекомендации к существующим популярным средствам перевода могут быть полезны для переводчиков.

Благодаря метрикам и способам, описанным в работе, можно и в дальнейшем формировать рекомендации для переводчиков, с учетом развития существующих и появления новых средств технического перевода.

×

Об авторах

Арсений Васильевич Аникин

Самарский университет

Автор, ответственный за переписку.
Email: ars.anikin.2003@gmail.com

студент, группа 6304-010302D, Институт информатики и кибернетики

Россия, Самара

Список литературы

  1. Винокуров А.А. Новый метод оценки машинного перевода. В кн.: Информационные технологии и системы Hardware Software Security. Тенденции и перспективы: Сборник статей / под ред.: А.А. Винокурова, В.О. Чуканова. Москва: Международная академия информатизации, 1997. С. 67–75.
  2. Фомиченко А.С. Эффективность использования студентами машинного перевода при работе с текстами разных жанров // The Scientific Heritage. 2020. № 51-4(51). С. 52–55. EDN: UOBOSG
  3. Alhaisoni E., Arabia S. An investigation of Saudi EFL university students' attitudes towards the use of google translate // International Journal of English Language Education. 2017. Vol. 5, № 1. Р. 72–82. doi: 10.5296/ijele.v5i1.10696

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Аникин А.В., 2024

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.