Анализ существующих средств технического перевода
- Авторы: Аникин А.В.1
-
Учреждения:
- Самарский университет
- Выпуск: Том 2 (2024)
- Страницы: 124-125
- Раздел: ЧАСТЬ II. Перевод и переводоведение
- URL: https://snv63.ru/osnk-sr2024/article/view/632636
- ID: 632636
Цитировать
Полный текст
Аннотация
Обоснование. Первые средства технического перевода текста появились достаточно давно и с тех пор преодолели большой путь, став не только вспомогательными инструментами, но и системами, способными самостоятельно переводить текст, аудиофрагменты и даже видео. Однако полученный таким образом перевод не может сравниться по качеству с тем, который сделает профессиональный переводчик. Всем средствам технического перевода свойственны одни и те же проблемы: неточность грамматических конструкций, ограниченность словарного запаса, недостаточная адаптация к контексту, ориентированность на определенный формат взаимодействия с пользователем. Анализ существующих средств технического перевода позволит оценить их эффективность в различных сценариях применения, а также выявить сильные и слабые стороны каждого из них.
Цель — выделить особенности каждого из существующих средств технического перевода и ситуации, наиболее подходящие для их применения.
Методы. Был проведен анализ трех самых популярных и технологичных средств технического перевода:
- DeepL — представитель переводчика на основе нейронных систем;
- Google Translate — переводчик, обладающий самой большой базой переводов;
- GPT-4 — развитая языковая модель, с помощью которой, кроме всего прочего, можно осуществлять перевод.
Оценка перевода с английского языка на русский, полученного с их помощью, производилась 15 студентами, обучающимися на переводческих специальностях. Использовалась интегральная метрика — они оценивали перевод в целом, а не отдельных слов и словосочетаний. Для оценивания им были представлены 5 отрывков из различных по жанру текстов. Все варианты перевода от выбранных средств технического перевода сравнивались бок о бок — в одном блоке, без указания самого средства. Студентам предлагалось отдать переводу от 1 до 3 баллов в зависимости от его качества.
Результаты. Итогом проведенного исследования стал набор рекомендаций, которыми может воспользоваться переводчик для упрощения своего труда. Контекстуальные системы, к которым относится Google Translate, отлично подходят для перевода фразеологизмов и идиоматических выражений, однако при увеличении контекста могут появляться различные ошибки. В системах на основе искусственного интеллекта, представителем которого является DeepL, существуют проблемы с русской грамматикой и построением предложений. С генеративными языковыми моделями (представитель — GPT-4) стоит работать особенным способом — важнейшим моментом является правильное введение в контекст, благодаря которому качество перевода повышается в разы, что и было доказано в ходе исследования. При правильном взаимодействии с генеративной моделью: формировании полных запросов c объяснением необходимого результата, обозначении жанра переводимого текста, а также указании года создания и источника — были получены лучшие результаты, набравшие наибольшее количество баллов.
Также были сформулированы и общие рекомендации по применению всех видов средств технического перевода:
1) нельзя полагаться на технические средства при переводе имен собственных, часто именно в них они совершают ошибки;
2) при переводе технической документации многие термины могут быть переведены неверно;
3) редактирование текста, полученного с помощью средств технического перевода, может занять больше времени, чем его перевод, поэтому нужно грамотно оценивать возможности каждого из средств.
Выводы. Несмотря на значительные достижения в области технического перевода, идеальной системы, способной полностью заменить переводчика, пока не существует. Современные средства перевода могут значительно облегчить и ускорить процесс перевода, но их использование должно быть осознанным и связанным с конкретной ситуацией.
Разработанные благодаря исследованию рекомендации к существующим популярным средствам перевода могут быть полезны для переводчиков.
Благодаря метрикам и способам, описанным в работе, можно и в дальнейшем формировать рекомендации для переводчиков, с учетом развития существующих и появления новых средств технического перевода.
Полный текст
Обоснование. Первые средства технического перевода текста появились достаточно давно и с тех пор преодолели большой путь, став не только вспомогательными инструментами, но и системами, способными самостоятельно переводить текст, аудиофрагменты и даже видео. Однако полученный таким образом перевод не может сравниться по качеству с тем, который сделает профессиональный переводчик. Всем средствам технического перевода свойственны одни и те же проблемы: неточность грамматических конструкций, ограниченность словарного запаса, недостаточная адаптация к контексту, ориентированность на определенный формат взаимодействия с пользователем. Анализ существующих средств технического перевода позволит оценить их эффективность в различных сценариях применения, а также выявить сильные и слабые стороны каждого из них.
Цель — выделить особенности каждого из существующих средств технического перевода и ситуации, наиболее подходящие для их применения.
Методы. Был проведен анализ трех самых популярных и технологичных средств технического перевода:
- DeepL — представитель переводчика на основе нейронных систем;
- Google Translate — переводчик, обладающий самой большой базой переводов;
- GPT-4 — развитая языковая модель, с помощью которой, кроме всего прочего, можно осуществлять перевод.
Оценка перевода с английского языка на русский, полученного с их помощью, производилась 15 студентами, обучающимися на переводческих специальностях. Использовалась интегральная метрика — они оценивали перевод в целом, а не отдельных слов и словосочетаний. Для оценивания им были представлены 5 отрывков из различных по жанру текстов. Все варианты перевода от выбранных средств технического перевода сравнивались бок о бок — в одном блоке, без указания самого средства. Студентам предлагалось отдать переводу от 1 до 3 баллов в зависимости от его качества.
Результаты. Итогом проведенного исследования стал набор рекомендаций, которыми может воспользоваться переводчик для упрощения своего труда. Контекстуальные системы, к которым относится Google Translate, отлично подходят для перевода фразеологизмов и идиоматических выражений, однако при увеличении контекста могут появляться различные ошибки. В системах на основе искусственного интеллекта, представителем которого является DeepL, существуют проблемы с русской грамматикой и построением предложений. С генеративными языковыми моделями (представитель — GPT-4) стоит работать особенным способом — важнейшим моментом является правильное введение в контекст, благодаря которому качество перевода повышается в разы, что и было доказано в ходе исследования. При правильном взаимодействии с генеративной моделью: формировании полных запросов c объяснением необходимого результата, обозначении жанра переводимого текста, а также указании года создания и источника — были получены лучшие результаты, набравшие наибольшее количество баллов.
Также были сформулированы и общие рекомендации по применению всех видов средств технического перевода:
1) нельзя полагаться на технические средства при переводе имен собственных, часто именно в них они совершают ошибки;
2) при переводе технической документации многие термины могут быть переведены неверно;
3) редактирование текста, полученного с помощью средств технического перевода, может занять больше времени, чем его перевод, поэтому нужно грамотно оценивать возможности каждого из средств.
Выводы. Несмотря на значительные достижения в области технического перевода, идеальной системы, способной полностью заменить переводчика, пока не существует. Современные средства перевода могут значительно облегчить и ускорить процесс перевода, но их использование должно быть осознанным и связанным с конкретной ситуацией.
Разработанные благодаря исследованию рекомендации к существующим популярным средствам перевода могут быть полезны для переводчиков.
Благодаря метрикам и способам, описанным в работе, можно и в дальнейшем формировать рекомендации для переводчиков, с учетом развития существующих и появления новых средств технического перевода.
Об авторах
Арсений Васильевич Аникин
Самарский университет
Автор, ответственный за переписку.
Email: ars.anikin.2003@gmail.com
студент, группа 6304-010302D, Институт информатики и кибернетики
Россия, СамараСписок литературы
- Винокуров А.А. Новый метод оценки машинного перевода. В кн.: Информационные технологии и системы Hardware Software Security. Тенденции и перспективы: Сборник статей / под ред.: А.А. Винокурова, В.О. Чуканова. Москва: Международная академия информатизации, 1997. С. 67–75.
- Фомиченко А.С. Эффективность использования студентами машинного перевода при работе с текстами разных жанров // The Scientific Heritage. 2020. № 51-4(51). С. 52–55. EDN: UOBOSG
- Alhaisoni E., Arabia S. An investigation of Saudi EFL university students' attitudes towards the use of google translate // International Journal of English Language Education. 2017. Vol. 5, № 1. Р. 72–82. doi: 10.5296/ijele.v5i1.10696
Дополнительные файлы
