Окей, Google! Когда машины заменят синхронных переводчиков?
Синхронные переводчики необходимы на любом международном мероприятии. Именно от них зависит, поймут ли друг друга партнеры и экспоненты, найдет ли спикер общий язык со зрителями. Правда, уже сейчас умные программы для перевода умеют транслировать человеческую речь на разные языки за доли секунд. Но почему у них не всегда получается выполнить свое задание хорошо? Откажется ли ивент индустрия совсем от услуг переводческих бюро в будущем? Event LIVE выясняет у профессионалов.
Вот почему лингвисты и IT-специалисты так старательно учат искусственный интеллект синхронному переводу.
Как человек машины учил
Сначала машинные переводчики использовали в своей работе только установленные в их память грамматические правила и словари (Rule-Based Machine Translation). Из-за этого перевод выходил чересчур правильным, а иногда не выходил вовсе, потому что люди редко разговаривают так, как написано в учебниках. Тогда разработчики стали показывать машинам много параллельных текстов, в которых написано одно и то же на разных языках. Программы сравнивали тексты, делили их на слова и фразы, запоминали все возможные способы их перевода и оценивали частоту употребления каждого из них (Statistical machine translation).
В дальнейшем, переводя похожие примеры, программы анализировали статистику и подбирали самый подходящий вариант из своей «памяти». Такой способ хорошо подошел для перевода редких и сложных слов и фраз, технических и официально-деловых текстов.
Большинство программ машинного перевода до сих пор основано на синтезе этих двух подходов, например, так переводит сервис ПРОМТ. Оставалась какая-то мелочь – совместить эти разработки с программами анализа и синтеза речи, что и попытались сделать такие компании, как Google и Microsoft.
Однако разговорный язык более бессвязный, чем тексты, его грамматика – более гибкая, а еще добавились проблемы распознавания речи, в общем, синхронный перевод оказался машинам все еще не по зубам. Тогда люди подключили к работе электронных переводчиков нейронные сети, и вот тут началось самое интересное.
Как работает нейронная сеть
Как и статистические переводчики, нейронные сети тоже анализируют огромное количество параллельных текстов в поисках закономерностей и совпадений, а потом запоминают их.
Но нейросеть работает не со словами и фразами, а с предложениями, и это позволяет не потерять при переводе самое главное – смысл.
Например, раньше программы переводили так:
Can I have an exhibition ticket?
У меня может быть билет на выставку
Могу ли я иметь билет на выставку?
А так выглядит нейронный машинный перевод:
Can I have an exhibition ticket?
Можно мне билет на выставку?
Другими словами, нейросети переводят не так, как надо, а так, как говорит человек. Пока известно только пять компаний, использующих такие гибридные системы: Google и Microsoft начали внедрять их в работу своих сервисов перевода с 2016 года,
Яндекс.Переводчик уже год использует нейросети, переводя с русского на английский и обратно, а месяц назад аналогичную разработку представил китайский поисковик Baidu. Также похожую технологию разработала компания ABBYY для своего ABBYY Compreno. Программы для распознавания тоже стали намного лучше подавлять шумы и анализировать речь. В общем, автоматизированные переводчики вырвались на новый уровень. Правда, рядовые пользователи все еще жалуются на ошибки и неточности.
Мы в Event LIVE решили провести собственный эксперимент и протестировать доступные сервисы синхронного нейронного перевода, когда готовили материал для этой статьи
For many years, the “show” in this very word “show floor” was understood to be about the exhibitors showcasing their products and services. To the millennial and post-millennial generation, however, it is just as much about the “show” that a show organiser puts on around the show floor itself. (Kai Hattendorf, UFI CEO/ MD)
В течение многих лет «шоу “в этом самом слове” выставочный зал» понималось как выставка экспонентов, демонстрирующих свою продукцию и услуги. В тысячелетнем и пост-тысячелетнего поколения, однако, это так же о “показать”, что организатор ставит вокруг себя шоу.
В течение многих лет «шоу» в этом самом слове «выставочный зал» понималось как экспоненты, демонстрирующие свои продукты и услуги. Однако для тысячелетнего и посттысячного поколений речь идет о «шоу», которое организатор шоу устраивает вокруг самого выставочного зала.
Translator от Microsoft
На протяжении многих лет, «шоу» в этом самом слове «Показать слово» было понятно, о экспонентов демонстрации своих продуктов и услуг. Для тысячелетия и после поколения тысячелетия, однако, это так же много о «шоу», что организатор шоу ставит на вокруг шоу этаже себя
Как видите, термины выставочной деятельности запутали автоматизированных синхронистов. Ближе всех к смыслу подобрался сервис от Google, но вопросы поколений тоже сбили его с толку. Мы бы перевели этот отрывок так:
Кстати, с обратным переводом те же самые сервисы справляются куда лучше. Это связано с особенностями строя нашего языка, и его отличиями от английского с понятным и четким аналитическим строем. Но несмотря на все оправдания, выводы очевидны: пока живые синхронисты справляются со своими задачами куда лучше автоматизированных, и мало кто поспорит с этим.
Елена Кадурова, Центр легализации и переводов «Легализуем.ру»
Несмотря на простоту и широту использования, программы для перевода текстов с одного языка на другой на сегодняшнем уровне своего развития не способны полностью заменить человека. Любой текст, переведенный компьютером, требует профессиональной редактуры переводчика. Только он может сравнить оригинал с результатами машинного перевода, найти и исправить все ошибки, допущенные машиной.
Ксения Давара, Moscow Business School
В данный момент качественный синхронный перевод без участия человека невозможен. Например, голосовые помощники не всегда правильно распознают речь пользователей, не понимают, как использовать интонацию или расставлять ударения. А теперь представьте: важные международные переговоры, любая неточность может привести к недопониманию или конфликту. Можно ли доверить ответственность синхронного перевода искусственному интеллекту?
Анатолий Кицура, генеральный директор ООО «Бизнес Диалог»
В данном вопросе мы по-прежнему верны живым переводчикам. Помимо стандартных опасений относительно индивидуальных особенностей речи каждого человека и распространенного пренебрежения грамматикой языка в разговоре, большие вопросы вызывают культурные различия. Синхронный перевод – это огромный труд, при котором необходимо учитывать все тонкости и нюансы.
Тимофей Окроев, генеральный директор Группы РПК
Для проверки смысла и приведения текста, переведенного специальными программами, в надлежащий вид, над ним приходится немало покорпеть редактору. Но при устном переводе редактора нет.
Машина не человек — она не прощает ни акцента, ни нечеткой дикции, ни «эканья». К тому же устная речь спонтанна, и для ее корректной передачи требуется чутье и умение учитывать экстралингвистический контекст, которыми пока не может похвастать компьютер. Докладчики тоже люди, они могут ошибаться, поддаваться эмоциям и не знать культурных особенностей аудитории. В такой ситуации переводчику приходится проявлять чисто человеческие качества: такт, здравый смысл, чувство юмора, умение разрядить обстановку.
Технологии развиваются, и раньше или позже эти проблемы могут быть решены. Но не исключено, что к этому времени машины смогут заменить не только переводчиков, но и самих докладчиков.
Так как все-таки относиться к автоматизированным синхронным переводчикам?
Пока возможности нейросетей сильно ограничены по сравнению с мозгом живого человека. Например, симуляция всего одной секунды активности 1% мозга заняла 40 минут на кластере из 82 944 процессоров. Однако мозг современного человека сформировался 25 тысяч лет назад, а технологии нейронных сетей разрабатываются в течение последних тридцати лет. У нейросетей есть преимущество – скорость, с которой они обучаются, чрезвычайно высока.
И если сейчас они еще делают ошибки, то что будет через каких-нибудь десять лет, когда автоматизированные переводчики смогут делать свою работу лучше любого человека?
Дэвид Талбот, глава сервиса Яндекс.Переводчик
Нет никакой угрозы для человека из гуманитарной среды со стороны сферы IT. Сфера искусственного интеллекта определенно сделает революцию в гуманитарных науках и станет для них инструментом, дополнением к человеческим возможностям.
Например, можно легко представить ситуацию, когда переводчик на деловой встрече не просто переводит речь, а помогает преодолевать культурный барьер. То есть понимает и может предложить что-то обеим сторонам, понимает разницу между манерой их общения и культурой. И вот это, конечно, никуда не уйдет.
Как машинный перевод экономит время переводчиков
Машинное обучение упрощает работу специалистов в самых разных областях, например, переводчикам. Хотя без живых людей по-прежнему не обойтись, их роль в процессе меняется. Технический специалист MedConsult Татьяна Апраксина рассказывала, как в бюро внедрили машинный перевод, как выглядит работа с ним на практике и каких результатов удалось достичь.
У переводчиков есть популярный анекдот: «Голый кондуктор бежит под вагоном» — так выглядит автоматический перевод фразы «A naked conductor runs under the tram» без учета контекста. А должно быть: «Оголенный провод проходит под вагоном». Примерно так выглядел и машинный перевод еще в 2008 году. Но сейчас все сильно изменилось: перевод, выполненный благодаря алгоритмам, сложно отличить от «человеческого». Да, полностью заменить переводчиков нельзя, но новые технологии сильно повышают качество и скорость. Разберемся, как это работает, на примере компании MedConsult.
MedConsult — бюро переводов медицинских документов. Его сотрудники помогают фармацевтическим, медицинским, страховым компаниям и частным заказчикам с переводом документов для регистрации препаратов, выписок из карт и т. д.
Татьяна Апраксина занимается внедрением и поддержкой инструментов автоматизации перевода в компании MedConsult. «Мы решили не разрабатывать программы сами, — рассказывает Татьяна, — создавать свое решение долго и дорого. На рынке есть поставщики услуг машинного перевода: мы пользуемся программой MemoQ и сервисами компании Intento. Наша задача — сделать использование этих инструментов максимально простым для наших переводчиков».
MemoQ — это программа для перевода текстов, в которой сотрудники используют разные плагины, помогающие в работе. В MedConsult начали использовать ее девять лет назад, отказавшись от обычных Word и Excel, и соответственно перестраивать работу переводчиков.
«Это было непросто: обычно переводчики — очень консервативные люди. Но они попробовали инструмент и поняли, что он значительно облегчает работу. Два года назад мы внутри компании начали внедрять плагин с машинным переводом, и теперь большинство переводчиков сами просят подготовить текст с использованием этой технологии».
Как работает программа для перевода
Даже без машинного перевода в MemoQ есть много полезных функций. Например, функция «память переводов» — файл, в котором записаны пары «оригинал-перевод». Если программа находит в тексте сегмент, который уже переводили ранее, — его перевод появится автоматически. В работе с медицинской документацией это экономит кучу времени: многие типовые куски документов уже когда-то переводили. А если программа находит похожий переведенный сегмент, то переводчик просто исправляет различающиеся детали.
Другая функция — глоссарий, словарь терминов. MemoQ позволяет создавать множество глоссариев, по которым программа будет подсвечивать медицинские термины, предлагая правильный перевод. В MedConsult создают глоссарии для каждой компании-заказчика, поэтому все переводчики, работающие над большим пакетом документов одного клиента, используют везде одинаковые термины.
Качество машинного перевода растет. У того же Google с 2009 по 2019 год работал сервис Translator Toolkit — в нем переводчики получали машинный перевод в веб-интерфейсе. Благодаря этому у Translator Toolkit появился большой массив данных о переводах и ручных исправлениях переводчиков за 10 лет. Эти данные использовали для обучения алгоритмов и повысили качество перевода.
По словам Татьяны, пока не все работает идеально. Иногда у поставщиков машинного перевода случаются сбои — может прийти текст очень плохого качества. Тогда приходится снова отправлять запросы на серверы и ждать, когда алгоритмы начнут работать правильно.
Как машинный перевод упрощает работу переводчиков
Пример: индийская фармацевтическая компания хочет продавать в России новое лекарство. Сначала компания оформит российское представительство и запросит в Минздраве список нужных документов. После этого она обратится в бюро медицинских переводов, чтобы перевести всю документацию с английского и подготовить ее по стандартам Минздрава.
Компания присылает в бюро большое количество документов: сертификаты, инструкции, результаты исследований и т. д. Чаще всего их присылают в формате сканов в PDF. Поэтому сканы нужно сначала распознать и перевести в удобный для перевода формат — в текстовые документы, например в Microsoft Word.
В бюро разбирают эти документы по темам и отдают переводчикам, которые, специализируются на конкретных направлениях. Специалист, как правило, имеет медицинское или химическое образование и узкое направление. Если с фармацевтикой могут работать многие, то документы, например, по эндокринологии будет переводить только специалист в этой теме.
Менеджеры бюро загружают текстовые файлы в программу MemoQ, подключают глоссарии и память переводов, после чего начинает работу переводчик. Если работают с типовым документом — может быть достаточно ручных исправлений из памяти переводов. Если текст нужно перевести с нуля, то работают с плагином для машинного перевода.
Переводчик использует машинный перевод как инструмент, но за конечный результат все равно отвечает человек. Чтобы документ был переведен правильно, проверяют падежи, стиль, формулировки, терминологию. Документ также утверждает редактор, а затем верстальщики оформляют его в нужной для Минздрава форме.
Кто занимается машинным переводом?
Обработкой текста занимаются специалисты по NLP (Natural Language Processing) — направлению Data Science. NLP-дата-сайентисты создают нейросети, которые анализируют исходный текст и выдают перевод. Для этого используют машинное обучение — нейросети обучают на больших наборах данных о правильном переводе слов.
В этой профессии есть две специальности, но иногда ими занимается один специалист:
NLP Researcher — исследователь со знаниями в лингвистике. Он подбирает данные для обучения разрабатываемых нейросетей и проводит в них эксперименты по переводу.
NLP Research Engineer — разработчик со знаниями математики и алгоритмов машинного обучения. Он пишет код на Python, который реализует задачи исследователя.
Дата-сайентисты могут работать и в других областях машинного обучения, например бизнес-аналитике и компьютерном зрении.
Data Science с нуля
Освойте самую востребованную профессию 2021 года! Только реальные знание и навыки, поддержка менторов и помощь в трудоустройстве. Дополнительная скидка 5% по промокоду BLOG.
Что дало внедрение машинного перевода?
Компания MedConsult работает с программой MemoQ уже девять лет, а плагин для машинного перевода внедрили два года назад. Главное преимущество над простой работой в Word — упрощение редактуры большого проекта, над которым работает несколько переводчиков. Машинный перевод делает работу качественнее и быстрее. Вот каких результатов с его помощью удалось достичь:
Как обучить компьютер переводу?
Мы спросили у Вячеслава Лялина, ведущего автора NLP-трека (интенсивного курса по Natural Language Processing — обработке естественного языка) в Акселераторе SkillFactory, как можно обучить компьютер машинному переводу. По его словам, современные системы перевода можно описать одним предложением: подаем в нейросеть текст на одном языке, а на выходе получаем текст на другом языке.
До нейронных сетей пользовались статистическими системами. Они были сложными и состояли из большого числа компонентов, таких как модель перевода отдельных фраз, языковая модель, которая старается получить из перевода фраз связный текст, и большого числа других подсистем. А с 2016 года мир начал двигаться в сторону нейронных моделей по нескольким причинам.
«Во-первых, нейронные модели стали работать лучше статистических, во-вторых, они были проще, но самое главное — их качество лучше “склеилось” с данными», — считает Вячеслав.
Для обучения нейронной системы перевода достаточно большого датасета так называемых параллельных предложений, то есть пар «предложение-перевод». При обучении системе подают на вход предложение, которое хотят перевести, и внутри она преобразует его в набор чисел (векторы). Эта часть нейросети называется энкодером. Дальше эти векторы изначального предложения передаются в следующую часть нейросети — декодер, — которая предсказывает вероятность следующего слова перевода на основе предыдущих слов перевода и слов оригинального предложения.
Когда система обучена, перевод генерируется пословно. Декодер предсказывает одно слово, после чего оно добавляется в перевод. Дальше декодер на основе векторов из энкодера (информации об оригинальном предложении) и уже сгенерированной части перевода предсказывает следующее слово. Операция повторяется, пока декодер не выдает специальное слово, обозначающее конец перевода.
Machine Learning и Deep Learning
На курсе вы освоите все классические алгоритмы машинного обучения — от деревьев до рекомендательных систем — а также научитесь создавать нейросети.
Почему машинный перевод никогда не заменит переводчиков?
Мы живем в мире, когда активно развиваются новые технологии. Мир не стоит на месте. В некоторых сферах деятельности машины заменяют труд человека. Порой это намного эффективнее и менее энергозатратно. Со временем технология станет лучше. Но смогут ли машины заменить труд переводчиков? Насколько точным может быть машинный перевод? Машинный перевод никогда не заменит реальных людей из-за точности и качества перевода. В особенности, когда дело касается художественного перевода, ведь там надо учитывать стилистический окрас текста и многочисленные стилистические приемы: метафоры, эпитеты и так далее. Переводчики лучше машин, потому что у них есть способность критически мыслить о нюансах и контексте, что очень важно. По данным справочника по языкам мира Ethnologue, существует более 7000 языков. Сам сервис Google Translate предлагает около 100 языков. У каждого языка есть свои особенности. В каждой культуре есть свои собственные высказывания, которые имеют смысл только в контексте. Когда вы думаете об этом в таких терминах, легко понять, почему переводчики-люди по-прежнему пользуются большим спросом. Бюро статистики труда США сообщает, что занятость устных и письменных переводчиков до 2029 года вырастет на 20 процентов.
Почему машины не заменят переводчиков?
1. Лучшее качество текста
Перевод обычного человека является естественным. Перевод основан на интерпретации созданного оригинального текста. Переводчики понимают суть переведенного текста, в то время как машинный перевод этого не делает. Люди знают особенности языка культуры, нюансы, которые используют носители языка. Поскольку машинный перевод на самом деле не понимает контекста, они не могут идеально перевести смысл содержимого.
2. Система машинного перевода далека от идеала
Глобальная система машинного перевода потребует значительного технического прогресса. В мире насчитывается около 7000 языков. Несмотря на то, что машинный перевод охватил лишь несколько сотен основных из них, еще существуют значительные препятствия.
Базовая система должна учитывать грамматические структуры, законы языка, словарный запас. Кроме этого, она включать правила перевода. Это делает роль переводчиков-людей критически важной для предприятий и организаций. Что приводит к большей точности перевода.
3. Человеческий интеллект
Искусственный интеллект, который используют машинные переводчики, никогда не сравнится с человеческим интеллектом. Онлайн-переводчики действительно довольно эффективны. Но все же люди придают переводу особое значение. Процесс перевода будет понятным и грамматически правильным, если им будут заниматься корректоры и редакторы. Поскольку только люди могут понять сложность языка, они единственные, кто может улучшить перевод для целевой аудитории.
4. Эволюция языка
Языки непрерывно развиваются. В каждом языке появляются слова, которых не существовало 10 или 20 лет назад. Многие слова меняют свое значение и больше не используются в старом смысле. С каждым новым продуктом, услугой и каждым новым научным открытием наш язык активно развивается. Переводчики-люди способны лучше адаптироваться к изменяющимся языкам, чем сами машины.
Меняются не только слова, но и наша грамматика. Слова, которые 20 лет назад не были обычными, теперь являются частью повседневного языка. Использование сокращений в настоящее время является стандартной практикой и во многих случаях считается правильным. Это одна из областей, где переводчики-люди гораздо более компетентны, чем машины.
Для машинного перевода нужно учитывать современные значения слов. В особенности, когда речь идет о жаргоне, слэнге. Помимо этого, машинам необходимо “выучить” всю историю словаря и использование слов и выражений. И последнее, но не менее важное: машинам потребуется понимать возраст и период времени, из которого исходит текст.
Для машин невозможно ‘выучить» всю историю словарного запаса языка и его использования. Тем более, что в наш повседневный разговорный язык ежедневно добавляются новые слова. Переводчики-люди могут гораздо быстрее адаптироваться к этим изменениям, чем машины.
5. Языковые навыки
Когда дело доходит до переводчиков-носителей языка, их опыт работы на обоих языках помогает переводить любой текст или речь в соответствии с потребностями аудитории. Хотя машинный перевод дешевле и быстрее, чем человеческий, он не может уловить сам смысл документа. Переводчики-люди обладают естественными языковыми навыками и подлинным умением формулировать и понимать содержание.
6. Культура
Наиболее важным аспектом при переводе текстов является культура. Каждая культура имеет свои особенности, которые отражаются в самом языке. При переводе текста с одного языка на другой переводчики могут учитывать различные культурные нормы и ценности. Поскольку переводчики-люди понимают культурные нормы и ценности, они будут переводить текст в совершенстве. Однако автоматизированные машины, скорее всего, пропустят культурные особенности и, следовательно, не смогут соответствующим образом перевести содержание.
7. Обновление программного обеспечения
Даже при том, что теоретически может быть написана 100-процентно совершенная система машинного перевода, программа будет зависеть от постоянных обновлений. Только команда программистов, переводчиков и экспертов может выполнить эту огромную миссию. Они проведут всю свою трудовую жизнь, обновляя систему языковыми законами, правилами грамматики, словарным запасом. Трудно написать программу, которая может перевести все предметы под солнцем во всех деталях. Для каждой ситуации.
8. Машины не могут сравниться с человеческим разумом
Машинный перевод довольно хорошо справляется с переводом технических руководств, которые следуют структурированной логике. Язык, однако, не имеет четко определенных критериев, он несколько изменчив и имеет индивидуальный подход. Он имеет многогранный смысл и эмоциональный подтекст, подкрепленный столь многими культурными представлениями, и он постоянно меняется.
Тексты не только передают знания, но и передают эмоции, юмор, каламбуры и поэзию. Машинному переводу может быть трудно определить это и перевести с точностью.
Многие профессиональные переводчики утверждают, что машинный перевод не может заменить человека. Самое простое объяснение этого заключается в том, что машины все еще ошибаются в процессе перевода по разным причинам.
Почему некоторые люди выбирают машинный перевод?
Хотя переводчики–люди в какой-то степени незаменимы в отрасли, некоторые компании и предприятия по-прежнему предпочитают машинный перевод — и вот почему.
1. Последовательность
Иногда машинный перевод обеспечивает более высокое качество, чем человеческий перевод. В основном это связано с последовательностью формулировок и стиля, в которых машинный перевод превосходит ожидания. Но программы часто не могут подобрать правильные слова. Поэтому, даже если они последовательны в своих формулировках и используемых фразах, им нельзя полностью доверять.
2. Скорость перевода
Само собой разумеется, что машинный перевод превосходит людей, когда дело доходит до скорости. Большинство компаний обращаются к машинному переводу, когда им нужно уложиться в срок или обработать большой объем текста одновременно. Однако существенным недостатком автоматизированного перевода является потеря точности перевода.
3. Экономия
Автоматизированный перевод позволяет быстро переводить крупные проекты с большим объемом текста. В результате это позволяет бизнесу экономить больше денег и избегать перерасхода средств на человеческий перевод, который обходится дорого. При машинном переводе часто отсутствуют или незначительны дополнительные затраты на доработку, поэтому автоматический перевод, как правило, является более экономичным вариантом.
Заключение
Машинный перевод прошел долгий путь за короткое время, но ему еще предстоит долгая дорога. Это то, что делает профессиональный человеческий перевод успешным для повседневного использования в бизнесе. Машинный перевод выполняется быстрее и экономит время. Тем не менее, конечные результаты не могут соответствовать качеству и структуре контента, переведенного человеком. Важность машинного переводчика очевидна, но, если вы исключите скорость как фактор процесса, человеческие переводчики по-прежнему будут вашим лучшим выбором для высококачественного перевода.