ИИ научился хорошо переводить с китайского на английский

29.03.2018

Перевод с одного языка на другой — это творческая операция. И как любое творчество, сложно алгоритмизируемое. Именно поэтому у человечества до сих пор нет “вавилонской рыбки”, которая могла бы обеспечить каждому из нас возможность понимать речь на любом языке. Даже письменный перевод всё ещё остаётся не до конца решённой задачей. С одними парами языков алгоритмы перевода справляются неплохо; работая с другими, ИИ выдаёт подчас тарабарщину вместо перевода. До последнего времени “крепким орешком” оставался китайский язык. Попытки автоматизировать перевод с китайского на английский, как правило, ничем хорошим не заканчивались.

В Microsoft использовали новый подход к обучению ИИ, который, по утверждению компании, обеспечил принципиально иное качество перевода. По заявлению представителей компании, новый ИИ справляется с переводом новостных текстов “на уровне человека”. Не очень понятное высказывание: я — человек, но я не могу переводить с китайского на английский. Да и многие, кто немножко знают китайский и чуть лучше английский, тоже не могут. Даже среди профессиональных переводчиков есть свои “чернорабочие”, есть мастера и есть гении профессии. Так что какого уровня достиг новый ИИ, пока что неясно, но, судя по всему, он наверняка справляется с переводом лучше, чем Google Translate — иначе с чего была бы вся эта шумиха вокруг новинки от Microsoft?

В частности, созданная в Microsoft Research система машинного перевода успешно прошла тест newtest2017, включающий в себя 2 тысячи предложений, взятых из профессионально переведенных новостных статей. Также в оценке участвовали внешние эксперты, владеющие обоими языками, они оценивали результаты ИИ при переводе предложений из выборке, сравнивая их с двумя профессиональными переводами.  

Суть метода, использованного компанией, в том, что вместо классики — перевода так называемым “статистическим методом” — компания задействовала нейросети. Обучением системы занялись профессиональные переводчики. Одна группа переводчиков выбирала текст на китайском для машинного перевода. ИИ делал свой вариант перевода на английский, получив который, другая группа переводчиков вручную переводила его на китайский, возвращая получившийся текст первой группе, что позволяло выявить ошибки и неточности в этом “испорченном телефоне”. Этот подход назвали двойным обучением.

Планируется применить его и к другим языковым парам. Ожидается, что результаты будут как минимум не хуже, чем при работе с китайским.

В ходе исследования применялись ещё несколько техник — одна напоминала способ, каким обычно пользуется человек, постепенно дорабатывающий, например, текст важного письма. Исследователи обучили систему раз за разом переводить одно и то же предложение, добиваясь всё более высоких оценок за перевод.

Техника “совместного обучения” использовалась для постепенной “прокачки” переводов с английского на китайский и с китайского на английский. Действуя этим методом, система перевода с английского на китайский переводила новые для неё английские предложения на китайский, формируя так называемые пары предложений. Затем результат использовался для наращивания обучающего набора данных, который применялся для обратного перевода — с китайского на английский. Затем процедура повторялась в обратном направлении. Постепенно результаты перевода становились всё лучше.

Перевод столь сложен для автоматизации, поскольку здесь не существует “верного” варианта — как правило, есть несколько способов перевести один и тот же фрагмент текста. Люди могут выбирать разные слова для того, чтобы выразить одно и то же. Именно поэтому исследователи Microsoft не утверждают, что создали систему идеального перевода, и даже что смогут создать её в ближайшем будущем. Но они уверены в том, что смогут добиваться всё более качественного перевода.

В источнике можно найти набор ссылок по теме, если она вас заинтересовала.

Смотрите связанные статьи Robo-педии:

  Публикации

Последние материалы


Метки
ai DARPA DIY (своими руками) DJI автоматизация автомобили и роботы андроиды анималистичные антропоморфные Арт аэротакси безопасность безработица и роботы беспилотники бионика будущее бытовые роботы вектор видео военные дроны военные роботы встречи выставки Германия Греция группы дронов дайджест Дания доильные роботы домашние роботы доставка беспилотниками доставка и роботы дроны Европа железные дороги захваты игрушки Израиль ИИ Индия интервью интерфейсы инфоботы Ирак Иран искусственный интеллект история Италия Казахстан как заработать Канада киборгизация кино Китай коллаборативные роботы колонки коммунальное хозяйство компании компоненты конспекты конструкторы концепты кооперативные роботы космос курьезы курьеры Латвия линки логистика машинное обучение медицина медицина и роботы металлургия море и роботы мусор и роботы наземные военные роботы налоги научные роботы необычные Нидерланды Новая Зеландия Норвегия носимые роботы ОАЭ образование образовательная робототехника обучающие роботы общепит и роботы Объединенное Королевство онлайн-курсы робототехники охрана и беспилотники охрана и роботы патенты персональные роботы пищепром ПО подводные роботы подземные пожарные роботы полевые роботы полезные роботы Португалия право презентации пресс-релизы применение беспилотников применение дронов применение роботов прогнозы проекты производство дронов происшествия промышленные роботы противодействие беспилотникам работа развлечения и беспилотники развлечения и роботы распознавание речи растениеводство регулирование регулирование дронов регулирование робототехники рекорды рисунки робомех робомобили роботизация робототехника роботрендз роботренды роботы роботы и автомобили роботы и медицина роботы и море роботы и мусор роботы и обучение роботы и развлечения роботы и строительство роботы и уборка роботы телеприсутствия роботы-транспортеры робошум рой Россия Руанда сайт RoboTrends.ru сделки сельское хозяйство сенсоры сервисные роботы синтез речи склады и роботизация соревнования софт-роботика социальная робототехника социальные роботы спорт и дроны спорт и роботы строительство США телеприсутствие термины терроризм торговля транспорт транспортные роботы тренды трубопроводы и роботизация уборка и роботы Украина уличные роботы Франция хобби-беспилотники ховербайки Хождение чатбот шагающие роботы Швейцария Швеция шоу экзоскелеты эко-дроны экология электроника этика (робоэтика) Южная Корея юмор

Подписка: RSS, Email, Telegram
  Информация