ИИ научился хорошо переводить с китайского на английский

29.03.2018

Перевод с одного языка на другой — это творческая операция. И как любое творчество, сложно алгоритмизируемое. Именно поэтому у человечества до сих пор нет “вавилонской рыбки”, которая могла бы обеспечить каждому из нас возможность понимать речь на любом языке. Даже письменный перевод всё ещё остаётся не до конца решённой задачей. С одними парами языков алгоритмы перевода справляются неплохо; работая с другими, ИИ выдаёт подчас тарабарщину вместо перевода. До последнего времени “крепким орешком” оставался китайский язык. Попытки автоматизировать перевод с китайского на английский, как правило, ничем хорошим не заканчивались.

В Microsoft использовали новый подход к обучению ИИ, который, по утверждению компании, обеспечил принципиально иное качество перевода. По заявлению представителей компании, новый ИИ справляется с переводом новостных текстов “на уровне человека”. Не очень понятное высказывание: я — человек, но я не могу переводить с китайского на английский. Да и многие, кто немножко знают китайский и чуть лучше английский, тоже не могут. Даже среди профессиональных переводчиков есть свои “чернорабочие”, есть мастера и есть гении профессии. Так что какого уровня достиг новый ИИ, пока что неясно, но, судя по всему, он наверняка справляется с переводом лучше, чем Google Translate — иначе с чего была бы вся эта шумиха вокруг новинки от Microsoft?

В частности, созданная в Microsoft Research система машинного перевода успешно прошла тест newtest2017, включающий в себя 2 тысячи предложений, взятых из профессионально переведенных новостных статей. Также в оценке участвовали внешние эксперты, владеющие обоими языками, они оценивали результаты ИИ при переводе предложений из выборке, сравнивая их с двумя профессиональными переводами.  

Суть метода, использованного компанией, в том, что вместо классики — перевода так называемым “статистическим методом” — компания задействовала нейросети. Обучением системы занялись профессиональные переводчики. Одна группа переводчиков выбирала текст на китайском для машинного перевода. ИИ делал свой вариант перевода на английский, получив который, другая группа переводчиков вручную переводила его на китайский, возвращая получившийся текст первой группе, что позволяло выявить ошибки и неточности в этом “испорченном телефоне”. Этот подход назвали двойным обучением.

Планируется применить его и к другим языковым парам. Ожидается, что результаты будут как минимум не хуже, чем при работе с китайским.

В ходе исследования применялись ещё несколько техник — одна напоминала способ, каким обычно пользуется человек, постепенно дорабатывающий, например, текст важного письма. Исследователи обучили систему раз за разом переводить одно и то же предложение, добиваясь всё более высоких оценок за перевод.

Техника “совместного обучения” использовалась для постепенной “прокачки” переводов с английского на китайский и с китайского на английский. Действуя этим методом, система перевода с английского на китайский переводила новые для неё английские предложения на китайский, формируя так называемые пары предложений. Затем результат использовался для наращивания обучающего набора данных, который применялся для обратного перевода — с китайского на английский. Затем процедура повторялась в обратном направлении. Постепенно результаты перевода становились всё лучше.

Перевод столь сложен для автоматизации, поскольку здесь не существует “верного” варианта — как правило, есть несколько способов перевести один и тот же фрагмент текста. Люди могут выбирать разные слова для того, чтобы выразить одно и то же. Именно поэтому исследователи Microsoft не утверждают, что создали систему идеального перевода, и даже что смогут создать её в ближайшем будущем. Но они уверены в том, что смогут добиваться всё более качественного перевода.

В источнике можно найти набор ссылок по теме, если она вас заинтересовала.

Смотрите связанные статьи Robo-педии:

  Публикации

Последние материалы

Метки
AGV ai AMR ARM BVLOS DARPA DIY DIY (своими руками) DJI eVTOL Lely pick-and-place RPA VTOL аватары авиация автоматизация автомобили автомобили и роботы автономные агродроны аддитивные технологии андроиды анималистичные АНПА антропоморфные Арт архитектура аэромобили аэропорты аэротакси безопасность безработица и роботы беспилотники бионика бионические больницы будущее бытовые роботы вакансии вектор вертолеты видео внедрения роботов внутритрубная диагностика водородные военные военные дроны военные роботы встречи высотные выставки газ Германия глайдеры горнодобыча городское хозяйство господдержка гостиницы готовка еды Греция грузоперевозки группы дронов гуманоидные дайджест Дания доение роботизированное доильные роботы дом домашние роботы доставка доставка беспилотниками доставка и роботы дронизация дронопорты дроны Европа еда железные дороги животноводство жилище захваты земледелие игрушки идеи измерения Израиль ИИ ИИ - вкратце инвентаризация Индия Иннополис инспекция интервью интерфейсы инфоботы Ирак Иран искусственный интеллект испытания исследования история Италия Казахстан как заработать Канада квадрупеды кейсы киборгизация кино Китай коботы коллаборативные роботы колонки коммунальное хозяйство компании компоненты конвертопланы конкурсы конспекты конструкторы концепты кооперативные роботы космос культура курьезы курьеры лабораторные роботы Латвия лесоустройство лизинг линки логистика люди и роботы магазины машинное обучение медицина медицина и роботы металлургия мнения мобильные роботы модульные мойка море морские мусор мусор и роботы навигация надводные наземные военные роботы налоги наука научные научные роботы необычные нефтегаз нефть Нидерланды Новая Зеландия Норвегия носимые роботы ОАЭ образование образовательная робототехника обучающие роботы общепит общепит и роботы общество Объединенное Королевство октокоптеры онлайн-курсы робототехники опрыскивание офисные охрана и беспилотники охрана и роботы парники патенты персональные роботы пищепром пляжи ПО подводные подводные роботы подземные пожарные пожарные роботы поиск полевые роботы полезные роботы полиция помощники Португалия порты последняя миля потребительские роботы почта право презентации пресс-релизы применение беспилотников применение дронов применение роботов прогнозы проекты производство производство дронов происшествия промышленность промышленные роботы противодействие беспилотникам псевдоспутники работа развлечения и беспилотники развлечения и роботы разгрузка разработка распознавание речи растениеводство регулирование регулирование дронов регулирование робототехники рекорды рисунки робомех робомобили роботакси роботизация робототехника роботрендз роботренды роботы роботы и автомобили роботы и мусор роботы и обучение роботы и развлечения роботы и строительство роботы телеприсутствия роботы-транспортеры робошум рои рой Россия Руанда сад садоводство сайт RoboTrends.ru сбор урожая сборка заказов сварка связь сделки сельское хозяйство сенсоры сервисные роботы синтез речи склады склады и роботизация смартроботы соревнования сортировка сотрудничество софт-роботика социальная робототехника социальные социальные роботы спорт спорт и дроны спорт и роботы спутниковая статистика строительство судовождение США такси телеком телеприсутствие теплицы теплосети термины терроризм тесты технологии техносказки тилтроторы ТНПА торговля транспорт транспортные роботы тренды трубопроводы трубопроводы и роботизация уборка Украина уличные роботы участники рынка фотограмметрия Франция химия хобби-беспилотники ховербайки Хождение цифры частоты чатбот шагающие роботы Швейцария Швеция шоу экзоскелеты эко-дроны экология электроника энергетика этика (робоэтика) Южная Корея юмор Япония

Подписка: RSS, Email, Telegram
  Информация