Распознавание речи и голосовое управление: будущее интерфейсов?

17.01.2019

Речевые системы и обработка естественной речи - будущее интерфейсов или шаг к связке “человек-машина”?

Мир уверенно избавляется от “последней мили”: новый формат - это децентрализованный “рой”, подразумевающий минимизацию расстояний между физическими и виртуальными объектами. В случае с компьютерными системами и робототехникой, речь идет об уходе от “интерфейсов” и развитии комплекса взаимодействий зарождающейся связки “человек-машина”.

Последовательное появление перфокарт, клавиатур, мышек и тачскринов можно рассматривать как набор мелких шажков, однако настоящим прорывом станет формирование исчерпывающей естественной экосистемы взаимодействий, исключающих искусственные ограничения и барьеры.

Фантастика и футурология связали подобный прорыв с моментом появления нейроинтерфейсов, однако, в реальности, барьер исчезнет уже в том случае, если каждый человек сможет задействовать комплекс интуитивно понятных инструментов, не сталкиваясь при этом с массой простоев и затруднений.

Компьютерная грамотность людей сменяется “человеческой грамотностью” устройств: роботы и ИИ учатся “говорить” и “слушать” естественную речь. Речевые взаимодействия удобны и просты, к тому же, они не используют ни руки, ни глаза человека. Для сравнения, среднестатистический англоязычный пользователь произносит до 150 слов в минуту, а печатает всего 40.

Источник изображения: voiceinthemachine.com

В 20-х годах прошлого века, когда слово “радио” было продающим, мир увидел игрушку Radio Rex. Скрытая в будке пружина выталкивала из нее игрушечного пса, стоило устройству “услышать” первую форманту имени Рекс. В 2010-е годы, технологии распознавания речи получили стремительное развитие: разработчики задействовали алгоритмы глубокого обучения, нарастив качество и точность работы систем.

В 2016 году Microsoft отчитались о создании алгоритма, способного распознавать речь с долей ошибок в 5.9% - т.е. той же, что и у большинства людей.

В 2017 году Google довел коэффициент эффективности своей голосовой системы до 95%. Собственные разработки в области распознавания речи представили Apple, Amazon и IBM.

Выходит, технологии, способные синтезировать и воспринимать речь с той же долей ошибок, что и человек, уже готовы для коммерциализации. По данным IDTechEx Research, рынок устройств с голосовым управлением достигнет объемов порядка $15.5 млрд к 2029 году. Стремительное развитие получит сегмент систем, предназначенных для англоязычной аудитории. Рынок отличается высокими входными барьерами: желающим посостязаться с гигантами придется разжиться корпусами речи - огромными массивами размеченных речевых данных - аудиосигналами и соответствующими им транскрибированным письменным текстом.

По материалам: markets.businessinsider.com; источник изображения в заставке - pixabay.com

За новостями робототехники, ИИ, а также за трендами удобно следить в телеграм-канале prorobots 

  Публикации

Последние материалы


Метки
ai DARPA DIY DIY (своими руками) DJI RPA автоматизация автомобили и роботы андроиды анималистичные антропоморфные Арт аэротакси безопасность безработица и роботы беспилотники бионика будущее бытовые роботы вектор видео военные дроны военные роботы встречи выставки Германия Греция группы дронов дайджест Дания доильные роботы домашние роботы доставка беспилотниками доставка и роботы дроны Европа железные дороги захваты игрушки идеи Израиль ИИ ИИ - вкратце Индия интервью интерфейсы инфоботы Ирак Иран искусственный интеллект исследования история Италия Казахстан как заработать Канада киборгизация кино Китай коллаборативные роботы колонки коммунальное хозяйство компании компоненты конспекты конструкторы концепты кооперативные роботы космос курьезы курьеры Латвия линки логистика машинное обучение медицина медицина и роботы металлургия море и роботы мусор и роботы наземные военные роботы налоги научные роботы необычные Нидерланды Новая Зеландия Норвегия носимые роботы ОАЭ образование образовательная робототехника обучающие роботы общепит и роботы Объединенное Королевство онлайн-курсы робототехники охрана и беспилотники охрана и роботы патенты персональные роботы пищепром ПО подводные роботы подземные пожарные роботы полевые роботы полезные роботы Португалия право презентации пресс-релизы применение беспилотников применение дронов применение роботов прогнозы проекты производство производство дронов происшествия промышленные роботы противодействие беспилотникам работа развлечения и беспилотники развлечения и роботы распознавание речи растениеводство регулирование регулирование дронов регулирование робототехники рекорды рисунки робомех робомобили роботизация робототехника роботрендз роботренды роботы роботы и автомобили роботы и медицина роботы и море роботы и мусор роботы и обучение роботы и развлечения роботы и строительство роботы и уборка роботы телеприсутствия роботы-транспортеры робошум рой Россия Руанда сайт RoboTrends.ru сделки сельское хозяйство сенсоры сервисные роботы синтез речи склады и роботизация соревнования софт-роботика социальная робототехника социальные роботы спорт и дроны спорт и роботы строительство США телеприсутствие термины терроризм технологии техносказки торговля транспорт транспортные роботы тренды трубопроводы и роботизация уборка и роботы Украина уличные роботы Франция хобби-беспилотники ховербайки Хождение чатбот шагающие роботы Швейцария Швеция шоу экзоскелеты эко-дроны экология электроника этика (робоэтика) Южная Корея юмор

Подписка: RSS, Email, Telegram
  Информация