Программный комплекс ЦРТ-инновации для голосового распознавания команд в робототехнике готов к тестированию
11.11.2015Компания «ЦРТ-инновации» (резидент «Сколково», дочерняя компания ЦРТ) работает над созданием технологии распознавания команд в робототехнике с 2014 года. Разработка субсидируется Министерством образования и науки РФ в рамках прикладных научных исследований «Разработка технологии преобразования русской речи в транскрипционное представление с метаданными для автоматического распознавания речевых команд в робототехнике и промышленности» (ПНИ "Распознавание команд в робототехнике и промышленности").
На сегодняшний день созданный «ЦРТ-инновации» программный комплекс автоматического распознавания речевых команд функционирует без подключения к сети Интернет в операционных системах Windows и Android. Лежащие в основе работы программного комплекса алгоритмы были апробированы на международном конкурсе CHiME 2015 и в коммерческих задачах.
Использовать программу предполагается для внедрения голосового управления автомобилями и другими транспортными средствами, промышленной техникой (например, станками) и как встраиваемый модуль в сервисных роботах.
В качестве индустриального партнера «ЦРТ-инновации», планирующего активно использовать новую программу в своих решениях и проектах, выступает компания «Центр речевых технологий» (ЦРТ).
За год работы в рамках прикладных исследований R&D команда «ЦРТ-инновации» добилась значительных успехов: было существенно улучшено качество распознавания речи и команд в сложной акустической обстановке. Сюда относятся такие задачи, как: распознавание речи и команд удаленного источника и распознавание речи и команд в условиях сильных шумов.
Решение этих задач было обеспечено такими собственными разработками, как:
• многоканальная обработка - комплекс аппаратных и алгоритмических средств, обеспечивающих пространственную избирательность системы распознавания речи и увеличение отношения сигнал-шум в интересующем направлении;
• помехоустойчивый детектор речевой активности;
• помехоустойчивые акустические модели (комплекс алгоритмов, обеспечивающих извлечение устойчивых к различным видам искажений представлений речевого сигнала и адаптацию нейросетевых акустических моделей к изменяющимся условиям).
«Разработка надежного голосового управления техникой – очень важная задача. Есть ситуации, когда без голосового управления нельзя обеспечить безопасность оператора. Например, в условиях неблагоприятной для человека среды. Или когда у оператора заняты руки, или он находится в условиях наблюдения сразу за несколькими объектами. Малейшее отвлечение в подобных ситуациях может стоить оператору жизни. И именно поэтому эта задача является одной из приоритетных для «ЦРТ-инновации», - прокомментировал исполнительный директор компании Алексей Яковлев.