В MIT роботов учат общаться с учетом контекста
08.09.2017Alexa и Siri по-своему хороши, но их возможности ограничены. С их помощью можно заказать что-нибудь из интернет магазина или услуги прачечной, но они не постирают для вас футболку, в которой вы вчера бегали и не сменят вам простыни. Для этого нужен куда более сообразительный робот.
Группа исследователей в лаборатории Компьютерных наук и ИИ Массачусетского технологического университета разработали эквивалент Alexa для использования в связке с роботом. Программа, которую называли ComText, позволяет отдавать роботам команды, используя естественный язык. Команда исследователей испытала ComText в связке со стандартным коллаборативным роботом Baxter, которых обычно используют на предприятиях или в учебных целях, но программа универсальна и ее можно использовать и с другими типами роботов.
Обучить роботов выполнять команды, отдаваемые на естественном языке, особенно такие, которые относятся к реальному миру, - чрезвычайно сложная задача. Роботы не понимают контекста. Если вы положите на стол какой-либо предмет, и скажете роботу “подними его”, робот не будет знать, что такое “его”. Если вы попросите его поднять последний предмет, который вы использовали, он опять же не сможет проассоциировать предыдущий “опыт” с новой командой.
ComText, - это сокращение от Commands in Context (Команды в контексте), это программа, которая дает роботу то, что психологи называют декларативной или явной памятью у людей: возможность вспоминать факты и события, которые происходили ранее. Существует два типа декларативной памяти. Одна, называемая семантическая память - основана на фактах, например, что ваше день рождения такого-то числа, или что вы работаете в такой-то компании.
Кроме того, существует так называемая эпизодическая память, которая основывается на опыте прошлого, и которая помогает принимать решения в будущем. Другими словами, это “контекст” - и это то, что дает ComText роботам. Благодаря этой системе, если попросить робота взять предмет, который он брал последним, робот буквально проведет поиск в собственной памяти (которая представляет из себя видеопоток), чтобы найти предыдущую ситуацию, в которой робот использовал данный предмет, вновь идентифицирует этот предмет в реальной жизни и возьмет его.
Люди постоянно используют эпизодическую память при обработке естественной речи, даже в самом молодом возрасте. Если вы скажете ребенку “это моя чашка”, а затем попросите его “дай мою чашку”, то ребенок проассоциирует чашку на столе с вами и возьмет ее в руки, если вы попробуете. Между тем, этот процесс требует сложных ассоциаций, которые очень сложны для роботов. “Моё” - это абстракция, нельзя построить соответствующий сенсор. Это не физическое проявление.
Тем не менее, ComText может также выполнять такие действия, когда “факты”, такие как “это моя чашка” записываются в то, что разработчики называют “хранилище знаний”. Затем, когда вы попросите робота “дай мне мою чашку”, он сможет обратиться к этой базе знаний, чтобы правильно определить, какая из чашек ваша.
ComText - это очередной шаг к человеко-машинному взаимодействию. Система обеспечивает возможность для естественной коммуникации с роботами с использованием информации о предыдущих ситуациях и абстрактных концепций, таких как право собственности. Если, например, в доме вашей бабушки окажется робот, оборудованный ComText, он сможет понять, когда она просит его подобрать посылку, оставленную у двери или подать ей ее любимый свитер.
При тестировании ComText вместе с коллаборативным роботом Baxter, робот исполнял команды с точностью в 90%.
Это серьезное достижение, поскольку люди и роботы взаимодействуют все больше и больше - на заводах, дома и все чаще - на дорогах. Кстати, исследования осуществляются на средства Toyota. Контекстуальная память будет обязательной для взаимодействия с автономными транспортными средствами, поскольку они позволят управлять ими такими фразами, как: “подбери меня там же, откуда я ехал вчера”, “забери мою жену в 5 вечера из ее офиса”, “поверни налево, после пешеходного перехода”. Все эти ситуации требуют умения робота использовать контекстную информацию.
Следующим этапом для ComText будет освоение более высокоуровневого взаимодействия и более сложных задач, нежели чем брать и класть предметы, к чему так хорошо приспособлены роботы Baxter. Разработчики планируют добавить в программу компонент для синтеза речи, что позволит роботу и человеку разговаривать, задавая друг другу вопросы для того, чтобы лучше наладить взаимодействие. Также планируется закачать в базу робота больше “знаний”, что позволит ему решать более сложные задачи и делать логические выводы. Например, если вы скажете роботу, что на столе лежит брусок алюминия, и что он является токопроводящим, то робот в дальнейшем должен суметь принести его вам, если вы произнесете “дай мне провод”. Комбинация знаний и контекстуальной памяти поможет программе лучше “понимать”, что означает та или иная команда.
+ +