Роботы могут доставлять еду в кампус колледжа и пробивать дырку на поле для гольфа, но даже самый сложный робот не может выполнять базовые социальные взаимодействия, которые имеют решающее значение для повседневной жизни человека.
Исследователи Массачусетского технологического института теперь включили определенные социальные взаимодействия в структуру робототехники, что позволяет машинам понимать, что значит помогать или мешать друг другу, и научиться выполнять это социальное поведение самостоятельно. В смоделированной среде робот наблюдает за своим спутником, угадывает, какую задачу он хочет выполнить, а затем помогает или мешает этому другому роботу, исходя из его собственных целей.
Исследователи также показали, что их модель создает реалистичные и предсказуемые социальные взаимодействия. Когда они показывали людям видео, на которых моделированные роботы взаимодействуют друг с другом, зрители в основном соглашались с моделью о том, какой тип социального поведения имеет место.
Предоставление роботам возможности проявлять социальные навыки может привести к более плавному и позитивному взаимодействию человека и робота. Например, робот в учреждении для престарелых может использовать эти возможности, чтобы помочь создать более заботливую среду для пожилых людей. Новая модель может также позволить ученым количественно измерять социальные взаимодействия, что может помочь психологам изучать аутизм или анализировать эффекты антидепрессантов.
«Роботы скоро начнут жить в нашем мире, и им действительно нужно научиться общаться с нами на человеческих началах. Им нужно понять, когда им пора помочь, а когда пора посмотреть, что они могут сделать, чтобы что-то не произошло. Это очень ранняя работа, и мы едва касаемся ее поверхности, но я чувствую, что это первая серьезная попытка понять, что означает социальное взаимодействие людей и машин », - говорит Борис Кац, главный научный сотрудник и глава InfoLab. Группа в Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) и член Центра мозга, разума и машин (CBMM).
Вместе с Кацем в работе над статьей работают со-ведущий автор Рави Теджвани, научный сотрудник CSAIL; со-ведущий автор Йен-Лин Куо, аспирант CSAIL; Тяньминь Шу, постдоктор отделения мозговых и когнитивных наук; и старший автор Андрей Барбу, научный сотрудник CSAIL и CBMM. Исследование будет представлено на конференции по обучению роботов в ноябре.
Для изучения социальных взаимодействий исследователи создали симулированную среду, в которой роботы преследуют физические и социальные цели, перемещаясь по двумерной сетке.
Физическая цель связана с окружающей средой. Например, физической целью робота может быть переход к дереву в определенной точке сетки. Социальная цель заключается в том, чтобы угадать, что другой робот пытается сделать, а затем действовать на основе этой оценки, например, помочь другому роботу полить дерево.
Исследователи используют свою модель, чтобы определить, каковы физические цели робота, каковы его социальные цели и насколько много внимания он должен уделять друг другу. Робот вознаграждается за действия, которые приближают его к достижению поставленных целей. Если робот пытается помочь своему компаньону, он регулирует свою награду, чтобы она соответствовала награде другого робота; если он пытается помешать, он регулирует свою награду на противоположную. Планировщик, алгоритм, который решает, какие действия должен предпринять робот, использует это постоянно обновляемое вознаграждение, чтобы направлять робота к выполнению сочетания физических и социальных целей.
«Мы открыли новую математическую основу для моделирования социального взаимодействия между двумя агентами. Если вы робот и хотите перейти в точку X, а я другой робот и вижу, что вы пытаетесь перейти в точку X, я могу сотрудничать, помогая вам быстрее добраться до точки X. Это может означать перемещение X ближе к вам, поиск другого лучшего X или выполнение любых действий, которые вы должны были предпринять в X. Наша формулировка позволяет плану обнаружить «как»; мы определяем «что» с точки зрения математического значения социальных взаимодействий », - говорит Теджвани.
Сочетание физических и социальных целей робота важно для создания реалистичного взаимодействия, поскольку люди, которые помогают друг другу, имеют ограничения на то, как далеко они зайдут. Например, по словам Барбу, рациональный человек, скорее всего, не просто отдаст кошелек незнакомцу.
Исследователи использовали эту математическую основу для определения трех типов роботов. Робот 0 уровня преследует только физические цели и не может рассуждать социально. Робот уровня 1 имеет физические и социальные цели, но предполагает, что все остальные роботы имеют только физические цели. Роботы уровня 1 могут действовать в соответствии с физическими целями других роботов, например помогать или препятствовать. Робот уровня 2 предполагает, что у других роботов есть социальные и физические цели; эти роботы могут выполнять более сложные действия, например, объединяться, чтобы помогать друг другу.
Чтобы сравнить их модель с человеческими взглядами на социальные взаимодействия, они создали 98 различных сценариев с роботами на уровнях 0, 1 и 2. Двенадцать человек просмотрели 196 видеоклипов взаимодействия роботов, а затем их попросили оценить физические и социальные цели этих роботов.
В большинстве случаев их модель соответствовала тому, что люди думали о социальных взаимодействиях, происходивших в каждом кадре.
«У нас есть этот долгосрочный интерес, как в создании вычислительных моделей для роботов, так и в том, чтобы глубже изучить человеческие аспекты этого. Мы хотим выяснить, какие функции из этих видеороликов люди используют для понимания социальных взаимодействий. Можем ли мы провести объективный тест на вашу способность распознавать социальные взаимодействия? Может быть, есть способ научить людей распознавать эти социальные взаимодействия и улучшить свои способности. Мы далеки от этого, но даже просто возможность эффективно измерять социальные взаимодействия - это большой шаг вперед », - говорит Барбу.
Исследователи работают над разработкой системы с трехмерными агентами в среде, которая допускает гораздо больше типов взаимодействий, таких как манипуляции с бытовыми предметами. Они также планируют изменить свою модель, включив в нее среды, в которых действия могут быть неудачными.
Исследователи также хотят включить в модель планировщика роботов на основе нейронных сетей, который учится на опыте и работает быстрее. Наконец, они надеются провести эксперимент по сбору данных о функциях, которые люди используют, чтобы определить, участвуют ли два робота в социальном взаимодействии.
«Надеюсь, у нас будет эталонный тест, который позволит всем исследователям работать над этими социальными взаимодействиями и вдохновить на научные и инженерные достижения, которые мы наблюдали в других областях, таких как распознавание объектов и действий», - говорит Барбу.
«Я думаю, что это прекрасное применение структурированных рассуждений к сложной, но неотложной задаче», - говорит Томер Ульман, доцент кафедры психологии Гарвардского университета и руководитель лаборатории вычислений, познания и развития, который не имел отношения к это исследование. «Даже младенцы, кажется, понимают социальные взаимодействия, такие как помощь и препятствие, но у нас пока нет машин, которые могли бы выполнять эти рассуждения на каком-либо уровне, например, на человеческом уровне. Я считаю, что модели, подобные тем, которые предлагаются в этой работе, когда агенты думают о вознаграждении других и социально планируют, как лучше всего помешать или поддержать их, являются хорошим шагом в правильном направлении ».
Ссылка: «Социальные взаимодействия как рекурсивные MDP» Рави Теджвани, Йен-Линг Куо, Тяньминь Шу, Бориса Каца и Андрея Барбу.
Это исследование было поддержано Центром мозга, разума и машин; Национальный научный фонд; Инициатива "Системы обучения MIT CSAIL"; лаборатория искусственного интеллекта MIT-IBM Watson AI; программа DARPA «Искусственный социальный интеллект для успешных команд»; Исследовательская лаборатория ВВС США; ускоритель искусственного интеллекта ВВС США; и Управление военно-морских исследований.