Софт

Facebook Research занимается разработкой роботов

Facebook Research занимается разработкой роботов

Как социальная медиа-платформа с глобальным охватом, Facebook широко использует свои системы искусственного интеллекта и машинного обучения, чтобы сохранять сайт всегда доступным в сети и удалять с него неуместный контент. В начале весны было объявлено о том, что Facebook занимается самообучением, компьютерным зрением и обработкой естественного языка, а теперь компания поделилась подробностями о трех дополнительных областях исследований, которые в конечном итоге могут привести к созданию более способного ИИ.

«Большая часть нашей работы в области робототехники сфокусирована на самообучении, в котором системы учатся непосредственно на необработанных данных, чтобы они могли адаптироваться к новым задачам и новым обстоятельствам», — написала команда исследователей из FAIR (Facebook AI Research) в блоге. — «В робототехнике мы развиваем такие методы, как обучение на основе модели (RL), чтобы позволить роботам учить себя методом проб и ошибок с помощью прямого ввода информации от датчиков».

В частности, команда пыталась заставить шестиногого робота научить себя ходить без посторонней помощи. «Вообще говоря, передвижение — это очень сложная задача в робототехнике, и это делает ее очень захватывающей с нашей точки зрения», — сказал Роберто Каландра, исследователь FAIR. - «Мы смогли разработать алгоритмы для ИИ и фактически протестировать их на действительно сложной задаче, которую в противном случае мы не знали бы, как решить».

Гексапод Facebook
Гексапод Facebook

Гексапод (работ на фото выше) начинал свое существование как куча ног без понимания окружения. Используя алгоритм усиленного обучения, робот постепенно вычисляет данные, которые помогут ему достичь своей цели при передвижении. А поскольку алгоритм использует рекурсивную функцию самосовершенствования, робот может отслеживать информацию, которую он собирает, и дополнительно оптимизировать свое поведение с течением времени. То есть, чем больше опыта приобретает робот, тем лучше он работает.

Это легче сказать, чем сделать, учитывая, что робот должен определять не только свое местоположение и ориентацию в пространстве, но также собственный баланс, скорость и прочее — все, что он получает из серии датчиков, расположенных на коленях машины. Оптимизировав поведение робота и сконцентрировавшись на том, чтобы он шел как можно быстрее, Facebook научил робота «ходить» в течение нескольких часов, а не дней.

Но что делать гексаподу, когда он уже выяснил, как двигаться? Идти изучать окружение, очевидно. Но не так легко вызвать страсть к путешествиям у роботов, которые обычно обучаются достижению узко определенной цели. Тем не менее, это именно то, что Facebook пытается сделать с помощью своих коллег из Нью-Йоркского университета и роботизированной руки.

Роботизированная рука Нью-Йоркского университета
Роботизированная рука Нью-Йоркского университета

Предыдущие исследования по распространению чувства любопытства в ИИ были направлены на уменьшение неопределенностей. Последние усилия Facebook стремятся к той же цели, но делают это более структурированным образом.

«На самом деле, мы начали с модели, которая мало знает о себе», — сказалаа исследователь FAIR Франческа Майер. — «В тот момент робот знал, как держать руку, но на самом деле он не знает, какие действия нужно предпринять для достижения определенной цели». Но когда робот узнает, какие алгоритмы необходимо применить, чтобы переместить руку в следующую целевую конфигурацию, он может в конечном итоге начать оптимизировать свое планирование.

«Мы используем модель, которая говорит нам об этом, чтобы планировать заранее ряд шагов», — продолжила Майер. — «И мы пытаемся использовать эту процедуру планирования для оптимизации последовательности действий для достижения поставленной задачи». Чтобы помешать роботу оптимизировать свои процедуры слишком сильно и зацикливаться на них, исследовательская группа поощряла робота за действия, которые разрешали неопределенности.

Кроме того, Facebook усердно учит роботов ощущать себя. Не эмоционально, а физически. И компания для этого использует предсказательную модель глубокого обучения, изначально разработанную для видео. «По сути, это метод, который может создать видео, исходя из текущего состояния, текущей картинки и действия», — объяснил Каландра.

Команда обучила ИИ работать напрямую, используя необработанные данные. В данном случае через тактильный датчик с высоким разрешением, а не через заранее заданную модель. «Наша работа показывает, что такая политика поведения может быть изучена полностью без вознаграждений, посредством разнообразных неконтролируемых исследовательских взаимодействий с окружающей средой», — заключили исследователи. Во время эксперимента робот смог успешно манипулировать джойстиком, катать шарик и определять правильную грань 20-стороннего кубика.

«Мы показываем, что у нас может быть робот, который манипулирует небольшими объектами без присмотра», — сказал Каландра. — «И на практике это означает, что… мы можем действительно точно предсказать, что будет результатом [данного] действия. Это позволяет нам начать планирование на будущее. Мы можем оптимизировать последовательность действий, которая будет давать желаемый результат».

Объединение визуальных и тактильных входов может значительно улучшить функциональность будущих роботизированных платформ и улучшить методы обучения. «Чтобы создавать машины, которые могут учиться, взаимодействуя с окружающим миром независимо, нам нужны роботы, которые могут использовать данные от разных органов чувств», — заключила команда.

В компании не комментируют потенциальное практическое применение для этого исследования в будущем.

Поделиться с миром: