Наука и жизнь

Агента ИИ научили делать выводы об увиденном

Агента ИИ научили делать выводы об увиденном

Специалисты по информатике научили интеллектуальных агентов (сущности в искусственном интеллекте, получающие информацию через систему сенсоров о состоянии управляемых ими процессов и осуществляющие влияние на них через систему актуаторов) делать то, что обычно делают только люди: быстро взглянуть на окружение и сделать вывод о том, где именно они находятся.

Новый навык необходим для разработки эффективных поисково-спасательных роботов, которые в один прекрасный день могут повысить эффективность опасных работ.

Большинство интеллектуальных агентов — компьютерных систем, которые могли бы наделить интеллектом роботов или другие машины — обучены для очень специфических задач, таких как распознавание объекта или оценка его объема, в среде, в которой они бывали ранее, например, на фабрике.

Новый агент общего назначения, собирает визуальную информацию, которая затем может использоваться им для широкого круга задач.

Новый интеллектуальный агент делает несколько «снимков» своего окружения, представляя менее 20 процентов от полного обзора в 360 градусов, и делает вывод об остальной части среды
Новый интеллектуальный агент делает несколько «снимков» своего окружения, представляя менее 20 процентов от полного обзора в 360 градусов, и делает вывод об остальной части среды

«Нам нужен агент, который способен входить в определенную среду и быть готовым к новым задачам восприятия по мере их возникновения», — говорит Кристен Грауман, профессор кафедры информатики в Техасском университете в Остине. — «Он ведет себя универсально и может успешно справляться с различными задачами, потому что он усвоил шаблоны для визуализации мира».

Исследователи использовали глубокое обучение — тип машинного обучения, вдохновленного нейронными сетями мозга — чтобы обучить своего агента тысячам 360-градусных изображений различных сред.

Теперь, когда ему показывают сцену, которую он никогда раньше не видел, агент использует свой опыт, чтобы выбрать несколько снимков — как турист, стоящий посреди собора, делающий несколько снимков в разных направлениях — которые вместе составляют менее 20 процентов от полной сцены.

То, что делает эту систему настолько эффективной, заключается в том, что она не просто делает снимки в случайных направлениях, но после каждого «взгляда» выбирает следующий снимок, который предсказывает следующую новую информацию обо всей картине. Это очень похоже на то, как если бы вы были в продуктовом магазине, в котором никогда раньше не были, и, увидев яблоки, ожидаете найти поблизости апельсины, но, чтобы найти молоко, вы должны были бы взглянуть в другую сторону.

Основываясь на снимках, агент делает вывод о том, что он увидел бы, если бы он смотрел во всех других направлениях, восстанавливая полное 360-градусное изображение своего окружения.

«Подобно тому, как вы используете предварительную информацию о закономерностях, которые существуют в ранее испытанной среде — как во всех продуктовых магазинах, в которых вы когда-либо были — этот агент ищет подсказки, определяющие его взгляд на окружение», — говорит Грауман. — «Он учится делать интеллектуальные предположения о том, где собирать визуальную информацию, чтобы преуспеть в задачах восприятия».

Одна из основных задач, которые исследователи поставили перед собой, заключалась в разработке агента, который мог бы работать в условиях ограниченного времени. Это будет иметь решающее значение в поисково-спасательных операциях. Например, в горящем здании робот должен был бы быстро найти людей, определить местонахождение огня и опасных материалов, а затем передать эту информацию пожарным.

На данный момент новый агент работает как человек, стоящий на одном месте, с возможностью направлять камеру в любую сторону, но он не может переместиться в какое-либо другое место. Или, что-то же самое, агент может смотреть на объект, который он держит, и решить, как повернуть объект таким образом, чтобы осмотреть другую его сторону. Затем исследователи продолжат разработку системы для работы в полностью мобильном роботе.

Использование суперкомпьютеров заняло около одного дня, чтобы обучить агента этому интеллектуальному подходу, называемого обучением с подкреплением. Команда разработала метод ускорения обучения: создание второго агента, называемого помощником, для оказания помощи первичному агенту.

«Использование дополнительной информации, которая присутствует исключительно во время обучения, помогает [первичному] агенту учиться быстрее», — говорит участник исследования Сантош Рамакришнан.

Исследование опубликовано в журнале Science Robotics. Поддержка исследования была частично предоставлена ​​Агентством перспективных исследований в области обороны США, Управлением научных исследований ВВС США, корпорацией IBM и корпорацией Sony.

Поделиться с миром: