Специалисты по информатике научили
Новый навык необходим для разработки эффективных поисково-спасательных роботов, которые в один прекрасный день могут повысить эффективность опасных работ.
Большинство интеллектуальных агентов — компьютерных систем, которые могли бы наделить интеллектом роботов или другие машины — обучены для очень специфических задач, таких как распознавание объекта или оценка его объема, в среде, в которой они бывали ранее, например, на фабрике.
Новый агент общего назначения, собирает визуальную информацию, которая затем может использоваться им для широкого круга задач.

«Нам нужен агент, который способен входить в определенную среду и быть готовым к новым задачам восприятия по мере их возникновения», — говорит Кристен Грауман, профессор кафедры информатики в Техасском университете в Остине. — «Он ведет себя универсально и может успешно справляться с различными задачами, потому что он усвоил шаблоны для визуализации мира».
Исследователи использовали глубокое обучение — тип машинного обучения, вдохновленного нейронными сетями мозга — чтобы обучить своего агента тысячам 360-градусных изображений различных сред.
Теперь, когда ему показывают сцену, которую он никогда раньше не видел, агент использует свой опыт, чтобы выбрать несколько снимков — как турист, стоящий посреди собора, делающий несколько снимков в разных направлениях — которые вместе составляют менее 20 процентов от полной сцены.
То, что делает эту систему настолько эффективной, заключается в том, что она не просто делает снимки в случайных направлениях, но после каждого «взгляда» выбирает следующий снимок, который предсказывает следующую новую информацию обо всей картине. Это очень похоже на то, как если бы вы были в продуктовом магазине, в котором никогда раньше не были, и, увидев яблоки, ожидаете найти поблизости апельсины, но, чтобы найти молоко, вы должны были бы взглянуть в другую сторону.
Основываясь на снимках, агент делает вывод о том, что он увидел бы, если бы он смотрел во всех других направлениях, восстанавливая полное 360-градусное изображение своего окружения.
«Подобно тому, как вы используете предварительную информацию о закономерностях, которые существуют в ранее испытанной среде — как во всех продуктовых магазинах, в которых вы когда-либо были — этот агент ищет подсказки, определяющие его взгляд на окружение», — говорит Грауман. — «Он учится делать интеллектуальные предположения о том, где собирать визуальную информацию, чтобы преуспеть в задачах восприятия».
Одна из основных задач, которые исследователи поставили перед собой, заключалась в разработке агента, который мог бы работать в условиях ограниченного времени. Это будет иметь решающее значение в поисково-спасательных операциях. Например, в горящем здании робот должен был бы быстро найти людей, определить местонахождение огня и опасных материалов, а затем передать эту информацию пожарным.
На данный момент новый агент работает как человек, стоящий на одном месте, с возможностью направлять камеру в любую сторону, но он не может переместиться в какое-либо другое место. Или, что-то же самое, агент может смотреть на объект, который он держит, и решить, как повернуть объект таким образом, чтобы осмотреть другую его сторону. Затем исследователи продолжат разработку системы для работы в полностью мобильном роботе.
Использование суперкомпьютеров заняло около одного дня, чтобы обучить агента этому интеллектуальному подходу, называемого обучением с подкреплением. Команда разработала метод ускорения обучения: создание второго агента, называемого помощником, для оказания помощи первичному агенту.
«Использование дополнительной информации, которая присутствует исключительно во время обучения, помогает [первичному] агенту учиться быстрее», — говорит участник исследования Сантош Рамакришнан.
Исследование опубликовано в журнале