Исследователи представили EgoInfinity — специализированный датасет и вычислительный движок, предназначенный для обучения роботов выполнению задач на основе анализа видеоданных. Проект направлен на решение одной из ключевых проблем современной робототехники: нехватки качественных данных, связывающих визуальное восприятие с конкретными физическими действиями. В отличие от стандартных наборов данных, EgoInfinity использует масштабные видеоархивы для генерации траекторий, которые роботы могут использовать для имитационного обучения.
Система позволяет эффективно масштабировать процесс сбора данных, преобразуя видеозаписи действий человека в структурированные инструкции для манипуляторов. Такой подход значительно снижает зависимость от дорогостоящего сбора данных в реальных физических условиях, позволяя моделям обучаться на разнообразных сценариях взаимодействия с объектами. Использование подобных инструментов ускоряет разработку алгоритмов, способных к обобщению навыков в различных средах.
Технология опирается на методы обучения с подкреплением и имитационного обучения, адаптированные для работы с большими объемами неразмеченных видео. Разработка открывает новые возможности для создания универсальных моделей управления роботами, которые могут обучаться сложным манипуляциям, просто наблюдая за выполнением задач людьми. Это важный шаг в развитии автономных систем, способных адаптироваться к новым задачам без необходимости перепрограммирования под каждый конкретный сценарий.