Исследователи представили метод Domain Adaptation with Adaptive Imagination (DAAI), решающий проблему переноса моделей обучения с подкреплением (RL) из симуляции в реальный мир. Новый подход позволяет агентам адаптироваться к визуальным различиям сред при ограниченном объеме реальных данных, минимизируя разрыв в распределении состояний, который критически затрудняет работу систем компьютерного зрения в робототехнике.
Основная сложность визуального RL заключается в том, что даже незначительные расхождения в освещении, текстурах или геометрии между симулятором и физическим пространством приводят к деградации производительности агента. Традиционные методы доменной адаптации часто требуют больших объемов размеченных данных из целевой среды, что дорого и не всегда осуществимо в реальных условиях эксплуатации роботов.
Предложенный метод использует механизм «адаптивного воображения», который позволяет модели генерировать синтетические представления целевого домена, опираясь на минимальное количество реальных наблюдений. Это создает более устойчивое латентное пространство, в котором агент обучается игнорировать визуальный шум и фокусироваться на инвариантных признаках, необходимых для выполнения задачи управления.
Ключевые факты
- Метод DAAI снижает зависимость от больших наборов данных при переносе моделей из симуляции в реальность (sim-to-real).
- Алгоритм фокусируется на устранении сдвига распределения состояний, вызванного различиями в визуальных наблюдениях.
- Подход демонстрирует эффективность в задачах визуального управления, где традиционные методы доменной адаптации показывают низкую точность из-за нехватки целевых данных.
- Исследование направлено на повышение надежности автономных систем, работающих в динамических физических средах.