Исследователи представили метод RECALL (Recovery Experience Collection for Active Lifelong Learning), предназначенный для оптимизации обучения моделей Vision-Language-Action (VLA). Традиционный подход к дообучению роботов основан на пассивном имитационном обучении: система собирает новые данные только после того, как модель совершила ошибку. Это приводит к неэффективному использованию ресурсов, так как экспертам приходится тратить время на демонстрации в ситуациях, которые не всегда критически важны для улучшения навыков робота.

Алгоритм RECALL меняет этот процесс, внедряя механизм активного обучения. Вместо ожидания сбоев система самостоятельно определяет состояния, в которых модель обладает наибольшей неопределенностью, и запрашивает демонстрации именно для этих сценариев. Такой подход позволяет сфокусировать усилия человека-оператора на наиболее сложных и информативных задачах, исключая избыточный сбор данных в предсказуемых ситуациях.

Внедрение RECALL позволяет значительно повысить эффективность дообучения VLA-моделей в долгосрочной перспективе. Метод не только снижает временные затраты на подготовку обучающих выборок, но и ускоряет адаптацию роботов к новым условиям эксплуатации. Исследование демонстрирует, что целенаправленный сбор опыта критически важен для создания более надежных и автономных систем, способных к непрерывному обучению в реальных условиях.