Исследователи представили метод адаптации моделей для непрерывного обучения агентов, работающих с человеческими движениями. Решение использует модификации LoRA для последовательного освоения новых концепций — от спортивных стилей до специфических жестов — без потери ранее накопленных знаний. Это позволяет ИИ-агентам эффективно адаптироваться к динамическим средам, сохраняя двунаправленную способность к преобразованию текста в движение и обратно.
Фундаментальные модели часто сталкиваются с проблемой «катастрофического забывания» при попытке дообучения на новых данных. В данной работе предложены специализированные варианты адаптеров с низким рангом, которые позволяют эффективно обновлять веса модели, минимизируя влияние на уже изученные паттерны. Такой подход критически важен для создания автономных систем, работающих в реальном времени, где требуется постоянное расширение базы навыков без необходимости переобучения всей архитектуры с нуля.
Методология фокусируется на инкрементальном обучении, где агент последовательно получает новые наборы данных о движениях. Использование LoRA-вариантов обеспечивает баланс между гибкостью модели и стабильностью её базовых функций. Это открывает возможности для создания более адаптивных робототехнических систем и виртуальных аватаров, способных обучаться сложным моторным навыкам в процессе взаимодействия с пользователем или средой.
Ключевые факты
- Предложен метод инкрементального обучения для двунаправленных моделей «текст-движение» (T2M) и «движение-текст» (M2T).
- Использование LoRA-адаптеров позволяет избежать катастрофического забывания при добавлении новых моторных концепций.
- Исследование направлено на решение проблемы адаптации агентов в динамических средах, где требуется постоянное обновление навыков.
- Метод обеспечивает эффективную интеграцию новых стилей движения без необходимости полного переобучения базовой нейросети.