Исследователи представили E-TTS (Embodied Test-Time Scaling) — фреймворк для улучшения производительности робототехнических агентов через масштабирование рассуждений во время выполнения задач. Система решает проблему длинных последовательностей действий, интегрируя механизмы работы с историей состояний и адаптивное планирование, что позволяет моделям эффективнее справляться со сложными манипуляциями в динамической среде без необходимости дообучения.
Традиционные подходы к масштабированию моделей часто игнорируют специфику воплощенного ИИ, где критически важна последовательность действий и учет предыдущего опыта. E-TTS вводит механизм динамического анализа траекторий, который позволяет агенту «размышлять» над следующими шагами, основываясь на накопленных данных, а не только на текущем сенсорном вводе. Это существенно повышает точность выполнения многоэтапных задач, требующих долгосрочного планирования.
Фреймворк демонстрирует, что вычислительные ресурсы, затраченные на этапе инференса для «обдумывания» действий, дают значительный прирост качества управления роботом. Такой подход открывает путь к созданию более автономных систем, способных адаптироваться к изменяющимся условиям в реальном времени, используя методы, аналогичные тем, что применяются в современных LLM для повышения качества ответов через цепочки рассуждений (Chain-of-Thought).
Ключевые факты
- E-TTS фокусируется на решении проблем длинного горизонта планирования в робототехнических задачах.
- Фреймворк внедряет механизм использования исторической информации для коррекции текущих действий агента.
- Система реализует масштабирование рассуждений (test-time scaling) непосредственно в процессе выполнения манипуляций.
- Метод позволяет повысить эффективность политики управления без изменения весов базовой модели.