Исследователи представили Agents-A1 — модель типа Mixture-of-Experts (MoE) с 35 млрд параметров, которая достигает эффективности систем с триллионами параметров за счет масштабирования «горизонта агента». Подход фокусируется на увеличении длины траекторий планирования и расширении спектра гетерогенных способностей, что позволяет модели решать сложные задачи без необходимости пропорционального увеличения количества параметров.
Ключевой особенностью разработки стала специализированная инфраструктура знаний и действий. Она объединяет внешние источники данных с механизмами исполнения, позволяя агенту эффективно оперировать в долгосрочных сценариях. Вместо простого наращивания весов модели, авторы сосредоточились на оптимизации процесса принятия решений и глубины анализа контекста, что критически важно для автономных агентных систем.
Методология исследования доказывает, что производительность агентных моделей определяется не только объемом обучающей выборки или количеством параметров, но и качеством архитектуры, поддерживающей длинные цепочки рассуждений. Интеграция внешней памяти и инструментов взаимодействия с внешней средой позволяет 35-миллиардной модели конкурировать с гораздо более крупными аналогами в задачах, требующих многошагового планирования.
Ключевые факты
- Модель Agents-A1 использует архитектуру Mixture-of-Experts (MoE) с общим объемом 35 млрд параметров.
- Достигнутая производительность сопоставима с моделями, имеющими более триллиона параметров.
- Основной упор сделан на масштабирование «горизонта агента» (long-horizon scaling) и работу с гетерогенными способностями.
- Разработана инфраструктура, связывающая внешние базы знаний с действиями агента для поддержки сложных траекторий планирования.