arXiv · 29.06.2026 ·Модели и релизы

Agents-A1: 35B модель с производительностью уровня триллионных систем

Исследователи представили Agents-A1 — модель типа Mixture-of-Experts (MoE) с 35 млрд параметров, которая достигает эффективности систем с триллионами параметров за счет масштабирования «горизонта агента». Подход фокусируется на увеличении длины траекторий планирования и расширении спектра гетерогенных способностей, что позволяет модели решать сложные задачи без необходимости пропорционального увеличения количества параметров.

Ключевой особенностью разработки стала специализированная инфраструктура знаний и действий. Она объединяет внешние источники данных с механизмами исполнения, позволяя агенту эффективно оперировать в долгосрочных сценариях. Вместо простого наращивания весов модели, авторы сосредоточились на оптимизации процесса принятия решений и глубины анализа контекста, что критически важно для автономных агентных систем.

Методология исследования доказывает, что производительность агентных моделей определяется не только объемом обучающей выборки или количеством параметров, но и качеством архитектуры, поддерживающей длинные цепочки рассуждений. Интеграция внешней памяти и инструментов взаимодействия с внешней средой позволяет 35-миллиардной модели конкурировать с гораздо более крупными аналогами в задачах, требующих многошагового планирования.

Ключевые факты

Модель Agents-A1 использует архитектуру Mixture-of-Experts (MoE) с общим объемом 35 млрд параметров.
Достигнутая производительность сопоставима с моделями, имеющими более триллиона параметров.
Основной упор сделан на масштабирование «горизонта агента» (long-horizon scaling) и работу с гетерогенными способностями.
Разработана инфраструктура, связывающая внешние базы знаний с действиями агента для поддержки сложных траекторий планирования.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

Hacker News · Инференс и железо Релиз Qwen-AgentWorld-35B-A3B: локальная модель мира для агентных систем Представлена модель Qwen-AgentWorld-35B-A3B — специализированная «модель мира», оптимизированная для работы на потребительском оборудовании. Архитектура использует 35 миллиардов параметров с активным использованием 3 миллиардов на токен, что позволяет эффективно решать задачи агентного планирования и взаимодействия с внешней средой, сохраняя при этом высокую скорость генерации и низкие требования к оперативной памяти. Hacker News · ИИ в бизнесе Опыт одновременного запуска 1500 ИИ-агентов в продакшене Анализ эксплуатации масштабной системы из 1500 автономных ИИ-агентов выявил ключевые метрики, определяющие стабильность и стоимость подобных решений. В ходе эксперимента основное внимание уделялось не только производительности моделей, но и операционным затратам на поддержание инфраструктуры. Выяснилось, что при массовом запуске агентов критически важными становятся показатели задержки (latency) и частота ошибок при выполнении цепочек действий, которые напрямую влияют на итоговую стоимость транзакции. Hacker News · Оркестрация агентов Фундаментальный обзор архитектур и систем агентного ИИ Авторы нового исследования представили комплексный обзор архитектур агентного ИИ, систематизируя переход от простых LLM-приложений к автономным агентным системам. Работа охватывает ключевые компоненты: от механизмов планирования и управления памятью до стратегий взаимодействия с внешними инструментами. Материал служит дорожной картой для проектирования масштабируемых систем, способных выполнять сложные многоэтапные задачи в реальных условиях. Hacker News · Модели и релизы Nous Research представила архитектуру Hermes MoA для повышения точности LLM Компания Nous Research анонсировала архитектуру Mixture-of-Agents (MoA), позволяющую объединять несколько специализированных языковых моделей для достижения более высоких результатов. Согласно бенчмаркам, система демонстрирует значительный прирост производительности по сравнению с ведущими проприетарными моделями, превосходя показатели Claude 3 Opus на 8% и GPT-4o на 11% в ряде ключевых задач, что подтверждает эффективность агентного подхода к генерации ответов. arXiv · Исследования и наука Новый подход к оценке интеллекта ИИ-агентов через теорию сжатия данных Исследователи представили аналитическую модель оценки интеллекта агентных систем, основанную на принципе «интеллект как сжатие». Авторы предлагают измерять эффективность агентов через объем информации, необходимый для выполнения конкретных задач в заданных условиях. Этот подход позволяет количественно сравнивать способности моделей к использованию инструментов, поиску данных и многошаговому взаимодействию с внешней средой, переводя качественные характеристики агентов в измеримые биты. Hacker News · Оценка и бенчмарки Сравнение производительности LLM в динамических агентных сценариях Платформа OpenRouter представила результаты тестирования различных языковых моделей в условиях симуляции, где агенты должны принимать решения в режиме реального времени. В рамках эксперимента модели помещались в динамическую среду, требующую быстрой реакции на меняющиеся обстоятельства. Цель исследования заключалась в оценке того, как архитектурные различия и методы обучения влияют на способность моделей эффективно управлять автономными объектами в условиях ограниченного времени. Hacker News · Исследования и наука Исследование OpenAI: переход от простых LLM к агентным системам Анализ данных платформы Codex демонстрирует фундаментальный сдвиг в использовании ИИ: разработчики всё чаще делегируют моделям выполнение многошаговых задач. Вместо разовых запросов пользователи переходят к агентным паттернам, где ИИ самостоятельно планирует действия и взаимодействует с внешними инструментами. Это меняет требования к архитектуре моделей, смещая фокус с генерации текста на надежность выполнения последовательных операций. arXiv · Машинное обучение Мультиагентные системы для многокритериальной оптимизации в динамических средах Исследователи представили новый подход к решению задач оптимизации в вычислительных и сетевых системах с помощью мультиагентных систем. Традиционные методы обучения с подкреплением часто сводят сложные задачи к минимизации единого скалярного вознаграждения, используя штрафные коэффициенты для учета ограничений. Однако такой подход оказывается недостаточно гибким в динамических условиях, где требования к производительности и затратам постоянно меняются. Hacker News · Оркестрация агентов Архитектура Knowledge Agents: как структура побеждает масштаб моделей Исследователи представили концепцию Knowledge Agents, которая меняет подход к проектированию агентных систем. Вместо того чтобы полагаться исключительно на мощь «фронтирных» моделей, разработчики предлагают использовать специализированные структуры данных и графовые представления знаний. Такой подход позволяет агентам эффективнее оперировать контекстом, минимизируя галлюцинации и повышая точность ответов в узкоспециализированных задачах. arXiv · Исследования и наука Ограничения универсальности ИИ-агентов: почему «мировые модели» должны быть фрагментарными Исследователи представили формальное доказательство того, что создание универсальных ИИ-агентов, способных эффективно работать в любых условиях, математически невозможно. Вместо единой архитектуры авторы предлагают концепцию «фрагментарных мировых моделей», где специализация агента на критических узлах принятия решений становится ключевым фактором успеха, а попытки достичь всеобщей компетентности ведут к неизбежным системным сбоям и непредсказуемым ошибкам.

← Все материалы