Представлена модель Qwen-AgentWorld-35B-A3B — специализированная «модель мира», оптимизированная для работы на потребительском оборудовании. Архитектура использует 35 миллиардов параметров с активным использованием 3 миллиардов на токен, что позволяет эффективно решать задачи агентного планирования и взаимодействия с внешней средой, сохраняя при этом высокую скорость генерации и низкие требования к оперативной памяти.

Данная разработка ориентирована на создание автономных агентов, способных функционировать локально без обращения к облачным API. Модель обучена на специфических наборах данных, имитирующих агентные сценарии, что улучшает качество принятия решений в многошаговых процессах. Использование разреженной архитектуры (MoE) позволяет достичь производительности, сопоставимой с более крупными моделями, при значительно меньших затратах вычислительных ресурсов.

Развертывание таких систем на локальных мощностях открывает новые возможности для приватной автоматизации и разработки сложных агентных пайплайнов. Это решение снижает зависимость от проприетарных сервисов и позволяет интегрировать продвинутые способности рассуждения непосредственно в локальную инфраструктуру, что критически важно для задач, требующих высокой конфиденциальности данных или работы в условиях ограниченного интернет-соединения.

Ключевые факты

  • Модель содержит 35 миллиардов параметров в общем объеме.
  • Активное количество параметров на один токен составляет 3 миллиарда.
  • Архитектура оптимизирована для локального запуска на потребительском железе.
  • Модель специализируется на задачах агентного планирования и «моделирования мира».
  • Решение позволяет минимизировать задержки и затраты на инференс за счет снижения требований к VRAM.