Компания Modular представила обновление платформы 26.4, сфокусированное на высокопроизводительном инференсе и автоматизации разработки. Ключевые изменения включают оптимизацию работы с моделями типа Mixture-of-Experts (MoE), внедрение агентных навыков для ускорения развертывания моделей и выпуск второй бета-версии языка программирования Mojo 1.0, направленного на повышение эффективности системного программирования для задач искусственного интеллекта.
Новый релиз значительно улучшает работу с MoE-архитектурами, которые становятся стандартом для современных LLM. Благодаря оптимизации распределения вычислений, платформа позволяет достичь более высокой пропускной способности и снизить задержки при инференсе. Это критически важно для инфраструктур, работающих с тяжелыми моделями, где эффективность использования GPU напрямую влияет на стоимость эксплуатации.
Интеграция «агентных навыков» (Agent Skills) в процесс развертывания моделей позволяет автоматизировать рутинные задачи по настройке и подготовке окружения. Это упрощает переход от экспериментальных моделей к продакшн-решениям, сокращая время на «bringup» — процесс запуска и оптимизации модели на целевом оборудовании. В свою очередь, Mojo 1.0 Beta 2 продолжает развивать экосистему языка, предлагая разработчикам инструменты для написания высокопроизводительного кода, который сочетает простоту Python с производительностью C++.
Ключевые факты
- Внедрена поддержка SOTA-оптимизаций для моделей архитектуры Mixture-of-Experts (MoE).
- Реализован функционал агентных навыков для автоматизации процесса подготовки и запуска моделей.
- Выпущена версия Mojo 1.0 Beta 2 с улучшениями в компиляторе и стандартной библиотеке.
- Обновление направлено на снижение задержек и повышение эффективности использования вычислительных ресурсов при инференсе.
- Платформа Modular продолжает развивать стек для унификации разработки и развертывания ИИ-решений.