Hacker News · 27.06.2026 ·Инфраструктура для агентов

Обновление Modular 26.4: оптимизация MoE, агентные навыки и Mojo 1.0 Beta 2

Компания Modular представила обновление платформы 26.4, сфокусированное на высокопроизводительном инференсе и автоматизации разработки. Ключевые изменения включают оптимизацию работы с моделями типа Mixture-of-Experts (MoE), внедрение агентных навыков для ускорения развертывания моделей и выпуск второй бета-версии языка программирования Mojo 1.0, направленного на повышение эффективности системного программирования для задач искусственного интеллекта.

Новый релиз значительно улучшает работу с MoE-архитектурами, которые становятся стандартом для современных LLM. Благодаря оптимизации распределения вычислений, платформа позволяет достичь более высокой пропускной способности и снизить задержки при инференсе. Это критически важно для инфраструктур, работающих с тяжелыми моделями, где эффективность использования GPU напрямую влияет на стоимость эксплуатации.

Интеграция «агентных навыков» (Agent Skills) в процесс развертывания моделей позволяет автоматизировать рутинные задачи по настройке и подготовке окружения. Это упрощает переход от экспериментальных моделей к продакшн-решениям, сокращая время на «bringup» — процесс запуска и оптимизации модели на целевом оборудовании. В свою очередь, Mojo 1.0 Beta 2 продолжает развивать экосистему языка, предлагая разработчикам инструменты для написания высокопроизводительного кода, который сочетает простоту Python с производительностью C++.

Ключевые факты

Внедрена поддержка SOTA-оптимизаций для моделей архитектуры Mixture-of-Experts (MoE).
Реализован функционал агентных навыков для автоматизации процесса подготовки и запуска моделей.
Выпущена версия Mojo 1.0 Beta 2 с улучшениями в компиляторе и стандартной библиотеке.
Обновление направлено на снижение задержек и повышение эффективности использования вычислительных ресурсов при инференсе.
Платформа Modular продолжает развивать стек для унификации разработки и развертывания ИИ-решений.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

Hacker News · Модели и релизы Новые SOTA-модели для агентного программирования В сфере разработки ИИ-агентов для написания кода произошел очередной сдвиг: новые модели установили новые рекорды производительности в задачах автоматизированного программирования. Эти системы демонстрируют улучшенную способность к рассуждению и выполнению многошаговых задач, что позволяет им эффективнее справляться с написанием, отладкой и интеграцией сложных программных модулей без участия человека. Hugging Face - Blog · Модели и релизы Mellum2: новая 12-миллиардная модель от JetBrains для локального использования JetBrains представила Mellum2 — новую 12-миллиардную модель, основанную на архитектуре Mixture-of-Experts (MoE). Эта модель разработана для эффективного локального использования, что делает её особенно интересной для разработчиков ИИ-агентов, которым важна производительность на локальных устройствах. Hacker News · Память и RAG MiMo Code: масштабирование агентов для сложных задач Команда Xiaomi представила фреймворк MiMo Code, который позволяет масштабировать ИИ-агентов для выполнения задач с длинным горизонтом. Это значит, что агенты могут работать с многоэтапными процессами, требующими последовательного выполнения действий и координации между разными модулями. MarkTechPost · Обучение и дообучение Релиз prime-rl 0.6.0 для обучения масштабных MoE-моделей Компания Prime Intellect представила обновленный фреймворк prime-rl версии 0.6.0, предназначенный для асинхронного обучения с подкреплением (RL) на базе архитектур Mixture-of-Experts (MoE) с триллионными параметрами. Инструмент ориентирован на решение сложных агентных задач, требующих работы с длинными контекстами и высокой вычислительной эффективностью. В ходе тестирования система продемонстрировала возможность обучения модели GLM-5 с длиной последовательности до 131 тысячи токенов. NVIDIA Technical Blog · Модели и релизы Как NVIDIA ускорила обучение MoE-моделей на 30% NVIDIA представила новые методы оптимизации обучения Mixture-of-Experts (MoE) моделей, которые стали ключевым компонентом современных ИИ-систем. Исследователи компании разработали продвинутые ядра слияния (fusion kernels), которые позволяют значительно ускорить процесс обучения. Hacker News · Инфраструктура для агентов Обновление mistral.rs: поддержка навыков и API-совместимость Вышла новая версия библиотеки mistral.rs (v0.8.10), ориентированной на эффективный инференс больших языковых моделей. Ключевым нововведением стала поддержка навыков (skills) через стандартный интерфейс /v1/skills. Это позволяет разработчикам интегрировать агентные функции непосредственно в среду выполнения модели, обеспечивая более гибкое управление задачами и исполняемым кодом. arXiv · Инфраструктура для агентов FoMoE: новый подход к обучению MoE-моделей через федерацию экспертов Исследователи представили архитектуру FoMoE (Federation of Mixture-of-Experts), которая решает проблему жесткой привязки параметров модели к вычислительной инфраструктуре. Традиционные методы обучения крупных языковых моделей требуют использования массивов тесно связанных ускорителей, что ограничивает масштабируемость. Новый подход позволяет распределять экспертов в составе MoE-архитектуры между независимыми вычислительными узлами, снимая барьер «полной репликации» весов модели на каждом устройстве. Hacker News · Инфраструктура для агентов Nvidia представила BioNeMo Agent Toolkit для ускорения научных исследований Nvidia выпустила BioNeMo Agent Toolkit — специализированный набор инструментов для создания ИИ-агентов, предназначенных для автоматизации процессов в биологии и химии. Платформа позволяет исследователям интегрировать генеративные модели в рабочие процессы по разработке лекарств, обеспечивая автономный поиск молекулярных структур и анализ данных, что значительно сокращает время на проведение лабораторных экспериментов и моделирование сложных биологических систем. arXiv · Модели и релизы Новый метод SoftMoE для эффективного масштабирования LLM Исследователи предложили новый подход SoftMoE для улучшения работы архитектур Mixture-of-Experts (MoE) в языковых моделях. Традиционные MoE используют top-k маршрутизацию, которая активирует только часть экспертов, но из-за недифференцируемости этого оператора число активных экспертов фиксировано, что приводит к неэффективному использованию вычислительных ресурсов. Hacker News · Инфраструктура для агентов Moa: инструмент для перекрестной проверки ответов LLM в CLI Moa — это CLI-инструмент, который внедряет механизм перекрестной проверки (peer review) в рабочий процесс локальных ИИ-агентов. Система позволяет использовать несколько LLM для анализа одного запроса: одна модель генерирует ответ, а другие выступают в роли рецензентов, оценивая качество, точность и логику вывода, что помогает минимизировать галлюцинации и повысить надежность агентных систем.

← Все материалы