Hugging Face - Blog · 01.06.2026 ·Модели и релизы

Mellum2: новая 12-миллиардная модель от JetBrains для локального использования

JetBrains представила Mellum2 — новую 12-миллиардную модель, основанную на архитектуре Mixture-of-Experts (MoE). Эта модель разработана для эффективного локального использования, что делает её особенно интересной для разработчиков ИИ-агентов, которым важна производительность на локальных устройствах.

Mellum2 использует технологию MoE, которая позволяет модели активировать только те части нейросети, которые необходимы для конкретной задачи. Это значительно снижает вычислительные затраты и делает модель более энергоэффективной. Модель поддерживает инференс на GPU и CPU, что расширяет её возможности для использования в различных сценариях.

Одной из ключевых особенностей Mellum2 является её способность работать с русским языком. Это делает её особенно полезной для разработчиков, создающих ИИ-агентов для русскоязычной аудитории. Модель была обучена на большом количестве текстов на русском языке, что обеспечивает высокое качество её ответов.

Mellum2 доступна на платформе Hugging Face и может быть легко интегрирована в существующие проекты. Это открывает новые возможности для разработчиков ИИ-агентов, которые ищут эффективные и мощные решения для локального использования. Модель может стать важным инструментом в арсенале тех, кто работает над созданием интеллектуальных агентов, способных работать в оффлайн-режиме.

Источник: Hugging Face - Blog

Обсудить с ИИ

Похожие материалы

Hacker News · Модели и релизы Локальный запуск моделей стал реальностью В последнее время локальный запуск больших языковых моделей (LLM) стал значительно проще и доступнее. Это связано с развитием технологий, которые позволяют запускать мощные модели даже на обычных ноутбуках. Например, модели вроде GPT-4 или Llama 2 теперь можно развернуть локально с помощью таких фреймворков, как Ollama или LM Studio. Это открывает новые возможности для разработчиков, которые хотят создавать ИИ-агенты с минимальными затратами на инфраструктуру. Hacker News · Модели и релизы AMD представила Instella-MoE: открытую модель с архитектурой Mixture-of-Experts Компания AMD выпустила Instella-MoE — новую открытую языковую модель, построенную на архитектуре Mixture-of-Experts (MoE). Релиз направлен на оптимизацию производительности при выполнении сложных вычислительных задач на аппаратном обеспечении AMD, включая использование стека ROCm. Модель демонстрирует эффективность в задачах инференса, сочетая высокую скорость обработки данных с качеством генерации, сопоставимым с современными аналогами аналогичного размера. Hacker News · Инфраструктура для агентов Обновление Modular 26.4: оптимизация MoE, агентные навыки и Mojo 1.0 Beta 2 Компания Modular представила обновление платформы 26.4, сфокусированное на высокопроизводительном инференсе и автоматизации разработки. Ключевые изменения включают оптимизацию работы с моделями типа Mixture-of-Experts (MoE), внедрение агентных навыков для ускорения развертывания моделей и выпуск второй бета-версии языка программирования Mojo 1.0, направленного на повышение эффективности системного программирования для задач искусственного интеллекта. MarkTechPost · Модели и релизы Thinking Machines Lab представила мультимодальную модель Inkling с 975 млрд параметров Лаборатория Thinking Machines Lab выпустила Inkling — мультимодальную модель с архитектурой Mixture-of-Experts (MoE), содержащую 975 млрд параметров. Модель поддерживает работу с текстом, изображениями и аудио, предлагая пользователям возможность гибко настраивать «усилия на размышление» (thinking effort) при генерации ответов. Веса модели опубликованы под лицензией Apache 2.0, что делает её доступной для широкого использования в исследовательских и прикладных целях. Microsoft Research · Оркестрация агентов MagenticLite: агентная система для малых моделей от Microsoft Research Microsoft Research представила MagenticLite — агентную систему, оптимизированную для работы с малыми моделями. Она поддерживает выполнение задач как в браузере, так и в локальной файловой системе, что делает её универсальным решением для повседневных задач. Система объединяет специализированные модели и оркестрацию, что позволяет эффективно использовать ограниченные вычислительные ресурсы. The Decoder · Модели и релизы Tencent представила открытую модель Hy3 с архитектурой Mixture-of-Experts Компания Tencent выпустила открытую языковую модель Hy3, использующую архитектуру Mixture-of-Experts (MoE). При общем объеме в 295 миллиардов параметров, модель задействует лишь 21 миллиард параметров для обработки каждого токена. Разработчики заявляют, что Hy3 сопоставима по качеству с моделями, превосходящими её по размеру в 2–5 раз, при этом уровень галлюцинаций снижен до 5,4%. Hacker News · Оркестрация агентов Mixture of Actors: новый подход к масштабированию агентных систем Концепция Mixture of Actors (MoA) предлагает архитектурное решение для повышения производительности ИИ-агентов через динамическую маршрутизацию задач между специализированными моделями. Вместо использования одной универсальной LLM, система распределяет запросы между пулом агентов, оптимизируя точность ответов и снижая вычислительные затраты за счет выбора наиболее подходящего исполнителя для конкретного типа подзадачи в реальном времени. Simon Willison's Weblog · Модели и релизы Microsoft представил две новые модели ИИ MAI-Thinking-1 и MAI-Code-1-Flash Microsoft объявил о выпуске двух новых текстовых моделей ИИ: MAI-Thinking-1 и MAI-Code-1-Flash. MAI-Thinking-1 — это модель для рассуждений с 1 триллионом параметров, из которых 35 миллиардов активны. Она доступна для "выбранных ранних партнеров". MAI-Code-1-Flash, с 137 миллиардами параметров и 5 миллиардами активных, специально разработана для GitHub Copilot и VS Code, чтобы обеспечить высокую производительность и низкую стоимость. Эта модель уже начинает выкатываться для индивидуальных пользователей GitHub Copilot в Visual Studio Code. Hugging Face - Blog · Оценка и бенчмарки Новый подход к оценке агентных способностей открытых моделей Hugging Face представила методологию для оценки того, насколько эффективно языковые модели справляются с использованием внешних инструментов. В отличие от стандартных тестов на логику или знание фактов, новый подход фокусируется на способности модели вызывать функции, интерпретировать ответы API и корректировать свои действия в рамках многошаговых задач. Это позволяет разработчикам точнее определять, какая модель лучше подходит для создания автономных агентов. Hacker News · Модели и релизы Tencent представила Hy3: эффективная модель для рассуждений и агентных задач Tencent выпустила Hy3 (Hunyuan-3), специализированную модель с 295 миллиардами параметров, ориентированную на сложные логические рассуждения и выполнение агентных задач. Разработчики сделали упор на высокую вычислительную эффективность, оптимизировав архитектуру для снижения затрат на инференс при сохранении производительности, сопоставимой с ведущими проприетарными решениями в задачах планирования и работы с инструментами.

← Все материалы