JetBrains представила Mellum2 — новую 12-миллиардную модель, основанную на архитектуре Mixture-of-Experts (MoE). Эта модель разработана для эффективного локального использования, что делает её особенно интересной для разработчиков ИИ-агентов, которым важна производительность на локальных устройствах.

Mellum2 использует технологию MoE, которая позволяет модели активировать только те части нейросети, которые необходимы для конкретной задачи. Это значительно снижает вычислительные затраты и делает модель более энергоэффективной. Модель поддерживает инференс на GPU и CPU, что расширяет её возможности для использования в различных сценариях.

Одной из ключевых особенностей Mellum2 является её способность работать с русским языком. Это делает её особенно полезной для разработчиков, создающих ИИ-агентов для русскоязычной аудитории. Модель была обучена на большом количестве текстов на русском языке, что обеспечивает высокое качество её ответов.

Mellum2 доступна на платформе Hugging Face и может быть легко интегрирована в существующие проекты. Это открывает новые возможности для разработчиков ИИ-агентов, которые ищут эффективные и мощные решения для локального использования. Модель может стать важным инструментом в арсенале тех, кто работает над созданием интеллектуальных агентов, способных работать в оффлайн-режиме.