IBM представила Granite Embedding Multilingual R2 — набор мультиязычных эмбеддингов с контекстом до 32K токенов. Это открытая модель под лицензией Apache 2.0, которая демонстрирует лучшее качество ретриваля среди моделей с менее чем 100 миллионами параметров.

Granite Embedding Multilingual R2 поддерживает более 100 языков и оптимизирована для задач информационного поиска и извлечения информации. Модель была обучена на огромном массиве данных, что позволяет ей эффективно работать с текстами на разных языках, включая редкие и малоизученные.

Для разработчиков ИИ-агентов, особенно тех, кто работает над системами с поддержкой нескольких языков, Granite Embedding Multilingual R2 может стать важным инструментом. Модель позволяет значительно улучшить качество ретриваля в системах RAG (Retrieval-Augmented Generation), что в свою очередь повышает точность и релевантность ответов агентов.

Granite Embedding Multilingual R2 доступна на платформе Hugging Face, что упрощает её интеграцию в существующие проекты. Модель может быть использована как для локального, так и для облачного развёртывания, что делает её универсальным решением для различных сценариев использования.

В перспективе Granite Embedding Multilingual R2 может стать стандартом для мультиязычных эмбеддингов, особенно в контексте разработки ИИ-агентов, где важна точность и эффективность обработки текстов на разных языках.