Mistral анонсировала Codestral Embed — модель для векторизации кода. Она предназначена для интеграции в системы RAG, чтобы улучшить поиск и обработку программного кода. Модель обучена на 100 миллиардах токенов кода и поддерживает 70 языков программирования.
Codestral Embed оптимизирована для работы с большими объёмами кода. Она позволяет точно находить и извлекать релевантные фрагменты, что полезно для разработчиков и систем автоматизации. Модель доступна в двух версиях: с 350 миллионами и 1,3 миллиарда параметров.
Mistral отмечает, что Codestral Embed может использоваться для создания более умных инструментов анализа кода, включая системы рекомендаций и помощников для программистов. Модель уже доступна для тестирования и будет интегрирована в продукты компании в ближайшее время.