Компания Mistral AI выпустила Leanstral 1.5 — специализированную модель, предназначенную для работы с языком формальной верификации Lean 4. Модель демонстрирует высокую эффективность в решении математических задач, успешно справившись с 587 из 672 проблем в бенчмарке PutnamBench. Релиз распространяется под лицензией Apache-2.0, что делает его доступным для широкого использования в исследовательских и инженерных задачах.

Leanstral 1.5 базируется на архитектуре Mixture-of-Experts (MoE) с общим количеством параметров 119 млрд. При этом для обработки каждого токена активируется только 6,5 млрд параметров, что обеспечивает баланс между вычислительной мощностью и скоростью инференса. Модель ориентирована на автоматизацию доказательства теорем и поиск ошибок в коде, что является критически важным направлением для создания надежных программных систем.

Внедрение подобных инструментов позволяет автоматизировать формальную верификацию, снижая вероятность логических ошибок в критически важном ПО. Способность модели работать с Lean 4 открывает новые возможности для интеграции ИИ-агентов в процессы разработки, где требуется математическая точность и строгая проверка корректности алгоритмов.

Ключевые факты

  • Модель Leanstral 1.5 решает 587 из 672 задач в бенчмарке PutnamBench.
  • Архитектура MoE включает 119 млрд параметров, из которых 6,5 млрд задействуются на каждый токен.
  • Модель полностью поддерживает язык Lean 4 и распространяется по лицензии Apache-2.0.
  • Решение демонстрирует высокую эффективность в задачах формальной верификации и автоматизированного поиска багов.