Компания Mistral AI выпустила новую модель Mistral OCR, предназначенную для высокоточного извлечения данных из сложных форматов документов, включая PDF, Word и PowerPoint. Согласно внутренним слепым тестам разработчика, новая модель превосходит конкурентов в 72% случаев, обеспечивая повышенную эффективность при обработке многостраничных файлов и структурированного контента для последующего анализа в ИИ-системах.

Релиз Mistral OCR направлен на решение проблем, с которыми часто сталкиваются стандартные мультимодальные модели при работе с нетекстовыми элементами документов. Инструмент оптимизирован для корректного распознавания таблиц, графиков и специфической верстки, что критически важно для автоматизации бизнес-процессов, связанных с обработкой первичной документации, контрактов и отчетов.

Внедрение специализированных OCR-решений позволяет значительно повысить качество RAG-систем, так как точность извлечения данных из исходных файлов напрямую влияет на релевантность ответов языковых моделей. Mistral AI позиционирует новинку как инструмент, способный заменить менее эффективные проприетарные решения, предлагая разработчикам более надежный способ подготовки данных для корпоративных приложений.

Ключевые факты

  • Mistral OCR разработана для работы с форматами PDF, DOCX и PPTX.
  • Модель показала преимущество над конкурентами в 72% случаев в ходе слепого тестирования.
  • Основной упор сделан на точность распознавания сложных структур, таких как таблицы и графики.
  • Решение ориентировано на интеграцию в пайплайны обработки данных и корпоративные системы автоматизации.