MarkTechPost · 23.06.2026 ·Память и RAG

Mistral представила OCR 4 для структурированной обработки документов в RAG-системах

Компания Mistral AI выпустила модель OCR 4, предназначенную для извлечения данных из сложных документов в структурированном виде. Инструмент предоставляет не только текст, но и метаданные: координаты блоков, классификацию типов контента и показатели уверенности модели. Решение оптимизировано для интеграции в RAG-пайплайны и агентные системы, обеспечивая высокую точность цитирования и привязку данных к исходным страницам.

Новая модель переводит процесс обработки документов на уровень выше простого распознавания текста. Благодаря поддержке 170 языков и возможности развертывания в едином самохостируемом контейнере, OCR 4 позволяет корпоративным системам автоматизировать извлечение информации из PDF, сканов и других форматов. Использование API-эндпоинта упрощает передачу данных в векторные базы данных, минимизируя ошибки при индексации и последующем поиске.

Система ориентирована на Enterprise-сегмент, где критически важна прослеживаемость данных. Возможность получения confidence scores для каждого слова и страницы позволяет разработчикам фильтровать низкокачественные данные на этапе подготовки RAG-индекса, что напрямую влияет на точность ответов LLM и снижает вероятность галлюцинаций при работе с корпоративной документацией.

Ключевые факты

Релиз модели состоялся 23 июня 2026 года.
Поддерживается 170 языков для распознавания и классификации контента.
Каждый блок данных содержит bounding box, тип классификации и метрики уверенности (confidence scores) на уровне страниц и слов.
Модель доступна для запуска в виде единого самохостируемого контейнера.
Архитектура ориентирована на прямую интеграцию с RAG-системами и агентными рабочими процессами через единый API.

Источник: MarkTechPost

Обсудить с ИИ

Похожие материалы

Mistral AI Blog · Инфраструктура для агентов Mistral представила специализированную модель OCR 4 для обработки документов Компания Mistral AI выпустила Mistral OCR 4 — специализированную модель, предназначенную для высокоточного извлечения данных из сложных документов. Решение поддерживает 170 языков и способно распознавать не только текст, но и структуру страниц, включая таблицы, графики и формулы. Важной особенностью модели является возможность определения координат (bounding boxes) для каждого распознанного элемента, что критически важно для автоматизации бизнес-процессов и интеграции с системами документооборота. Mistral AI Blog · Модели и релизы Mistral Small 4: компактная модель с улучшенными характеристиками Mistral представила новую версию своей компактной модели Mistral Small 4. Она поддерживает контекстное окно в 128K токенов, что позволяет обрабатывать более длинные тексты и сложные запросы. Новая модель демонстрирует улучшенные показатели в различных задачах, включая понимание естественного языка и генерацию текста. Hugging Face - Blog · Машинное обучение Релиз модели PP-OCRv6 с поддержкой 50 языков Команда PaddlePaddle представила шестую версию системы оптического распознавания символов PP-OCRv6. Обновленная архитектура демонстрирует значительный прогресс в эффективности: размер моделей варьируется от компактных 1,5 млн до производительных 34,5 млн параметров. Такой диапазон позволяет развертывать систему как на мобильных устройствах с ограниченными ресурсами, так и на мощных серверных мощностях для высоконагруженных задач. Mistral AI Blog · Модели и релизы Mistral представила модель Mistral 3 с 200+ миллиардами параметров Mistral анонсировала новую модель Mistral 3, которая включает три версии: Mistral 3 12B, Mistral 3 44B и Mistral 3 200B. Все версии поддерживают работу с 128K контекстными окнами и доступны в режиме инференса на платформе Mistral AI. Mistral AI Blog · Инференс и железо Mistral Compute: инфраструктура для локального запуска моделей Mistral AI представила Mistral Compute — инфраструктуру для локального запуска больших языковых моделей. Решение позволяет развернуть модели на собственных серверах или в облаке, обеспечивая контроль над данными и снижая зависимость от сторонних сервисов. Mistral AI Blog · Память и RAG Mistral представила систему памяти для ИИ-агентов Mistral анонсировала новую систему памяти для ИИ-агентов, которая позволяет сохранять и использовать контекстные данные для более точного выполнения задач. Решение интегрируется с существующими агентными платформами и поддерживает различные форматы хранения информации. GitHub · Машинное обучение Baidu представила Unlimited OCR для обработки длинных документов Компания Baidu выпустила проект Unlimited OCR, направленный на решение проблемы распознавания текста в документах с большой протяженностью и сложной структурой. Технология ориентирована на переход к парадигме one-shot обучения, что позволяет моделям эффективно обрабатывать длинные последовательности данных без необходимости многократных итераций или сложной предварительной разметки. Hacker News · Модели и релизы Mistral AI анонсировала новую линейку моделей Mistral AI объявила о планах по выпуску новой линейки моделей. Компания намерена расширить своё портфолио, предложив пользователям более разнообразные и мощные решения для работы с искусственным интеллектом. Hacker News · Инфраструктура для агентов Обновление mistral.rs: поддержка навыков и API-совместимость Вышла новая версия библиотеки mistral.rs (v0.8.10), ориентированной на эффективный инференс больших языковых моделей. Ключевым нововведением стала поддержка навыков (skills) через стандартный интерфейс /v1/skills. Это позволяет разработчикам интегрировать агентные функции непосредственно в среду выполнения модели, обеспечивая более гибкое управление задачами и исполняемым кодом. Mistral AI Blog · Инфраструктура для агентов Mistral представила Search Toolkit для поисковых пайплайнов Mistral анонсировала Search Toolkit — фреймворк для создания поисковых пайплайнов в AI-приложениях. Он позволяет собирать и настраивать компоненты для обработки запросов, фильтрации и ранжирования результатов.

← Все материалы