Команда PaddlePaddle представила шестую версию системы оптического распознавания символов PP-OCRv6. Обновленная архитектура демонстрирует значительный прогресс в эффективности: размер моделей варьируется от компактных 1,5 млн до производительных 34,5 млн параметров. Такой диапазон позволяет развертывать систему как на мобильных устройствах с ограниченными ресурсами, так и на мощных серверных мощностях для высоконагруженных задач.
Ключевым преимуществом новой версии стала поддержка 50 языков, что существенно расширяет возможности применения технологии в глобальных проектах. Разработчики оптимизировали алгоритмы детекции текста и распознавания символов, добившись повышения точности при работе со сложными макетами документов, рукописным вводом и низким качеством изображений. Модель показывает высокую устойчивость к шумам и искажениям, что критически важно для автоматизации обработки первичной документации и оцифровки архивов.
Инструментарий доступен на платформе Hugging Face, включая предобученные веса и документацию для интеграции в прикладные системы. Благодаря модульной структуре, пользователи могут выбирать конфигурацию модели в зависимости от требований к скорости инференса и качеству распознавания. Обновление направлено на упрощение внедрения OCR-решений в бизнес-процессы, где требуется быстрая и точная обработка текстовых данных из неструктурированных источников.
