Компания Datalab выпустила lift — открытую мультимодальную модель с 9 миллиардами параметров, предназначенную для преобразования PDF-документов и изображений в структурированный JSON. Инструмент использует схематически ограниченное декодирование и механизм обучения воздержанию от ответов, что позволяет модели возвращать пустые значения вместо генерации галлюцинаций при отсутствии данных в исходном файле.
Основная задача модели — автоматизация обработки документов, где критически важна точность извлечения полей. В отличие от стандартных LLM, lift жестко придерживается заданных пользователем схем, что гарантирует валидность выходного формата. Это упрощает интеграцию модели в существующие ETL-пайплайны и системы обработки данных, требующие строгой типизации и предсказуемого поведения на входе.
Технология опирается на специализированное обучение, которое минимизирует ошибки интерпретации визуальных данных. Модель демонстрирует высокую эффективность в задачах, где требуется извлечение специфических атрибутов из таблиц, форм и счетов, обеспечивая стабильную работу даже с документами сложной верстки.
Ключевые факты
- Модель lift содержит 9 миллиардов параметров и распространяется с открытыми весами.
- Точность извлечения полей достигает 90,2% согласно внутреннему бенчмарку на 225 документах.
- Использование схемы при декодировании исключает ошибки структуры JSON.
- Механизм «обученного воздержания» позволяет модели возвращать null, если поле отсутствует в документе, предотвращая галлюцинации.
