arXiv · 16.06.2026 ·Машинное обучение

Новый подход к распознаванию таблиц в мультизадачном режиме

Исследователи предложили новый метод для распознавания таблиц, который объединяет три задачи: предсказание структуры таблицы, локализацию ячеек и распознавание содержимого ячеек. В отличие от традиционных подходов, которые используют авторегрессивные декодеры, новый метод применяет порядково-независимые представления на уровне ячеек. Это позволяет избежать проблем, связанных с авторегрессивным генерацией, где порядок обработки ячеек может влиять на качество распознавания.

Авторы работы утверждают, что их метод обеспечивает более стабильные и точные результаты. Они также отмечают, что новый подход может быть полезен в различных приложениях, включая обработку документов и анализ данных. Исследование было опубликовано на arXiv и доступно по ссылке.

Разработчики подчеркивают, что их метод может быть интегрирован в существующие системы обработки таблиц, что делает его потенциально полезным для бизнеса и научных исследований. Они также планируют дальнейшие исследования для улучшения точности и эффективности метода.

Исследование представляет собой важный шаг в развитии технологий распознавания таблиц, которые играют ключевую роль в автоматизации обработки данных и анализе информации.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

arXiv · Исследования и наука Новый метод для мультимодального разрешения кореферентности без предварительного обучения Исследователи предложили новый подход Plug-and-Adapt для мультимодального разрешения кореферентности (MCR), который не требует предварительного обучения на аннотированных данных. В статье на arXiv показано, что визуальная информация помогает устранять неоднозначности в тексте, что значительно повышает точность системы. arXiv · Машинное обучение Новый метод выявления скрытых групп данных для повышения точности моделей Исследователи представили новый подход к решению проблемы ложных корреляций в машинном обучении. Современные модели часто показывают высокую среднюю точность, но допускают критические ошибки на недостаточно представленных подгруппах данных. Традиционные методы борьбы с этим явлением обычно требуют либо предварительной разметки подгрупп, либо использования псевдометок, которые не дают интерпретируемого результата на этапе инференса. arXiv · Машинное обучение Новый подход к анализу сложной иерархической структуры газетных полос Исследователи представили комплексный метод анализа газетных изображений, отличающихся высокой плотностью и сложной вложенной версткой. Решение объединяет модульный пайплайн на базе YOLO и LayoutReader для определения порядка чтения с подходом «сверху вниз», использующим специализированные визуально-языковые модели. Это позволяет эффективно извлекать данные из гетерогенных макетов, где традиционные алгоритмы распознавания часто допускают ошибки. Hacker News · Оркестрация агентов Многоагентный подход к извлечению таблиц из PDF Разработчики Unstract представили архитектуру для извлечения табличных данных из PDF-документов, основанную на разделении задачи между шестью специализированными ИИ-агентами и последующим этапом генерации кода. Такой подход позволяет преодолеть ограничения стандартных LLM при обработке сложных структур, обеспечивая высокую точность парсинга даже в документах с нестандартным форматированием и разрывами страниц. arXiv · Машинное обучение Новый метод генерации корреляционных матриц на основе графовых структур Исследователи представили метод генерации теоретических корреляционных матриц с заданными шаблонами разреженности, опирающийся на графовые структуры. Подход использует фреймворк выпуклой оптимизации для проецирования начальной матрицы на эллиптоп при соблюдении условий положительной полуопределенности. Разработанные численные схемы позволяют эффективно решать задачи, возникающие при анализе сложных зависимостей в данных и машинном обучении. arXiv · Машинное обучение Автоматизация дешифровки клинописи с помощью компьютерного зрения Исследователи представили новый пайплайн для автоматического распознавания клинописных знаков на глиняных табличках. Проект решает проблему нехватки данных в ассириологии: из полумиллиона найденных артефактов эксперты успели проанализировать лишь малую часть из-за сложности ручной расшифровки. Разработанный метод использует крупнейший на сегодняшний день размеченный датасет клинописных символов для обучения моделей компьютерного зрения. Hacker News · Машинное обучение Новый подход к законам масштабирования может изменить обучение ИИ-моделей Исследователи из Стэнфордского университета предложили новый подход к законам масштабирования, который может существенно повлиять на процесс обучения искусственных нейронных сетей. Традиционные законы масштабирования описывают, как увеличение размера модели и объёма данных влияет на её производительность. Однако новый метод позволяет более точно предсказывать, как изменения в архитектуре модели и данных повлияют на её точность и эффективность. arXiv · Машинное обучение Новый метод адаптивного обучения для работы с графовыми данными Исследователи представили метод Adaptive Recurrent Message Passing, который решает проблему несовместимости предобученных моделей с графовыми структурами данных. Традиционные архитектуры часто оказываются неэффективными при работе с графами из-за фиксированной структуры нейронных сетей, которая не учитывает динамическую природу связей между узлами. Новый подход позволяет моделям адаптироваться непосредственно в процессе вычислений, используя рекуррентную передачу сообщений. arXiv · Машинное обучение Новый графовый метод для определения порядка чтения в сложных документах Исследователи представили метод определения порядка чтения в сложных документах, таких как исторические рукописи с нелинейной версткой. Решение позволяет восстанавливать последовательность текста в макетах с комментариями, обтекающими основной блок по непрямоугольным траекториям. Подход не требует дополнительного обучения моделей, опираясь на графовые алгоритмы для анализа пространственных связей между текстовыми блоками и их логической структурой. arXiv · Машинное обучение Метод декомпозиции задач для повышения эффективности разметки данных Исследователи представили новый подход к разметке структурированных данных, основанный на декомпозиции сложных задач на более простые подзадачи. Метод позволяет значительно снизить затраты на создание качественных обучающих выборок, минимизируя необходимость в дорогостоящей ручной проверке результатов, полученных с помощью моделей, и повышая общую точность разметки для последующего обучения downstream-моделей.

← Все материалы