Исследователи из Together AI предложили новый подход к обработке длинных текстов с помощью небольших языковых моделей. Они разработали фреймворк «Divide & Conquer», который разбивает длинные документы на параллельные части и обрабатывает их с помощью нескольких моделей.

В основе метода лежит три компонента: планировщик, рабочие и менеджер. Планировщик разбивает текст на части, рабочие обрабатывают их параллельно, а менеджер объединяет результаты. Такой подход позволяет моделям Llama-3-70B и Qwen-72B превосходить GPT-4o в задачах с длинным контекстом.

Авторы отмечают, что традиционные подходы к обработке длинных текстов часто приводят к ухудшению качества. Новый метод позволяет избежать этого, используя параллельную обработку и распределение задач между несколькими моделями.

Исследование показывает, что даже небольшие модели могут эффективно справляться с длинными текстами, если использовать правильную стратегию обработки. Это открывает новые возможности для применения языковых моделей в задачах, требующих анализа больших объёмов текста.