arXiv · 23.06.2026 ·Машинное обучение

Posterior Refinement: новый метод ускорения генерации текста в неавторегрессионных моделях

Исследователи представили метод Posterior Refinement, решающий проблему низкой эффективности неавторегрессионных языковых моделей. Новый подход использует Any-Order Flow Maps для итеративного уточнения текста, позволяя моделям критиковать и перегенерировать произвольные фрагменты токенов одновременно. Это устраняет ошибки факторизации, характерные для маскированных диффузионных моделей, и значительно повышает качество генерации при сохранении высокой скорости работы.

Традиционные неавторегрессионные модели часто сталкиваются с деградацией качества при попытке генерировать несколько токенов за один шаг. Авторы работы переосмыслили процесс итеративного уточнения, внедрив механизм, который позволяет модели гибко управлять процессом генерации, не ограничиваясь строгой последовательностью. Это открывает путь к созданию более быстрых и точных систем, способных к глубокому редактированию собственного контента в процессе вывода.

Предложенная архитектура демонстрирует, как математически обоснованное управление потоками данных позволяет избежать коллапса распределения вероятностей. Метод обеспечивает баланс между скоростью параллельной генерации и качеством, которое ранее было доступно только авторегрессионным моделям. Исследование предлагает новый взгляд на архитектурные принципы построения генеративных систем, ориентированных на высокую производительность.

Ключевые факты

Метод Posterior Refinement использует Any-Order Flow Maps для оптимизации процесса итеративного уточнения токенов.
Решение устраняет ошибки факторизации, которые приводили к снижению качества в маскированных диффузионных моделях (MDM).
Подход позволяет моделям рекурсивно анализировать, удалять и перегенерировать произвольные подмножества токенов без потери связности текста.
Технология направлена на преодоление ограничений неавторегрессионной генерации, обеспечивая высокую скорость вывода при сохранении точности генерации.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

← Все материалы