Исследователи представили DreamReasoner-8B — открытую языковую модель, использующую метод блочной диффузии для генерации цепочек рассуждений (Chain-of-Thought). В отличие от стандартных авторегрессионных моделей, которые генерируют текст токен за токеном, блочные диффузионные модели позволяют выполнять параллельное шумоподавление сразу для нескольких сегментов текста. Это решение направлено на преодоление ограничений скорости при выполнении сложных логических задач, требующих длинных последовательностей рассуждений.
В рамках работы авторы провели систематическое исследование того, как размер блока влияет на качество и стабильность логических выводов. Эксперименты показали, что масштабирование блочного подхода позволяет ускорить процесс генерации без существенной потери точности в задачах, где критически важна последовательность шагов. Модель демонстрирует, что архитектуры на основе диффузии могут эффективно справляться с длинными цепочками рассуждений, которые ранее считались сложными для параллельной обработки.
Релиз DreamReasoner-8B предоставляет сообществу инструмент для изучения альтернативных подходов к инференсу LLM. Полученные данные о зависимости между размером блока и способностью модели к рассуждению дают основу для оптимизации будущих систем, работающих с длинным контекстом и сложной логикой. Разработка открывает возможности для создания более быстрых и эффективных моделей, способных выполнять глубокий анализ данных в режиме, приближенном к реальному времени.