Исследователи представили метод SPIRAL, направленный на повышение качества логических рассуждений языковых моделей на этапе инференса. Текущие подходы к дообучению моделей фокусируются преимущественно на последовательном построении цепочки рассуждений в рамках одного прохода. Новый подход предлагает использовать специальные каркасы (scaffolds), которые масштабируют вычислительные ресурсы за счет комбинирования различных примитивов: последовательного вывода, параллельной генерации независимых вариантов рассуждений и последующей агрегации этих данных в итоговый ответ.
Основная проблема существующих моделей заключается в том, что в процессе пост-тренировки они оптимизируются только для линейного мышления. Это ограничивает их способность к самокоррекции и пересмотру промежуточных выводов. Метод SPIRAL позволяет модели не просто следовать по одному пути, а исследовать пространство возможных решений, сопоставляя разные логические цепочки перед формированием финального результата. Такой подход имитирует процесс активного поиска, где модель может оценивать несколько гипотез одновременно.
Эксперименты показывают, что интеграция механизмов поиска и агрегации значительно повышает точность ответов в задачах, требующих многошаговой логики. Использование параллельных траекторий рассуждений позволяет снизить вероятность ошибок, характерных для моделей, ограниченных единственной цепочкой мыслей. Разработка открывает возможности для более эффективного использования вычислительных мощностей при инференсе, позволяя моделям демонстрировать более глубокий уровень анализа без необходимости дополнительного дообучения под каждую конкретную задачу.