Исследователи представили метод Message Passing, который оптимизирует процесс рассуждения больших языковых моделей. В отличие от традиционных цепочек мыслей (CoT), требующих последовательных вычислений, новый подход использует параллельную обработку через обмен сообщениями между потоками модели. Это позволяет значительно сократить вычислительные затраты и время инференса при сохранении высокой точности решения сложных логических задач.

Традиционные методы масштабирования рассуждений, такие как CoT, создают «бутылочное горлышко», так как требуют генерации длинных последовательностей токенов. Альтернативные подходы на базе примитивов fork-join (разделение и объединение) позволяют распределять нагрузку, однако они часто сталкиваются с проблемами синхронизации и неэффективным использованием контекста между независимыми потоками.

Предложенная архитектура Message Passing решает эти ограничения, позволяя потокам модели обмениваться промежуточными результатами в процессе генерации. Это обеспечивает более эффективное использование вычислительных ресурсов и позволяет моделям быстрее приходить к верным выводам в задачах, требующих многошаговой логики, без необходимости кратного увеличения количества параметров или времени работы.

Ключевые факты

  • Метод Message Passing заменяет последовательные цепочки рассуждений (CoT) на параллельную архитектуру обмена данными.
  • Технология устраняет вычислительные задержки, характерные для методов fork-join, за счет оптимизации взаимодействия между потоками.
  • Подход направлен на повышение эффективности инференса при сохранении качества логического вывода в сложных задачах.
  • Исследование сфокусировано на преодолении ограничений масштабирования времени вывода (inference-time scaling) в современных LLM.