Исследователи представили новую теоретическую модель, рассматривающую большие языковые модели не как простые авторегрессионные генераторы, а как высокоразмерные ассоциативные памяти. Авторы доказывают, что цепочки логических рассуждений соответствуют глубоким аттракторам в энергетическом ландшафте модели. Использование минимизации энергии по Гиббсу позволяет извлекать скрытые паттерны мышления, что открывает новые пути для повышения точности и надежности ИИ в сложных математических задачах.

Традиционный подход к LLM фокусируется на предсказании следующего токена, что часто приводит к накоплению ошибок в длинных рассуждениях. Новая концепция переосмысляет процесс генерации как поиск состояния с минимальной энергией, где правильные логические шаги выступают в роли устойчивых точек притяжения. Это позволяет модели «вспоминать» корректные структуры рассуждений, заложенные в процессе обучения, вместо того чтобы полагаться исключительно на вероятностную последовательность слов.

Метод Gibbs-Weighted Energy Minimization позволяет динамически корректировать процесс вывода, направляя модель к наиболее вероятным и логически обоснованным траекториям. Такой подход особенно эффективен в задачах, требующих многошаговой верификации, где малейшее отклонение от верного пути ведет к галлюцинациям. Исследование предлагает математический аппарат для управления этим процессом, превращая инференс в процесс оптимизации энергетического состояния системы.

Ключевые факты

  • Модели рассматриваются как Dense Associative Memories, где знания хранятся в виде латентных аттракторов.
  • Логические цепочки определены как пути в энергетическом ландшафте с глубокими минимумами.
  • Метод минимизации энергии по Гиббсу используется для динамического извлечения паттернов рассуждения.
  • Подход позволяет снизить вероятность ошибок в длинных цепочках математических вычислений.
  • Исследование меняет парадигму инференса с чисто генеративной на оптимизационную.