Исследователи представили метод компиляции сложных агентных рабочих процессов непосредственно в веса больших языковых моделей. Вместо использования внешних оркестраторов или многошаговых промптов, логика выполнения задач «запекается» в архитектуру модели. Это позволяет значительно сократить задержки при инференсе и снизить потребность в дополнительных вычислительных ресурсах для управления цепочками рассуждений агента.

Традиционные подходы к построению агентов опираются на внешние фреймворки, которые управляют вызовами инструментов и памятью через итеративные запросы к API. Новый подход переносит эту логику на уровень параметров нейросети, превращая агентный цикл в единый процесс предсказания. Это минимизирует накладные расходы на контекстное окно и делает поведение агента более предсказуемым за счет исключения промежуточных этапов интерпретации.

Технология опирается на специализированное дообучение, при котором модель обучается имитировать последовательность действий, необходимых для решения конкретных задач. В результате модель «понимает» структуру рабочего процесса как внутреннюю закономерность, а не как набор инструкций. Такой метод открывает путь к созданию узкоспециализированных моделей, способных выполнять сложные многоэтапные операции автономно и с высокой скоростью.

Ключевые факты

  • Метод позволяет перенести логику агентных цепочек (agentic workflows) непосредственно в веса LLM.
  • Исключение внешних оркестраторов снижает задержку (latency) при выполнении многошаговых задач.
  • Подход использует специализированное дообучение для интеграции алгоритмов выполнения задач в параметры модели.
  • Технология направлена на повышение автономности моделей при работе с инструментами без необходимости в постоянном внешнем контроле.