Исследование анализирует эффективность 11 современных языковых моделей при рефакторинге «god node» — перегруженного узла в архитектуре LangGraph. Автор тестирует способность моделей декомпозировать сложную логику, сохраняя при этом целостность графа. Результаты показывают значительные различия в качестве кода и понимании агентных потоков между проприетарными и открытыми моделями при работе с высокоуровневыми абстракциями.

В ходе эксперимента оценивалась способность ИИ справляться с архитектурным долгом, который часто возникает при масштабировании агентных систем. Основная проблема «god node» заключается в накоплении избыточной ответственности, что затрудняет тестирование и поддержку. Тестирование проводилось на задачах по разделению монолитной логики на специализированные узлы с сохранением корректной передачи состояния между ними.

Анализ подчеркивает, что выбор модели критически влияет на чистоту архитектуры агентных систем. Некоторые модели склонны к созданию избыточных связей или нарушению логики обработки состояний, в то время как другие демонстрируют более глубокое понимание паттернов проектирования, специфичных для фреймворков оркестрации агентов.

Ключевые факты

  • В тестировании участвовало 11 различных LLM, включая как закрытые API, так и открытые веса.
  • Основным объектом рефакторинга стал «god node» — узел с чрезмерной концентрацией логики в LangGraph.
  • Оценка проводилась по критериям декомпозиции, сохранения состояния и корректности графа.
  • Исследование выявило прямую зависимость между способностью модели к логическому структурированию и качеством итоговой агентной архитектуры.