Исследователи представили Phoenix — многоагентную систему, предназначенную для полного цикла обработки задач в репозиториях GitHub: от первичной классификации до создания готового пулл-реквеста. Архитектура системы опирается на разделение ответственности между шестью специализированными агентами. В их число входят планировщик, репродуктор ошибки, разработчик, тестировщик, аналитик сбоев и агент, отвечающий за оформление PR. Координация работы между ними осуществляется через систему меток и вебхуков GitHub, что позволяет автоматизировать процесс исправления багов без участия человека.

Ключевым аспектом системы является многоуровневая стратегия безопасности, включающая семь независимых контрольных механизмов. Они предотвращают внесение некорректных изменений в кодовую базу и обеспечивают соблюдение стандартов разработки. Для проверки результатов Phoenix использует стратегию оценки, основанную на базовых тестах, что позволяет системе самостоятельно анализировать причины неудач и корректировать код до тех пор, пока проблема не будет устранена.

Данный подход демонстрирует возможность масштабируемой автоматизации инженерных процессов с использованием специализированных агентных цепочек. Использование узкопрофильных агентов в сочетании с жесткими протоколами верификации позволяет минимизировать риски, связанные с автономным внесением правок в программное обеспечение, и повышает надежность автоматизированных пайплайнов разработки.