Исследователи представили Simple-Agent — фреймворк для создания автономных ИИ-агентов, ориентированный на решение задач по написанию и отладке программного кода. В основе проекта лежит принцип минимизации сложности архитектуры: вместо многоуровневых систем оркестрации разработчики сделали ставку на прямое взаимодействие модели с инструментами разработки. Такой подход позволил достичь высоких показателей производительности на популярных бенчмарках, включая SWE-bench Pro и Verified.
В ходе тестирования система была проверена на 21 различных языковых моделях. Результаты показали, что упрощение агентного цикла позволяет эффективнее использовать возможности LLM при выполнении сложных инженерных задач. Фреймворк демонстрирует, что для достижения состояния SOTA (state-of-the-art) в задачах программирования не всегда требуются громоздкие агентные платформы. Ключевым фактором успеха стала оптимизация взаимодействия агента с файловой системой и средой исполнения кода.
Проект предоставляет открытые инструменты для оценки и тестирования агентных систем в реальных сценариях разработки. Это решение позволяет разработчикам быстрее прототипировать и внедрять автономных помощников, способных самостоятельно исправлять ошибки в коде и реализовывать новые функции. Использование данного фреймворка упрощает процесс интеграции ИИ в существующие CI/CD пайплайны, делая автоматизацию разработки более предсказуемой и масштабируемой.