Проект Crespo предлагает новый подход к взаимодействию языковых моделей с исходным кодом. Вместо передачи в модель «сырого» текста, инструмент использует возможности Tree-sitter для генерации абстрактных синтаксических деревьев (AST). Это позволяет преобразовывать сложные кодовые базы в структурированные «чертежи», которые содержат только ключевую логическую информацию, необходимую для понимания структуры программы.

Использование AST-представлений значительно снижает количество токенов, потребляемых моделью при анализе больших репозиториев. Такой метод помогает LLM точнее интерпретировать зависимости, вызовы функций и иерархию классов, минимизируя риск галлюцинаций, вызванных избыточным или нерелевантным контекстом. Структурированный формат данных упрощает для агентов навигацию по коду и выполнение задач по рефакторингу или поиску ошибок.

Решение ориентировано на интеграцию в пайплайны разработки, где требуется глубокое понимание контекста проекта. Благодаря компактности AST-схем, разработчики могут подавать в контекстное окно модели гораздо большие объемы кода без потери точности, что критически важно для работы с крупными корпоративными системами и сложными программными архитектурами.