Hacker News · 22.06.2026 ·Инфраструктура для агентов

Crespo: использование AST-структур для оптимизации работы LLM с кодом

Проект Crespo предлагает новый подход к взаимодействию языковых моделей с исходным кодом. Вместо передачи в модель «сырого» текста, инструмент использует возможности Tree-sitter для генерации абстрактных синтаксических деревьев (AST). Это позволяет преобразовывать сложные кодовые базы в структурированные «чертежи», которые содержат только ключевую логическую информацию, необходимую для понимания структуры программы.

Использование AST-представлений значительно снижает количество токенов, потребляемых моделью при анализе больших репозиториев. Такой метод помогает LLM точнее интерпретировать зависимости, вызовы функций и иерархию классов, минимизируя риск галлюцинаций, вызванных избыточным или нерелевантным контекстом. Структурированный формат данных упрощает для агентов навигацию по коду и выполнение задач по рефакторингу или поиску ошибок.

Решение ориентировано на интеграцию в пайплайны разработки, где требуется глубокое понимание контекста проекта. Благодаря компактности AST-схем, разработчики могут подавать в контекстное окно модели гораздо большие объемы кода без потери точности, что критически важно для работы с крупными корпоративными системами и сложными программными архитектурами.

Источник: Hacker News

Похожие материалы

Hacker News · Инфраструктура для агентов Оптимизация затрат на ИИ через маршрутизацию задач между моделями Разработчики представили плагин для Claude Code, который внедряет систему интеллектуальной маршрутизации запросов. Инструмент анализирует сложность поступающих задач и автоматически перенаправляет простые операции на специализированные компактные языковые модели (SLM), оставляя ресурсоемкие процессы для более мощных систем. Hacker News · Инфраструктура для агентов Lightpanda представила подход к выполнению LLM на этапе сборки Команда Lightpanda анонсировала инструмент Lightpanda Agent и язык PandaScript, предлагающие перенос логики работы с большими языковыми моделями с этапа выполнения (runtime) на этап сборки (buildtime). Основная идея заключается в том, чтобы выполнять вызовы LLM и обработку данных до того, как приложение будет развернуто, превращая динамические агентные процессы в статический код. Это позволяет избежать задержек при генерации ответов и снизить затраты на API в продакшене. arXiv · Модели и релизы Новый метод обнаружения ошибок в цепочках рассуждений LLM Исследователи из MIT и Университета Карнеги-Меллона предложили новый подход к выявлению ошибок в цепочках рассуждений языковых моделей (LLM) без использования меток. Их метод, основанный на операдной теории, позволяет обнаруживать несоответствия в логических цепочках, которые модели строят при решении сложных задач. Hacker News · Машинное обучение Применение поиска по дереву Монте-Карло для улучшения ответов ИИ В сообществе разработчиков обсуждают потенциал интеграции алгоритма поиска по дереву Монте-Карло (MCTS) в процесс генерации ответов большими языковыми моделями. Основная идея заключается в том, чтобы позволить модели не просто предсказывать следующее слово, а проводить многовариантное планирование и оценку различных путей рассуждения перед выдачей финального результата. Такой подход имитирует логику игровых ИИ, которые просчитывают последствия своих действий на несколько шагов вперед. Hacker News · Обучение и дообучение Оптимизация локального обучения и инференса LLM с Unsloth Библиотека Unsloth позволяет значительно ускорить процесс дообучения и запуска популярных языковых моделей на локальном оборудовании. Инструмент оптимизирует использование видеопамяти и повышает скорость вычислений при работе с архитектурами Llama, Mistral и Phi. За счет переработки алгоритмов градиентного спуска и использования специализированных ядер CUDA, разработчики добиваются снижения потребления ресурсов до 70% при сохранении точности весов. Hacker News · Модели и релизы SubQ: новая архитектура LLM для работы с длинным контекстом Разработчики представили SubQ — специализированную языковую модель, архитектура которой оптимизирована для обработки многомиллионных контекстных окон. В отличие от стандартных моделей, использующих квадратичную зависимость вычислительных затрат от длины входных данных, SubQ применяет сублинейные методы вычислений. Это позволяет значительно снизить потребление памяти и ускорить логические операции при анализе сверхдлинных документов, баз кода или массивов данных. Hacker News · Инфраструктура для агентов Запуск сторонних LLM в среде Claude Code через Cc-fleet Инструмент Cc-fleet позволяет интегрировать различные языковые модели в рабочие процессы Claude Code. Решение выступает в роли прослойки, которая перенаправляет запросы агента к альтернативным LLM, обеспечивая совместимость с инфраструктурой, изначально ориентированной на модели Anthropic. arXiv · Машинное обучение OpenAnt: новый подход к автоматическому поиску уязвимостей в коде с помощью LLM Исследователи представили OpenAnt — фреймворк для автоматизированного поиска уязвимостей в крупных репозиториях программного обеспечения. Система объединяет возможности больших языковых моделей с методами декомпозиции кода, состязательной верификации и динамического тестирования. Такой подход позволяет преодолеть ограничения традиционных инструментов статического анализа, которые часто выдают избыточное количество ложноположительных срабатываний, и динамических фаззеров, требующих сложной инфраструктуры. Hacker News · ИИ в бизнесе Эффективность LLM при аудите безопасности кода на Rust Исследование применения больших языковых моделей для поиска уязвимостей в языке программирования Rust показало неожиданно высокие результаты. Несмотря на встроенные механизмы безопасности Rust, такие как проверка владения памятью, критические ошибки все еще могут возникать в блоках unsafe или при использовании небезопасных API. Использование специализированных промптов и итеративного анализа позволяет нейросетям находить сложные логические дефекты, которые часто пропускают традиционные статические анализаторы. Hacker News · Инфраструктура для агентов Автоматическая маршрутизация запросов для оптимизации стоимости и скорости LLM Компания Factory представила инструмент для автоматической маршрутизации запросов между различными языковыми моделями. Система в режиме реального времени анализирует входящие задачи и перенаправляет их на наиболее подходящую модель, исходя из заданных параметров стоимости и времени отклика. Такой подход позволяет компаниям снизить расходы на API, не жертвуя качеством ответов в критически важных сценариях.

← Все материалы