Представлен проект Enki — специализированная система управления памятью для ИИ-агентов, ориентированная на снижение затрат при сохранении высокой точности ответов. Разработка позволяет сократить объем потребляемых ресурсов примерно в два раза по сравнению с традиционными методами хранения контекста, обеспечивая при этом сопоставимое качество генерации ответов в агентных сценариях.
Система решает проблему избыточности данных в долгосрочной памяти агентов, где хранение всей истории взаимодействия приводит к неоправданному росту расходов на токены и замедлению работы. Enki использует алгоритмы фильтрации и сжатия, которые выделяют наиболее значимые фрагменты информации, необходимые для выполнения текущих задач, отсекая шум и дублирующиеся данные.
Подход ориентирован на разработчиков, создающих масштабируемые агентные системы, где критически важна оптимизация контекстного окна. В отличие от стандартных векторных баз данных, решение сфокусировано на динамическом управлении памятью в процессе выполнения запросов, что позволяет агентам эффективнее использовать доступные ресурсы LLM.
Ключевые факты
- Enki обеспечивает снижение затрат на память примерно на 50% при сохранении качества ответов.
- Проект включает набор бенчмарков для оценки эффективности управления контекстом в агентных системах.
- Система оптимизирует передачу данных в LLM, минимизируя использование токенов без потери релевантности контекста.
- Решение доступно в формате открытого исходного кода на GitHub для интеграции в существующие агентные фреймворки.