Представлен проект Enki — специализированная система управления памятью для ИИ-агентов, ориентированная на снижение затрат при сохранении высокой точности ответов. Разработка позволяет сократить объем потребляемых ресурсов примерно в два раза по сравнению с традиционными методами хранения контекста, обеспечивая при этом сопоставимое качество генерации ответов в агентных сценариях.

Система решает проблему избыточности данных в долгосрочной памяти агентов, где хранение всей истории взаимодействия приводит к неоправданному росту расходов на токены и замедлению работы. Enki использует алгоритмы фильтрации и сжатия, которые выделяют наиболее значимые фрагменты информации, необходимые для выполнения текущих задач, отсекая шум и дублирующиеся данные.

Подход ориентирован на разработчиков, создающих масштабируемые агентные системы, где критически важна оптимизация контекстного окна. В отличие от стандартных векторных баз данных, решение сфокусировано на динамическом управлении памятью в процессе выполнения запросов, что позволяет агентам эффективнее использовать доступные ресурсы LLM.

Ключевые факты

  • Enki обеспечивает снижение затрат на память примерно на 50% при сохранении качества ответов.
  • Проект включает набор бенчмарков для оценки эффективности управления контекстом в агентных системах.
  • Система оптимизирует передачу данных в LLM, минимизируя использование токенов без потери релевантности контекста.
  • Решение доступно в формате открытого исходного кода на GitHub для интеграции в существующие агентные фреймворки.