Исследователи представили концепцию агент-ориентированной системы памяти, которая выходит за рамки классического RAG. В отличие от статических векторных баз данных, новая архитектура предлагает динамическое управление контекстом, позволяя ИИ-агентам самостоятельно структурировать, обновлять и извлекать накопленный опыт в зависимости от текущих задач, что критически важно для долгосрочной автономной работы сложных систем.

Современные подходы к работе с памятью в LLM часто ограничены поиском по семантическому сходству, что приводит к потере контекста при длительных взаимодействиях. Предложенная модель предполагает переход к иерархическим структурам хранения, где агент не просто считывает данные, а активно управляет их жизненным циклом: от фильтрации шума до синтеза новых знаний на основе прошлых сессий.

Такой подход решает проблему «забывания» и накопления нерелевантной информации, с которой сталкиваются разработчики при масштабировании агентных систем. Система имитирует когнитивные процессы, разделяя кратковременную рабочую память и долговременное хранилище, что позволяет агентам сохранять последовательность действий и учитывать специфические предпочтения пользователя на протяжении недель или месяцев.

Ключевые факты

  • Предложена архитектура, разделяющая память на рабочую (активный контекст) и долговременную (архив знаний).
  • Внедрен механизм динамической приоритизации данных, основанный на частоте обращения и релевантности текущей цели агента.
  • Система поддерживает автоматическую дедупликацию и сжатие информации для оптимизации использования токенов при инференсе.
  • Предложенный фреймворк позволяет агентам самостоятельно проводить рефлексию над накопленным опытом для улучшения будущих ответов.