Разработчики представили архитектуру памяти для ИИ-агентов, решающую проблему ограниченного контекстного окна и неэффективного извлечения данных. Система использует многоуровневый подход к хранению информации, разделяя её на краткосрочную и долгосрочную память с механизмом семантического поиска. Это позволяет агентам сохранять контекст диалогов и накопленный опыт в течение длительного времени, значительно повышая точность выполнения сложных задач.

Традиционные методы RAG часто страдают от «шума» при поиске по большим базам данных и потери связности при длинных сессиях. Новая архитектура внедряет слой динамической индексации, который приоритизирует релевантные факты в зависимости от текущей цели агента. Такой подход имитирует когнитивные процессы, позволяя модели не просто извлекать документы, а выстраивать логические цепочки на основе прошлых взаимодействий.

Внедрение подобной структуры памяти критически важно для создания автономных систем, способных работать над многоэтапными проектами без постоянного переобучения или ручной очистки контекста. Архитектура оптимизирована для работы с современными LLM, минимизируя количество токенов, необходимых для «напоминания» агенту о его предыдущих действиях и принятых решениях.

Ключевые факты

  • Архитектура разделяет данные на активный контекст и архивную память для оптимизации инференса.
  • Внедрен механизм семантической фильтрации, снижающий количество нерелевантных данных, попадающих в промпт.
  • Система поддерживает динамическое обновление весов памяти в реальном времени без необходимости полной переиндексации векторной базы.
  • Решение ориентировано на снижение затрат на токены при работе с длинными агентными сессиями.