Команда Elasticsearch представила архитектурное решение для создания слоя долговременной памяти в агентных системах. Разработка опирается на возможности векторного поиска и гибридных запросов, позволяя агентам извлекать релевантный контекст из больших массивов неструктурированных данных. Использование специализированных индексов и механизмов фильтрации обеспечивает точность поиска (recall) на уровне 0.89, что критически важно для поддержания последовательности действий агента в длительных сессиях.

Система решает проблему «забывания» контекста, с которой сталкиваются стандартные LLM при работе с длинными диалогами или сложными задачами. В основе подхода лежит интеграция векторных представлений (embeddings) с традиционными методами полнотекстового поиска. Это позволяет агенту не только опираться на семантическую близость данных, но и учитывать метаданные, такие как временные метки, приоритеты задач или специфические атрибуты пользователей, что повышает точность ответов в бизнес-сценариях.

Техническая реализация включает пайплайн для обработки и индексации данных, который минимизирует задержки при обновлении памяти агента. Инструментарий позволяет динамически управлять контекстным окном, подгружая только те фрагменты информации, которые необходимы для выполнения текущего шага. Такой подход снижает затраты на токены и повышает надежность автономных систем, работающих в корпоративной среде с высокими требованиями к качеству извлекаемой информации.