Разработчики представили FERNme — инструмент для управления долгосрочной памятью ИИ-агентов, ориентированный на снижение затрат на вычисления. Основная задача проекта заключается в минимизации количества обращений к языковым моделям при обновлении контекста. Вместо того чтобы каждый раз задействовать LLM для переработки накопленных данных, система использует более легкие алгоритмические подходы для структурирования и хранения информации.

Решение позволяет агентам сохранять релевантный контекст диалогов и действий, не перегружая при этом бюджет на токены. Механизм обновления памяти работает по принципу избирательного накопления, где только значимые фрагменты данных проходят через процесс семантической индексации. Это делает систему подходящей для сценариев, где требуется длительное удержание контекста в рамках сложных агентных цепочек.

Технология ориентирована на интеграцию в существующие агентные фреймворки, где стоимость инференса является критическим фактором. Использование FERNme позволяет сократить задержки при извлечении данных и оптимизировать работу с векторными хранилищами, предоставляя агентам более эффективный способ обращения к накопленному опыту без необходимости постоянного переобучения или дорогостоящих вызовов API.