Разработан метод Causal Graph Memory, направленный на оптимизацию работы с длинным контекстом в больших языковых моделях. В отличие от стандартных подходов, где стоимость токенов растет пропорционально длине сессии, данная архитектура использует структуру причинно-следственного графа для хранения и извлечения информации. Это позволяет поддерживать фиксированную стоимость обработки токенов независимо от продолжительности диалога или объема накопленных данных.

Система работает путем преобразования входящих данных в узлы и связи графа, что обеспечивает более эффективное управление памятью агента. Такой подход решает проблему «забывания» информации при переполнении контекстного окна и снижает вычислительные затраты на повторную обработку истории сообщений. Метод позволяет модели обращаться к релевантным фактам из прошлых сессий без необходимости перечитывать весь массив накопленного контекста.

Реализация ориентирована на создание масштабируемых агентных систем, где критически важна долгосрочная память. Использование графовых структур для индексации знаний позволяет агентам точнее сопоставлять текущие запросы с накопленным опытом, сохраняя при этом предсказуемую производительность инференса. Технология доступна в виде открытого решения для интеграции в существующие пайплайны обработки данных и построения интеллектуальных ассистентов.