Исследователи обнаружили, что современные системы управления памятью для ИИ-агентов, такие как mem0 или LangMem, склонны искажать информацию при её сжатии. В процессе переработки диалогов в структурированные «факты» неуверенные или гипотетические высказывания пользователей трансформируются в категоричные утверждения. В результате агенты начинают воспринимать сомнительные данные как верифицированную истину, что критически влияет на их последующие решения.

Проблема заключается в механизме консолидации памяти, который стремится к лаконичности и определенности. Когда агент сохраняет историю взаимодействия, система извлекает ключевые тезисы, отбрасывая контекст сомнений, модальные глаголы и оговорки. В итоге в векторную базу данных попадает «очищенная» версия, которая для модели выглядит как неоспоримый факт. Это создает риск галлюцинаций, основанных не на ошибках самой LLM, а на некорректной архитектуре хранения данных.

Авторы работы подчеркивают, что текущие методы RAG и агентной памяти не учитывают эпистемическую неопределенность. Агенты слепо доверяют извлеченным записям, даже если исходный источник был неточным или субъективным. Это приводит к накоплению «искусственной уверенности», когда агент с высокой долей вероятности выдает неверную информацию, опираясь на ранее сгенерированные и ошибочно интерпретированные данные.

Ключевые факты

  • Исследование выявило, что системы памяти (mem0, LangMem) систематически удаляют маркеры неуверенности из пользовательских реплик.
  • Процесс консолидации превращает предположения в жесткие утверждения, которые агент считает верифицированными данными.
  • Искажение происходит на этапе суммаризации и записи фактов в базу данных, что делает ошибку системной для агентных архитектур.
  • Агенты демонстрируют повышенный уровень уверенности в ложных фактах, полученных из сжатой памяти, что затрудняет проверку достоверности ответов.