Разработчики представили подход CEM888.AI, предлагающий использовать файловую систему в качестве основного механизма хранения и извлечения контекста для языковых моделей. В отличие от традиционных RAG-систем (Retrieval-Augmented Generation), которые опираются на векторный поиск по эмбеддингам, данный метод фокусируется на прямой работе с файловой структурой. Это позволяет модели обращаться к данным более предсказуемо, сохраняя иерархические связи и метаданные документов без потерь, характерных для семантического поиска.
Согласно опубликованным результатам, использование файловой памяти демонстрирует высокую эффективность в задачах поиска и обработки информации. Авторы заявляют о достижении точности 99,9% в задачах AR (Answer Retrieval) и 77,2% в метриках Beam Search. Такой подход позволяет избежать проблем «зашумленности» контекста, которые часто возникают при извлечении слишком большого количества похожих по смыслу, но нерелевантных фрагментов текста из векторных баз данных.
Данная архитектура упрощает процесс интеграции внешних знаний в агентные системы, так как не требует сложного процесса векторизации и настройки параметров поиска. Файловая система выступает как структурированное хранилище, к которому модель обращается через специализированные инструменты доступа. Это решение может стать значимым дополнением к существующим методам управления памятью, особенно в сценариях, где критически важна точность цитирования и работа с большими массивами структурированных документов.