Исследователи представили многоагентный подход к защите данных в RAG-системах, предотвращающий утечки конфиденциальной информации через вредоносные промпты. Метод использует семантическое переписывание извлеченного контекста, позволяя сохранять точность ответов модели при строгом соблюдении приватности. Система разделяет задачи анализа, фильтрации и реконструкции данных между специализированными агентами, что минимизирует риски компрометации чувствительных документов в процессе генерации.

Традиционные RAG-системы часто уязвимы перед атаками, направленными на извлечение данных из базы знаний через манипуляцию контекстом. Новый фреймворк решает эту проблему на этапе подготовки данных: вместо простой передачи найденных фрагментов в LLM, система пропускает их через цепочку обработки. Агенты идентифицируют приватные сущности, анализируют их семантическую роль и заменяют на безопасные аналоги, сохраняя при этом логическую связность и информативность ответа для пользователя.

Такой подход позволяет внедрять RAG в корпоративные и медицинские среды, где требования к безопасности данных являются критическими. Использование специализированных агентов для «санитарной обработки» контента обеспечивает баланс между функциональностью системы и защитой интеллектуальной собственности или персональных данных, не требуя при этом радикального изменения архитектуры самих языковых моделей.

Ключевые факты

  • Фреймворк использует три специализированных агента: для извлечения приватных данных, семантического анализа и финальной реконструкции контента.
  • Основной механизм защиты базируется на семантическом переписывании (semantic rewriting), которое удаляет чувствительные маркеры без потери контекстуальной точности.
  • Метод направлен на устранение уязвимостей, связанных с атаками типа «prompt injection» и несанкционированным извлечением данных из внешних баз знаний.
  • Решение позволяет безопасно интегрировать RAG в чувствительные бизнес-процессы, где утечка данных недопустима по регуляторным или этическим соображениям.