Исследователи представили метод SIFT (Claim-Conditioned Re-scoring), решающий проблему «разрыва обоснований» (Warrant Gap) в ИИ-системах проверки фактов. Хотя современные LLM показывают высокую точность на бенчмарках, они часто подтверждают утверждения, используя нерелевантные доказательства. Новый подход переоценивает извлеченные данные с учетом контекста исходного утверждения, что позволяет выявлять логические несоответствия между фактом и цитируемым источником.

Традиционные системы фактчекинга часто полагаются на жесткие протоколы извлечения данных, которые при декомпозиции утверждений теряют критически важный контекст. Это приводит к тому, что модель классифицирует утверждение как подтвержденное, даже если найденные фрагменты текста не содержат прямого логического обоснования для вывода. SIFT вводит этап условного переранжирования, который анализирует связь между конкретными аспектами утверждения и найденными доказательствами.

Применение SIFT позволяет более эффективно фильтровать галлюцинации и ошибки логического вывода в RAG-системах. Метод фокусируется не просто на поиске релевантных документов, а на верификации того, что найденный фрагмент действительно является достаточным основанием для признания утверждения истинным. Это повышает надежность автоматизированных систем проверки информации в задачах, требующих высокой точности цитирования.

Ключевые факты

  • SIFT (Claim-Conditioned Re-scoring) устраняет проблему «разрыва обоснований», при которой LLM выдает вердикт «подтверждено» без логической связи с доказательствами.
  • Метод использует контекстно-зависимую переоценку извлеченных фрагментов текста для проверки их соответствия конкретным частям утверждения.
  • Исследование направлено на решение фундаментальной проблемы RAG-систем: неспособности моделей различать релевантность документа и его доказательную силу.
  • Подход позволяет избежать потери контекста, характерной для жестких протоколов структурированной декомпозиции утверждений.