Исследователи представили теоретическую модель для улучшения логических рассуждений больших языковых моделей (LLM) при работе с неполными графами знаний. Авторы предлагают математический аппарат для привязки траекторий рассуждений к фрагментарным данным, что позволяет моделям эффективнее интерпретировать контекст, когда доступная информация в графе ограничена или содержит пробелы, снижая вероятность галлюцинаций при извлечении фактов.

В основе подхода лежит концепция «сущностей-якорей» (entity anchors), которые позволяют модели соотносить свои внутренние логические шаги с конкретными узлами и связями в графе. Вместо попыток получить исчерпывающую картину мира, система учится работать с динамически извлекаемыми подграфами, которые часто являются временными или неполными. Это критически важно для RAG-систем, где качество ответов напрямую зависит от способности модели корректно обрабатывать разрозненные данные из внешних источников.

Методология формализует процесс «заземления» (grounding) рассуждений, превращая задачу поиска ответа в последовательность верифицируемых операций над графом. Такой подход позволяет минимизировать логические ошибки, возникающие из-за отсутствия прямых связей между сущностями в базе данных. Исследование предлагает новые метрики для оценки того, насколько точно модель следует структуре графа при построении цепочки рассуждений.

Ключевые факты

  • Разработана теоретическая база для привязки траекторий рассуждений LLM к неполным графам знаний.
  • Введены «сущности-якоря» для стабилизации логических выводов при дефиците данных.
  • Метод направлен на снижение галлюцинаций в RAG-системах за счет строгой верификации шагов по графу.
  • Исследование решает проблему временной и структурной неполноты данных, типичную для реальных корпоративных баз знаний.