Исследователи Google представили метод, который значительно повышает точность извлечения фактов из внутренней памяти больших языковых моделей. Вместо прямого запроса модель сначала генерирует цепочку рассуждений, что позволяет ей эффективнее активировать параметрические знания. Этот подход помогает преодолеть ограничения стандартных моделей при ответе на вопросы, требующие глубокого контекстного понимания или редких данных.

Традиционные методы извлечения информации часто сталкиваются с проблемой «галлюцинаций» или неспособностью модели вспомнить специфические факты, заложенные в веса при обучении. Новый подход, названный «Thinking to Recall», заставляет модель структурировать процесс поиска ответа, разбивая его на логические этапы. Это имитирует человеческий процесс вспоминания, когда ассоциации и контекстуальные связи помогают восстановить забытую информацию.

Эксперименты показали, что использование промежуточных рассуждений позволяет моделям лучше справляться с задачами на проверку знаний, где требуется высокая точность. Метод не требует дообучения (fine-tuning) и может быть применен к существующим архитектурам через изменение промптов или стратегий генерации. Это открывает путь к созданию более надежных систем, которые опираются на свои внутренние знания без необходимости постоянного обращения к внешним базам данных.

Ключевые факты

  • Метод «Thinking to Recall» фокусируется на активации параметрических знаний через генерацию цепочки рассуждений перед ответом.
  • Исследование подтверждает, что структурированный мыслительный процесс снижает количество ошибок при извлечении фактов из весов модели.
  • Техника не требует изменения архитектуры или дополнительного обучения, что упрощает её внедрение в текущие LLM-системы.
  • Подход демонстрирует эффективность в задачах, требующих точного воспроизведения редких или узкоспециализированных данных, заложенных в модель.