Исследователи представили метод борьбы с галлюцинациями в генеративных мировых моделях, которые создают реалистичные, но физически недостоверные прогнозы будущего. Авторы установили, что ошибки накапливаются в областях пространства состояний с низкой плотностью обучающих данных. Использование легковесных сигналов позволяет эффективно выявлять такие отклонения и корректировать траектории моделей, обеспечивая их соответствие реальной динамике среды.

Проблема заключается в том, что современные модели визуально убедительны, но часто теряют связь с физическими законами при длительном планировании. Галлюцинации возникают там, где модель сталкивается с редкими сценариями, не представленными в обучающей выборке в достаточном объеме. Вместо переобучения всей архитектуры, предложенный подход фокусируется на анализе «покрытия» данных, что позволяет системе «понимать», когда она выходит за пределы своей компетенции.

Методология опирается на дата-центричный подход: вместо усложнения нейросетевых архитектур предлагается внедрение механизмов мониторинга, которые отслеживают неопределенность модели в реальном времени. Это позволяет не только детектировать ошибки на ранних этапах, но и направлять процесс генерации, принудительно возвращая модель в область высокой достоверности данных.

Ключевые факты

  • Галлюцинации в мировых моделях напрямую коррелируют с низкой плотностью данных в пространстве состояний и действий.
  • Предложенный метод использует легковесные сигналы для детекции ошибок без необходимости полной перетренировки нейросети.
  • Подход позволяет корректировать динамику «развертки» будущего, предотвращая визуально правдоподобные, но физически невозможные сценарии.
  • Исследование подтверждает гипотезу о том, что предсказуемость галлюцинаций является ключом к их предотвращению в автономных системах.