Исследователи предложили новый подход для повышения устойчивости диффузионных политик, которые используются в управлении физическими системами. Проблема заключается в том, что конечномерные (FD) диффузионные политики страдают от временного дрейфа из-за артефактов дискретизации, что ухудшает их производительность на длительных временных горизонтах.

Авторы работы ввели обратное уравнение Колмогорова, которое позволяет «поднять» диффузионные политики в пространство Камерона-Мартина — подмножество гильбертова пространства. Это решение заменяет стохастическое согласование оценок на детерминированное краевое задача для дифференциального уравнения в частных производных (PDE).

Подход позволяет снизить влияние случайных факторов и повысить стабильность политик при их применении в реальных физических системах. Исследование может найти применение в робототехнике, автоматизированном управлении и других областях, где требуется надёжное управление динамическими процессами.

Работа опубликована на arXiv и доступна по ссылке: https://arxiv.org/abs/2606.18186v1.