Исследователи представили метод высокопараллельной оценки расстояния Слайсед-Вассерштейна (SW), основанный на использовании функций кумулятивного распределения (CDF). Новый подход позволяет избежать затратной по времени сортировки данных, необходимой в классических методах Монте-Карло, что существенно ускоряет вычисления при работе с большими наборами данных и многомерными распределениями в задачах машинного обучения.

Расстояние Вассерштейна является мощным инструментом для сравнения вероятностных распределений, однако его вычислительная сложность ограничивает применение в глубоком обучении. Вариант Слайсед-Вассерштейна упрощает задачу, сводя её к одномерным проекциям. Традиционные алгоритмы требуют вычисления квантильных функций, что создает «узкое место» из-за необходимости сортировки всех элементов выборки на каждой итерации.

Предложенный метод переносит акцент на использование CDF, что позволяет эффективно распараллеливать вычисления на современных GPU. Это делает оценку расстояния SW более масштабируемой для обучения генеративных моделей, оптимизации распределений и задач сопоставления данных, где требуется высокая скорость обработки без потери точности аппроксимации.

Ключевые факты

  • Метод использует функции кумулятивного распределения (CDF) вместо квантильных функций для оценки расстояния.
  • Алгоритм устраняет необходимость в сортировке спроецированных выборок, что является основным вычислительным ограничением стандартных методов.
  • Подход обеспечивает высокую степень параллелизма, позволяя эффективно использовать архитектуру графических процессоров.
  • Техника применима для задач, требующих сравнения сложных многомерных распределений в реальном времени.