Исследователи предложили новый метод обучения диффузионных моделей, который делает их более устойчивыми к загрязненным обучающим выборкам. Традиционный подход, основанный на минимизации среднеквадратичной ошибки (MSE), часто оказывается чувствительным к выбросам и некачественным данным, что снижает итоговое качество генерации контента.
Авторы работы заменили стандартную функцию потерь на нелинейное преобразование, индуцированное f-дивергенцией. Этот подход позволяет модели эффективнее игнорировать аномалии в данных без существенного увеличения вычислительных затрат. Теоретическая база метода опирается на конструкцию локальной дивергенции в рамках структуры обратного гауссовского ядра.
Экспериментальные результаты подтверждают, что предложенный суррогат обучения позволяет сохранять высокую производительность даже при наличии значительного уровня шума в датасетах. Метод открывает возможности для обучения более надежных генеративных моделей на «сырых» или не полностью очищенных данных, что критически важно для масштабирования обучения на больших массивах информации.