Исследователи предложили новый подход к дообучению моделей генерации изображений по тексту. В статье на arXiv представлен метод STAR (SpatioTemporal Adaptive Reward Allocation), который учитывает временную и пространственную структуру процесса генерации.

Традиционные методы дообучения с подкреплением (RL) применяют одно и то же вознаграждение ко всему процессу генерации. В отличие от них, STAR адаптивно распределяет вознаграждение, учитывая, что разные этапы денойзинга отвечают за разные стадии генерации.

Авторы утверждают, что их метод позволяет более точно контролировать качество генерируемых изображений. В статье приведены результаты экспериментов, демонстрирующие улучшение качества генерации по сравнению с традиционными подходами.

Разработка может найти применение в улучшении существующих моделей генерации изображений, таких как Stable Diffusion или DALL-E, а также в других задачах компьютерного зрения.