Исследователи представили метод FreeStyle, направленный на решение проблемы разделения стиля и контента при генерации изображений по двум разным референсам. Основная сложность подобных систем заключается в необходимости сохранять структуру и семантику исходного контента, одновременно перенимая визуальную стилистику другого изображения, не допуская при этом «утечки» смысловых элементов из стилевого референса.

Авторы работы предложили подход, основанный на использовании сообщества LoRA-адаптеров (Low-Rank Adaptation). Метод позволяет эффективно извлекать и комбинировать стилевые признаки, минимизируя искажения, которые часто возникают при попытке совместить разнородные визуальные данные. В отличие от стандартных подходов, FreeStyle лучше справляется с балансом между точностью следования текстовой инструкции и визуальной верностью обоим источникам.

Технология опирается на предварительно обученные модели и позволяет гибко управлять процессом синтеза без необходимости переобучения базовой архитектуры под каждую задачу. Это открывает новые возможности для создания контента, где требуется строгий контроль над композицией при сохранении заданного художественного оформления, что актуально для задач дизайна, рекламы и генеративного искусства.