Исследователи представили метод ProductConsistency, направленный на решение проблемы потери деталей при редактировании изображений с помощью текстовых инструкций. Современные модели часто искажают ключевые характеристики товаров, такие как брендинг, специфические элементы дизайна и текстовые надписи, когда пользователь запрашивает изменение фона или окружения. Новый подход позволяет сохранять визуальную идентичность продукта, что критически важно для коммерческого использования ИИ в маркетинге и электронной коммерции.
Решение базируется на комбинации методов SFT (Supervised Fine-Tuning) и обучения с подкреплением (RL). Авторы разработали специализированный пайплайн, который обучает модель лучше распознавать и фиксировать важные атрибуты объекта, предотвращая их случайную модификацию в процессе генерации. В ходе экспериментов модель продемонстрировала значительное превосходство над существующими open-source и закрытыми решениями в задачах, требующих высокой точности передачи визуальных признаков.
Внедрение подобных алгоритмов позволяет автоматизировать создание рекламных креативов, сохраняя при этом строгую привязку к айдентике бренда. Технология минимизирует необходимость ручной доработки изображений, обеспечивая стабильность визуального контента при смене контекста или условий освещения. Работа открывает возможности для более эффективного применения генеративных моделей в профессиональных бизнес-сценариях, где точность воспроизведения продукта является приоритетной задачей.