arXiv · 30.06.2026 ·Машинное обучение

Новый метод аугментации данных с помощью диффузионных моделей

Исследователи представили метод аугментации данных для семантической сегментации, решающий проблему нехватки редких объектов и визуального разнообразия. Алгоритм использует диффузионные модели для генерации синтетических данных, сохраняя при этом высокую точность разметки. Подход опирается на оценку неопределенности, что позволяет выборочно обновлять области изображения, минимизируя риск рассогласования между сгенерированными пикселями и исходными масками сегментации.

Традиционные методы синтетической аугментации часто сталкиваются с артефактами или потерей точности границ объектов, особенно в задачах автономного вождения или анализа аэрофотоснимков. Новый подход предлагает стратегию «сохранения сложного и генерации остального», где модель фокусируется на дополнении данных только в тех областях, где текущий классификатор демонстрирует наибольшую неуверенность. Это позволяет эффективно расширять обучающие выборки без необходимости привлечения дополнительных внешних моделей для контроля качества.

Технология позволяет значительно улучшить производительность моделей сегментации в условиях дефицита данных для специфических сценариев. Метод демонстрирует устойчивость при работе с мелкими объектами и сложными сценами, где стандартные методы аугментации часто приводят к деградации метрик качества из-за шума или ошибок в разметке.

Ключевые факты

Метод основан на управлении неопределенностью (uncertainty-guided) при генерации синтетических данных.
Технология решает проблему рассогласования (misalignment) между сгенерированными пикселями и целевыми метками.
Решение оптимизировано для задач семантической сегментации, включая автономную мобильность и анализ аэрофотоснимков.
Подход позволяет эффективно обрабатывать редкие классы объектов и визуально сложные регионы без использования внешних моделей-верификаторов.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

← Все материалы