Исследователи представили Moebius — компактную нейросетевую архитектуру для задачи заполнения пропущенных областей на изображениях (inpainting). Несмотря на крайне малый размер в 0,2 млрд параметров, модель демонстрирует качество генерации, сопоставимое с крупными решениями класса 10B. Разработка оптимизирована для эффективной работы в условиях ограниченных вычислительных ресурсов, сохраняя при этом высокую детализацию и структурную целостность восстанавливаемых фрагментов.
В основе подхода лежит оптимизация архитектурных связей, позволяющая эффективно использовать визуальные признаки без избыточного потребления памяти. Модель успешно справляется с удалением объектов, восстановлением поврежденных участков и дополнением сцен, что делает её перспективным инструментом для мобильных приложений и систем реального времени, где развертывание тяжелых диффузионных моделей затруднено.
Метод прошел апробацию на стандартных наборах данных, показав конкурентные результаты в сравнении с современными SOTA-решениями. Авторы подчеркивают, что Moebius значительно снижает порог входа для внедрения качественного визуального редактирования в клиентские устройства, минимизируя задержки при обработке графического контента.
Ключевые факты
- Размер модели составляет 0,2 млрд параметров, что значительно меньше актуальных аналогов.
- Качество генерации соответствует моделям с 10 млрд параметров.
- Архитектура представлена в рамках конференции ECCV 2026.
- Решение ориентировано на задачи image inpainting (ретушь и восстановление изображений).
- Разработка позволяет перенести сложные визуальные вычисления на устройства с ограниченным «железом».