Исследователи представили метод World from Motion, позволяющий создавать полноценные динамические 3D-сцены на основе обычного монокулярного видео. Технология использует генеративные видеомодели для восстановления геометрии, внешнего вида и траекторий движения объектов. Система автоматически исправляет артефакты рендеринга и заполняет пропущенные области, обеспечивая высокое качество визуализации при смене ракурса камеры в пространстве.
В основе подхода лежит использование 3D-гауссианов (3D Gaussian Splatting), которые дополняются генеративными алгоритмами для предсказания динамики сцены. Традиционные методы реконструкции часто сталкиваются с проблемами при обработке движущихся объектов или при нехватке данных о ракурсах. Новый метод решает эту задачу, обучая модель понимать пространственно-временные связи, что позволяет «дорисовывать» скрытые части объектов и корректно отображать их перемещение в 3D-пространстве.
Данная разработка значительно упрощает создание контента для виртуальной и дополненной реальности, так как исключает необходимость использования специализированных систем захвата движений или многокамерных установок. Метод эффективно работает с видеопотоком, извлекая из него плотные представления, которые можно свободно рендерить с любой точки обзора, сохраняя при этом физическую согласованность динамических элементов сцены.
Ключевые факты
- Метод преобразует монокулярное видео в динамическую 3D-репрезентацию на базе гауссианов.
- Алгоритм использует генеративные видеомодели для заполнения окклюзий и восстановления геометрии.
- Система обеспечивает корректный рендеринг сцены при произвольном изменении траектории виртуальной камеры.
- Технология позволяет исправлять артефакты, возникающие при первичной реконструкции из одного источника видео.
- Подход ориентирован на создание интерактивных 3D-сред без необходимости использования сложного оборудования для захвата сцен.