Исследователи представили DreamForge-World 0.1 Preview — фундаментальную модель мира, предназначенную для интерактивной симуляции в реальном времени. В отличие от крупномасштабных аналогов, система оптимизирована для работы на устройствах с ограниченными вычислительными ресурсами. Архитектура базируется на стеке LongLive 1 и модели Wan2.1-T2V-1.3B, дополненных механизмом обработки действий, заимствованным из игровых симуляторов.

Ключевой особенностью разработки является фокус на интерактивности при низких затратах на инференс. Модель позволяет пользователям управлять развитием видеопотока, что делает её пригодной для создания динамических сред, где визуальный ряд реагирует на действия в реальном времени. Это направление дополняет текущие исследования в области генеративных видеомоделей, смещая акцент с чистого синтеза контента на создание управляемых виртуальных пространств.

Система использует авторегрессионный подход к генерации видео, адаптированный для обработки последовательностей действий. Интеграция остаточного пути для команд управления позволяет модели предсказывать изменения в визуальной среде, вызванные внешним воздействием, сохраняя при этом высокую скорость генерации кадров, необходимую для интерактивного взаимодействия.

Ключевые факты

  • DreamForge-World 0.1 Preview базируется на архитектуре Wan2.1-T2V-1.3B.
  • В основе системы лежит авторегрессионный стек LongLive 1.
  • Модель использует специализированный путь для обработки действий (residual action pathway).
  • Разработка ориентирована на снижение вычислительных требований для симуляции миров в реальном времени.