ICCV高分论文|可灵ReCamMaster在海外爆火,带你从全新角度看好莱坞大片

机器之心 2025-07-23 18:36

本文第一作者白健弘,浙江大学26届博士生,研究方向为视频生成,目前正在寻找工业界全职岗位。


作为视频拍摄爱好者,你是否曾因为设备限制无法完成想要实现的运镜效果?例如想要将镜头上移拍摄风景的全貌,但没有入手拍摄无人机;又或是对拍摄素材很满意,但拍摄时手抖影响了成片质量。作为 AI 视频创作者,是否对于生成视频的内容很满意,然而运镜却不尽人意?


为了解决以上问题,可灵研究团队提出了一种可将输入视频沿新相机轨迹重新运镜的视频生成模型 ReCamMaster。用户可以上传任意视频并指定新相机拍摄轨迹,实现已有视频的重运镜。该工作还发布了一个高质量多相机同步拍摄的视频数据集 MultiCamVideo-Dataset,数据集和训练、测试代码均已开源



此外,ReCamMaster 在 4D 重建、视频去抖动、自动驾驶、具身智能等领域有较强的应用价值。




1.ReCamMaster 能力展示


a) 视频重运镜



b) 4D 场景重建



c) 视频去抖动



d) 在自动驾驶、具身智能等场景作为数据生成器




可以观察到,ReCamMaster 生成的视频可以保持原视频中的场景和动态,并在不同场景有较好的泛化性。更多示例请访问项目主页:https://jianhongbai.github.io/ReCamMaster/


2.ReCamMaster 创新点


研究者表示,ReCamMaster 的主要创新点为:



3. ReCamMaster 算法解读



如上图所示,ReCamMaster 的核心创新点在于提出了一种新的 video conditioning 范式,即将 condition video 与 target video 在 patchify 之后沿时间维度拼接。所提出的 video conditioning 范式较之前工作所常用的通道维度拼接有显著的性能提升。


4.MultiCamVideo 数据集


MultiCamVideo 数据集是使用 Unreal Engine 5 渲染的多摄像机同步视频数据集。它包含 13,600 个不同的动态场景,每个场景由 10 个摄像机沿不同的相机轨迹拍摄,总计 136,000 个视频,112,000 个不同的相机轨迹。MultiCamVideo 以 66 个不同的人物为 “主要拍摄对象”,93 种不同的人物动作,和 37 个高质量 3D 环境作为背景。数据集示例如下:



5.ReCamMaster 实验结果



视频中研究者将 ReCamMaster 与最先进的方法进行了比较,ReCamMaster 较 baseline 有较大幅度的性能提升。


6. 总结


在本文中,研究者提出了 ReCamMaster,一种可将输入视频沿新相机轨迹重新运镜的视频生成模型。ReCamMaster 的核心创新点在于提出了一种简单且有效的 video conditioning 范式,其性能显著优于 baseline 方法。此外、研究者还发布了多相机同步视频数据集 MultiCamVideo-Dataset 用于相机可控的视频生成、4D 重建等领域的研究。


更多细节请参阅原论文。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
IC
more
年产60万片!8英寸SiC项目开工
ICML2025|清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval
Franka Robotics 机器人全新升级 从全球1400 篇论文看科研 “顶流” 如何坐稳机器人研究 “首选载体”
AI智能体推理新范式!CMU开源Agentic-R1,双策略蒸馏实现推理最优选择
消费级最强:魔法原子发布MagicDog-W轮式四足机器人
DIC2025新兵连特辑:北方华创、德莎、高光半导体、鹿山兴邦、奥莱电子等您“围观”
455匹的iCAR V23来了!福特烈马新增纯电+增程双动力,方程豹慌不慌?
ICCV高分论文|可灵ReCamMaster在海外爆火,带你从全新角度看好莱坞大片
又两家突破12英寸SiC技术
国讯芯微 NSPIC 具身智能全家桶震撼登场,驶入具身智能新蓝海
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号