NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数

机器之心 2025-09-26 08:32
NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数图1


论文一作李放,美国伊利诺伊大学香槟分校 (UIUC) 博二学生,研究方向为 4D 视觉定位、重建/新视角合成以及理解。第二作者为美国伊利诺伊大学香槟分校博四学生张昊。通讯作者是 Narendra Ahuja, 美国伊利诺伊大学香槟分校 Donald Biggar Willet Professor(Ming-hsuan Yang, Jia-bin Huang 博士导师)。这篇工作为作者在博一期间完成。


研究背景


在三维重建、NeRF 训练、视频生成等任务中,相机参数是不可或缺的先验信息。传统的 SfM/SLAM 方法(如 COLMAP)在静态场景下表现优异,但在存在人车运动、物体遮挡的动态场景中往往力不从心,并且依赖额外的运动掩码、深度或点云信息,使用门槛较高,而且效率低下。


纵使在 3R 时代下,三维与四维前馈模型可以高效产出相机相对位姿与点云结构,但 3R 模型本质上仍存在很多痛点。3R 模型对部署硬件容量需求大 (大 GPU), 对丰富高精度训练数据需求大,易发生场景漂移。而且目前基于 3R 模型的衍生品们仍无法做到同时解决这些问题。Per-scene optimization 的方法常常依赖多种监督和先验,同时优化效率低下。


这让作者重新思考:有没有一种方法可以从动态场景视频准确、高效、稳定地预测相机参数,不受前景运动物体的影响,且仅用一段 RGB 视频作为监督呢?


方法概览


为了实现这一目的,他们提出了 ROS-Cam(RGB-Only Supervised Camera Parameter Optimization in Dynamic Scenes),已被 NeurIPS 2025 接收为 Spotlight 论文代码即将开源。


NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数图2



NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数图3


从第一性原理出发,作者分析并将这个挑战拆解为几部分:



NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数图4


基于上述思考,作者提出了一种仅 RGB 监督,高效,准确的动态场景相机参数估计的新方法。该方法涵盖了三个部分:


1)补丁式跟踪滤波器


他们发现现有方法都依赖预训练的密集预测模型(深度,光流,点跟踪)建立帧间联系作为伪监督。但这种密集预测模型经常由于准确性无法保证而引入噪声伪监督,影响模型损失回归。但是,准确且鲁棒的帧间关系的建立理论上并不需要密集预测,相反,密集预测除了引入噪声外还会增加模型处理数据的负担,降低模型优化效率。因此,他们提出补丁式跟踪滤波器,用来高效,准确的建立视频帧之间的铰链式稀疏点跟踪联系。


NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数图5


2)异常值感知联合优化


由于不使用任何运动先验,部分伪监督会包含移动点(outlier)轨迹,对模型损失回归造成负面影响。不同于与现有方法对每一帧的每一个像素赋予一个不确定性参数不同,作者认为每一条提取出的点跟踪轨迹表示场景中的一个点(他们称之为校准点),且对每一个校准点赋予一个不确定性参数。相比较现有工作,他们所提出的方法可以使模型需要学习的不确定性参数量随着帧数增加趋于线性增长,从而加快优化效率。


作者用柯西分布中的 scale 参数来代表不确定性参数,并引入 softplus 来保证不确定参数大于 0。此外,他们引入全新的「平均积累误差」和「柯西损失函数」来对模型进行监督,有效避免移动点对相机参数回归的影响。


NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数图6


3)双阶段训练策略。


由于不确定性参数的引入,同时优化所有参数会导致模型倾向于收敛至局部最小值。为了避免这种情况,经过对新引入损失函数中的 Softplus 的极限与凸最小值分析,作者设计了双阶段训练策略,在第一阶段实现模型快速收敛,在第二阶段实现模型稳定高效 fine-optimization。


实验结果



NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数图7



NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数图8



NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数图9



NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数图10



NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数图11



NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数图12


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
IP 相机
more
好看!柯达推出复古款钥匙链相机,不过官网已售罄……
英伟达向英特尔投资50亿美元;苹果承认iPhone 17存在相机故障;红米K90系列入网...
未上市先“中招”!iPhone 17系列相机出现大故障,苹果:暂时解决不了!
一加哈苏影像合作结束;联发科否认被英伟达收购;苹果iPhone 17相机按钮曝光...
三轮融资过千万美金!美团前高管做了款AI相机,要做自媒体博主神器?
疑似大疆新品预告片曝光,或为首款L卡口全画幅相机
事件相机会成为自动驾驶的下一代核心传感器?
国产手机的相机,又要卷出新高度了
运动相机进入生态战:大疆Osmo Nano何以“轻”撬“重”担
1998元!大疆Osmo Nano发布:可穿戴相机市场要变天了?
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号