ICCV2025佳作 | 3DGS渲染质量↑10%+训练速度↑200倍+内存占用↓7.9倍,无需相机位姿。

AI产品会 2025-08-25 07:55

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,

用心写好每一篇文章!



项目主页-https://linjohnss.github.io/longsplat/

代码链接-https://github.com/NVlabs/LongSplat

论文链接-https://arxiv.org/pdf/2508.14041



为什么需要这个算法?--从随意捕获的长视频中进行新视图合成(NVS)的关键挑战,不规则的相机运动、未知的相机姿态和广阔的场景。当前的方法经常受到姿态漂移、几何初始化不准确和严重内存限制的困扰。
这个算法能做什么?--LongSplat在没有提供相机姿态的情况下,从随意拍摄的长视频中实现了强大的新颖视图合成。该方法联合优化了相机姿态和3D高斯散斑,即使在具有挑战性的条件下也能产生准确和视觉连贯的重建结果。
这个算法效果如何?--  在具有挑战性的多个基准上面的大量实验结果表明:LongSplat取得了最佳的效果,与基线方法相比,大大提高了渲染质量、姿态精度和计算效率,渲染质量↑10%,训练速度↑200倍,内存占用↓7.9倍!


资讯配图


01-LongSplat核心优势

    LongSplat解决了从随意捕获的长视频中进行新视图合成(NVS)的关键挑战,这些长视频的特征包含:不规则的相机运动、未知的相机姿态和广阔的场景。当前的方法经常受到姿态漂移、几何初始化不准确和严重内存限制的困扰。
    为了解决这些问题,作者引入了LongSplat,这是一个强大的无需位姿的3D高斯散点框架,其核心特点如下:
1)增量联合优化,同时优化相机姿态和3D高斯分布,从而避免局部最小值并确保全局一致性;
2)利用所学习的3D先验的姿态估计模块;3)动态调整锚密度、显著减少内存使用的自适应八叉树锚形成机制。


02-LongSplat落地场景

02.01-根据随手拍的长视频重建新视图
    如上面的视频所示,分隔线左边表示用户自己随手拍摄的一些长视频,分隔线右边表示利用该方法重建出来的一些新视图,整个视频的稳定性和质量都得到了较大幅度的提升。
02.02-重建相机位姿
    上面的视频展示了该方法对用户输入的无位姿的长视频重建出来的相机位姿和点云图,肉眼可见其精确度。
02.03-重建点云

03-LongSplat上手指南

03.01-搭建运行环境

# 步骤1-克隆代码到本地git clone --recursive https://github.com/NVlabs/LongSplat.git cd LongSplat
# 步骤2-创建&激活虚拟环境conda create -n longsplat python=3.10.13 cmake=3.14.0 -y conda activate longsplat conda install pytorch torchvision pytorch-cuda=12.1 -c pytorch -c nvidia  # use the correct version of cuda for your system 
# 步骤3-安装3方依赖包pip install -r requirements.txt pip install submodules/simple-knn pip install submodules/diff-gaussian-rasterization pip install submodules/fused-ssim

03.02-运行样例代码

# 在几个不同的数据集上面训练、验证与评估# For Free dataset bash scripts/train_free.sh  
# For Hike dataset bash scripts/train_hike.sh  
# For Tanks and Temples dataset bash scripts/train_tnt.sh


04-LongSplat性能评估

04.01-主观效果评估
    如上面的视频所示,作者将LongSplat与其它方法的结果进行了比较与可视化。通过观察与分析,我们可以发现:LongSplat的表现远优于其它基线的高斯泼溅方法。
资讯配图
    上图展示了该方法与其它多个SOTA方法的姿态估计结果。通过观察与分析,我们可以得出以下的初步结论:LongSplat实现了最佳的姿态估计,在大多数情况下其输出精度接近GT。
04.02-客观指标评估
资讯配图
    上表展示了该方法与多个SOTA的方法在Free评估基准上面的多项指标评估结果。通过观察与分析,我们可以发现:与其它基线方法相比,该方法在多项客观指标上面(PSNR、SSIM、LPIPS)上面获得了最佳的得分,远优于其它方法。


关注我,AI热点早知道,AI算法早精通,AI产品早上线!



资讯配图

禁止私自转载,需要转载请先征求我的同意!

欢迎你的加入,让我们一起交流、讨论与成长!

若二维码失效:关注公众号--》交流分享--》联系我们

资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
IC 内存 相机
more
特斯拉车祸,被判赔偿超2亿美元;传OpenAI将推10美元「亲民订阅」;影石刘靖康:祝贺同行大疆推全景相机 | 极客早知道
前美团硬件负责人创业,做了一款项链式的“AI相机”|涌现NewThings
英伟达回应「芯片后门」:不存在后门;大疆推Osmo 360 全景相机,2999元;微软成第二家 4 万亿美元公司 | 极客早知道
相机按钮,卒!!!
终于来了!3D视觉!保姆级从入门到进阶系统学习教程!相机标定、SLAM、三维重建、自动驾驶等
大疆首款全景相机!Osmo 360正式发布:2999元起
全景相机镜头起雾?温差的锅不能让产品来背
重磅!华经产业研究院发布《2025年中国数码相机行业市场深度研究报告》
谷歌Pixel 10手机新增“相机教练”功能,基于AI
JD-400!iToF 3D相机!测距0.2~3m!可用于避障、具身智能感知、栈板识别等!
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号