【他山之石】ICCV2025 Highlight统一动态重建与物理仿真三维表示!浙江大学ReLER Lab提出MaGS的全新框架

人工智能前沿讲习 2025-07-29 18:00


他山之石,可以攻玉”,站在巨人的肩膀才能看得更高,走得更远。在科研的道路上,更需借助东风才能更快前行。为此,我们特别搜集整理了一些实用的代码链接,数据集,软件,编程技巧等,开辟“他山之石”专栏,助你乘风破浪,一路奋勇向前,敬请关注!

资讯配图
图 0:项目主页

如何仅通过单目视频实现对动态三维物体的高质量重建与物理仿真,一直是计算机视觉与图形学领域一个极具挑战性的问题。近期,来自浙江大学等机构的研究者们提出了名为 MaGS (Mesh-adsorbed Gaussian Splatting) 的全新统一框架,为解决这一难题提供了新的思路。MaGS 框架的核心是创建一种创新的“网格吸附高斯(Mesh-adsorbed Gaussian)”混合表示,它巧妙地结合了三维高斯泼溅(3DGS)的渲染灵活性与三角网格(Mesh)的结构化特性。通过这种方式,MaGS 在动态场景重建和动态场景仿真两个任务上均取得了当前最优的性能。

资讯配图
图 1:MaGS 示意图

该研究目前已被 ICCV 2025 接收为Highlight Paper

Arxiv地址:https://arxiv.org/abs/2406.01593

Project Page: https://wcwac.github.io/MaGS-page/

在计算机图形学和计算机视觉领域,从视频中重建三维世界(Reconstruction)并对其进行物理交互和动画模拟(Simulation),是构建数字孪生、虚拟现实(VR)、游戏和电影特效等应用的关键。近年来,以三维高斯泼溅(3DGS)为代表的神经渲染技术,因其卓越的渲染质量和速度,在三维重建领域取得了革命性突破。

然而,三维重建和物理仿真这两个目标之间存在着根本性的矛盾:重建任务追求极致的视觉真实感,需要一种非常灵活、能够捕捉复杂外观和几何细节的表示方法(如 3DGS);而仿真任务则需要一个结构化的、符合物理规律的表示方法(如三角网格),以便进行姿态编辑、碰撞检测和软体变形等操作。

正是由于这种内在矛盾,之前尚未有框架可以在不牺牲任何一方性能的前提下将两者完美结合。


研究者们也尝试过结合3DGS和Mesh形成混合表示来完成这两个工作。然而,混合方法由于采用“刚性锚定”,使得高斯点和网格之间缺乏相对运动的自由度。这导致在优化过程中,渲染损失函数产生的梯度(为了更好的视觉效果)和变形约束产生的梯度(为了更合理的物理运动)会相互冲突,最终得到一个“折衷”但两方面都不完美的结果。

对此,研究人员提出了 MaGS 框架。该方法的核心思想是“网格吸附(Mesh-adsorbed)”而非“网格锚定”。它允许三维高斯点在网格表面附近“漫游(roam)”,从而拥有一定的相对位移自由。为了实现这种可控的“漫游”,MaGS 设计了两个关键网络:

资讯配图
图 2:MaGS 框架结构

为了更直观地理解 MaGS 的工作方式,我们可以将其核心组件与人体的“骨、肉、皮”进行类比:

MaGS 的创新之处就在于,它不像传统方法那样用胶水把“皮肤”粘死在“骨骼”上,而是让“皮肤”能够像真实生物一样,在“肌肉”和“骨骼”运动时,进行合理且自然的微小滑动和调整。这便是“网格吸附”思想的精髓,它使得运动既符合物理规律,外观又极其逼真。

资讯配图
图 3:网格锚定(左)与网格吸附(右)的对比示意图

MaGS 的工作流程分为重建和仿真两个阶段:

  1. 预处理: 首先,从输入的单目视频中提取一个时序上连续的、比较粗糙的初始动态网格序列(称为引导网格)。
  2. 网格吸附高斯初始化: 在这个粗糙网格的表面随机初始化大量的“网格吸附高斯”,每个高斯点记录了它吸附在哪个网格面片上。
  3. 联合优化:
  • 仿真阶段: 重建完成后,我们得到了一个高质量的网格和一套学会了变形规律的网络。用户可以使用任何基于网格的仿真工具(如 ARAP、SMPL、软体物理引擎)来编辑这个网格,产生新的动作或交互。然后,将这个新的被编辑过的网格作为引导网格,再次输入到学会了变形规律的网络中,即可渲染出具有同样高保真度纹理和外观的仿真结果。

  • 为了全面验证方法的有效性,研究人员在 D-NeRF、DG-Mesh 和 PeopleSnapshot 等多个主流动态场景和数字人数据集上进行了实验,并与 D-NeRF、4D-GS、SC-GS、SplattingAvatar 等一系列顶尖方法进行了定量和定性比较。

    定量分析: 实验数据显示,MaGS 在所有测试场景的各项关键指标(PSNR、SSIM、LPIPS)上几乎全面领先。

    资讯配图
    表 1:D-NeRF 数据集定量结果
    资讯配图
    表 2:PeopleSnapshot 数据集定量结果
    资讯配图
    表 3:DG-Mesh 数据集定量结果

    定性分析: 从渲染的视频和图像对比来看,MaGS 生成的动态人物和物体细节更清晰、边缘更锐利,动作也更自然。特别是在进行大幅度动作的仿真时,其他方法可能会出现表面破裂或伪影,而 MaGS 由于其连续的网格结构,能够保持完整和真实的外观。

    资讯配图
    图 4:D-NeRF 数据集定性对比图
    资讯配图
    图 5:DG-Mesh 数据集网格重建定性对比图
    资讯配图
    图 6:PeopleSnapshot 数据集网格重建定性对比图
    资讯配图
    图 7:与 SC-GS 等方法的仿真效果对比图
    资讯配图
    图 8:MaGS 的多种仿真效果展示

    消融研究: 通过移除 RMD-Net 或 RGD-Net 等关键模块,模型性能出现显著下降,这有力地证明了“网格吸附”和“高斯漫游”这一核心设计的必要性和有效性。

    资讯配图
    表 4:消融实验结果

    总结:

    1. MaGS 通过引入创新的“网格吸附高斯”表示和一套协同工作的变形网络,成功地在一个统一框架内解决了高质量动态三维重建与物理仿真的双重挑战。
    2. 这项研究为从单目视频创建可交互、可编辑的动态数字资产提供了一个全新的、性能强大的范式。它极大地降低了高质量动态 3D 内容的制作门槛,在元宇宙、数字人、游戏开发、影视预览、机器人仿真等领域拥有广阔的应用前景。
    3. 该研究相关代码和数据已在 GitHub 上开源,地址为:https://github.com/wcwac/MaGS

    资讯配图

    资讯配图

    击呗!

    声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
    IC
    more
    乾瞻科技(InPsytech)成为全球晶圆代工三巨头的生态伙伴, 完成符合UCIe 2.0标准的SoIC设计
    博主爆料,iCAR V27或为插混动力
    华为海思入局SiC领域,推出两款1200V工规SiC器件
    【他山之石】ICCV2025 Highlight统一动态重建与物理仿真三维表示!浙江大学ReLER Lab提出MaGS的全新框架
    暴降1000!荣耀Magic7终于“开闸”!
    曝荣耀Magic8系列将用上双2亿像素镜头,有小屏机
    新品 | 第二代CoolSiC™ MOSFET G2 750V - 工业级与车规级碳化硅功率器件
    ICML史上首次,中国内地高校教授出任董事!北大林宙辰、上交大严骏驰获选
    大疆新品速递!Matrice 4D 系列无人机方案及成果分享
    Agentic AI时代揭幕,AI Agent可以开始「做生意」了?
    Copyright © 2025 成都科技区角科技有限公司
    蜀ICP备2025143415号-1
      
    川公网安备51015602001305号