打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,
用心写好每一篇文章!
项目主页-https://cwchenwang.github.io/physctrl/
代码链接-https://github.com/CUT3R/CUT3R
论文链接-https://arxiv.org/pdf/2509.20358

01-PhysCtrl算法简介
PhysCtrl是一种物理可控的图像到视频生成新框架,具有物理参数和力控制等特点。其核心是一个生成性物理网络,通过基于物理参数和施加力的扩散模型,学习四种材料(弹性、沙子、橡皮泥和刚性)的物理动力学分布。
作者将物理动力学表示为3D点轨迹,并在物理模拟器生成的550K动画的大规模合成数据集上进行训练。
作者利用一种新颖的时空注意力块来增强扩散模型,该注意力块模拟粒子相互作用,并在训练过程中结合基于物理的约束来增强物理合理性。
02-PhysCtrl落地场景
03-PhysCtrl基本原理

上图展示了该算法的整体流程。详细的步骤如下所述:
给定一张图像,首先将该图像中的对象提升为3D点。
接着,作者训练了一个基于扩散的轨迹生成模型,该模型以物理参数和外力为条件进行运动生成;
最后,将其用作图像到视频生成的强物理基础指导。
04-PhysCtrl性能评估


关注我,AI热点早知道,AI算法早精通,AI产品早上线!

禁止私自转载,需要转载请先征求我的同意!
欢迎你的加入,让我们一起交流、讨论与成长!