AI视频的牛顿革命!PhysCtrl给扩散模型装上「物理引擎」,反重力特效终成历史!

AI产品汇 2025-09-26 08:00

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,

用心写好每一篇文章!





项目主页-https://cwchenwang.github.io/physctrl/

代码链接-https://github.com/CUT3R/CUT3R

论文链接-https://arxiv.org/pdf/2509.20358



为什么需要这个算法?--现有的视频生成模型擅长从文本或图像生成逼真的视频,但往往缺乏物理合理性和3D可控性。
这个算法能做什么?--宾夕法尼亚大学提出了PhysCtrl,这是一种基于物理的图像到视频生成的新框架,具有物理材料和力控制功能。
这个算法效果如何?--大量实验结果表明:PhysCtrl可以生成逼真的、基于物理的运动轨迹,当用于驱动图像到视频模型时,可以产生高保真、可控的视频,在视觉质量和物理合理性方面都优于现有方法。


AI视频的牛顿革命!PhysCtrl给扩散模型装上「物理引擎」,反重力特效终成历史!图1


01-PhysCtrl算法简介

    PhysCtrl是一种物理可控的图像到视频生成新框架,具有物理参数和力控制等特点。其核心是一个生成性物理网络,通过基于物理参数和施加力的扩散模型,学习四种材料(弹性、沙子、橡皮泥和刚性)的物理动力学分布。

    作者将物理动力学表示为3D点轨迹,并在物理模拟器生成的550K动画的大规模合成数据集上进行训练。

    作者利用一种新颖的时空注意力块来增强扩散模型,该注意力块模拟粒子相互作用,并在训练过程中结合基于物理的约束来增强物理合理性。

02-PhysCtrl落地场景

02.01-物理场景1生成
02.02-物理场景2生成
02.03-物理场景3生成

03-PhysCtrl基本原理

AI视频的牛顿革命!PhysCtrl给扩散模型装上「物理引擎」,反重力特效终成历史!图2

    上图展示了该算法的整体流程。详细的步骤如下所述:

  • 给定一张图像,首先将该图像中的对象提升为3D点。

  • 接着,作者训练了一个基于扩散的轨迹生成模型,该模型以物理参数和外力为条件进行运动生成;

  • 最后,将其用作图像到视频生成的强物理基础指导。

04-PhysCtrl性能评估

04.01-主观效果评估
AI视频的牛顿革命!PhysCtrl给扩散模型装上「物理引擎」,反重力特效终成历史!图3
    上图展示了该方法与多个SOTA的物理可控生成方法(DragAnything、ObjCtrl2.5D、Wan2.1、CogVideoX)在相同输入下的生成效果。通过观察与分析,我们可以发现:该方法生成的可控效果一致性&连贯性更佳。
04.02-客观指标评估
AI视频的牛顿革命!PhysCtrl给扩散模型装上「物理引擎」,反重力特效终成历史!图4
    上表展示了该方法与多个SOTA方法的客观指标评估结果。其中,SA表示语义连贯性、PC表示物理常识、VQ表示视频质量。通过观察与分析,我们可以得出以下的初步结论:该方法在多项指标上面都获得了最佳的得分结果,远优于其它基线方法。

关注我,AI热点早知道,AI算法早精通,AI产品早上线!



AI视频的牛顿革命!PhysCtrl给扩散模型装上「物理引擎」,反重力特效终成历史!图5

禁止私自转载,需要转载请先征求我的同意!

欢迎你的加入,让我们一起交流、讨论与成长!

若二维码失效:关注公众号--》交流分享--》联系我们

AI视频的牛顿革命!PhysCtrl给扩散模型装上「物理引擎」,反重力特效终成历史!图6

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
盈利暴增、股价大跌,好未来押注AI能换来更好的未来吗?
AIDA64 v8.30发布:前瞻支持Intel Nova Lake与AMD Zen 6,新增实时帧率监控
ChatGPT 拎包入住云计算一哥,你的下一任好同事可能是 AI
20岁了!劈柴哥发帖庆生:谷歌翻译换了4代AI,第一次有了「呼吸感」
同时布局,Anthropic和OpenAI在企业AI服务赛道又杆上了
Reddit搜索业务逆袭:周活用户激增30%,AI重塑社区商业价值
Omdia:前沿AI模型增长放缓, “小型”模型规模化扩张重塑基础设施需求
豆包新增付费订阅,黄仁勋称英伟达中国市场份额降为零,iOS27将重心转向AI,“诺基亚” 品牌手机或将“绝版”,这就是今天的其他大新闻!
OpenAI暂缓硬件分拆,IPO前夕的战略收缩与重构
OpenAI董事会主席创办的Sierra ai获9.5 亿美元新一轮融资
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号