清华联手英伟达打造扩散模型新蒸馏范式!视频生成提速50倍,4步出片不穿模

量子位 2025-10-22 17:08
rCM团队 投稿
量子位 | 公众号 QbitAI

让视频生成提速50倍,不穿模还不糊字。

新蒸馏范式让Wan2.1 14B仅需4步就生成吃火锅视频:

清华联手英伟达打造扩散模型新蒸馏范式!视频生成提速50倍,4步出片不穿模图1

这是清华大学朱军教授团队, NVIDIA Deep Imagination研究组联合提出的一种全新的大规模扩散模型蒸馏范式——

分数正则化连续时间一致性模型 (Score-Regularized Continuous-Time Consistency Model, rCM)。

清华联手英伟达打造扩散模型新蒸馏范式!视频生成提速50倍,4步出片不穿模图2

该方法首次将连续时间一致性蒸馏成功扩展至百亿参数级别的文生图和文生视频模型,解决了现有方法在真实应用场景中的瓶颈。

通过引入前向-反向散度联合优化框架,rCM在大幅提升推理速度(高达50倍)的同时,兼顾了生成结果的高质量与高多样性。

清华联手英伟达打造扩散模型新蒸馏范式!视频生成提速50倍,4步出片不穿模图3

下面具体来看。

连续时间一致性蒸馏:从学术“刷点”到应用落地

近年来,以扩散模型为代表的生成模型取得了巨大成功,但其迭代采样的慢推理速度始终是阻碍其广泛应用的核心障碍。

为解决此问题,模型蒸馏技术应运而生,其中,OpenAI近期提出的连续时间一致性模型 (sCM),因其理论的优雅性和在学术数据集上的良好表现而备受关注。

今年5月份,何恺明加持的MeanFlow,作为sCM的热门变体,在学术界掀起了研究热潮。

然而,尽管相关研究层出不穷,但它们大多局限于在ImageNet等学术数据集上进行“小打小闹”式的验证,距离真实世界中动辄数十亿、上百亿参数的大规模文生图、文生视频应用场景相去甚远。

究其原因,sCM/MeanFlow依赖的雅可比-向量积 (Jacobian-Vector Product, JVP) 计算在现有深度学习框架下存在巨大的工程挑战,尤其是在与FlashAttention-2、序列并行等大模型训练“标配”技术结合时,这使得sCM迟迟未能在大模型时代兑现其潜力。

同时,学术界关心的FID等指标,往往不能很好的衡量真实应用场景下的细节生成,如文生图时对细小文字的渲染。因此,sCM/MeanFlow在大规模应用中的效果亟待验证

rCM:前向-反向散度联合优化,实现质量与多样性“双赢”

清华联手英伟达打造扩散模型新蒸馏范式!视频生成提速50倍,4步出片不穿模图4

为了打破这一僵局,团队首先从底层“硬骨头”啃起。

通过自研FlashAttention-2 JVP CUDA算子并兼容序列并行等分布式训练策略,首次成功将连续时间一致性蒸馏应用到CosmosWan2.1等业界领先的大模型上。

然而,初步的实验暴露出单纯sCM的深层问题:模型在生成精细纹理(如文字)和保证视频的时序稳定性方面存在明显缺陷。

理论分析指出,这是由于sCM所依赖的前向散度(Forward Divergence)优化目标具有“模式覆盖(mode-covering)”的倾向,会因误差累积导致生成样本质量下降。

清华联手英伟达打造扩散模型新蒸馏范式!视频生成提速50倍,4步出片不穿模图5

受此启发,团队创新性地提出了rCM

rCM 在sCM的基础上,引入了基于分数蒸馏的反向散度(Reverse Divergence)作为正则项,构建了一个前向-反向联合蒸馏框架。

这种联合优化,使得rCM能够取长补短,在保持sCM高多样性优势的同时,有效修复其质量短板,最终实现“鱼与熊掌兼得”。

实验:2-4步媲美教师模型,多样性超越SOTA

rCM在多个大规模文生图和文生视频任务中展现了卓越的性能,将教师模型上百步的采样过程压缩至惊人的1-4步,实现了15-50倍的推理加速。

清华联手英伟达打造扩散模型新蒸馏范式!视频生成提速50倍,4步出片不穿模图6

同时,rCM在细节文字渲染等方面表现良好。

清华联手英伟达打造扩散模型新蒸馏范式!视频生成提速50倍,4步出片不穿模图7
清华联手英伟达打造扩散模型新蒸馏范式!视频生成提速50倍,4步出片不穿模图8Wan2.1 1.3B使用不同算法蒸馏后的4步生成结果
清华联手英伟达打造扩散模型新蒸馏范式!视频生成提速50倍,4步出片不穿模图9

rCM不仅提供了一个无需多阶段训练与复杂超参搜索的高效蒸馏方案,还揭示了结合前向与反向散度是提升生成模型性能的统一范式

rCM未来将被更广泛地应用在NVIDIA的Cosmos系列世界模型中。

感兴趣的朋友可到原文查看更多细节~

论文地址:https://arxiv.org/abs/2510.08431
代码地址:https://github.com/NVlabs/rcm


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
英伟达
more
英伟达份额降至零,寒武纪的三季报分析
黄仁勋站台,台积电美工厂造出首片英伟达Blackwell晶圆
阿里云秘密武器亮相顶会:狂砍82%英伟达含量,213块GPU干了1192块的活
传 iPhone Air 表现不佳,砍百万产量;黄仁勋:英伟达中国份额从 95% 降到 0%;维基百科流量暴跌 | 极客早知道
英伟达中国份额从95%降至0%;英国将11个中国实体列入制裁名单;“业务造假”、“经济舞弊”,华为多名高管被处罚
阿里云计算池化方案:英伟达H20 GPU用量削减82%
训练成本暴降99%,35秒出1分钟高清视频!英伟达MIT等引爆视频AI革命
阿里云:英伟达GPU用量削减82%
2550亿芯片!中国不买了,ASML股价下跌14%,巨头英伟达宣告退出中国
黄仁勋“撒钱”创纪录!英伟达超级AI帝国崛起,但没带中国玩
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号