
题目:Mean Flows for One-step Generative Modeling
论文地址:https://arxiv.org/pdf/2505.13447

创新点
传统Flow Matching方法通过瞬时速度场(Instantaneous Velocity)指导模型训练,但需依赖时间积分计算轨迹,导致一步生成时误差累积。本文首次提出平均速度场的概念,定义为瞬时速度在时间区间上的积分平均值。
现有一步生成模型(如Consistency Models)通常需要依赖预训练的多步模型进行蒸馏,或通过课程学习逐步约束时间域,训练过程复杂且不稳定。MeanFlow完全自包含,其训练仅需随机采样时间点对(r,t),并通过神经网络直接拟合平均速度场,无需任何外部模型或分阶段训练。
方法
本文主要研究方法围绕基于平均速度场的一步生成建模框架(MeanFlow)展开,其核心是通过引入平均速度场替代传统瞬时速度场,构建自包含的神经网络训练体系,实现高效的一步生成。
MeanFlow框架及其在ImageNet上的性能突破

本图提出的MeanFlow框架通过引入平均速度场(Average Velocity)替代传统瞬时速度场,实现了ImageNet 256×256数据集上的一步高质量生成(1-NFE)。生成图像示例展示了16张由MeanFlow生成的样本,涵盖动物、交通工具等复杂类别,图像细节(如猫的毛发、飞机的结构)逼真,语义清晰,表明模型能高效捕捉真实数据分布。
条件流与边际流的对比图示

本图通过示意图与数学定义,对比了Flow Matching方法中条件速度场(Conditional Flow)与边际速度场(Marginal Flow)的差异,阐明了MeanFlow框架对传统方法的改进逻辑。本图通过对比条件流与边际流,揭示了Flow Matching中速度场的多值性与训练目标的不确定性问题,为MeanFlow引入平均速度场提供了理论动机。边际速度场作为传统方法的底层目标,其积分导致的轨迹弯曲问题,被MeanFlow的平均速度场定义直接规避,为高效一步生成奠定了基础。
平均速度场实现直线路径生成

本图通过二维可视化对比了MeanFlow框架与传统边际流匹配(Marginal Flow Matching)的生成轨迹,直观揭示了平均速度场在优化生成路径中的核心作用。图中左侧展示了边际流匹配的生成轨迹,图中右侧展示了MeanFlow的生成轨迹。本图通过轨迹可视化揭示了传统边际流匹配的路径低效性问题,并阐明MeanFlow通过平均速度场实现直线路径生成的机制。这一改进不仅简化了神经网络的训练目标(从拟合复杂速度场到拟合线性位移),更从根本上提升了一步生成的稳定性与质量,为高分辨率实时生成任务提供了关键技术突破。
实验

本表通过系统对比MeanFlow与主流生成模型在ImageNet 256×256数据集上的性能,全面验证了其单次评估(1-NFE)下实现高质量生成的核心优势。表格横向罗列了不同方法(包括传统扩散模型DDPM、NCSN++,单步生成模型iCT、Shortcut,以及基于矩匹配的IMM),纵向展示了两项关键指标:FID(衡量生成质量,值越低越好)与NFE(反映计算效率,值越低代表生成步骤越少)。数据显示,传统扩散模型(如DDPM)虽能通过数千步迭代(NFE≥1000)达到较低FID(2.92),但计算成本极高,难以应用于实时场景;单步基线方法(如iCT、Shortcut)虽将NFE压缩至1,但生成质量大幅下降(FID≥110),表明其无法平衡效率与质量;IMM通过引入归纳矩匹配将FID优化至7.77,但其实际依赖2步引导(NFE=2),且需复杂训练技巧(如课程学习),训练流程繁琐。相比之下,MeanFlow以NFE=1实现FID=3.43,不仅较最优基线IMM提升56.2%(FID降低4.34),更接近多步模型DDPM的水平(仅高0.51),同时完全摒弃预训练、蒸馏等额外步骤,训练过程简洁高效。
-- END --

关注“学姐带你玩AI”公众号,回复“DM论文”
领取扩散模型高分论文合集+开源代码
