Code2Video:代码驱动、智能体协同、精准可控的教学视频生成

机器之心 2025-10-10 14:36
Code2Video:代码驱动、智能体协同、精准可控的教学视频生成图1


本研究由新加坡国立大学 ShowLab 团队主导完成。 共一作者 Yanzhe Chen 陈彦哲(博士生)与 Kevin Qinghong Lin 林庆泓(博士生)均来自 ShowLab@NUS,分别聚焦于多模态理解以及智能体(Agent)研究。 项目负责人为新加坡国立大学校长青年助理教授 Mike Zheng Shou 寿政。


随着视频生成模型的发展,基于像素空间(Pixel-based)的文生视频方法(如 Sora2、Veo3 等扩散模型)在自然场景生成上表现出色,但在教育场景中仍存在以下不足:



Code2Video:代码驱动、智能体协同、精准可控的教学视频生成图2

图 1: Pixel-based Video Generation对比我们的Code-driven Video Generataion


视频 1: 扩散模型与 Code2Video 生成视频对比


相比之下,教育视频强调的是清晰的知识传递、逻辑的演进、可控的时序与空间结构。为此,本文提出了 Code2Video——一种基于代码驱动的视频生成新范式。

 

Code2Video:代码驱动、智能体协同、精准可控的教学视频生成图3



Code2Video 核心设计


Code2Video 的目标是:以可执行代码(Manim)作为统一媒介,将抽象的知识点转化为结构化、可复现的教学视频。以代码为媒介不仅保证了视频生成的可控性与可解释性,还保证了在教育视频中至关重要的逻辑流畅与视觉一致性。


Code2Video:代码驱动、智能体协同、精准可控的教学视频生成图4

图 2: Code2Video 方法示意图


基于此,本文提出了三智能体(Tri-Agent)协同框架






Code2Video:代码驱动、智能体协同、精准可控的教学视频生成图5

图 3: 视觉锚点提示(Visual Anchor Prompt)示意图


这种多方位的流水线协作设计,使得 Code2Video 能在以下方面发挥优势:



Code2Video 将复杂的知识点转化为逻辑清晰、视觉精美、可扩展的教学视频,兼顾了视频质量与生成效率。


评测基准 MMMC


为系统化评测,本文构建了 MMMC (Massive Multi-discipline Multimodal Coding) 评测集






Code2Video:代码驱动、智能体协同、精准可控的教学视频生成图6

图 4: MMMC 数据集可视化


实验与评估


本文从三个维度对 Code2Video 进行系统性评测:








Code2Video:代码驱动、智能体协同、精准可控的教学视频生成图7

图 5: TeachQuiz 评测指标流程示意图


实验结论






Code2Video:代码驱动、智能体协同、精准可控的教学视频生成图8

表 1: Code2Video 与各类方法对比结果


Code2Video:代码驱动、智能体协同、精准可控的教学视频生成图9

图 6: 可视化对比示例


视频 2: Code2Video 生成视频示例


视频 3: 预设不同模板生成效果示例


消融实验


本文进一步对 Code2Video 的关键组件进行了消融分析,以考察各模块对视频质量与生成效率的贡献。


视频质量方面:





效率分析方面:




Code2Video:代码驱动、智能体协同、精准可控的教学视频生成图10

表 2: 关于视频质量(左表)及生成效率(右表)的消融分析


人类实验


本文开展了五组人类受试者实验(每组包含 6 名中学生 + 2 名本科生),每位受试者仅观看一种视频类型并完成 20 个知识点 × 5 道 TeachQuiz 测试题。结果显示:






Code2Video:代码驱动、智能体协同、精准可控的教学视频生成图11

表 3: 受试者实验结果对比


结语


本文提出教育视频生成的新范式——以可执行代码为核心媒介,结合三智能体协同框架,实现高质量、可控、可解释的教学视频生成,为未来自动化教育内容创作与多模态智能系统的发展提供了坚实基础。


Code2Video:代码驱动、智能体协同、精准可控的教学视频生成图12


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
驱动
more
一文读懂鲸智百应:驱动组织进化的企业AI操作系统,让企业从「用AI」到「是AI」
2025年中国工程机械驱动桥行业市场深度调查报告:发展背景、产业链及市场规模
2025年中国潮玩盲盒行业商业模式分析 以IP为灵魂,以稀缺性驱动消费,以用户社群为粘性
创新驱动 芯耀未来——CPCA Show Plus 2025助力产业共享AI时代发展机遇
2025年中国电压互感器‌行业发展现状、竞争格局及趋势分析:智能升级驱动百亿市场,绿色转型引领产业未来[图]
2025年中国钛合金材料‌行业发展现状、竞争格局及趋势研判:高端需求驱动产业升级,钛合金在航空航天与深海领域应用前景广阔[图]
多款涡轴发动机研发取得进展——国产中小型航空动力谱系化发展驱动低空经济发展
2025年欧洲海上风电市场规模增长及市场驱动因素
两款“17ProMax”卖爆并非偶然,外观已经成核心“驱动力”
SPJ|CBS:杨广中团队提出集压电振动与原位力传感为一体的显微机器人驱动系统
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号