点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达
3D视觉工坊很荣幸邀请到了香港大学余济闻,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎文末联系我们。
GameFactory: Creating New Games with Generative Interactive Videos
论文:https://arxiv.org/pdf/2501.08325
主页:https://yujiwen.github.io/gamefactory/
代码:https://github.com/KwaiVGI/GameFactory
数据集:https://huggingface.co/datasets/KwaiVGI/GameFactory-Dataset
直播信息
时间
2025年08月01日(周五)19:00
主题
GameFactory:迈向交互式生成视频的更高级智能
直播平台
3D视觉工坊哔哩哔哩
扫码观看直播,或前往B站搜索3D视觉工坊观看直播

3D视觉工坊视频号也将同步直播
主讲嘉宾
余济闻
香港大学一年级博士生
香港大学一年级博士生,主要研究视频生成,世界模型以及具身智能。他曾在CVPR,ICCV,ICLR,ICML,NeurIPS,TPAMI,IJCV等人工智能领域的著名国际会议和期刊发表多篇学术论文。
个人主页:https://yujiwen.github.io/
直播大纲
交互式视频生成最近被认为有潜力能够仿真真实世界。通过视频生成来对交互控制信号进行反馈,从而模拟世界的变化,这将促进很多下游领域的发展,例如具身智能,游戏以及自动驾驶。我们尝试对交互生成视频的发展路线做了总结和展望,并在此基础上研究了GameFactory,尝试从流式视频生成和可泛化的控制两个角度来推动交互式生成视频的技术发展。
背景:交互式生成视频的定义以及范围是什么?终极目标是什么? 发展现状: 交互式生成视频的发展路线是什么?有哪些重要的能力模块需要实现?每个模块目前的发展现状和痛点问题是什么? GameFactory:此工作解决了交互式生成视频能力模块中的哪些能力?具体是怎么做的?未来的研究方向是什么?
参与方式

注:3D视觉工坊很荣幸邀请到了香港大学余济闻,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎联系微信:cv3d009
,请备注:姓名/昵称+工作名称
,则不予通过。