点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达
3D视觉工坊很荣幸邀请到了上海期智研究院陈泽铭,为大家着重分享他们团队的工作:BEV-VAE。如果您有相关工作需要分享,欢迎文末联系我们。
BEV-VAE: Multi-view Image Generation with Spatial Consistency for Autonomous Driving
论文:https://arxiv.org/pdf/2507.00707
代码:https://github.com/Czm369/bev-vae
直播信息
时间
2025年07月21日(周一)19:00
主题
上海期智&清华!BEV-VAE:首个自监督BEV视角的VAE,从图像到场景生成跃迁~
直播平台
3D视觉工坊哔哩哔哩
扫码观看直播,或前往B站搜索3D视觉工坊观看直播

3D视觉工坊视频号也将同步直播
主讲嘉宾
陈泽铭
上海期智研究院
现任上海期智研究院赵行团队的研究助理,硕士毕业于清华大学。主要研究方向为自动驾驶中的生成建模与三维感知,聚焦于利用AIGC技术(如扩散模型与自编码器)从多视图图像构建结构化的世界模型。
个人主页: https://czm369.github.io/
直播大纲
BEV-VAE的研究背景与灵感来源 BEV感知算法回顾:自上而下 vs 自下而上 生成模型回顾:离散表示 vs 连续隐空间 BEV-VAE架构详解 多视角图像重建实验分析 新视角图像生成能力展示 多视角图像生成实验分析 未来工作展望
参与方式

注:3D视觉工坊很荣幸邀请到了上海期智研究院陈泽铭,为大家着重分享他们团队的工作:BEV-VAE。如果您有相关工作需要分享,欢迎联系微信:cv3d009 请备注:宣传工作,则不予通过。