清华开源！BEV-VAE：空间一致的多视角生成如何重塑自动驾驶感知？ - 科技区角清华开源！BEV-VAE：空间一致的多视角生成如何重塑自动驾驶感知？

点击下方卡片，关注「3D视觉工坊」公众号
选择星标，干货第一时间送达

3D视觉工坊很荣幸邀请到了上海期智研究院陈泽铭，为大家着重分享他们团队的工作：BEV-VAE。如果您有相关工作需要分享，欢迎文末联系我们。

BEV-VAE: Multi-view Image Generation with Spatial Consistency for Autonomous Driving
论文：https://arxiv.org/pdf/2507.00707
代码：https://github.com/Czm369/bev-vae

直播信息

时间

2025年07月21日(周一)19：00

主题

上海期智&清华！BEV-VAE：首个自监督BEV视角的VAE，从图像到场景生成跃迁~

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播，或前往B站搜索3D视觉工坊观看直播

3D视觉工坊视频号也将同步直播

主讲嘉宾

陈泽铭
上海期智研究院

现任上海期智研究院赵行团队的研究助理，硕士毕业于清华大学。主要研究方向为自动驾驶中的生成建模与三维感知，聚焦于利用AIGC技术（如扩散模型与自编码器）从多视图图像构建结构化的世界模型。

个人主页： https://czm369.github.io/

直播大纲

BEV-VAE的研究背景与灵感来源
BEV感知算法回顾：自上而下 vs 自下而上
生成模型回顾：离散表示 vs 连续隐空间
BEV-VAE架构详解
多视角图像重建实验分析
新视角图像生成能力展示
多视角图像生成实验分析
未来工作展望

参与方式

注：3D视觉工坊很荣幸邀请到了上海期智研究院陈泽铭，为大家着重分享他们团队的工作：BEV-VAE。如果您有相关工作需要分享，欢迎联系微信：cv3d009 请备注：宣传工作，则不予通过。