ACM MM'25 | 小鹏最新：利用导航指令模仿人类驾驶员的超视距自动驾驶

点击下方卡片，关注「3D视觉工坊」公众号
选择星标，干货第一时间送达

3D视觉工坊很荣幸邀请到了UCF三年级博士生Qucheng Peng，为大家着重分享他们团队的工作：NavigScene。如果您有相关工作需要分享，欢迎文末联系我们。

资讯配图 NavigScene: Bridging Local Perception and Global Navigation for Beyond-Visual-Range Autonomous Driving
论文：https://arxiv.org/pdf/2507.05227

直播信息

时间

2025年07月28日(周一)10：30

主题

ACM MM'25 | 小鹏最新：利用导航指令模仿人类驾驶员的超视距自动驾驶

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播，或前往B站搜索3D视觉工坊观看直播

3D视觉工坊视频号也将同步直播

主讲嘉宾

Qucheng Peng

现为UCF三年级博士生，同时在Amazon担任研究实习生。研究方向为基于高斯溅射的多模态3D场景理解，以及多模态大模型在自动驾驶等领域的应用。曾在ICLR，CVPR，ICCV，IJCAI，ACM MM等会议上发表独立一作论文，并担任BMVC领域主席，以及NIPS，ICCV，TIP，TNNLS等会议期刊审稿人。

直播大纲

自动驾驶研究问题简介
导航数据集的视觉生成和文本生成
基于导航数据集的多模态大模型后训练
基于导航数据集的视觉-语言-动作模型

参与方式

注：3D视觉工坊很荣幸邀请到了UCF三年级博士生Qucheng Peng，为大家着重分享他们团队的工作：NavigScene。如果您有相关工作需要分享，欢迎联系微信：cv3d009，请备注：姓名/昵称+工作名称，则不予通过。