北大开源3D-R1：释放具身导航中的3D场景理解能力

点击下方卡片，关注「3D视觉工坊」公众号
选择星标，干货第一时间送达

3D视觉工坊很荣幸邀请到了北京大学张泽宇，为大家着重分享他们团队的工作。如果您有相关工作需要分享，欢迎文末联系我们。

北大开源3D-R1：释放具身导航中的3D场景理解能力图1 3D-R1: Enhancing Reasoning in 3D VLMs for Unified Scene Understanding
主页：hhttps://aigeeksgroup.github.io/3D-R1/
代码：https://github.com/AIGeeksGroup/3D-R1

直播信息

时间

2025年10月09日(周四)19：00

主题

3D-R1: RL如何帮助多模态大模型理解空间信息

直播平台

3D视觉工坊视频号

点击按钮预约直播

3D视觉工坊哔哩哔哩也将同步直播北大开源3D-R1：释放具身导航中的3D场景理解能力图2

主讲嘉宾

北大开源3D-R1：释放具身导航中的3D场景理解能力图3 张泽宇

张泽宇（Zeyu Zhang）是Richard Hartley教授和Ian Reid教授指导的研究员。他的主要的研究方向在于几何生成建模及其在多模态大模型、世界模型、具身智能和医疗智能中的应用。他在空间智能和生成模型领域的多项科研成果发表在计算机视觉和人工智能的顶级会议，包括 ECCV 2024，CVPR 2025, ICLR 2025 和 NeurIPS 2025。

个人主页：https://steve-zeyu-zhang.github.io/

直播大纲

3D多模态表征学习
RL增强多模态大模型对于空间的理解
3D多模态大模型在具身智能导航任务上的应用
3D多模态大模型在机器人操控任务上的应用

参与方式

注：3D视觉工坊很荣幸邀请到了北京大学张泽宇，为大家着重分享他们团队的工作。如果您有相关工作需要分享，欢迎文末联系我们。如果您有相关工作需要分享，欢迎联系微信：cv3d009，请备注：宣传工作，则不予通过。