北大开源3D-R1:释放具身导航中的3D场景理解能力

3D视觉工坊 2025-10-09 07:00

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到了北京大学张泽宇,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎文末联系我们。

北大开源3D-R1:释放具身导航中的3D场景理解能力图13D-R1: Enhancing Reasoning in 3D VLMs for Unified Scene Understanding
主页hhttps://aigeeksgroup.github.io/3D-R1/
代码https://github.com/AIGeeksGroup/3D-R1

直播信息

时间

2025年10月09日(周四)19:00

主题

3D-R1: RL如何帮助多模态大模型理解空间信息

直播平台

3D视觉工坊视频号

点击按钮预约直播

3D视觉工坊哔哩哔哩也将同步直播北大开源3D-R1:释放具身导航中的3D场景理解能力图2

主讲嘉宾

北大开源3D-R1:释放具身导航中的3D场景理解能力图3张泽宇

张泽宇(Zeyu Zhang)是Richard Hartley教授和Ian Reid教授指导的研究员。他的主要的研究方向在于几何生成建模及其在多模态大模型、世界模型、具身智能和医疗智能中的应用。他在空间智能和生成模型领域的多项科研成果发表在计算机视觉和人工智能的顶级会议,包括 ECCV 2024,CVPR 2025, ICLR 2025 和 NeurIPS 2025。

个人主页https://steve-zeyu-zhang.github.io/

直播大纲

  1. 3D多模态表征学习
  2. RL增强多模态大模型对于空间的理解
  3. 3D多模态大模型在具身智能导航任务上的应用
  4. 3D多模态大模型在机器人操控任务上的应用

参与方式

北大开源3D-R1:释放具身导航中的3D场景理解能力图4

:3D视觉工坊很荣幸邀请到了北京大学张泽宇,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎文末联系我们。如果您有相关工作需要分享,欢迎联系微信:cv3d009,请备注:宣传工作,则不予通过。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
导航 开源
more
AI应用元年,只会yes,无视风险?软件开发的航行日志全面开源
开源机器人 XLeRobot 动手实战工作坊
5分钟AI长视频不翻车!国产开源框架杀到全球第一梯队
LingBot-Map长序列越跑越抖?港科广开源HorizonStream:48帧训练+万帧不崩,流式重建从此稳如磐石!
精彩亮点抢先看!6月25日开源欧拉使能智能化基础设施论坛即将开启
32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一
CVPR 2026 | 破解开放世界“语义盲区”:北大和华为团队携手开源大规模OmniVTG数据集,用“自我反思”机制补齐定位短板
刚刚,Mind Lab开源V1系列模型Preview,749B参数,专为Agent 后训练
全球开放!“RISC-V+AI开源生态社区”六大重点开源项目发布!
【K230/K230D新技能点亮】有趣开源项目分享:CanMV 解锁 AI 代码生成 + 硬件控制全新体验
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号