ICCV25满分论文| MTU3D统一空间理解与主动探索的具身导航

3D视觉工坊 2025-08-26 07:00

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到了清华大学计算机系博四在读诸子钰,为大家着重分享他们团队的工作:MTU3D。如果您有相关工作需要分享,欢迎文末联系我们。

资讯配图Move to Understand a 3D Scene: Bridging Visual Grounding and Exploration for Efficient and Versatile Embodied Navigation
论文https://arxiv.org/pdf/2507.04047
主页https://mtu3d.github.io/
代码库https://github.com/MTU3D/MTU3D

直播信息

时间

2025年08月26日(周二)19:00

主题

ICCV25满分论文| MTU3D统一空间理解与主动探索的具身导航

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播,或前往B站搜索3D视觉工坊观看直播

资讯配图

3D视觉工坊视频号也将同步直播

主讲嘉宾

资讯配图诸子钰
清华大学计算机系博四在读

清华大学计算机系博四在读,师从邓志东教授。 研究方向为3D空间理解,视觉语言学习,具身智能,空间导航。代表工作为3D-VisTA, PQ3D, MTU3D系列。

直播大纲

  1. 具身智能背景介绍,和3D空间理解的关系
  2. 3D空间理解的相关工作和难点分析
  3. MTU3D是如何统一空间理解和主动探索的
  4. 实验结果和应用

参与方式

资讯配图

:3D视觉工坊很荣幸邀请到了清华大学博士生诸子钰,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎联系微信:cv3d009,请备注:宣传工作,则不予通过。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
IC 导航
more
全球三大机器人展盘点:德国慕尼黑机器人展(automatica) 、中国工博会机器人展(RS) 、日本东京机器人展(iREX)
ICLR2025:脑机绘影,中科院自动化所Mind-Animator从大脑信号中解码出动态视频
ICCV 2025 | 机器人非抓取操作重大突破!北大&银河通用王鹤团队提出自适应世界动作模型DyWA
ICCV 2025 | ECD:高质量合成图表数据集,提升开源MLLM图表理解能力
ICCV 2025 | 打造通用工具智能体的基石:北大提出ToolVQA数据集,引领多模态多步推理VQA新范式
【他山之石】ICCV 2025 | ECD:高质量合成图表数据集,提升开源MLLM图表理解能力
荣耀Magic新机官宣:8月28日,正式发布!
强化学习之父Richard Sutton最新架构OaK 架构对机器人的启示
ICCV 2025 | 打造通用工具智能体的基石:北大提出ToolVQA数据集
小米16小直屏新旗舰中最大电池?| 荣耀Magic8系列入网 中屏8E2来了
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号