上海AL Lab | NavDP：跨场景及本体的通用端到端导航方法

3D视觉工坊 2025-07-28 07:00

点击下方卡片，关注「3D视觉工坊」公众号
选择星标，干货第一时间送达

3D视觉工坊很荣幸邀请到了上海人工智能实验室担任青年研究员蔡文哲，为大家着重分享他们团队的工作：NavDP。如果您有相关工作需要分享，欢迎文末联系我们。

资讯配图 NavDP: Learning Sim-to-Real Navigation Diffusion Policy with Privileged Information Guidance
论文：https://arxiv.org/abs/2505.08712
主页：https://wzcai99.github.io/navigation-diffusion-policy.github.io/
代码：https://github.com/wzcai99/NavDP

直播信息

时间

2025年07月28日(周一)19：00

主题

NavDP：跨场景及本体的通用端到端导航方法

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播，或前往B站搜索3D视觉工坊观看直播

资讯配图

3D视觉工坊视频号也将同步直播

主讲嘉宾

资讯配图 蔡文哲
上海人工智能实验室担任青年研究员

现于上海人工智能实验室担任青年研究员，博士毕业于东南大学，师从孙长银教授。研究方向为端到端视觉导航，视觉语言导航，强化学习等。在CoRL, ICLR, NeurIPS, ICRA, TNNLS等会议期刊发表论文多篇，并担任RA-L, ICRA, IROS, CoRL等学术会议与期刊审稿人。

个人主页: https://wzcai99.github.io/

直播大纲

端到端视觉导航模型概述
仿真导航数据生成
NavDP网络结构及训练
仿真评测与真机部署
结论与展望

参与方式

资讯配图

注：33D视觉工坊很荣幸邀请到了上海人工智能实验室担任青年研究员蔡文哲，为大家着重分享他们团队的工作：NavDP。如果您有相关工作需要分享，欢迎联系微信：cv3d009，请备注：姓名/昵称+工作名称，则不予通过。

声明：内容取材于网络，仅代表作者观点，如有内容违规问题，请联系处理。

导航

more

具身导航最新SOTA！清华联合智源提出NavA³框架，已成功部署轮式和四足机器人

智猩猩 1周前

具身导航最新SOTA！清华联合智源提出NavA³框架，已成功部署轮式和四足机器人

大话一下！具身里面视觉语言导航和目标导航有什么区别？

具身智能之心 1个月前

大话一下！具身里面视觉语言导航和目标导航有什么区别？

ICCV25满分论文| MTU3D统一空间理解与主动探索的具身导航

3D视觉工坊 3周前

ICCV25满分论文| MTU3D统一空间理解与主动探索的具身导航

视觉-语言-导航（VLN）技术梳理：算法框架、学习范式、四大实践

深蓝具身智能 3周前

视觉-语言-导航（VLN）技术梳理：算法框架、学习范式、四大实践

机器人通用导航的底层密码：扩散模型，如何打通场景与平台壁垒？（2篇标志性成果解读）

深蓝具身智能 4周前

机器人通用导航的底层密码：扩散模型，如何打通场景与平台壁垒？（2篇标志性成果解读）

新车：新款奕派008售价17.36万起；比亚迪新车卖130万；小米SU7上线截图导航功能；小鹏新P7外观细节公布

好机友 1个月前

新车：新款奕派008售价17.36万起；比亚迪新车卖130万；小米SU7上线截图导航功能；小鹏新P7外观细节公布

什么是真正强大的具身智能？顶会顶刊解读：Zero-Shot 导航如何在复杂数据集上实现 SOTA 性能！

深蓝具身智能 5天前

什么是真正强大的具身智能？顶会顶刊解读：Zero-Shot 导航如何在复杂数据集上实现 SOTA 性能！

Meta“手滑”曝光4款智能眼镜，带屏、HUD导航、隔空打字腕带，售价或超5000元

智东西 2天前

Meta“手滑”曝光4款智能眼镜，带屏、HUD导航、隔空打字腕带，售价或超5000元

导航App上的红绿灯读秒有什么用

备胎说车 1个月前

导航App上的红绿灯读秒有什么用

一文解码百度地图AI导航“小度想想”

百度AI 1周前

一文解码百度地图AI导航“小度想想”

Copyright © 2025 成都区角科技有限公司

蜀ICP备2025143415号-1

川公网安备51015602001305号