上海AL Lab | NavDP:跨场景及本体的通用端到端导航方法

3D视觉工坊 2025-07-28 07:00

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到了上海人工智能实验室担任青年研究员蔡文哲,为大家着重分享他们团队的工作:NavDP。如果您有相关工作需要分享,欢迎文末联系我们。

资讯配图NavDP: Learning Sim-to-Real Navigation Diffusion Policy with Privileged Information Guidance
论文https://arxiv.org/abs/2505.08712
主页https://wzcai99.github.io/navigation-diffusion-policy.github.io/
代码https://github.com/wzcai99/NavDP

直播信息

时间

2025年07月28日(周一)19:00

主题

NavDP:跨场景及本体的通用端到端导航方法

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播,或前往B站搜索3D视觉工坊观看直播

资讯配图

3D视觉工坊视频号也将同步直播

主讲嘉宾

资讯配图蔡文哲
上海人工智能实验室担任青年研究员

现于上海人工智能实验室担任青年研究员,博士毕业于东南大学,师从孙长银教授。研究方向为端到端视觉导航,视觉语言导航,强化学习等。在CoRL, ICLR, NeurIPS, ICRA, TNNLS等会议期刊发表论文多篇,并担任RA-L, ICRA, IROS, CoRL等学术会议与期刊审稿人。

个人主页https://wzcai99.github.io/

直播大纲

  1. 端到端视觉导航模型概述
  2. 仿真导航数据生成
  3. NavDP网络结构及训练
  4. 仿真评测与真机部署
  5. 结论与展望

参与方式

资讯配图

:33D视觉工坊很荣幸邀请到了上海人工智能实验室担任青年研究员蔡文哲,为大家着重分享他们团队的工作:NavDP。如果您有相关工作需要分享,欢迎联系微信:cv3d009,请备注:姓名/昵称+工作名称,则不予通过。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
导航
more
具身导航最新SOTA!清华联合智源提出NavA³框架,已成功部署轮式和四足机器人
大话一下!具身里面视觉语言导航和目标导航有什么区别?
ICCV25满分论文| MTU3D统一空间理解与主动探索的具身导航
视觉-语言-导航(VLN)技术梳理:算法框架、学习范式、四大实践
机器人通用导航的底层密码:扩散模型,如何打通场景与平台壁垒?(2篇标志性成果解读)
新车:新款奕派008售价17.36万起;比亚迪新车卖130万;小米SU7上线截图导航功能;小鹏新P7外观细节公布
什么是真正强大的具身智能?顶会顶刊解读:Zero-Shot 导航如何在复杂数据集上实现 SOTA 性能!
Meta“手滑”曝光4款智能眼镜,带屏、HUD导航、隔空打字腕带,售价或超5000元
导航App上的红绿灯读秒有什么用
一文解码百度地图AI导航“小度想想”
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号