视觉-语言-导航（VLN）技术梳理：算法框架、学习范式、四大实践

深蓝具身智能 2025-08-22 10:57

视觉语言导航（VLN）是一个涉及多种学科的研究领域，涵盖了自然语言处理、计算机视觉、机器人导航、多模态信息融合等多个学科。在该领域，研究人员致力于开发能够理解自然语言指令，并在复杂环境中实现自主导航的智能体。

VLN作为具身人工智能领域的一项关键任务，其重要性日益凸显。随着具身智能的快速发展，它已经成为推动智能体自主导航和交互能力的关键技术。因为不断有新的模型和方法涌现，学习者需要不断更新知识以跟上技术的最新进展。但是数据稀缺、硬件和软件成本高、跨模态融合的挑战等诸多问题，都限制了学习者在VLN领域的学习和应用。

为此，深蓝学院联合阿德莱德大学吴琦老师及视觉语言导航公众号开设了「视觉语言导航VLN」课程，带大家全面了解VLN的基础知识、算法框架、数据资源、学习范式，以及它在现实世界中的应用方式，比如服务机器人、无人机等。

以下是课程项目实践展示：

资讯配图

（Project：AerialVLN 任务）

扫码添加

抢占限时特价名额

资讯配图

资讯配图

课程讲师

资讯配图

吴琦

澳大利亚阿德莱德大学计算机科学系副教授

吴博士在计算机视觉、自然语言处理、多模态学习与机器人导航等领域具有广泛影响。他主导的研究团队是澳大利亚最大规模的视觉语言研究团队，研究成果广泛发表于CVPR、ICCV、ECCV、NeurIPS等顶级会议。吴博士长期致力于视觉语言导航（VLN）与具身智能体研究，是该方向的重要开创者及推动者之一。

资讯配图

课程大纲

资讯配图

资讯配图

实践项目

资讯配图

资讯配图

资讯配图

课程收获

1. 深入理解VLN任务在具身智能中的定位与挑战

2. 掌握从感知、语言到行为决策的模型设计方法

3. 熟悉主流数据集、开源框架与评估方法

4. 能够设计并实现基本的VLN系统，并理解其在不同平台（机器人、无人机等）中的适配需求

5.为多模态人工智能系统的研发提供理论基础与技术储备

资讯配图

适合人群

1. 机器学习、人工智能、机器人领域的学生和工程师

2. 具身智能领域研究学者

3. 计算机视觉与自然语言处理开发者

资讯配图

课程服务

1. 三师助力

讲师&助教及时答疑解惑，班主任全程带班督学，帮你克服拖延，不断进步。

2.定期班会

助教1V1批改作业，并在班会中进行讲评和指导；在班会中，学习更多技巧；在交流中收获更多思路。

资讯配图

课程咨询

扫码添加，咨询详情

资讯配图

仅剩最后22个优惠名额

>>>现在成为星友，特享99元/年<<<

资讯配图

我们开设此账号，想要向各位对【具身智能】感兴趣的人传递最前沿最权威的知识讯息外，也想和大家一起见证它到底是泡沫还是又一场热浪？‍

欢迎关注【深蓝具身智能】👇

资讯配图

1、2.6倍成功率碾压SOTA！双 VLM 架构 + 百万数据集，打造跨平台通用具身导航框架！

2、2.6倍成功率碾压SOTA！双 VLM 架构 + 百万数据集，打造跨平台通用具身导航框架！

3、技术拆解 | Galbot闭环控制实战，从感知到指令理解、决策，如何实现机器人的精准操作

～【研发/硬件需求】咨询～

💪致力于解决各类研发、硬件、人才需求。机器人、自动驾驶、无人机等研发硬件，研发合作、企业内训、高校建设、人才内推等具身智能行业综合方案。

商务合作扫码咨询

机器人、自动驾驶、无人机等研发硬件

关于我们：深蓝学院北京总部于2017年成立，2024年成立杭州分公司，2025年成立上海分公司。

学院课程涵盖人工智能、机器人、自动驾驶等各大领域，开设近100门线上课程。拥有多个实训基地助力教学与科研，多台科研平台硬件设备可供开展算法测试与验证。

服务专业用户数达11万+（人工智能全产业链垂直领域的高净值用户），硕博学历用户占比高达70%。已与多家头部机器人企业、头部高校建立深度合作，深度赋能教育、企业端人才培养与匹配。

工作投稿｜商务合作｜转载：SL13126828869

资讯配图

【深蓝具身智能】的内容均由作者团队倾注个人心血制作而成，希望各位遵守原创规则珍惜作者们的劳动成果。

资讯配图

点击❤收藏并推荐本文

声明：内容取材于网络，仅代表作者观点，如有内容违规问题，请联系处理。

导航

more

清华RAL'25开源 | VR-Robo：通过3DGS实现机器人视觉运动与导航！

3D视觉工坊 1个月前

清华RAL'25开源 | VR-Robo：通过3DGS实现机器人视觉运动与导航！

具身机器人公司无界智慧招募操作算法、导航算法、运动控制等方向（社招+实习）

具身智能之心 4周前

具身机器人公司无界智慧招募操作算法、导航算法、运动控制等方向（社招+实习）

哈工大提出UAV-ON：面向空中智能体的开放世界目标导航基准测试

具身智能之心 4周前

哈工大提出UAV-ON：面向空中智能体的开放世界目标导航基准测试

深圳无界智慧招聘机器人导航、医疗Agent开发工程师和具身操作算法实习等岗位

3D视觉工坊 4周前

深圳无界智慧招聘机器人导航、医疗Agent开发工程师和具身操作算法实习等岗位

ACM MM'25 | 小鹏最新：利用导航指令模仿人类驾驶员的超视距自动驾驶

3D视觉工坊 1个月前

ACM MM'25 | 小鹏最新：利用导航指令模仿人类驾驶员的超视距自动驾驶

（备胎视频）导航的8个隐藏功能，你知道几个

备胎说车 2周前

（备胎视频）导航的8个隐藏功能，你知道几个

【独家】国家发布低空经济“建设圣经”！万亿赛道迎来爆发临界点；中国斩获全球最大eVTOL订单！高德抢先卡位“低空导航”赛道

低空猫头鹰 1个月前

【独家】国家发布低空经济“建设圣经”！万亿赛道迎来爆发临界点；中国斩获全球最大eVTOL订单！高德抢先卡位“低空导航”赛道

你的空中高德为你导航

飞行汽车evtol之家 1个月前

你的空中高德为你导航

登顶 ICCV 2025！清华大学提出统一具身智能导航框架：主动感知、三维视觉-语言理解

深蓝具身智能 1个月前

登顶 ICCV 2025！清华大学提出统一具身智能导航框架：主动感知、三维视觉-语言理解

传统SLAM的定位导航和具身目标导航有什么区别？

具身智能之心 4天前

传统SLAM的定位导航和具身目标导航有什么区别？

Copyright © 2025 成都区角科技有限公司

蜀ICP备2025143415号-1

川公网安备51015602001305号