2025年10月,IROS (智能机器人与系统国际会议)期间,上海人工智能实验室(上海AI实验室)将举办物理世界中的多模态机器人学习研讨会,IROS 2025“桃源”与真实世界机器人学习挑战赛(机器人学习挑战赛)现已启动报名,欢迎全球创新者与挑战者参加。
近期,上海AI实验室发布了『书生』具身全栈引擎Intern-Robotics,通过构建虚拟仿真建模、虚实数据贯通、训测一体化等技术体系,一站式破解具身智能从数据、训练到实际应用的全链条难题,推动具身大脑从 “碎片化开发” 迈向 “全栈化量产”时代。欢迎全球开发者体验:https://internrobotics.shlab.org.cn
挑战赛设置2大赛道,聚焦操作与导航两类具身智能典型任务,旨在打通仿真与现实壁垒,推动具身智能技术从“看起来能做”到“现实中能做”的关键跨越。
2大赛道赛程均分为线上和线下两阶段,线上赛将在“桃源 Intern·Utopia”通用具身仿真平台(GitHub地址:https://github.com/InternRobotics/InternUtopia)中进行,晋级队伍将进行线下决赛。
冠军队伍可获得七万现金奖励,优胜团队将受邀参加IROS Workshop,现场展示算法方案,与领域顶级专家面对面交流。优秀参赛者有机会参加上海AI实验室组织的各类前沿学术交流活动。
本次赛事由上海AI实验室主办,群核科技与阿德莱德大学协办,字节跳动、华为、众擎、荣耀、魔搭社区、阿里云、松灵机器人、越疆机器人等企业联合赞助支持。

参赛方式
进入赛事官网,填写报名信息(点击文末阅读原文直达)。
https://internrobotics.shlab.org.cn/challenge/2025/

(扫码报名)
赛道介绍
赛道1:开放桌面场景的视觉语言操作任务
任务简介:
本赛道旨在构建具备语言理解与执行能力的多模态机器人操作系统。参赛者需设计端到端的操控策略模型,实现从视觉感知、语言指令理解到动作控制预测的完整流程。机器人需在开放的桌面场景中,控制机械臂完成复杂指令引导下的多种操控任务。
主要挑战包括:
融合语言与视觉信息,驱动感知-决策-控制一体化流程;
长程的操作任务,挑战模型决策控制的稳定性和自我纠偏能力;
多样化的场景布局、物体类型、操作指令,挑战模型泛化能力。

赛道2:物理环境中的视觉语言导航任务
任务简介:
本赛道任务旨在构建具备语言理解能力的多模态移动机器人导航系统。参赛者需设计感知-决策模型,实现从自我中心视觉感知、语言指令理解、历史轨迹建模到导航动作预测的完整流程。机器人需在真实物理引擎环境中,驱动足式机器人(如人形机器人 Unitree H1)在语言引导下完成室内导航任务,具备应对视角抖动、高度变化及局部避障等挑战的能力,实现稳健、安全的视觉语言导航行为。
主要挑战包括:
融合语言与视觉信息,驱动感知-决策-控制一体化流程;
在物理引擎驱动的人形机器人平台上,稳健处理行走过程中的视角抖动、高度变化及局部避障等问题;
真实复杂的室内场景、多样化的导航指令,挑战模型应对复杂新场景与指令的泛化能力。

比赛奖励
总奖励价值近百万元人民币(包括奖金,奖品,机器人代金券等);
每个赛道的冠军团队七万元人民币奖金激励;
IROS 2025现场展示机会;
上海AI实验室前沿学术沙龙参会名额。
线下每个赛道的前三名均可获得现金奖励,以及差旅资助。所有线下参赛队伍可获得参赛证书和纪念品。
名次 | 奖金(元) | 其他奖励 |
第1名 | 70,000 | 奖品 + 证书 |
第2名 | 35,000 | 奖品 + 证书 |
第3名 | 21,000 | 奖品 + 证书 |
赛程安排
7月25日:报名启动及赛事材料包发布
7月30日:测试服务器上线
9月30日:提交截止
10月18日:线下挑战
10月20日:IROS 2025现场颁奖
*(日程如有调整将另行通知)
研讨会嘉宾
10月20日,上海AI实验室将在IROS 2025大会现场举办物理世界中的多模态机器人学习研讨会,多位国内外机器人学习和计算机视觉领域的顶尖专家将出席会议并分享前沿观点。
