ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控

新智元 2026-07-05 12:41

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图1

  新智元报道  

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图2

【新智元导读】SymSkill创新性地融合模仿学习与经典规划,使机器人能从少量演示中归纳技能,并实时组合执行复杂任务。这项成果推动机器人从「记忆动作」迈向「理解任务」,为智能家庭服务机器人带来新突破。

2026年6月初,在维也纳国际会议中心落幕的ICRA 2026上,从多瑙河畔传来消息:

来自宾夕法尼亚大学GRASP实验室的博士生Yifei Shao(邵逸飞) 作为第一作者的论文一举斩获两项ICRA最高学术荣誉:Best Conference Paper Award(大会最佳论文奖) 和 Best Paper Award on Planning and Control(规划与控制方向最佳论文奖)。

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图3

论文链接:https://arxiv.org/abs/2510.01661

一篇论文同时揽获两项大奖,在ICRA历史上较为罕见,也标志着GRASP实验室在机器人规划与控制领域的又一次跨越式突破。

让机器人在真实世界中执行复杂的多步骤操控任务,一直是机器人学最核心也最棘手的挑战之一。

现有方法主要分为两大流派,却各自陷入困境:模仿学习反应迅速,但缺乏组合泛化能力,学习到的往往是「单一体策略」,环境稍有变化就无法拆解复用旧技能;而经典的任务与运动规划虽然有良好的符号抽象和组合能力,但规划延迟动辄数十秒甚至上百秒,根本无法支持实时故障恢复。

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图4

SymSkill的突破在于——它不再在这两条路径中做选择题,而是搭建了一座桥。论文提出了一套统一的学习框架,将两者的优势无缝融合:离线的符号与技能共创与在线的实时执行。

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图5

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图6
核心技术架构

SymSkill的核心创新可以概括为两个阶段:

离线阶段——符号与技能共创。 

与以往需要人工标注和分割演示数据的方法不同,SymSkill能够直接从无标签、无分割的机器人演示数据中,以无监督的方式联合学习谓词、操作符和目标导向技能。

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图7

这意味着,机器人只需要观看少量演示(每个任务仅需约5次演示数据),就能自行「归纳」出完成任务所需的符号抽象和技能库。

在线阶段——实时组合与恢复。

执行时,一旦用户指定一个或多个目标谓词,SymSkill就会调用符号规划器来动态组合和重排已学技能以达到符号目标,同时在运动层级和符号层级同时执行故障恢复。配合柔顺控制器,SymSkill能够在人类和环境扰动下实现安全、不间断的执行。

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图8

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图9
实验表现与意义

实验数据令人信服。在RoboCasa模拟环境中,SymSkill成功执行了12个单步任务,成功率达85%;面对需要多达6次技能重排的多步复杂任务时,SymSkill仍能从执行失败中稳健恢复。

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图10

而最令学界惊叹的是真实机器人实验:在一台真实的Franka机器人上,SymSkill仅用5分钟的无分割、无标签玩耍数据作为训练素材,仅通过目标指令即可操控机器人执行多种任务。这种数据效率在此前的规划系统中几乎不可想象。

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图11

这项研究的更深层意义在于,它让机器人从「背答案」进化到了「理解题目」——不再是简单记忆动作序列,而是能够抽象出任务背后的符号结构,并根据现实变化实时调整策略。

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图12

SymSkill为下一代通用家庭服务机器人提供了一条从「反应型模仿」走向「推理型执行」的可行路径。


ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图13
作者信息


一作Yifei Shao(邵逸飞) 是宾大计算机与信息科学系的博士生,师从Vijay Kumar教授与Pratik Chaudhari教授,并与Nadia Figueroa教授合作。主攻符号规划与运动规划的融合理论。

在该研究中,他主导了SymSkill整体框架的设计与符号规划器的开发,是论文核心思想的主要构建者。其他两位博士生作者为Yuchen Zheng(郑宇辰)和Sunan Sun(孙苏楠)。

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图14


参考资料:

https://arxiv.org/abs/2510.01661


编辑:LRST


秒追ASI
点赞、转发、在看一键三连
点亮星标,锁定新智元极速推送!

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图15

ICRA'26双奖加冕!华人博士生重新定义机器人长时程操控图16


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
IC 机器人
more
Anthropic、OpenAI同一天落子AI4S赛道,巨头混战从「拼模型」转向「卡生态」
突发!Anthropic拟全面封禁地下通道,国产的机会要来了吗?
IC设计版本管理:从设计数据版本管控到企业级协同
Anthropic 将删除「中国用户检测代码」;马斯克曾展示 AI 手机原型机;索尼:2028 年后不再卖游戏光盘|极客早知道
关于CPO、Micro LED,京东方成立技术攻关项目组
伯克利系主任出走Anthropic:一个理论算法大牛背后,藏着Anthropic怎样的野心?
中国用户被针对!Anthropic承认私藏“木马”Claude信任崩塌,网友直呼太可怕
慕展抢先看 | Allegro 推出首款集成轮速传感器接口的安全型 PMIC,专为电子机械制动系统打造
大疆这5年出了这么多Mic,我们反而更好选了?
突发!Anthropic拟全面封禁地下通道
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号