GEM:一次训练,随处部署,实现数据高效的动态物体操作

具身进化 2025-10-24 10:54

摘要

Abstract


实现可推广的动态物体操作对提升制造业效率至关重要,它能避免为不同场景进行重复的专用工程开发。模仿学习作为一种有前途的范式,能利用专家演示来教导机器人操作策略。然而,尽管增加演示数据可以提升策略的泛化能力,但收集这些数据本身是劳动密集型的。为此,本研究核心探讨了如何仅凭少量演示即可实现动态物体操作的强泛化能力


GEM:一次训练,随处部署,实现数据高效的动态物体操作图1


项目地址:

https://lizhuoling.github.io/GEM_webpage/


核心方法:广义熵机(GEM)

为解决上述数据效率问题,我们首先开发了一个基于熵的理论框架,用以量化模仿学习的数据需求。基于从该框架中获得的洞见,我们提出了一个名为广义熵机(GEM) 的操作系统。广泛的实验验证表明,GEM能够成功泛化至不同的环境背景、机器人本体、运动动力学和物体几何形状。

首个动态操作模拟器与高效数据生成

我们构建了首个动态物体操作模拟器。该模拟器极大地便利了算法开发,使我们能够以极低的人工成本高效生成数千个操作演示。

得益于GEM的智能设计,我们的算法能够自然地泛化至操作物体未知的运动动力学。因此,在演示采集阶段,我们仅操作静态物体,这显著降低了远程操作的挑战性。

卓越的泛化能力验证

GEM在模拟器中展现出强大的泛化性能。例如,它能够控制一台UR10e机械手成功操作不同几何形状的物体(成功率100%),而所有训练演示均基于Franka Panda机器人收集。

这意味着,在策略训练数据集中未曾出现过的机器人本体、操作物体及其运动速度,GEM都能很好地应对。

模拟到真实的零样本迁移

最显著的成果是,仅使用模拟演示进行训练的GEM,无需任何实际调整数据,便可直接推广到真实世界的动态物体操作

实验显示,即使环境背景、机器人本体和运动动力学都是未曾见过的,GEM也能成功抓取现实世界中的未知物体。凭借其强大的泛化性,GEM甚至能完成精度要求极高的任务,例如将一个方块插入一个移动的容器中,该任务仅允许两毫米的位置误差。

实际应用与前景

GEM的实用性已在真实场景中得到验证。它被部署于一所食堂进行餐具收集任务。在未使用任何该场景下的演示数据进行微调的情况下,GEM在超过10,000次操作中取得了超过97%的成功率

研究表明,若能用少量真实世界演示对策略进行进一步微调,GEM即使在全新的、未曾见过的场景中,也能实现近100%的成功率,展现出强大的应用前景。

GEM:一次训练,随处部署,实现数据高效的动态物体操作图2

往期文章

GEM:一次训练,随处部署,实现数据高效的动态物体操作图3

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
2026年,塑造下一波EDA创新浪潮的关键趋势
字节跳动将Dreamina Seedance 2.0植入Capcut,Sora退场后AI视频赛道迎来王者
国产半导体破局路径引热议:九位产学研领袖联合建言“十五五”攻坚EDA、EUV与硅片
跟GPU类似,本土EDA迎来IPO潮
SEDA-EEG:一种用于跨被试EEG分析的半监督域适应情绪识别网络
字节Seedance 2.0实测:语音错乱、字幕乱码,AI视频仍是概率游戏
“芯片之母”的攻坚战,国产EDA如何成为中国集成电路突围先锋
思尔芯再获 “2026年度创新EDA公司”,以生态之力赋能复杂芯片
中国电子2026年全面布局EDA工具链与高性能芯片,加速“中国芯”自主化进程
国盾量子宣布进军EDA软件
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号