GEM:一次训练,随处部署,实现数据高效的动态物体操作

具身进化 2025-10-24 10:54

摘要

Abstract


实现可推广的动态物体操作对提升制造业效率至关重要,它能避免为不同场景进行重复的专用工程开发。模仿学习作为一种有前途的范式,能利用专家演示来教导机器人操作策略。然而,尽管增加演示数据可以提升策略的泛化能力,但收集这些数据本身是劳动密集型的。为此,本研究核心探讨了如何仅凭少量演示即可实现动态物体操作的强泛化能力


GEM:一次训练,随处部署,实现数据高效的动态物体操作图1


项目地址:

https://lizhuoling.github.io/GEM_webpage/


核心方法:广义熵机(GEM)

为解决上述数据效率问题,我们首先开发了一个基于熵的理论框架,用以量化模仿学习的数据需求。基于从该框架中获得的洞见,我们提出了一个名为广义熵机(GEM) 的操作系统。广泛的实验验证表明,GEM能够成功泛化至不同的环境背景、机器人本体、运动动力学和物体几何形状。

首个动态操作模拟器与高效数据生成

我们构建了首个动态物体操作模拟器。该模拟器极大地便利了算法开发,使我们能够以极低的人工成本高效生成数千个操作演示。

得益于GEM的智能设计,我们的算法能够自然地泛化至操作物体未知的运动动力学。因此,在演示采集阶段,我们仅操作静态物体,这显著降低了远程操作的挑战性。

卓越的泛化能力验证

GEM在模拟器中展现出强大的泛化性能。例如,它能够控制一台UR10e机械手成功操作不同几何形状的物体(成功率100%),而所有训练演示均基于Franka Panda机器人收集。

这意味着,在策略训练数据集中未曾出现过的机器人本体、操作物体及其运动速度,GEM都能很好地应对。

模拟到真实的零样本迁移

最显著的成果是,仅使用模拟演示进行训练的GEM,无需任何实际调整数据,便可直接推广到真实世界的动态物体操作

实验显示,即使环境背景、机器人本体和运动动力学都是未曾见过的,GEM也能成功抓取现实世界中的未知物体。凭借其强大的泛化性,GEM甚至能完成精度要求极高的任务,例如将一个方块插入一个移动的容器中,该任务仅允许两毫米的位置误差。

实际应用与前景

GEM的实用性已在真实场景中得到验证。它被部署于一所食堂进行餐具收集任务。在未使用任何该场景下的演示数据进行微调的情况下,GEM在超过10,000次操作中取得了超过97%的成功率

研究表明,若能用少量真实世界演示对策略进行进一步微调,GEM即使在全新的、未曾见过的场景中,也能实现近100%的成功率,展现出强大的应用前景。

GEM:一次训练,随处部署,实现数据高效的动态物体操作图2

往期文章

GEM:一次训练,随处部署,实现数据高效的动态物体操作图3

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
工人罢工半年,美国包装巨头一怒之下关闭工厂!168人失业!
福华化学智慧工厂项目可行性研究报告
独家调查丨楚能造车,要盘活威马工厂?
宝马打造全球首个AI工厂,背后有5G技术作为驱动
小米回应工厂起火,长鑫发布全新DDR5内存,毫末智行已停工解散,摩尔线程启动申购,这就是今天的其他大新闻!
安世半导体东莞工厂,原材料告急、已限制出货、员工将“上四休三”!
雷军:人形机器人将大面积进入小米工厂;淘宝闪购将全面取消超时扣款;苹果新专利:耳机读取脑电波 | 极客早知道
黄仁勋站台,台积电美工厂造出首片英伟达Blackwell晶圆
小米辟谣汽车工厂内电池产线起火
小米17 Pro背屏新功能,小米智能家电工厂投产
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号