GEM:一次训练,随处部署,实现数据高效的动态物体操作

具身进化 2025-10-24 10:54

摘要

Abstract


实现可推广的动态物体操作对提升制造业效率至关重要,它能避免为不同场景进行重复的专用工程开发。模仿学习作为一种有前途的范式,能利用专家演示来教导机器人操作策略。然而,尽管增加演示数据可以提升策略的泛化能力,但收集这些数据本身是劳动密集型的。为此,本研究核心探讨了如何仅凭少量演示即可实现动态物体操作的强泛化能力


GEM:一次训练,随处部署,实现数据高效的动态物体操作图1


项目地址:

https://lizhuoling.github.io/GEM_webpage/


核心方法:广义熵机(GEM)

为解决上述数据效率问题,我们首先开发了一个基于熵的理论框架,用以量化模仿学习的数据需求。基于从该框架中获得的洞见,我们提出了一个名为广义熵机(GEM) 的操作系统。广泛的实验验证表明,GEM能够成功泛化至不同的环境背景、机器人本体、运动动力学和物体几何形状。

首个动态操作模拟器与高效数据生成

我们构建了首个动态物体操作模拟器。该模拟器极大地便利了算法开发,使我们能够以极低的人工成本高效生成数千个操作演示。

得益于GEM的智能设计,我们的算法能够自然地泛化至操作物体未知的运动动力学。因此,在演示采集阶段,我们仅操作静态物体,这显著降低了远程操作的挑战性。

卓越的泛化能力验证

GEM在模拟器中展现出强大的泛化性能。例如,它能够控制一台UR10e机械手成功操作不同几何形状的物体(成功率100%),而所有训练演示均基于Franka Panda机器人收集。

这意味着,在策略训练数据集中未曾出现过的机器人本体、操作物体及其运动速度,GEM都能很好地应对。

模拟到真实的零样本迁移

最显著的成果是,仅使用模拟演示进行训练的GEM,无需任何实际调整数据,便可直接推广到真实世界的动态物体操作

实验显示,即使环境背景、机器人本体和运动动力学都是未曾见过的,GEM也能成功抓取现实世界中的未知物体。凭借其强大的泛化性,GEM甚至能完成精度要求极高的任务,例如将一个方块插入一个移动的容器中,该任务仅允许两毫米的位置误差。

实际应用与前景

GEM的实用性已在真实场景中得到验证。它被部署于一所食堂进行餐具收集任务。在未使用任何该场景下的演示数据进行微调的情况下,GEM在超过10,000次操作中取得了超过97%的成功率

研究表明,若能用少量真实世界演示对策略进行进一步微调,GEM即使在全新的、未曾见过的场景中,也能实现近100%的成功率,展现出强大的应用前景。

GEM:一次训练,随处部署,实现数据高效的动态物体操作图2

往期文章

GEM:一次训练,随处部署,实现数据高效的动态物体操作图3

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
手残党跪了,Pi 0.6机器人15分钟学会拧螺丝,能进厂边干边学了
Rivian创始人RJ Scaringe再推新创企Mind Robotics,专注工业级AI机器人
椰树集团招标50台人形机器人打造全自动椰子加工线
真赚钱!宇树IPO来了,年收入17亿,人形机器人超50%,雷军感谢王兴兴
从新能源车到具身机器人,卧龙电驱再遇老对手汇川技术
北京人形机器人创新中心交付15台“天工”机器人,备战2026人机共跑半马赛事
小智一周要闻|特斯拉Optimus 3将投产;理想前高管做机器人融了20亿
中国最大家电展上,一批想帮你做家务的机器人来了!
汽车早餐 | 交通运输部要求深入实施“人工智能+交通运输”行动;吉利汽车辅助驾驶系统获欧盟认证;宝马德国工厂启用AI机器人“打螺丝”
宇树科技冲刺科创板,拟募资42亿元领跑人形机器人赛道
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号