摘要
Abstract
实现可推广的动态物体操作对提升制造业效率至关重要,它能避免为不同场景进行重复的专用工程开发。模仿学习作为一种有前途的范式,能利用专家演示来教导机器人操作策略。然而,尽管增加演示数据可以提升策略的泛化能力,但收集这些数据本身是劳动密集型的。为此,本研究核心探讨了如何仅凭少量演示即可实现动态物体操作的强泛化能力。

项目地址:
https://lizhuoling.github.io/GEM_webpage/
核心方法:广义熵机(GEM)
为解决上述数据效率问题,我们首先开发了一个基于熵的理论框架,用以量化模仿学习的数据需求。基于从该框架中获得的洞见,我们提出了一个名为广义熵机(GEM) 的操作系统。广泛的实验验证表明,GEM能够成功泛化至不同的环境背景、机器人本体、运动动力学和物体几何形状。
首个动态操作模拟器与高效数据生成
我们构建了首个动态物体操作模拟器。该模拟器极大地便利了算法开发,使我们能够以极低的人工成本高效生成数千个操作演示。
得益于GEM的智能设计,我们的算法能够自然地泛化至操作物体未知的运动动力学。因此,在演示采集阶段,我们仅操作静态物体,这显著降低了远程操作的挑战性。
卓越的泛化能力验证
GEM在模拟器中展现出强大的泛化性能。例如,它能够控制一台UR10e机械手成功操作不同几何形状的物体(成功率100%),而所有训练演示均基于Franka Panda机器人收集。
这意味着,在策略训练数据集中未曾出现过的机器人本体、操作物体及其运动速度,GEM都能很好地应对。
模拟到真实的零样本迁移
最显著的成果是,仅使用模拟演示进行训练的GEM,无需任何实际调整数据,便可直接推广到真实世界的动态物体操作。
实验显示,即使环境背景、机器人本体和运动动力学都是未曾见过的,GEM也能成功抓取现实世界中的未知物体。凭借其强大的泛化性,GEM甚至能完成精度要求极高的任务,例如将一个方块插入一个移动的容器中,该任务仅允许两毫米的位置误差。
实际应用与前景
GEM的实用性已在真实场景中得到验证。它被部署于一所食堂进行餐具收集任务。在未使用任何该场景下的演示数据进行微调的情况下,GEM在超过10,000次操作中取得了超过97%的成功率。
研究表明,若能用少量真实世界演示对策略进行进一步微调,GEM即使在全新的、未曾见过的场景中,也能实现近100%的成功率,展现出强大的应用前景。

往期文章
