《Science Robotics》封面:DeepMind发布RoboBallet,重新定义多机器人协同规划

机器人大讲堂 2025-09-17 19:10

资讯配图


在现代工业制造中,无论是汽车焊接、电子产品装配、飞机喷漆还是建筑构件安装,多机器人系统正逐渐成为提升生产效率的关键技术。


通过在同一工作单元中部署多个机械臂,企业可以在不显著增加成本和空间的前提下,大幅缩短任务执行时间、提高整体产能。然而,尽管多机器人系统在理论上潜力巨大,其实际部署却面临一个根本性的挑战:如何在共享且充满障碍物的环境中,高效、安全地协调多个机器人完成多项任务?


▍多机器人协调的“三座大山”


多机器人协同需同时解决三个核心子问题,每个问题单独求解已属“计算硬骨头”,而三者的耦合关系更让传统方法难以突破:


运动规划(Motion Planning需为每个机器人规划“无碰撞路径”,确保末端执行器精准抵达目标位置。传统基于采样的算法(如 RRT)在低维度场景中表现尚可,但当机器人数量超过 个、障碍物复杂度提升时,计算时间呈 “指数级增长”


资讯配图


任务调度(Scheduling):

决定任务执行顺序,类似经典的“旅行商问题(TSP)”,属于 PSPACE 完全问题(计算复杂度随任务量呈指数上升)。即使采用近似解法,也需预设大量规则,难以适配动态场景。


任务分配(Assignment则需决定哪个机器人执行哪个任务但每个任务的“成本”并不是独立的,而是依赖于其他任务的分配和调度结果。


更棘手的是,三个子问题存在“牵一发而动全身” 的耦合关系:任务分配决定 “谁做什么”→ 直接影响调度阶段 “先做什么” 的顺序→ 调度顺序改变机器人的运动路径需求→ 路径耗时又反过来修正任务分配的合理性。


传统方案通常将三者“拆分迭代求解”:先人工分配任务,再规划调度顺序,最后计算运动路径。这种模式不仅依赖数百甚至数千小时的人工经验还常为了计算可行性牺牲解决方案的质量和完整性


RoboBallet:一种基于神经网络与强化学习的新范式


据探索前沿科技边界,传递前沿科技成果的X-robot投稿为了应对这一挑战,来自伦敦大学学院/谷歌DeepMind工程师Matthew Lai及其研究团队提出了一种名为RoboBallet的新型框架,它结合了图神经网络(GNN) 和强化学习(RL),旨在自动化地解决多机器人的任务分配、调度和运动规划问题。该研究成果以RoboBallet: Planning for multirobot reaching with graph neural networks and reinforcement learning”问题发表在国际顶级期刊《Science Robotics》上。


资讯配图


RoboBallet的核心创新在于其场景的图表示和基于GNN的策略网络。具体而言,RoboBallet将整个协同场景抽象为 “动态图”,其中:


节点(Nodes表示每个机器人个体,其特征包含位置、速度、目标状态等。


边(Edges表示机器人之间的交互关系,通常根据空间邻近性定义,例如相距在一定阈值内的两个机器人视为互相关联。


GNN能够高效处理这种结构化信息。无论图中增加了多少任务或障碍物,GNN的核心处理逻辑是不变的,它学会了“如何理解一对元素之间的关系”。这种“关系归纳偏差”使得模型具备极强的泛化能力,能够轻松应对在训练中从未见过的障碍物布局、机器人位置和任务分布。


资讯配图


在强化学习框架设计方面,RoboBallet采微调TD3Twin-Delayed Deep Deterministic Policy Gradient)算法来训练策略网络。使模型能够生成多机械臂轨迹,同时解决任务分配、调度和运动规划等子问题,使得昂贵的在线计算转移到了离线训练阶段。


团队还设计了奖励机制函数,其包含两个主要组成部分:任务完成奖励和碰撞惩罚。


任务完成奖励基于已解决任务比例的变化,而碰撞惩罚则对可能导致碰撞的动作施加负奖励。这种设计鼓励智能体既高效完成任务,又避免危险的碰撞情况。此外,研究团队还采用了HER技术通过在失败回合中重新标记目标来生成额外的训练数据,从而提供更丰富的学习信号。


接着研究团队在程序化生成的随机环境中对模型进行训练。每一轮训练开始时,系统会随机生成机器人的位置、长方体障碍物的布局和任务目标位姿。通过数百万次这样的随机环境交互,模型逐渐学会如何协调多个机器人高效、无碰撞地完成所有任务。


在计算效率方面,RoboBallet表现更为突出:在NVIDIA A100 GPU上,即使是8个机器人、40个任务、30个障碍物的最大配置,每个规划步骤仅需约0.3毫秒;即使是在CPU上运行,也能实现3倍于实时的规划速度。这种高效性使得RoboBallet可用于实时重新规划、动态响应环境变化等需要快速决策的场景。


▍实验结果证明可扩展性、通用性与实用性


为了系统评估RoboBallet的扩展性与泛化性能,研究团队设计了一套全面的实验框架。在训练过程中,每个回合均使用随机生成的环境,包括动态分布的机器人初始位姿、障碍物布局以及任务目标。


机器人被随机放置在一条长度为1.6米的虚拟轨道周围,并排除了初始即发生碰撞的配置。障碍物由30个立方体构成,其位置与朝向均随机生成,且确保不与机器人初始状态重叠。任务目标点通过在障碍物表面均匀采样生成,并附加一个微小的法向偏移,使其略微脱离表面。


资讯配图


评估主要围绕两个关键指标展开:一是整体轨迹执行时间,即从开始至所有任务完成的总耗时;二是轨迹质量,通过与基线方法在最优性方面的对比进行衡量。鉴于现有方法难以应对大规模场景,团队在缩减规模的问题设置(包含4个机器人和20个任务)中进行了对比实验,比较对象为基于RRT-Connect和穷举调度的基准算法。


实验结果表明,尽管基于强化学习的方法并不具备理论上的完备性,但其所得轨迹在成本方面与基线方法相当,甚至在多数情况下表现更优,而基线方法则需要消耗数量级更多的计算资源,且依赖较强的简化假设。


RoboBallet在训练和推理阶段均展现出良好的可扩展性。训练所需步数并未随机器人或任务数量的增加呈指数增长;推理时间则与机器人数量的平方、任务及障碍物的数量成线性关系,在实际应用中具备可行性。


资讯配图

可扩展性与泛化性的训练曲线


实验还发现,增加机器人数量能够显著提高任务执行效率。例如在优化布局的条件下,机器人从4台增至8台,平均执行时间从7.5秒减少到4.5秒,降幅达40%


资讯配图

工作单元的布局优化


这也是RoboBallet架构的核心优势,能够将从小规模训练中学到的协作模式推广到更大规模场景。


关于X-robot


X-robot是中关村机器人产业创新中心与机器人大讲堂联手打造的权威性信息发布品牌专栏,集前沿探索、产业研究、知识普及于一体,致力于积极推动新质生产力的生成与发展,助力我国乃至全球机器人行业的蓬勃繁荣。X-robot立足国际化视野,通过全方位、多角度的挖掘与追踪,生动展现机器人前沿技术与尖端成果,为学术界、产业界及公众提供一个洞见未来、共享科技的重要窗口。


论文链接:https://www.science.org/doi/10.1126/scirobotics.ads1204



如需咨询企业合作事宜,欢迎联系机器人大讲堂-客服(19560423866,手机与微信同号)进行对接。


----------------END-------------------

资讯配图



工业机器人企业

埃斯顿自动化 | 埃夫特机器人 | 非夕科技 | 法奥机器人 | 越疆机器人 | 节卡机器人 | 松灵机器人 | 珞石机器人 盈连科技 集萃智造 | 优傲机器人 | CGXi长广溪智造 | 阿童木机器人 极智嘉

服务与特种机器人企业

亿嘉和 | 晶品特装 | 七腾机器人 史河机器人 | 九号机器人 | 普渡机器人 | 小笨智能 | 机器姬

医疗机器人企业

元化智能 | 天智航 | 思哲睿智能医疗 | 精锋医疗 | 佗道医疗 | 真易达 | 术锐®机器人 | 罗森博特 | 磅客策 | 柏惠维康 | 迪视医疗 | 水木东方

人形机器人企业

优必选科技 | 宇树 | 云深处 | 星动纪元 | 伟景机器人 | 逐际动力 | 乐聚机器人 | 大象机器人 | 中科深谷 | 魔法原子 | 众擎机器人 | 帕西尼感知 | 赛博格机器人 | 数字华夏 | 理工华汇 | 傅利叶智能 | 天链机器人 | 开普勒人形机器人 | 灵宝CASBOT | 清宝机器人 | 浙江人形机器人创新中心 | 动易科技智身科技 | PNDbotics

具身智能企业

跨维智能 | 银河通用 | 千寻智能 | 灵心巧手 | 睿尔曼智能 | 微亿智造 | 推行科技 | 中科硅纪 | 枢途科技 | 灵巧智能 | 星尘智能 | 穹彻智能 | 方舟无限 | 科大讯飞 | 北京人形机器人创新中心| 国地共建人形机器人创新中心 | 擎朗智能 | 戴盟机器人 视比特机器人星海图 月泉仿生 | 零次方机器人

核心零部件企业

绿的谐波 | 因时机器人 | 坤维科技 | 脉塔智能 | 青瞳视觉 | 本末科技 | 鑫精诚传感器 | 蓝点触控 | BrainCo强脑科技 | 宇立仪器 | 极亚精机 | 思岚科技 | 神源生 | 非普导航科技 | 锐驰智光 | NOKOV度量科技 | 因克斯 | 褔德机器人 | 巨蟹智能驱动 | 微悍动力 | 凌云光 元客视界 璇玑动力意优科技| 瑞源精密 | 灵足时代 Xynova曦诺未来 | HIT华威科

教育机器人企业

硅步机器人 | 史河科教机器人 | 大然机器人

加入社群

欢迎加入【机器人大讲堂】读者讨论群, 共同探讨机器人相关领域话题,共享前沿科技及产业动态,添加微信“robospeak2018”入群!


资讯配图
资讯配图



看累了吗?戳一下“在看”支持我们吧

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
IC 机器人
more
蚂蚁集团旗下灵波科技推出首款R1服务人形机器人,已投入试点
“重启”布局移动机器人后,Rethink Robotics再次倒闭
海康机器人发布三大生态新品,助推移动机器人产业协同
PharmAGRI称与特斯拉签署意向书,拟采购1万台Optimus 3+人形机器人
【会员风采】我会会员单位科钛机器人:极简版CP15——极简工业智能,赋能柔性制造
特斯拉机器人被官宣获10000台订单!
快讯|Figure融资10亿估值达390亿美元;Rethink Robotics再次倒闭;西湖大学研发昆虫尺度软体机器人等
ADI "激活边缘智能 共绘具身未来":探寻人形机器人的工业智能新征程
【智合·政策速览】工信部公布智能养老服务机器人结对攻关与场景应用试点项目名单!
链接技术与产业生态,聚焦落地与真实场景!2025年第二届中关村具身智能机器人应用大赛持续征集报名
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号