机器人想要实现通用实用性,需要在真实场景中稳定运行,以应对各类动态干扰,包括地形变化、外力作用及自身物理属性改变等情况。为达成这一目标,国内研究人员最近提出了一种创新的两阶段强化学习(RL)框架:Any2Track,可在真实世界中跟踪多种干扰条件下的各类运动。这项研究的主要作者来自清华和北大,多数人同时在银河通用(Galbot)任职,北京大学助理教授、银河通用机器人创始人及CTO王鹤,上海期智研究院PI、清华大学交叉信息研究院助理教授弋力等也参与了这项研究。Any2Track将动态适应性重新定义为基础动作执行能力之外的附加能力,该团队在宇树(Unitree)G1机器人硬件上部署了Any2Track,并以“零样本”方式成功实现了从仿真到现实的迁移,在真实世界多种干扰条件下跟踪各类运动时,Any2Track表现格外出色。人形机器人运动跟踪,旨在在机器人平台上复现人类运动序列,相较于纯基于强化学习(RL)的控制器,该技术能让机器人实现更具表现力与类人特征的运动行为。然而,现有人形机器人运动跟踪器无法同时具备通用运动跟踪能力与动态适应性——它们在运动跟踪能力以及对真实世界不同干扰的抗干扰能力方面,均表现出不同程度的局限性。行业面临的挑战主要有两点:1、如何构建一个统一的通用运动跟踪器,以高效、高质量地学习多样的运动控制策略;2、如何为控制器赋予在线动态适应能力,从而克服“仿真-现实”(sim2real)动态差异及真实世界中的各类干扰。
具体而言,Any2Track框架由两大核心组件组成:AnyTracker(任意跟踪器)与AnyAdapter(任意适配器)。在第一阶段,研究人员构建了AnyTracker——一款用于跟踪多样、高动态且富含接触交互类运动的通用运动跟踪器。研究发现,训练通用运动跟踪器的瓶颈在于高自由度与运动多样性所带来的复杂动作空间,为此,他们提出了一系列精心设计的方案(包括规范化动作空间与“从专精到通用”策略),以缓解复杂动作空间引发的优化难题。AnyTracker作为基础策略进行训练时,未引入任何动态随机化处理,从而避免跟踪性能下降。在第二阶段引入动态变化,并在AnyTracker基础上进一步提出了一个基于历史信息的自适应模块——AnyAdapter。AnyAdapter能为基础跟踪器赋予针对各类干扰(包括地形变化、外力作用及物理属性改变)的在线动态适应能力,同时不会损害其原本具备的基础运动跟踪能力。此外,AnyAdapter以 “动态感知世界模型预测” 作为代理任务(proxy task),从历史数据缓存中提取动态特征并将其转化为神经嵌入——这种嵌入可作为有效表征,用于识别环境动态特性。当面临来自不同来源的真实世界干扰(包括地形、外力及物理属性变化)时,Any2Track的方法在跟踪多样、高动态且富含接触交互的运动方面展现出优异效果。这项研究的一作Zhikai Zhang是清华大学交叉信息研究院(IIIS)的一年级博士生,师从弋力,同等贡献作者Jun Guo (郭骏)也来自清华。
通讯作者弋力曾在清华大学电子工程系取得了学士学位,后于斯坦福大学取得博士学位,导师为Leonidas J. Guibas教授,毕业后在谷歌研究院任研究科学家,目前担任上海期智研究院PI,清华大学交叉信息研究院助理教授,研究兴趣涵盖3D感知,计算机图形学和具身人工智能,研究目标是使机器人代理具备理解3D世界并与之互动的能力。银河通用创始人、CTO王鹤则是机器人圈里知名的“90后”创业者,出生于1992年,本科毕业于清华大学电子系,后进入斯坦福大学攻读博士学位,师从美国三院院士Leonidas J.Guibas教授;2021年9月,王鹤回国加入北京大学任教,现担任北京大学前沿计算研究中心(CFCS)终身制助理教授、博士生导师,创立并领导了具身感知与交互(EPIC)实验室,同时是北大-银河通用器具身智能联合实验室和北京智源研究院器具身智能研究中心主任。
银河通用今年的发展迅猛,今年6月份曾完成一轮11亿元融资,创下国内具身智能领域单笔融资之最,今年的WAIC和WRC期间,银河通用旗下机器人展示的无人商超值守、工业领域的前置仓、汽车零件SPS分拣场景的“干活儿”能力令人印象深刻。王鹤曾在采访中透露,公司计划今年在北京、上海、深圳等城市共开100家无人值守零售店,预计今年将为银河通用带来近亿元人民币的收入。2025年下半年,具身智能赛道已经从融资热转向拼订单,各路厂商机器人的商业落地能力迎来最终考验。据IT桔子数据显示,前8个月机器人领域一级市场融资额达386.24亿元,是2024年全年总融资额的1.8倍,从少数头部明星企业到第二、三梯队的行业新锐,不少公司在短期内完成了多轮融资加持,除了传统的财务VC,国家队、地方基金与产业资本(宁德时代、美团、阿里、京东)等深度参与布局。融资热点不仅涉及机器人整机研发,也覆盖了关键零部件(如灵巧手、驱动电机、感知模块)、模型算法、集群智能系统等上下游核心技术领域。投融资推波助澜下,不少机器人企业开始进入“拼”订单阶段。例如,优必选宣称获得2.5亿元订单;智元机器人和宇树科技中标中移项目,项目总预算为1.24亿元;智平方与深圳慧智物联合作签下近5亿元人形机器人大单;松延动力宣称2025年上半年已签约2000台机器人;加速进化已完成全球数百台人形机器人交付;众擎机器人与多伦科技签署战略合作预计交付不低于2000台人形机器人······目前公开的大额订单主要集中在几家头部或业内知名企业。由于整个行业仍处于早期发展阶段,大多数订单还带有试点、示范或特定场景验证的性质,真正大规模的、通用化的应用可能仍需时日。根据相关行业动态和研究报告预测,2026年被认为是具身智能机器人产业发展的一个关键节点,整个产业链中,资本聚集、量产探索、技术深化、场景拓宽与成本控制等多方并举,国内外厂商有望启动数万台乃至十万台级别的量产计划,有望推动具身智能行业进入真正的规模化量产交付元年。-END-
如果您有什么想说的,欢迎在评论区留言讨论!
投稿或寻求报道,欢迎私信“投稿”,添加编辑微信。
【AI超级增长启航营】入群好礼:了解更多启航营资讯,交流最新科技动态和产业趋势,定期互动讨论和知识分享,与启航营导师互动交流,领取100份AI科技商业研报合集,加群共同探讨与成长,开启AI领域的超级增长之旅!