全球首个人形机器人通用视觉感知系统:Humanoid Occupancy

具身智能之心 2025-08-06 08:17


资讯配图

点击下方卡片,关注“具身智能之心”公众号
>>点击进入→具身智能之心技术交流群

更多干货,欢迎加入国内首个具身智能全栈学习社区具身智能之心知识星球(戳我)这里包含所有你想要的。

第一作者崔巍,北京人形机器人创新中心感知算法负责人;共同一作王浩宇,极佳科技算法工程师,项目负责人;通讯作者张强,北京人形机器人创新中心学术委员会主任。


凭借类人化的结构设计与运动模式,人形机器人被公认为最具潜力融入人类环境的通用型机器人。其核心任务涵盖操作 (manipulation)、移动 (locomotion) 与导航 (navigation) 三大领域,而这些任务的高效完成,均以机器人对自身所处环境的全面精准理解为前提。


然而,传统感知系统存在明显局限:有些仅能适配特定场景,难以应对复杂多变的真实环境;有些无法有效融合多种传感器信息,导致数据利用率低下。这直接造成机器人在实际应用中频繁出现感知失效问题,严重制约了任务执行效率。


为此,北京人形机器人创新中心推出 Humanoid Occupancy 感知系统,为破解这一行业难题提供了革命性方案。该系统通过创新性融合多模态传感器信息,构建起基于语义占用 (occupancy) 表征的通用感知框架,能够精准捕捉环境中的语义属性与几何特征,为机器人的任务规划和导航决策奠定坚实基础,也为人形机器人向实际场景大规模部署迈出了关键的一步。


资讯配图



资讯配图



突破传统感知局限,占用表征具有核心优势


人形机器人面临三大核心任务:操作、移动和导航。操作需要丰富的纹理和几何信息,移动依赖地形几何感知,导航则要求全局环境语义和空间几何理解。这些多样化需求对感知系统设计提出了巨大挑战,而传统的感知表示方法往往只能反映部分信息,无法满足复杂任务需求。


因此,Humanoid Occupancy 系统选择语义占用表征作为人形机器人感知的核心范式,其具备两大显著优势:




三大关键技术,构建完整感知体系


Humanoid Occupancy 系统构建了一套覆盖硬件布局、数据集构建及多模态融合网络设计的全链条解决方案,为人形机器人提供了通用化的感知技术路线。


资讯配图



资讯配图




资讯配图


实验结果优异,实现性能和效率的平衡


基于采集的多样化场景数据,团队同步构建了数据集与 Benchmark。我们使用 mIoU 和 rayIoU 来衡量三维空间语义分割精度,同时统计模型参数量衡量模型规模。


资讯配图
资讯配图



我们在该数据集上,将我们的方法与具有代表性的 BEV 感知模型进行了训练和测试。所有模型均采用相同的训练配置,包括输入图像分辨率、骨干网络结构、特征维度和训练策略。结果显示,我们的模型在取得更优指标的同时,还保持了轻量化架构,参数数量更少。



我们通过消融实验验证了每一个设计的有效性。具体来说,我们分析了相机畸变修正策略、时序信息聚合和输入模态数据的影响。


资讯配图



资讯配图



资讯配图



我们展示了典型感知结果,可以发现得益于图像和点云的深度融合,该方法能够实现精准的语义占用感知。


资讯配图
资讯配图
资讯配图



推动人形机器人迈向通用化感知时代


Humanoid Occupancy 系统的推出,不仅为人形机器人提供了强大的环境感知能力,更解决了传感器布局、数据标注和多模态融合等关键挑战,奠定了通用感知模块标准化的技术基础。此外,我们构建了首个人形机器人的全景占用感知数据集,并在天工机器人上验证了该系统的有效性。


未来,团队计划进一步扩展数据集、优化时序融合策略,并探索在更多人形机器人平台上的应用。随着技术的不断成熟,人形机器人有望在家庭服务、工业协作、户外救援等多个领域发挥重要作用,为人类生活带来更多便利。


想了解更多关于 Humanoid Occupancy 的详细信息,可参考项目主页以及技术报告。


资讯配图

本文只做学术分享,如有侵权,联系删文

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
机器人
more
智能进化,易用至极!新时达众为兴机器人视控一体软件全新发布
三菱电机携手鹿明,杀入人形机器人赛道!
对话投资人王晟:朱啸虎退早了,宇树和智元上市后,可能会把机器人市场的热情再往上拉
VLA模型的「核心引擎」:盘点5类核心动作Token,如何驱动机器人精准操作?
TechWeb早报:宇树发布新款四足机器人,特斯拉因Robotaxi被股东起诉欺诈
浙江大学Science Robotics|AI-专家远程协作支气管镜机器人:为异物吸入手术带来新突破
最高给5000万!上海发具身智能重磅政策,卖/租机器人都有奖
基于ml的个性化可穿戴机器人控制可改善受损的手臂功能
机器人业务收入暴增183.5%,这只上海“毛驴”赴美IPO
CoRL 2025|零遥操作!AirExo-2助力规模化机器人模仿学习
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号