

文|易玉琴
在人形机器人真正走向商业化的路上,数据采集与训练正成为最关键的瓶颈。这不是单纯的技术问题,而是一个涉及产业链上下游的复杂生态。从机器人本体企业到应用场景方,每个角色都有着不同的期待、困惑和无奈。
我们试图从产业链上四类关键角色的视角,拼出人形机器人训练系统的真实图景。
01
本体企业:渴望“能自学”的机器人
对于本体企业来说,硬件制造已经不是最大难题。电机、减速器、传感器这些核心器件虽然仍有技术壁垒,但至少有明确的技术路径。真正让他们头疼的是,造出来的机器人就像一个有手有脚但大脑空白的"婴儿",需要通过大量数据训练才能掌握基本技能。

数字华夏联合创始人陈军民将人形机器人的发展路径与汽车类比:“当初智能车也搭载了大量算力模块,通过不断跑真实场景、采集数据,才逐渐训练出今天的智能驾驶系统。”同样地,人形机器人的迭代也离不开长周期、高频率的数据采集。
但不同于封闭路线上的行驶轨迹,人形机器人面对的是开放、复杂、充满不确定性的真实世界,训练难度指数级上升,也对数据质量与系统泛化能力提出了更高要求。
这种依赖性是前所未有的。传统工业机器人的动作都是预编程的,每个指令都有明确对应的执行动作。但具身智能机器人必须拥有对环境的感知、对任务的理解、对行为的决策。这意味着本体企业必须从"制造商"转变为"教育者"。
问题在于,数据采集的成本和复杂度超出了大多数本体企业的预期。要让机器人学会端茶倒水,需要采集不同杯子、不同倾斜角度、不同液体粘稠度的数据。要让它学会走路,需要在不同地面材质、不同坡度、不同障碍物环境下反复训练。每一个看似简单的动作,背后都是指数级增长的数据需求。
睿尔曼智能科技客户成功部负责人李帆分享道,他们在北京的数据训练场部署了超百台人形机器人设备,每晚定时将数据回传服务器,并定期清洗、评估质量后提交给合作方用于模型训练,今年预计将产出百万级数据样本。
不止北京,上海、深圳、天津等地也在加速建设类似的数据采集工厂。本体企业开始意识到:训练数据的稳定产出,已成为决定产品进化速度的核心能力之一。
然而,让人无奈的是,这些投入巨大的数据资产,往往难以复用。A公司训练的抓取数据,很难直接用于B公司的机器人,因为硬件结构、传感器配置、控制算法都不同。每家公司都需要重新"造轮子",这种重复性投入正在消耗整个行业的耐心和资金。
逐际动力西南区副总李建辉指出,一条高质量的工业动作数据,成本可能达20元;而一个模型往往需要几万条数据才能初具实用价值,成本极高。
更复杂的是多模态数据的处理难题。他表示:“一是数据种类繁多,涉及动作、视觉、触觉等维度,统一管理难度极高;二是在训练过程中并非每个任务都需要所有模态,这就要求我们能按需组合、灵活调用数据,才能实现定向、高效的训练路径。”
面对这种复杂局面,本体企业们渴望的是能够"自学"的机器人,但现实是,即使是最先进的强化学习算法,也需要大量的初始数据和人工标注。这种矛盾正在推动产业分工的细化,也催生了新的商业模式。
02
训练技术服务商:数据"炼金师"的困境
如果说本体企业是机器人的"父母",那么数据采集与训练技术服务商就是"老师"。他们提供仿真平台、模型调优、算法训练等服务,承担着将"笨拙机器人"训练成"技能专家"的重任。
但这些"老师"正面临着前所未有的挑战。问题不是算法不够先进,而是客户提供的数据质量参差不齐,甚至可以用"混乱"来形容。这种情况在行业内并不罕见。许多企业在数据采集初期缺乏规范,导致数据质量低下,后期训练效果大打折扣。
更深层的问题是缺乏行业标准。不同的本体企业有不同的数据格式,不同的应用场景有不同的标注规范,不同的传感器有不同的输出协议。训练服务商需要针对每个客户开发定制化的数据处理流程,这大大增加了成本和周期。
仿真训练是解决数据稀缺的重要手段,但现实与仿真之间的"sim-to-real"差距仍然巨大。在仿真环境中训练得再好的模型,到了真实环境中往往会出现各种意外。光照变化、材质差异、环境噪音,这些在仿真中很难完美建模的因素,都可能导致机器人"翻车"。
在多重挑战之下,服务商正探索更加多元的数据路径。艾欧智能是一家专注于操作类机器人数据采集的企业,其市场总监丁哲章指出,目前行业主流的数据来源大致分为三类:
一是仿真合成数据,生成效率高但现实还原度有限;二是人工采集数据,主要依赖光学动捕、惯性动捕等手段记录人类演示,精度高但成本昂贵;三是真机遥操作数据,由机器人在真实环境中执行任务并记录过程,贴近实际但采集难度大。
“这些路径各有优劣,没有哪一种方式可以单独支撑起具身智能训练。”丁哲章表示,“我们更理想的状态,是三类数据的有机结合。仿真提供通用操作训练,人工数据可构建标准动作库,真机数据用于提高环境适应力。多维融合,才更接近具身智能的真实需求。”
但比起“怎么采”,丁哲章认为,行业还面临一个更棘手的问题:“谁来为数据买单?”
当机器人处于训练阶段,本体厂商自然是数据的主要使用方;可一旦设备交付并运行在实际场景中,随之产生的新数据到底属于谁?客户是否愿意将这些数据继续用于模型优化?谁来承担数据管理和再利用的责任?这些问题至今没有形成明确的行业共识。
“在实践中,数据归属和模型迭代的责任边界并不清晰。”他指出,如果缺乏授权机制,企业很可能既无法使用这些数据,又难以形成真正的训练闭环。
对于这些技术服务商而言,他们面临的不只是模型优化问题,而是一场围绕数据质量、标准、归属、使用、闭环的系统性考验。当前,行业在采集端的探索已经越走越深,但若缺乏清晰的权责机制与闭环逻辑,最终可能走得越远,风险越高。
03
设备供应商:硬件也得“懂训练”
摄像头、激光雷达、IMU传感器、动作捕捉设备......这些设备供应商原本只需要专注于硬件性能,但在人形机器人时代,他们发现自己必须"懂训练"。
传统的设备采购模式是:客户明确需求,供应商提供对应规格的产品。但在机器人训练场景中,客户往往也不清楚自己需要什么样的设备。他们会问:"我要训练一个能够识别和抓取不规则物体的机器人,需要什么样的摄像头?"这类问题,没有标准答案,反而需要供应商反向理解算法目标、模型路径,从感知需求倒推技术规格。

这也意味着,微小的硬件参数差异,可能引发训练结果的巨大偏差。比如摄像头的帧率、分辨率、色彩精度,会影响视觉模型的学习效率;而触觉传感器的灵敏度与响应时间,则决定了操作策略的精度与安全性。设备供应商必须跨越“硬件-算法”的专业鸿沟,参与到训练链条的前端。
这一趋势也推动了供应链的深度融合:越来越多硬件厂商开始引入AI工程师,参与模型协同设计;AI公司也逐步下沉至硬件层面,探索算法与传感器协同优化的整体方案。
以触觉传感器为例,在机器人向家庭与复杂应用场景扩展的背景下,触觉的重要性正在被重新认识。他山科技是一家专注于新型触觉感知技术的企业。其深圳负责人王凯旋介绍,他们正在探索将多模态传感器(如温度、湿度、摩擦力等)融合为类似“人类五感整合”的新一代触觉架构。
“比如抓取一个湿润、油滑的物体时,系统需要综合分析七到十个维度的信息,包括表面纹理、受力方向、摩擦系数等。”王凯旋表示。他们自主研发的触觉芯片具备边缘计算能力,可以在端侧实时完成处理与反馈,不依赖云端。
她还提到一个关键对比:“在没有触觉信息的训练中,完成一个任务可能需要5万条样本数据;而加入基础触觉反馈后,只需要约100条数据就足够。”这说明,高质量触觉感知不仅提升了模型泛化能力,也极大提高了训练效率。
但转型之路并不容易。硬件厂商的基因是追求稳定、通用、标准化,而算法世界则讲究快速迭代、高度定制。这种文化差异,使得许多设备供应商在“懂训练”的转型中感到阵痛,既需要补齐算法理解能力,也要建立跨部门协同机制。
不过,一些前瞻性的厂商已经主动跳出“设备供应商”的角色,开始定位为“感知解决方案伙伴”。他们不再只卖摄像头,而是卖“视觉理解能力”;不再只是提供传感器,而是参与到数据采集、模型训练和系统验证全过程中。
04
应用场景方:理想与现实的落差
工厂车间、商场超市、医院、餐厅......这些应用场景方是人形机器人最终的"雇主",也是训练数据的重要来源。但他们的心情是复杂的:既希望机器人能够快速上岗,又担心开放场景会带来风险。
数据隐私是首要挑战。应用方掌握着海量、真实且高价值的数据:工厂的流程参数、商场的顾客行为、医院的患者信息……这些往往涉及商业机密或个人隐私。即便签署了保密协议,仍有不少企业担心数据被二次利用或泄露。
成本更是横亘眼前的现实问题。数据标注往往是劳动密集型任务:一个简单的抓取动作,可能需要标注数十个关键点的坐标信息。一段几分钟的操作视频,可能需要几个小时的标注工作。这些成本最终都需要有人承担。
更大的挑战来自认知落差。很多应用方对机器人的期望往往过于乐观。他们看到演示视频中机器人的精彩表现,就以为机器人很快就能在自己的场景中发挥同样的作用。但现实是,每个场景都有独特性,都需要专门的训练。从演示到实用,中间的距离往往比想象的要远得多。
一些有远见的应用方开始探索新的合作模式。他们不再简单地"购买"机器人,而是与机器人公司建立长期的合作关系,共同进行数据采集和模型训练。这种模式下,应用方从"客户"变成了"合作伙伴",分享训练成果的同时也分担训练成本。
富士康便是其中的代表案例之一。作为制造业的超级场景拥有者,富士康并不追求以机器人完全替代人,而是强调“人机协作”与“人文关怀”。其仓储技术中心副理高鹏坦言:“从最初的完美主义转向实用主义,我们逐渐接受——机器人不是一开始就完美,而是需要边部署、边进化。”

富士康也率先规划了五类优先替代岗位:物流搬运、高危化学岗位、工业垃圾回收、实验室测试,以及重复性重体力劳动岗位。在这些典型场景中,他们逐步导入人形机器人,并同步开展员工技能转岗培训,借助“富士康大学”将一线工人培养为机器人运维人员,推动人机融合。
从“客户”走向“共建者”,应用场景方的角色正在悄然转变。只有当他们真正参与进来,开放数据、共担成本,整个具身智能产业链才能真正实现闭环、走向成熟。
结语:
从四个角色的困境中,我们可以看出人形机器人训练面临的根本问题:缺乏成熟的产业生态。只有当产业链上的各个角色找到合理的分工和利益分配机制,形成良性的协作关系,人形机器人才能真正从实验室走向现实世界。
这个过程可能比我们想象的要漫长,但也比我们想象的要重要。因为这不仅关系到机器人产业的未来,更关系到人工智能如何与物理世界深度融合。在这个意义上,每一次训练数据的积累,每一次算法的优化,都是在为未来的智能世界奠定基础。
9月11日,深圳-2025(第二届)人形机器人感知与控制峰会暨具身智能数据采集与训练技术论坛即将盛大召开。聚焦感知-控制-数据三类核心技术,为人形机器人发展保驾护航。

后台回复“加群”,加入“人形机器人场景应用联盟交流群

推荐阅读
本体企业
威迈尔|浙江人形机器人创新中心|赛博格机器人
供应链企业
睿芯行|集和诚|科峰智能|灵猴机器人|思岚科技
终端企业
富士康|欣旺达|泰山体育|润新机械
豪森智能|南京市保|中广核检测|金旺智能
中国兵器工业集团|小小科技|天奇股份