人形机器人行业现状:会干活了,但还不会上班

电子工程世界 2026-06-26 08:00

视觉识别没有出错,机械臂的运动轨迹也没有问题。吸盘接触纸箱后开始向上抬升,纸箱却依然留在传送带上,机器人最终抓起来的,只有一张刚刚贴上去的快递标签。

这是仓储机器人公司Ultra首席技术官Oliver Ortlieb在纽约科技周一场机器人圆桌讨论中分享的经历。

把机器人送到客户仓库前,Ultra已经在实验室中测试了两个星期。识别、抓取和分拣流程都很稳定,但实验室里的纸箱已经放置数周,标签与纸箱表面充分黏合。真实仓库中的标签则是在几秒钟前刚刚打印出来,胶水尚未完全附着,吸盘向上提拉时,只拉起了标签。

这是一个很小的问题,却准确描述了当前人形机器人产业正在经历的变化。

过去两年,具身智能和机器人受到大量关注。发布会上,机器人能够行走、跳舞、搬运物体,也可以在操作员示范之后学习新的动作。但当机器人离开布置好的演示环境,进入仓库、工厂和公共空间,需要在成千上万次重复运行中适应现实世界的变化。

纽约科技周期间,Ultra首席技术官Oliver Ortlieb、Standard Bots创始人兼CEO Evan Beard、General Intuition创始人Pim de Witte,以及Fauna Robotics联合创始人兼首席技术官Josh Merel,共同讨论了机器人从原型走向生产过程中的问题:客户系统如何集成,现场故障如何恢复,遥操作是否仍然必要,仿真能否覆盖真实环境,以及机器人企业的商业化途径,机器人本体、数据,还是一套完整的解决方案给客户。

几位嘉宾给出的答案并不完全相同,但他们至少形成了一个共识:机器人行业正在从展示能力,进入交付能力竞争中。

人形机器人行业现状:会干活了,但还不会上班图1


安装机器人只用了11分钟



在Ultra公司看来,把机器人运到客户仓库,完成拆箱、通电和基础安装,并不是部署过程中最困难的环节。

Ortlieb提到,Ultra曾经在客户现场用11分钟完成一台机器人的安装。但这并不意味着机器人已经能够投入生产,更不意味着部署工作已经结束。

Ultra目前主要面向电商仓库开发固定式双臂机器人,首先切入订单包装、贴标和分拣等相对明确的工作流程。表面看,不同仓库处理的都是纸箱、标签和订单,实际进入现场后,每个包装工位的运行方式都可能不同。

有的仓库先装箱,再打印标签;有的仓库先生成物流信息,再完成称重和封箱。有的包装工位需要与扫描枪、称重设备连接,有的还要调用仓库管理系统中的订单、物流商和库存信息。即便任务名称同样是“订单包装”,背后的信息流、物料流和操作顺序也不完全相同。

因此,机器人本体安装完成以后,工程师还要理解客户流程、对接仓库管理系统,并处理机器人与传送带、打印机、称重设备和物流系统之间的关系。

Ortlieb对“部署完成”的定义是,机器人公司不再需要派人驻守现场,客户能够自己运行机器人并获得稳定产出,供应商只需在后台提供正常的远程支持即可。

因此,部署能力并不只是机械臂能不能移动到指定位置,也不只是模型能不能识别纸箱。它还包括系统接口、异常处理、人员培训、维护方式,以及机器人与客户原有生产流程之间的匹配程度。

过去,工业机器人产品经常强调负载、臂展、自由度和重复定位精度。机器人进入规模化落地阶段以后,就要关注一些额外的指标:从开箱到投入生产需要多长时间,是否必须由专业工程师编程,能兼容多少种客户设备,发生故障后多久能够恢复,以及客户是否需要长期依赖系统集成商。

Standard Bots公司试图解决的正是这类问题。

Beard认为,传统工业机器人的使用门槛仍然过高。操作员可能需要参加数天乃至数周培训,学习机器人坐标系、视觉系统和运动编程。即使只是让一台机器人完成基础动作,也可能需要阅读复杂手册,或者请集成商完成接线和配置。

Standard Bots希望把工业机器人做得更接近消费电子产品:机器人寄到客户工厂后,普通工人不需要理解机器人控制的底层数学,也能够完成安装、示教和任务配置。

这并不意味着工业机器人可以完全摆脱专业工程,而是要把大量重复性的系统配置工作封装到产品内部,让专业人员将时间用在真正复杂的产线设计上。

人形机器人行业现状:会干活了,但还不会上班图2


现实世界没有完整的测试集



Ultra抓下快递标签的故事并不是孤例。

Fauna Robotics曾经利用强化学习和仿真训练机器人从躺倒状态起身。在办公室常见地板上,机器人都能够顺利完成动作。直到团队把机器人带到一间铺有高摩擦粗糙地毯的办公室,动作策略就失效了。

机器人起身时,身体需要与地面发生滑动和支撑。当地毯摩擦系数明显高于训练环境时,动作轨迹与地面接触条件发生变化,策略无法继续按照原有方式完成起身。

团队回到办公室后购买了多种地毯,重新构建更多的测试条件。

Standard Bots也遇到过更加直接的材料问题。一名客户的设备中使用了特殊酸性化合物,而机器人关节密封件最初只按照常见冷却液和工业环境设计。机器人进入客户现场后,化学品逐渐腐蚀了类似橡胶的密封材料,破坏了关节原有的防护能力。

第一次更换部件后,问题再次发生。团队后来查阅客户所用化学品的安全数据,才确认这种物质会侵蚀密封材料。

还有一些问题甚至与机器人的核心功能没有直接关系。

Ultra早期部署的机器人没有配备远程KVM设备。当现场计算机需要执行特定级别的重启或维护时,工程师无法远程操作,只能让客户员工协助完成。此后,Ultra为每台出厂机器人配置了远程访问工具。

Fauna Robotics的机器人本体足够轻,可以作为行李托运,但电池受到航空运输规则限制,无法与机器人一起登机。团队出差演示时,需要提前把电池单独寄到目的地。

General Intuition遇到的问题则是延迟。模型在公司测试环境中的推理延迟相对稳定,部署到客户使用的不同云平台后,网络、计算资源和游戏服务器的延迟分布均发生变化。一个在30毫秒延迟下运行正常的动作模型,可能需要适应50毫秒甚至100毫秒的响应窗口。

综上,每家公司遇到的问题各不相同,并且很难在单一实验室中全部复现。

仿真环境可以限定机器人面对的物体、光线、地面、摩擦力和任务流程,现实世界却是一个开放系统。物料会变化,工艺会变化,网络会波动,人会靠近机器人,客户也可能有误操作。

Pim de Witte将其概括为,仿真环境能够约束状态空间,但现实世界中可能出现的状态数量事先并不明确,机器人总会遇到没有出现在测试集里的事件。

具身智能与普通人工智能的差异也在这里变得更加清楚。

一套图像识别模型判断错误,可能只会输出错误标签;机器人控制模型判断错误,则会影响电机转矩、关节位移和末端执行器动作,并直接作用于人员、设备和材料。

算法误差会变成物理后果。这使机器人对可靠性和异常覆盖的要求,远远高于只在屏幕中生成内容的软件系统。

人形机器人行业现状:会干活了,但还不会上班图3


机器人领域的墨菲定律



在传统工业自动化系统中,企业习惯用多个“9”描述设备可靠性。汽车和制造业客户希望设备长时间稳定运行,并且不允许未经控制的异常动作影响生产线。

但学习型机器人依赖感知和策略模型,需要面对不断变化的环境,现阶段很难保证每一个动作都完全正确。

Ortlieb认为,机器人公司不能等到自主模型接近完美之后再开始部署,而应该从一开始就按照“机器人一定会失败”的假设设计产品和运营体系,这也就是所谓的墨菲定律。

这听起来有些消极,实际上是一种工程实现的正确思路。

一个能够商业化运行的机器人系统,不仅要回答“正常情况下如何完成任务”,还要回答一系列异常问题:机器人如何知道自己失败了,抓取失败后是否可以自动重试,物品掉落后是否需要停止任务,什么情况下应该由人工接管,远程工程师能够看到哪些传感器和日志,现场是否有可以快速替换的零部件。

Ortlieb表示,Ultra会把恢复机制纳入运行模式,通过远程支持和人工操作保障客户产出。机器人自主能力会继续提高,但公司不会假设模型在短期内可以消灭所有长尾故障。

因此,可靠性不能只用平均无故障时间衡量,故障发生后的恢复时间也要考虑在内。一台机器人每运行1000次出现一次异常,但每次都要工程师乘飞机到现场处理,很难形成可扩展的商业模式。另一台机器人虽然仍会出现异常,却能够自动暂停、记录环境信息,由远程人员接管并在几分钟内恢复,对客户而言反而可能更加实用。

机器人的关键指标需要从“会不会错误”,进一步变成“错误是否可识别、可控制、可恢复”。

对初创机器人公司而言,这还涉及客户关系的变化。在产品早期阶段,客户往往不能只是购买设备的一方,也需要成为设计合作伙伴。

Ultra早期的一家合作仓库允许团队在真实环境中连续测试三代机器人。Ortlieb将机器人的部署距离分成几个阶段:机器人留在实验室最容易;搬到街对面的客户仓库,难度会立刻提高,但工程师仍然可以随时步行过去处理问题;当机器人被运到其他州,每次现场故障都需要乘飞机解决,维护成本和产品可靠性的需求完全不同。

真实客户的价值,不只是提供一笔订单,而是帮助机器人团队构建实验室中无法复现的问题。

人形机器人行业现状:会干活了,但还不会上班图4


人工操作并不代表着落后



在具身智能的讨论中,遥操作经常被视为一种不够先进的过渡方案,只要机器人背后还有人在控制,就很难被称为完全自主。

几位嘉宾对这一问题的看法更加务实。

Ultra目前仍然在客户现场使用遥感操作,以保证订单包装等任务的完成质量。公司也与外部模型团队合作训练自主策略,但在模型能力尚未完全覆盖客户需求之前,人工操作可以维持业务运行,并持续产生真实任务数据。

General Intuition也计划把遥感操作纳入产品体系,其背后的一个重要资源是分布在全球的大量游戏玩家和控制器。游戏数据中的键盘、鼠标和手柄操作,本身就是一类带有动作标签的时序数据,可以用于训练智能体理解视觉变化与动作结果之间的关系。

De Witte认为,遥感操作与自主运行并不是一个非黑即白的选择。

例如,一套无人机系统最初可能需要一名操作员控制一架无人机。随着模型能够自主处理大多数正常情况,并更准确地预测异常,一名操作员可以远程同时监督两架、四架甚至更多无人机。人依然存在,但单位任务需要的人工时间不断下降。因此,机器人自主化的商业指标不一定是“有没有人类参与”,而可能是“一个人可以同时管理多少台机器人”。

从一人一机到一人多机,本身就是生产效率的提高。只要人工接管的频率和时间足够低,遥操作并不会破坏机器人的经济性,反而可以让产品在自主模型尚未完全成熟时提前进入市场。

遥感操作还可以成为机器人数据闭环的一部分。

例如,当模型在现场遇到无法处理的异常时,操作员接管并完成任务,这段过程既解决了客户当前的问题,也产生了一组具有明确输入、动作和结果的数据。机器人企业可以把这些数据加入训练集和评测集,使下一代模型逐渐覆盖相似场景。

人形机器人行业现状:会干活了,但还不会上班图5


世界模型并不是唯一终点



怎样以更低成本覆盖现实世界中的异常,是圆桌中分歧较为明显的问题之一。

General Intuition正在利用大规模游戏视频和操作数据训练动作模型与世界模型。与语言模型预测下一个文本Token不同,这类模型希望根据视觉环境和历史行为,预测智能体下一步应该执行的动作。

De Witte认为,传统仿真器需要工程师预先定义物理规则、场景和交互方式。面对人类行为、道路参与者和复杂环境,枚举所有异常事件的成本非常高。世界模型则可以从视频中学习环境随动作变化的规律,从而生成未来状态,用于测试策略和模拟不利事件。

游戏数据在这里有一个特殊优势。

玩家会不断撞车、失败、跌落、偏离路线,也会以设计者没有预料到的方式操作。这些行为在现实世界中可能成本很高,在游戏中却可以很便宜。General Intuition希望借此获得比标准成功数据更加丰富的异常样本。

Josh Merel对此提出了一个关键问题:边缘案例之所以被称为边缘案例,正是因为它们在真实数据中的出现频率很低。即便世界模型拥有庞大的训练数据,也不意味着数据中一定包含足够多的关键异常。世界模型生成出来的场景能否准确反映现实物理规律,也需要进一步验证。

Evan Beard对传统仿真的看法则更加谨慎。

他认为,仿真非常适合强化学习中的运动控制任务,例如让机器人站立、行走或者完成特定姿态。但工业客户真正需要的任务往往涉及切割、吸附、柔性材料、液体和复杂摩擦。要在仿真器中准确表示材料被切开的过程、吸盘与不同包装表面的密封状态,或者工件与夹具之间的细微接触,可能需要重新开发相应的物理模型。

有时,构建仿真的成本已经接近甚至超过采集真实数据的成本,直接在客户现场记录数据可能更加有效。

世界模型、传统物理仿真和真实数据因此不会简单地相互替代。

工程路线是先从客户现场记录失败,分析模型为什么没有正确处理,再通过真实采集、传统仿真或生成式世界模型补充相邻场景,最后把失败案例加入固定评测集。

人形机器人行业现状:会干活了,但还不会上班图6


物理AI不只是一个模型



Standard Bots正在尝试让普通工人通过示范训练机器人。

传统工业机器人通常由工程师编写动作程序,明确设置关节路径、速度、坐标系和触发条件。这种方式在高度标准化、长期不变的生产线上非常有效,但面对物品差异较大、任务频繁变化的场景,编程和重新集成的成本可能过高。

示范学习提供了另一种路径。操作员直接向机器人展示任务,系统记录相机画面、机器人状态和动作轨迹,再利用这些数据训练策略模型。理论上,负责装配、上下料或者包装的一线工人最了解任务,也最适合教机器人完成工作。

当然,不能要求这些工人同时成为机器学习工程师。他们不需要理解学习率、损失函数、数据分布和训练轮次,也不需要手动处理每一段传感器数据,机器人平台需要帮助用户完成数据采集、标注、筛选、训练、部署和后续修正。

Beard表示,Standard Bots花费了大量时间设计这套交互方式,包括哪些参数应该展示给用户,哪些设置可以自动完成,模型出现错误后如何补充示范,以及怎样让一个并不理解人工智能的工人完成重新训练。

这说明物理AI的产品化不只是训练一个基础模型,它还需要一整套工具链。机器人本体负责执行动作,传感器采集环境信息,示教设备记录人类操作,训练平台生成策略模型,部署系统把模型下发到设备,监控工具负责识别失败并回收新的数据。

模型只是其中一层。因此,如果数据采集和重新训练仍然需要机器人公司的算法工程师长期驻场,即便模型本身很先进,部署成本也很难下降。

人形机器人行业现状:会干活了,但还不会上班图7


如何进行泛化



Ultra和Standard Bots选择了不同的产品路径。

Ultra首先聚焦电商仓库的订单包装、分拣和套件组装,不追求第一天就提供一台可以完成所有任务的机器人。

这种策略更加落地。不同仓库的流程依然存在差异,但需要处理的核心对象、信息系统和设备类型相对集中。随着部署数量增加,Ultra能够逐步积累对不同仓库管理系统、打印设备、称重流程、包装材料和物流商接口的支持。

第一次遇到某个流程时,它可能只是一个定制项目,但是随后就可处理相同组合。

Standard Bots则更强调平台化和模块化,通过不同机械臂、底座、末端执行器与学习软件的组合,覆盖机床上下料、焊接、喷涂和搬运等任务。

两种路线并不矛盾。一个从具体工作流出发,通过不断增加兼容组合扩大能力边界;另一个从软硬件平台出发,把机器人训练和配置的权力交给更多普通工人。

但无论如何,他们并不是先制造一台声称无所不能的通用机器人,再寻找客户愿意付费的任务。

通用能力未必来自一开始就制造“通用机器人”,也可能来自对大量具体任务的持续积累。

机器人创业公司需要同时回答三个问题:机器人今天真正能够稳定完成什么,客户今天愿意为什么付钱,以及当前任务产生的数据和工程积累能否帮助产品进入更大的市场。

人形机器人行业现状:会干活了,但还不会上班图8


机器人的量产也是能力



机器人从原型走向批量生产以后,制造过程本身也会成为新的技术门槛。

Standard Bots采用较高程度的垂直整合,自行开发和制造部分电路板、编码器与机械结构。Beard表示,公司后来逐渐意识到,制造机器人并不是把设计图交给外包工厂就行了,需要把生产体系本身视为一项需要持续开发的产品。

公司为装配人员提供软件,指导每一步生产和测试,并记录装配者、操作时间、质量检查和测试结果。当机器人在客户现场发生问题时,团队可以把故障与具体生产记录关联,以提升自零部件、装配工艺、测试覆盖,还是设计本身的各种问题。

这套体系类似软件开发中的可观测性,软件系统出现故障后,工程师可以查看日志、版本和运行环境;机器人企业同样需要知道每台设备使用了哪一批零部件,经过哪些测试,由谁完成装配,现场的运行情况。

只有建立这种从制造到现场的数字链路,机器人企业才能确保量产的一致性。机器人产品的生产可靠性也因此不只来自模型或本体设计,而是来自算法、机械、电气、供应链、生产工艺、质量测试和现场支持的共同作用。

人形机器人行业现状:会干活了,但还不会上班图9


系统集成商不会消失



随着机器人产品更加易用,系统集成商的角色也会发生改变。

今天,很多集成商需要替机器人厂商完成基础接线、参数配置、控制器设置和安全启动。一些传统机器人甚至没有面向普通用户的标准化接口,客户必须接受培训或查阅复杂手册,才能让设备运转。

Beard认为,这部分工作会逐渐被产品标准化取代。机器人应该像成熟工业设备一样,具备明确接口和合理的默认配置,而不是要求每个客户重新完成基础工程。

但这不意味着系统集成商会消失。如果客户需要建设传送带、组合多台机器人阵列、开发定制夹具,或者改造一条复杂生产线,仍然需要熟悉工艺、机械、电气和安全规范的专业团队。

和其他行业一样,未来被减少的是低价值、重复性的集成商,留下来的则是复杂系统设计和工厂级集成。

机器人真正进入百万级产能后,,市场需要的专业集成能力甚至可能比现在更多,只是集成商不再依赖产品基础使用功能获得收入,而是通过理解客户生产系统创造价值。

人形机器人行业现状:会干活了,但还不会上班图10


数据最终要可用



圆桌最后讨论了机器人数据创业公司的商业模式。

随着具身智能升温,越来越多公司开始收集第一视角视频、触觉信号、遥操作轨迹和机器人动作数据,希望将其出售给基础模型实验室。

几位嘉宾对此都比较谨慎。

机器人数据并不是数量越多越有价值。不同机器人具有不同的关节结构、动作空间、传感器和末端执行器,一套设备采集的数据未必能够直接用于另一套设备。时间戳没有对齐、图像与动作顺序存在偏差,也没有太多价值。

Ortlieb建议,数据公司至少应该先用自己的数据训练出一个有用的模型。只有真正完成训练,团队才能发现数据中的问题,也才能向买方证明这些数据具有实际价值。

Beard的观点更加直接。他认为,市场上单纯出售数据的公司越来越多,数据采集容易演变成价格竞争。如果一家创业公司已经能够进入医院、养老机构或工厂收集高质量数据,它或许更应该进一步理解客户工作流,开发一套能够直接解决问题的机器人产品。

客户最终购买的不是数据本身,而是更低的成本、更稳定的产出,或者过去无法完成的任务。

也正隐私,机器人产业似乎重新经历软件行业曾经走过的一段路:技术能力不值钱,需要封装成产品,才能真正形成商业闭环。

人形机器人行业现状:会干活了,但还不会上班图11


离开Demo之后



机器人行业并不缺少令人印象深刻的演示。

真正稀缺的是一台能够现场执行的机器人,在不同光线、地面、网络、材料和工作流程下都能持续运行,同时具有在失败时能及时发现问题并恢复生产的生产力工具。

从实验室原型到生产设备,中间并不存在一条简单的模型性能曲线。

这条路还要经过系统集成、材料验证、远程运维、制造追溯、人员培训、客户支持和经济性计算。算法进步确实可以缩短其中一些环节,但也无法自动消除现实世界的复杂性。

对机器人企业来说,成功完成一次任务只是开始,证明了技术的可成立性。只有客户在没有任何支持的情况下,能够持续使用设备,才算作真正的产品。


精彩文章推荐


· END ·


请将我们设为“星标”,这样就会第一时间收到推送消息。

欢迎关注EEWorld旗下订阅号:“机器人开发圈”

人形机器人行业现状:会干活了,但还不会上班图12

扫码添加小助手回复“机器人”

进群和电子工程师们面对面交流经验

人形机器人行业现状:会干活了,但还不会上班图13


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
机器人
more
场景牵引、多点突破!四川省机器人应用推广成效显著
仙工智能正式登陆港交所,成港股“机器人大脑第一股”
市值112亿港元!科沃斯IDG押注的智能机器人IPO了
最强教授团押注的AI厨房机器人,融资数千万!
具身数据采集产业链调查:被机器人采集的人|甲子光年
让机器人学会“预判接触”:它石智航牵头四大顶尖机构发布TacForeSight,破解精细操作难题
狐聊 | 1 万块的宇树机器人,你会考虑买吗?
贾跃亭发布工业级轮臂机器人 三款机型直接交付
四川机器人减速器零部件制造商,通过北交所上市辅导验收!
机器人关节,盯上“薄饼电机”
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号