最近的机器人赛道,每天都有新鲜事,各家都在证明自己并非实验室炫技,而是实实在在地走进具体的场景开始干活。
不信吗?开全天直播给你看。
两大全球具身智能玩家先后开启现象级实景直播:首先是美国Figure持续更新物流实景直播,以通用人形机器人完成无序包裹分拣、拆包搬运等民用场景作业。
而国内智元机器人走进3C量产工厂,8台精灵G2机器人连续6天、每日11小时驻厂作业,公开整条质检产线作业实况。

左边为智元,右边为Figure
【具身进化】将透过直播画面对硬件选型、场景设计、技术逻辑的全方位差异做一些分析,看看两家公司的差异性在哪里。
直播节奏:
工业量产实录VS通用能力实测
看似都是“机器人直播干活”,但两家的直播时长规划、节奏设计、展示逻辑,从根源上的逻辑均有很大的差异。
首先拿Figure来说,它从场景选择上选择动态性强的一个场景,非强节拍性质的场景。这个快递五花八门,有袋子、有盒子、有大盒子、有小盒子。
也就是说他很难从传统基于视觉、基于规格的控制逻辑上来实现一个比较好的控制策略。他必须实现高空间泛化、认知泛化,也就是我们常说的“通用”机器人而非编程机器人的维度。当然从容错率来说,他是高容错率的,即使犯了错误,再来一次就可以了,不会对整个流程产生致命性的问题。
Figure的物流直播呈现出动态调整、持续拉长、实时迭代的特点。本来计划直播24小时,在开通了直播以后才改为多天直播,也显示其对其技术的自信。

这种场景的选择,核心目的为了显示其“大脑”不是自动化策略,而是具备泛化能力的“智能”。民用物流场景存在大量不确定性:包裹大小不一、摆放角度随机、环境杂物干扰、作业动线随时变化。
智元则是另一种画风:他们选择了在生产的相对后端的工作,质检环节。但是可以明显可以看出他是一个有着明显节拍性质的工作,他的每一个动作可以看出都是有预设的,可能存在最终在夹取过程中的微调,但是整理的空间姿态的流程是固定的。
从场景维度来说,这是一个流程固定、空间固定、位置固定的高节拍、高稳定的工作,他的容错率很低。固定工时,主打标准化量产落地。
不同于Figure的灵活调整,智元本次工厂直播是完整、规整、预设的工业级量产实录。

直播为期6天,机器人严格遵循早八晚七的工厂工时,8台精灵G2集群上岗,全程直播无剪辑、无暂停、无预演,完整公开3C产线全流程质检作业。
整场直播节奏高度工业化、标准化,每20秒完成一个作业节拍,所有工序、动线、操作流程完全贴合量产产线规范。
截至直播结束,累计作业超过64小时,累计产量超1.7万件,作业成功率最终定格在99.99%。
总结来说Figure直播更像是证明基于模型的人形通用机器人在未来想象力,打磨通用智能的上限;智元直播是工业落地的可行性,夯实工业量产的下限。
场景抉择:
无序民用物流VS有序工业产线
直播场景的选择,是两家企业商业化战略最直观的体现,直接决定了技术研发、硬件选型、产品定位的所有走向。
Figure聚焦高泛化、高随机的民用物流场景。
快递分拣、包裹拆包、物料规整的民用流通场景,优势和短板都极其鲜明。
优势在于场景大众认知度高、传播性强、市场想象空间大。物流行业存在海量人工替代缺口,且场景无严格的工业标准束缚,适合展示机器人的通用能力。
但该场景的技术难度极高:所有作业对象都是无序、非标准化的。包裹形态、重量、摆放位置完全随机,作业环境动态多变,没有固定轨迹和标准姿态,这恰恰是这次具身浪潮最需要解决的问题,不是去和工业自动化抢饭碗,而是在需要真的空间泛化、任务泛化、通用智能的场景去解决问题。
选择物流场景,意味着Figure彻底押注“通用优先”,核心目标是打磨一台能够适配万千陌生场景、自主应对随机变量的通用人形机器人。
而智元聚焦高规整、高标准的3C工业产线场景。
智元放弃了大众流量场景,深耕3C电子量产质检这一垂直工业赛道,落地场景高度封闭、规整、标准化。
本次落地的龙旗科技南昌量产工厂,是成熟的标准化产线,工件规格统一、工位固定、工序闭环、环境变量可控。
精灵G2机器人全程承接平板全流程质检工作,独立完成多媒体界面测试、音频测试、辐射杂散发射测试、耦合测试等多道高精度工序,完全匹配工业量产的精度与节拍要求。
工业场景的核心特点是容错率极低、稳定性优先、泛化需求靠后。制造业不需要机器人“聪明万能”,只需要“精准稳定、持续干活、不掉链子”。
硬件本体:
双足通用人形VS轮式双臂工业体
两场直播最直观、最本质的差距,体现在机器人整机硬件架构上,这也是两家技术路线、产品定位、落地逻辑的核心分水岭。Figure选择通用人形机器人本体作为其智能的载体,而智元则选择了稳定移动机器人底盘加上人形上半身以及定制的末端夹爪。
总结概括如下表:

AI大脑:
大模型自主决策VS传统工业控制
硬件差异的背后,是两家企业AI算法、控制逻辑、智能架构的核心分歧,也是行业目前两大主流技术路线的正面碰撞。
Figure:大模型+模仿学习,自主智能优先
关于Figure的整个直播是否是人为在后面进行遥控操作,在业内也有很多的讨论,我们咨询了一些在我们湾区的朋友,确认为真是模型推理,而非人为的遥控操作,Figure的整套作业逻辑,完全基于端到端AI智能方案:大模型空间决策+人机模仿学习+遥操作数据迭代。
它的每一次作业都不是机械重复,而是AI实时自主判断、临场自适应调整。哪怕出现新的未知场景,模型也能基于过往数据自主优化,持续提升泛化能力。
这套方案的核心是智能优先,缺点是稳定性不可控、作业精度波动大,暂时无法满足工业量产的零容错需求。目前还存在可解性差。
智元:传统工业控制,稳定精度优先
从直播作业画面可以清晰看出,智元精灵G2的作业逻辑,以成熟工业运动控制+预设程序指令集+固定姿态轨迹为核心。
整套质检工序、抓取动作、测试流程、动线节拍,均基于工业场景标准化需求提前预设,机器人严格按照既定程序重复作业,姿态固定、轨迹稳定、节拍统一。
现阶段智元并未过度依赖大模型自主决策,而是深耕工业控制技术,用成熟的传统控制理论保障工业级的重复精度与作业稳定性。33小时超长作业、99.98%的超高成功率,正是这套方案的最好证明。
行业终局:
两条路线谁对谁错
两场顶级直播看完,我们可以打破行业一个最大误区:人形机器人不是“越像人、越智能、越通用就越好”,不同阶段有不同的最优解。
目前整个具身智能赛道,清晰分化为两大阵营:
远期派(Figure为代表):押注通用人形,深耕AI大模型智能。打磨全场景泛化能力,牺牲短期落地速度,换取长期技术壁垒与行业终局话语权,目标是颠覆所有人工场景。
近期派(智元为代表):聚焦工业垂直落地,优化成熟控制方案。舍弃无用的通用冗余能力,优先实现规模化交付、商业化盈利,目标是快速替代传统工业自动化设备。

智元精灵G2在龙旗科技江西南昌量产工厂
放在产业视角来看,智元的路线更贴合当下产业现实,Figure的路线定义行业未来方向。
当下的制造业,不一定需要万能的人形机器人,对于终端来说核心要能稳定替代人工、降本增效、快速落地的智能设备。其ROI能算的过来,稳定新能保证,能保证的产品产生的可靠性以及稳定新,至于到底是人形机器人生产的、还是类人形机器人生产的、还是自动化设备流水线甚至是人生产的应该都不是最重要的。
我们不去看终局,站在终局看当下没有任何意义,得能活到终局才行。
赛道分化
总要证明自己可以
2026年,随着轰轰烈烈的资本投入,人形机器人行业正式开始show阶段了,证明自己有想象力、有未来、有空间。未来只会有越多的Figure以及智元出现。
没有谁的路线更先进,都是前往未来的路径之一。
凡是过往,皆为序章。
