
作者|Li Yuan
具身智能赛道的融资纪录又刷新了。
6 月 24 日,灵巧手公司临界点 AGILINK 宣布完成新一轮融资,投后估值超 10 亿美元。从公司成立到跻身独角兽,这一过程用了 5 个月,4 轮融资——是灵巧手赛道至今最快的速度。
本轮投资方阵容包括未来资产、某互联网大厂、京铭资本等战略与产业资本,东风资产、国信中数、上海电科基金等产业资源方,清新资本、凯联资本、普华资本、天季资本、We Venture、箴言投资、明嘉资本等财务投资机构,以及高瓴创投、蓝驰创投、C 资本等老股东的持续加注。
临界点是一家专注于灵巧手硬件与算法的公司,年初从智元机器人拆分出来。
过去几个月临界点的进展很快,已经有了多款产品:有尺寸接近鼠标的轻量化灵巧手 OmniHand 3 Lite,也有面向具身场景的夹爪 OmniPicker 3;在高自由度灵巧手上,临界点也同时推进绳驱和直驱两条路线。
之前发布的 Ultra-T 采用绳驱方案;6 月 2 日,在维也纳 ICRA 现场,临界点又首次发布了全直驱旗舰灵巧手 OmniHand 3 Ultra-M。
在软硬件协同层面,临界点还在 ICRA 现场展示了可以把长条气球折成小狗形状。气球柔软、易变形,也很容易被捏爆,从个人经验出发,确实人类都不一定每次都完成好这个任务。灵巧手能够做到这个 demo,不仅展现了手指运动能力,也展现了很好的触觉感知、力控和接触建模能力。
在此次融资之际,极客公园和临界点熊坤进行了一次对谈。
我们聊到:临界点为什么能在短时间内融到这么多钱;ICRA 现场的气球 demo 背后,究竟对应怎样的技术叙事;为什么临界点要同时布局多种技术路线和不同自由度产品;它如何判断当前的触觉路线;以及作为具身智能赛道最快成为独角兽的公司之一,临界点怎么看灵巧手行业的下一阶段。
01
灵巧手不是一门纯硬件生意
极客公园:这次我们想聊「为什么临界点能融到这么多钱」。你会有一个很直接的答案吗?
熊坤: 如果有一个唯一答案,就是临界点可以更好地跑通灵巧手,解决机器人最后 10 厘米的问题。
硬件上,我们不是只做一款产品,而是有低、中、高全矩阵投入。灵巧手基模研发也会加大投入,下半年应该会有一定成果。整个软硬件壁垒会越来越深,助力灵巧操作爆发式增长。
除了旗舰产品以外,我们还有量产能力。我们在不同场景下有不同硬件布局,算法也会针对不同场景做定制化开发。更重要的是量产和供应链整合能力,这是我们的不同优势。
极客公园: 灵巧手公司的估值应该怎么衡量?
熊坤: 关键在于你把它当成纯硬件公司,还是既做硬件又有模型的公司。
一些传统灵巧手公司可能还是纯做硬件,只能按硬件方式估值。但很多新的公司,如果具备很好的灵巧操作模型能力,我觉得硬件加软件模型的估值体系,才符合对灵巧手公司的评判。未来想活下去,应该都要软硬件都有。到那个时候,估值方式里软件比重会越来越多。
极客公园:融资后你们想做基模,这次的拧气球就是一个模型能力展示。拧气球展示了哪些模型特点?
熊坤:我们认为,下一阶段机器人竞争的核心,不只是让机器人「看懂世界」,而是让机器人能够通过触觉和力反馈理解物理世界。临界点把这一能力定义为「接触智能」(Contact Intelligence),对应的,我们有一套具体的技术架构 DUET(Dual-layer Unified Embodied Tactile Intelligence, 双层具身触觉智能)。拧气球 demo 是我们对 DUET 架构的一次公开完整验证。
第一层是操作层,会采集人类完成长序列拧气球的视频和数据,包括手的数据、双臂的数据。通过这些数据,我们会获取运动空间、手和气球之间的碰撞区域等信息。基于这些数据做训练,在真实环境中用强化学习不断调整整个任务规划和灵巧手轨迹。
第二层是接触层。手上的触觉会实时采集拧气球过程中的数据信息。基于这些信息,我们会在仿真环境里搭建气球物理模型和灵巧手模型,做接触和摩擦建模。灵巧手和被操作物体之间的接触建模,对灵巧操作模型训练非常关键。

拧气球不同于其他任务,它操作的是软体物品。捏上气球的时候,气球会产生形变,所以接触建模、力的感知,对手、传感器和模型建立的要求都非常高。
总的来说,操作层负责手和臂的任务规划、轨迹计算和运动策略;接触层实时给运动层提供精细的手类触觉信息、力的信息,并对抓力做调整,起反馈作用。通过这两层,可以让灵巧手稳定完成拧气球动作,防止脱滑和把气球捏爆。
据我们了解,很多友商也尝试过捏气球任务。有些可能是在力控制、手和接触模型搭建上有问题,就没办法完成这个。
气球是人打的,很难保证每次打出来的软硬、长度一致。所以每次捏的气球,包括形状,都不是 100% 一致。有些是完整直条,有些有一点弯曲,会有差异。
实际上我们也不是 100% 成功,但成功率已经足够拿出来展示。我们的展示每隔半小时会有一次,一天大概十几次,连续展示了四天。

此外,我们的模型泛化能力会做得比较好。对于不同场景需求有不同的原子技能,搭配不同自由度灵巧手执行,技能底层通用。比如我们这次 ICRA 是用了十个主动自由度的 OmniHand 做了拧气球的展示,而旗舰款的 Ultra M 也能做。
极客公园: 刚才说到运动智能和接触智能,接触智能在仿真环境中做。我理解现在触觉信息在仿真环境里有时没办法模拟得很好,是这样吗?
熊坤: 对,尤其是要搭建非常准确的接触模型。只有仿真环境里搭了很好的接触模型,仿真里跑的算法做 sim-to-real 迁移时 gap 才会小。这是行业通病。
基于这个问题,我们也在尝试搭建自己的仿真平台,包含触觉仿真、力和接触模型仿真等。尽量保证接触不同物品,不管是硬质材料还是柔性物品时,接触模型和力仿真都最准确,这样才能保证训练出来的模型做真机迁移时质量最好。
这是整个行业的共识,难度非常大。只不过目前解决了运动智能问题之后,迁移到作业智能,大家才把精力花在操作仿真上。
极客公园:这次同期我们还发布了一个 Ultra M 的灵巧手,它的特点之一也是触觉能力很强,整手超过 300 个三维触觉感知点?
熊坤: 是的,每个指尖是视触觉,手掌是三维触觉。视触觉和三维触觉还有点不同,视触觉合下来可以有六维信息。它里面有一个小摄像头,可以拍到形变、颜色等变化,再通过计算得出更丰富的信息,比三维触觉还要丰富。
搭载的单个传感器的精度,也是行业里比较高的。我们用的是三色光触觉传感器,不同于行业里很多单色光视触觉传感器。它的精度可以达到 5 mN 的要求,指尖至少有 125 个点位,整体来说应该是目前视触觉传感器里做得比较好的。
从行业情况看,视触觉以前更多用在夹爪上,因为要把它做小、做到指尖里很难。目前能做到指尖这么小的公司不多。我们应该是行业里较早用三色光原理做指尖力计算的公司之一。其他家也有标注数据,我没法直接评估,但我们的数据是基于实测效果标注的,可信度比较高。最主要的是,我们提供了动态三维分布力。
我们的一个特点是,在更小的尺寸里整合了更多传感器。我们始终坚持产品要和人手一致,因为越小越轻,对客户来说应用性更强,成本也更低。它只有 630 克,是最接近人手尺寸的 20 个主动自由度直驱灵巧手。目前应该是整个行业做得最小、最接近人手的。这对后面的强化学习和真机强化学习也有帮助,因为目前大家验证下来,灵巧手越接近人手,后面的数据采集、模型训练和 replay 效果会最好。
运动速度也很快,可以达到最快 3 赫兹的开合要求。在保证结构强度的同时,用钛合金、镁合金减重,也对构型和运动构型做了调整,保证符合运动空间需求。它是一款性能和仿生融合得比较好的产品。
极客公园: 为什么手掌需要传感器?
熊坤: 不同场景需要不同定位的灵巧手。不同灵巧手匹配场景需求时,对触觉传感器的要求也不一样。
所以我们的低、中、高不同手,传感器使用也不一样。低端用一维压阻传感器,这类没有太高技术门槛,我们会和友商合作。高端的视触觉传感器,核心技术更多掌握在自己手里,同时也会和友商配合。
高端手要完成对标人手的高复杂任务,比如掌内转魔方,除了指尖最频繁接触以外,手掌和指腹也会不停和被操作物体接触。
比如拿筷子,或者用圆珠笔写字。大部分人在拿筷子、写字时,食指指腹,不只是正面,还有侧面,会频繁和笔、筷子接触。如果这个区域有分布比较好的触觉传感器,能感知三维力变化,对圆珠笔和筷子的机械化操作会有很大帮助。它可以帮助做动作微调,让整体质量上去,提升写字和操作筷子的精确度。
我们实际测试发现,如果这部分触觉传感器的信息也能输入,模型训练可以得到更好的结果。
02
用不同的自由度、不同的路线通向未来
极客公园:Ultra T 应该是绳驱,这次新发布的 Ultra M 是直驱。为什么有两个技术方案?
熊坤:这两种方案来看,它们上限都非常高,都是最接近人手功能的实现方式。相比连杆、蜗轮蜗杆等方案,它们更接近人手。所以只要做技术突破,很明显会成为未来高端灵巧手的两种主流方案。我认为未来两种方案都会存在,只是时间问题。
直驱手的工艺路线更明确,对做学习的同学非常友好,因为控制非常直接、简单。对于做真机强化学习、强化学习的同学,它也非常合适。我们验证下来,从工艺、方案、量产,到硬件做好之后的数据、模型和部署打通,直驱都比较合适,也符合高复杂、高难度、高自由度任务的要求。

绳驱手的优点是抗冲击、负载自重比非常好;缺点是蠕变问题比较严重。绳驱如果把自由度做高,也是很好的一种方案,适合在人居环境里做类似人的操作,和人打交道,或者使用人类工具。
我们同时布局绳驱和直驱,希望在两种技术上都有积累。当相应核心技术点,比如腱绳问题、基本材料问题解决之后,可以很快把两款手推到大规模使用和量产。
极客公园:「只是时间问题」怎么理解?
熊坤: 我们可以把直驱和绳驱的问题点罗列清楚,分析解决这些问题大概需要多少时间,就能看出两条技术路线最后实现和爆发的时间点。目前看,直驱可能 3 年左右会解决得好一点;绳驱可能要更长,可能拉到 5 年,甚至更久。
极客公园:在这两条技术路线之外,临界点多种自由度都做。行业里也一直争论,灵巧手到底需要多高的自由度?
熊坤: 临界点的观点是,一只灵巧手的价值不是取决于有多少自由度,而是取决于它能否真正让人形机器人进入各类场景。
所以在内部,我们在科学地分析一只灵巧手或夹爪能完成多少任务、一个场景需要多少自由度。我们采集了大量工业端、商业端、C 端消费端的操作场景任务,并把任务划分成 A、B、C 三类。
C 类任务,夹爪可以完成,灵巧手也可以完成,两者差别不大。B 类任务,夹爪可以勉强完成,但成功率或完成质量没有灵巧手高。
A 类任务,只有灵巧手才能完成。比如拧瓶盖,如果是需要三个手指去做旋拧任务,夹爪比较难满足。你可能会说两个夹爪配合腕部也能完成,但我们对任务会有一些限制,因为最后要适配人形机器人,不能用非常规动作完成操作。
剥橘子也是 A 类。它会涉及拧、扣、掰等动作。如果夹爪再配合特定工具,也许可以,但如果以人为第一性角度考虑,按照人怎么操作来要求,夹爪没法完成。
做完这样的划分,就可以清晰知道不同场景更适合夹爪,还是需要多少自由度的灵巧手。为什么要用两款不同自由度的手完成同一个气球任务,就是要去分析不同任务对自由度的需求。
基于 A、B、C 类任务分析,我们对场景和不同灵巧手的匹配度理解,应该是行业当中最准确的。
比例还是要和场景挂钩。比如工业类固定场景,统计下来 C 类可能占 50% 到 60%,也就是说面对工业场景,可能有 50% 到 60% 的场景用夹爪就可以满足。另有 40% 到 50% 需要不同自由度的灵巧手,其中这 40% 到 50% 里大概一半左右,中等自由度手就可以满足,也就是 10 到 17 个主动自由度。
我们做这么多款手,本质上是因为我们对场景的理解比较透彻。不同场景需要不同手。
除了旗舰款,Lite 应该是目前行业当中最小、最便宜,而且最抗冲击的一款手。Lite 的需求来自我们对人形机器人轻作业和交互场景的理解:它需要抗摔,需要适配更小尺寸的人形机器人和更轻量的机械臂。
我们做的 OmniPicker 3 夹爪,也是我们把对具身场景的理解解析出来,发现它需要指尖能够精确感知力的变化。所以我们做了模块化触觉指尖,可以快速更换,也可以精细采集触觉信息。OmniPicker 3 目前还没有开始卖,但已经拿到批量订单。
03
灵巧手明年收敛到人形整机格局,
正在攻克量产和数据的问题
极客公园: 从去年到今年,灵巧手行业一直很热,你觉得现在竞争格局是什么?
熊坤: 灵巧手目前收敛程度在加快,但还没有到人形整机那样。人形整机的基本格局,我觉得已经算形成了。
灵巧手的话,我觉得今年、明年也会逐步收敛到类似人形整机的格局,可能前面有 3 到 5 家头部,其他很多会慢慢被淘汰。灵巧手整体发展速度也非常快。
极客公园: 我们现在累计交付灵巧手 8000 台,是吗?主要是哪一款,交付给谁?
熊坤: 是。交付的 8000 台当中,差不多六七千台是 OmniHand 灵动款。主要客户包括智元,还有一些具身客户。也有科研机构、方案解决商等。
极客公园:Ultra-M 预计什么时候量产?
熊坤: 直驱预计今年 Q4 会达到量产。绳驱手可能也差不多,或者稍微晚一点。
目前高自由度灵巧手,主流还是出给高校科研机构,以及一些需要做模型训练、专门做软件算法的具身公司,用来做数据采集和模型训练。
未来出货给做模型训练的公司可能占 60%,另外 40% 出给高校。量级要等量产后看市场,现在说都是想象。我们在所有高自由度手里应该有相对优势。量级至少是千台往上,数千台。
极客公园: 我看到 GGII 的数据:2025 年中国灵巧手市场销量约 2 万只,2026 年可能达到 7 万只,2030 年可能突破 43 万只。你认同这个增长节奏吗?
熊坤: 大差不差,基本类似。但我可能会更激进一些。我觉得今年可能会突破 10 万只,到 2030 年,50 万甚至 100 万只都有可能。
这主要来自人形机器人销量本来就很快,第二是灵巧手自身技术成熟度也在加快。所以会加快人形机器人搭配灵巧手在各类场景中做部署态落地。
极客公园: 从去年到今年,整个灵巧手行业你觉得是什么状况?
熊坤:很多公司,包括我们,都在攻克量产问题。
大家一直说,2024 年是研发元年,2025 年是量产元年,2026 年是商业化部署元年。我觉得这是对人形整机的评判。灵巧手会比人形整机稍微晚一点。今年对灵巧手来说,应该是量产和初步部署化的年份,更主要还是量产。
Demo 是一块,但不能只从 demo 角度评估灵巧手行业的发展。很多公司还没有达到像临界点这样比较大规模的灵巧手量产能力。与其纯粹做惊艳 demo,不如在底层量产工艺上下功夫。
从核心零部件,比如电机、触觉传感器安装,到基础的螺钉、胶水使用、装配工艺、装配方法、材料应用、涂料和涂层应用等,都要建立一套非常规范的要求。这也是临界点相比其他友商非常有竞争力的一个点。
极客公园: 这些问题解决之后,成本下降空间还很大吗?
熊坤: 成本下降空间应该很大。它的价格要符合人形机器人 20% 的要求,才能被人形机器人大规模应。
极客公园: 如果按 100 分算,今天灵巧手做到多少分?
熊坤: 还是及格分左右,可能 60 分。
极客公园: 再往上突破,哪一块拖后腿?
熊坤: 软件硬件都需要进步。如果想让分数快速提上去,我觉得硬件比重会多一些。
极客公园:人形机器人或通用机器人都说缺数据,灵巧手自己有数据问题吗?操作数据怎么收集?
熊坤:目前行业对数据,包括灵巧手数据,有一个数据金字塔划分。
最底层是仿真数据。再往上是人手数据,比如通过视觉、视频采集人手数据。第二层是通过手套形式,或者五指外骨骼采集到的操作数据。最高层是真机遥操数据。
我们目前的数据采集基本也是基于这样的数据工厂完成。我们在筹备自己的数采厂,也和一些公司合作做数据采集。我们已经有 8000 多只手销售出去,目前日常有 1000 多只手在做常规数据采集,已经累计了数万个小时数据。
临界点的数据类型构型上和其他家类似,但我想强调几个点。
第一,我们的产品矩阵最全,所以不是用单一一款手做数据采集。这保证了即便是真机遥操的灵巧手采集数据,种类也是最多的。后面做模型训练时,泛化能力会更好。当用我们的模型训练人形机器人做任务时,可以很好完成不同灵巧手本体的迁移。
第二,我们在数据采集设备上有一些调整和优化。比如我们有自研数据手套,可以解决触觉手套常见的应力残留等问题,保证采集到的触觉信息准确度更好。



