给中国大模型创企5个月,一次打通本体+灵巧手

高工人形机器人 2025-08-11 21:23

加入高工人形机器人行业群,加微信:17748568763,出示名片,仅限人形机器人及具身智能产业链相关企业

资讯配图

在人形机器人行业,新品首秀往往是一场秀肌肉的竞赛,跳舞、后空翻、收纳……企业们使尽浑身解数展现自家人形机器人的优异性能。


自变量把这个竞赛提高到了另一个高度:


他们把展区变成一处开放的作业现场,让机器人在嘈杂人群、频繁干扰的环境中同时干几件事——做香囊、捡垃圾、收衣物、组装零件——而且没有任何预设剧本,全靠自主学习与即时应对。看似“演出”,实则是一场硬核的工作考核。


这一幕背后,是自变量的野心。


这家以具身大模型技术闻名的赛道头部玩家,在2025世界机器人大会上选择了最难的登场方式:不是孤立地秀一段模型 Demo,也不是摆一台只能拍照的机械“花瓶”,另外一次性亮出两张底牌——新一代人形机器人“量子2号”自研五指灵巧手


一个是身体,一个是灵巧手,都是行业里最难啃下、也最难回避的部分。


正如乔布斯在 2007 年 iPhone 发布会上说过:“真正认真对待软件的人,就应该自己做硬件。”这句话开启了智能手机的黄金时代。自变量 CEO 王潜显然深以为然:“我们不只是做大模型的,我们是面向终端的软硬一体公司。”


这不是姿态,而是基于实打实的速度:不到半年,他们从零开始搭建团队,如今打造出齐平行业水准的整机本体,并将灵巧手自由度提升至20个,未来还将结合他们领先的大模型能力。

在供应链尚未成熟、大模型企业纷纷自研硬件本体的赛道,这样的节奏本身就是宣言——自变量不仅要证明自己能造硬件,更要在软硬结合的具身智能落地战中抢先夺权

资讯配图

这不是一次普通的新品发布,而是一封战书——写给所有还停留在表演阶段的人形机器人厂商:

接下来,拼的不再是能不能发 Demo,而是能不能真的让人形机器人落地干活。

资讯配图

5个月交卷:

人形机器人本体+20自由度灵巧手


我觉得还好。早期肯定会有一点困难,但后面就很顺了。而且我们确实用5个月多一点的时间,从零开始做出了完整的本体。目前整个人形本体赛道都起步,我们追赶的速度也很快,预计到明年就能和本体企业齐头并驾了。

谈到一家以大模型见长的公司跨进硬件领域是否会遇到门槛时,王潜的回答很直接——我们有很专业且很优秀的硬件研发团队,工程师素质非常优秀,我们很自信可以快速迭代出优秀的机器人本体。

在他看来,真正的区别不在技术本身,而在公司组织是否能适应新打法:大模型往往依赖少数顶尖个人的突破,而硬件是一场大军团作战,需要跨团队协作、工程管理与供应链磨合,并通过真实场景反推结构、电控与感知设计。

这种思路,让量子2号在不到半年的时间内,就走到接近上市的完成度,并携20自由度灵巧手一同亮相。

资讯配图

具体看量子2号的性能:

机动能力——量子2号的底盘,是为跨场景移动而生。54厘米直径底盘可原地转向,1.5/秒的机动速度在家居走廊、商用通道都不显笨重;4厘米越障和15°爬坡能力,让它不止能到得了,还能到得快

操作性能——全机最多62个自由度,双臂7自由度构型,肩展765毫米,单臂末端速度可达2/秒,负载6公斤,重复定位精度±0.03毫米。未来搭载具身大模型,无论是开放随机的家庭服务场景,还是高节拍的工业场景,都有稳定的速度与精度双保险。

感知与安全——布设RGB-D、激光雷达、高精度IMUTOF、超声波、红外镜头、力/位觉等多源传感器,0.5牛级力觉和毫秒级避碰反应,让它在人群和货架间穿行时能知进退。这正是“AI定义硬件的体现——感知配置不是为了堆料,而是为模型的长链路决策提供可靠输入。

能源策略——高倍率快充可在约1小时充满,高负载续航4小时以上,并有智能BMS实时监控。对一台要真干活的机器人来说,这才是作业节奏的下限。

要让量子2号真正发挥价值,那么灵巧手的精巧操作能力是关键。起初,自变量并不打算亲自造手——在理想情况下,只要有供应商能把灵巧手做到足够好,他们完全愿意直接采购,把精力留给其他环节。

但现实是,外部厂商有自己的优先级和产品节奏,更新迭代速度、适配支持往往跟不上自变量软硬一体的开发节奏。王潜说得直白:如果没有绝对必要性,我们肯定不愿意自己去做。

最终,为了在性能、适配和迭代速度上掌握主动权,他们选择把灵巧手收归自研,让这一关键部件与本体和模型的演进保持同频

资讯配图

在设计上,王潜并不回避腱绳传动的非线性难控问题,他表示,自变量采用弯曲自由度腱绳+侧摆直驱的混合架构,并通过算法优化在小型化、抓力与稳定性之间找到平衡,同时减少堆叠干涉和维护负担。

l 传动架构:弯曲自由度采用空心杯腱绳传动,带来更大的抓力与更紧凑的体积;侧摆自由度由微型减速箱直驱控制,确保运动的线性与响应速度,并配合算法削弱腱绳的非线性影响。

l 运动与负载能力:整手20个自由度(15个主动),自重不足1公斤,单指可承受1公斤、整手5公斤,重复定位精度<1毫米,既能胜任精细操作,也能完成中等重量搬运。

l 节能与耐用设计:节能自锁机制让抓取保持时静态功耗下降80%,降低长时间作业的能耗与发热压力,同时延长零部件寿命。

l 感知与控制系统:指尖集成0.1–20牛(±0.1牛)的力觉传感与1厘米接近感知,500Hz实时闭环控制通过USB 3.0高速传输,兼容ROS1/ROS2及即插即用SDK,让它既能精准感知抓力,又能快速融入不同应用环境。

资讯配图

是时候用AI定义硬件了


自变量跨进硬件的背后,是一整套“AI定义硬件的方法论。

王潜坦言,最大原因在于现有供应链无法跟上他们的迭代节奏。许多厂商仍沿用工业机器人、自动化设备、汽车等行业的体系,而AI驱动的人形机器人在传感、关节模组等核心部件上的需求与这些领域有着本质差异。

尤其是通用型人形机器人,需要的不是照搬旧图纸,而是一套全新的设计逻辑——由真实任务驱动迭代,用场景需求倒逼结构、控制、感知与传动系统的重构

资讯配图

在这样的现实下,有的环节可以与供应商共同成长,有的则必须亲自掌握,才能保证研发速度与产品完整性。机械臂要在机器人身上而不是支在桌面上,动力学与可靠性就得推倒重来;灵巧手外形再像人手,如果功能无法满足任务,也必须在实测中不断重定义。硬件必须适配真实场景,而不是复用旧的专用设计王潜强调。

他举了一个典型案例:业内验证灵巧手稳定性,常用的方法是让手指反复弯曲一百万次,如果没坏,就被视为可靠。然而真正投入任务时,情况往往截然不同——“有些手在实验室能跑完百万次测试,但在真实使用中,半小时就坏了。

原因不在于测试不严,而在于实验室的环境过于单一可控,而现实世界中,手指可能被无意磕碰、刮擦,甚至轻轻撞到,就可能造成损坏。对于频繁与物理世界互动的机器人来说,这样的碰撞几乎无法避免。

如果硬件在这种情况下就罢工,那它在纸面上的寿命再长也没有意义。正是这种脱节,让自变量意识到,必须用自己的方法论重新定义硬件标准——让设计、测试和验证尽可能接近真实环境,而不是依赖工业臂或专用设备的旧范式

这种从应用场景反推硬件演进的路径,让量子2号与20自由度灵巧手在短短数月内同步迭代到接近上市的水准,并具备跨场景作业的适应力。对自变量而言,硬件不是大模型的附庸,而是让AI真正落地的肌肉与骨骼”——只有它足够稳,AI才能在物理世界中释放全部力量。

资讯配图

具身大模型赋予硬件本体灵魂


如果说 Quanta X2 是一副强健的身体,那么WALL-A就是赋予它感知、理解与行动能力的大脑。过去半年,这颗大脑从实验室原型一路走到真实场景的长时间稳定运行,在推理深度、任务泛化和执行稳定性上,已经稳稳站进行业全球第一梯队。

据透露,半年间,它的进化集中在四个方向——

长序列推理能力爆发:半年前,要让模型完成一个很长的任务链,必须针对整个序列一次性训练,而且还未必能训出来;如今,WALL-A 只要掌握每个子任务,就能自主拆解、规划执行顺序,无需人为干预。它能在不切换模型的情况下,跨任务、跨空间处理复杂长链条任务,并在执行中实时修正计划。

任务泛化更极致:在陌生环境中,能快速适配、识别并处理从未见过的物体或情境,把原子技能零样本组合成全新任务。

人机交互更顺畅:执行过程中可一边操作,一边实时响应自然语言指令,动态调整动作顺序与策略。

软硬件深度一体化:推理与规划结果能瞬时回灌至机器人的控制系统,让动作更稳、更准。

与市面上依赖多层模型拼接的方案不同,WALL-A走的是完全自研的统一端到端架构——视觉、语言和动作的双向输入输出一气呵成,没有中间模型的衔接损耗。这让它不仅能跨模态理解与生成,还能把推理结果即时回灌,形成闭环大脑系统

资讯配图

王潜形容,这是一条一个模型做所有事的路线——不需要为感知、决策、控制分别调用不同模型,也无需为每类任务单独训练。理论上,它可以处理无限长的任务链,执行无限复杂的推理规划。

分层模型做长程复杂任务,幻觉严重到不可用,成功率低到根本落不了地。那是 Toy Model(玩具模型),拍拍 Demo 可以,真干活不行。

资讯配图

王潜举了一个自变量半年前实现的机器人找削皮刀的案例。

基于WALL-A模型的具身思维链,机器人先识别到桌上的苹果,推断需要工具削皮,并判断工具可能在果篮或抽屉里;果篮翻找无果后,又结合房间里有小孩的提示,自主推断锋利物品不会放在低处,直接跳过下方抽屉,精准锁定最上层抽屉的削皮刀。

全程,它都能实时理解人类的自然语言打断,动态调整下一步的动作计划,把一个跨任务、跨空间的长链条推理干净利落地完成

WRC 现场的香囊制作演示,则展现了它在柔性物体处理与双臂协作上的熟练度——自主选择香料,在不足 10cm 的空间中双臂缝制、贴徽章、递送,并在发现物料不足时,自主避障去更换和补充,全程无需人工插手。

资讯配图

这种能力的底层基础,是 WALL-A 通过海量、多样化数据训练,获得了真正的操作泛化能力。

哪些是学过的,哪些是没学过的?老实说,我们并不在意,也没空去数。王潜轻描淡写。

而这套能力,从来不是为了炫技,而是为落地而生。自变量的路线清晰直接:短期优先攻下商业服务和公共服务场景——酒店、养老院等,这些场景中充斥着传统自动化无法替代的复杂任务,客户愿意持续买单,场景纵深够深,足以迭代到更复杂的任务;工业领域的高节拍、高负载环节不是优先项,只切入那些需要通用推理的工序。

我们的目标,不是让机器人会一个技能,而是让它在真实世界里想得明白、干得漂亮。

在自变量看来,真正的通用智能,不是靠预编程秀一两个绝活,而是让机器人在开放陌生世界里,靠自主学习摸索出答案——然后,把事干成。

资讯配图

结语


相比去年还自认与具身大模型龙头企业 PI 存在“3–6 个月差距,如今的自变量的自信更足。

综合对比,我们的大模型能力,放到全球,就是第一梯队,对标 DeepMind,和 Physical Intelligence 也几乎没差。王潜直言。

这句话背后,是对旧格局的正面宣战——那个中国主宰硬件、美国统治软件的年代,正在被中国新一代具身智能势力硬生生掀翻。接下来,不是追赶,而是正面硬钢。

在王潜看来,真正的竞争从来不在舞台上,而在落地现场——谁能让机器人在陌生环境中想得明白、干得漂亮,谁才有资格定义下一轮规则。自变量选择了最难、也最直接的路径:软硬一体、端到端模型、从高价值场景切入,拒绝演示级炫技,直奔可持续的商业化。

这是一种背水一战的姿态——要么干成,要么被淘汰。而他们显然更愿意做前者。

在具身智能的赛道上,没有谁会永远领跑,但有些企业生来就是奔着终点去的。

END



资讯配图


资讯配图
对话智元研究院:瞄准中国老年人的“第二双腿”
38自由度+28.7kg握力,这只灵巧手要挑战人类了
跌倒爬起,疾跑落座!众擎全矩阵机器人惊艳2025WRC
数字华夏亮相2025世界机器人大会,夏澜“再升级”,星行侠即将完成场景落地闭环
1.3年回本,90%成功率!赛那德让VLA物流机器人真正上岗
灵心巧手完成数亿元天使轮融资,全球唯一实现高自由度灵巧手千台量产
资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
灵巧手
more
精研取舍,方得始终——ECP10030成就灵巧手触手可及的经济动力
ICCV'25 | Dexterous Grasp Motion Challenge灵巧手抓取生成挑战开启!
WAIC集锦 | 多家人形机器人、灵巧手新品发布一览
00后投身具身智能创业,剑指机器人界「Model 3」!已推出21个自由度灵巧手
灵巧手赛道进入“战国时代”,谁将脱颖而出?
强脑科技在WAIC发布全球最轻专业级灵巧手Revo 2,可轻松提起20公斤重物丨证券时报
融资加速、订单暴涨,这家公司何以冲进灵巧手第一梯队?
曾帮小米机器人造手,95后清华学霸创业,自研灵巧手刷新世界记录|硬创先锋
央视聚焦“武汉造”黑科技!华威科第2000只灵巧手电子皮肤下线交付、200万片车规级产能达产,开启人形机器人“触觉”量产时代
【报告】灵巧手专题四:灵巧手行业:灵巧手赛道百花齐放,关注工艺收敛进程中的产业链机遇(附PDF下载)
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号