2025年,人形机器人无疑是最吸“金”的赛道之一:资本频繁出手、估值飙升、“会走会跑”的视频刷屏,“过热”与“泡沫”的争议此起彼伏。然而,具身机器人的关键不在于造出多少炫目的样机,而在于能否成为可靠的工业基础设施。
上海理工大学机器智能研究院执行院长、卓益得机器人公司创始人李清都教授在接受《澎湃城市报告》专访时指出,当前机器人行业的健康发展需要聚焦三个关键点:在功率密度、能量密度与本体安全之间塑造怎样的工程底线;在情绪/表演与重复性劳动之间如何筛选首批可复制场景;在价格区间、运维体系和区域分工上,如何把人形机器人做成“算得过账、用得长久”的工业设备,而不是一场昙花一现的技术烟花。

「在“物理极限”与“安全底线”间
重塑机器人工程体系」
澎湃城市报告:在您看来,物理AI(Physical AI)的提出,对人形机器人技术路线的选择意味着什么?
李清都:物理AI的核心,是把感知、理解、决策和执行闭合在一个真实的物理系统里,让机器人“在世界中行动”,而不是只在算力里“想象世界”。这和我们十多年前在德国汉堡大学从事的“物理世界的人工智能”是一回事。如果对力、摩擦、形变、平衡这些物理量缺乏真实感知和控制,再强的大模型也很难在现实中稳定工作。
从这个角度看,路线选择本质上是“物理观”的选择。现在主流的大扭矩电机路线,更接近于用硬功率去对冲环境不确定性,优点是控制直观、爆发力强,代价是整机更重、对执行器和电池要求极高,能效和安全边界的压力都被放大。我创立的卓益得公司坚持做机器人肌腱仿生和轻量化。相比传统的全尺寸人形机器人(1.7m),卓益得机器人在重量上缩减了40%,仅重30kg左右,却能够达到持续工作6-8小时。我们力图在现有材料和能源约束下,尽量用结构设计、质量分布和被动弹性“顺势而为”,把一部分稳定性和能效交给物理本身,而不是全靠电机和算法硬扛。这样做的好处是能效和本体安全性更友好,挑战是控制问题变得更加复杂,需要在多执行器协同、状态估计和感知融合上长期下功夫。
澎湃城市报告:撇开社交媒体上那些“吸睛”的演示视频,回到真实的生产生活逻辑中,您认为真正决定人形机器人能从“样机”走向“常态化上岗”的核心工程与运维能力是什么?
李清都:对人形机器人来说,交付从来不是“搬进工厂、接上电源”那么简单,而是一条从需求抽象、任务建模、系统集成到长期运维的闭环链条。这里面至少包含三类能力,会直接决定谁能撑过几轮行业洗牌。
第一是可复制的部署方法论。机器人部署的理想状态不是每接一个项目就重做一遍系统工程,而是逐步沉淀出相对标准化的“任务模板+开发工具链+测试流程”,让新工位可以在有限工程投入下快速落地,否则仅工程成本会把ROI(投入产出比)直接“穿透”。
第二是体系化的运维能力。人形机器人本质上是持续学习、持续更新的复杂系统,而不是“一装了之”的设备。现场工程师怎么培训,远程监控和故障诊断如何组织,软件升级如何在不影响安全的前提下滚动发布,备件如何周转,这些都不仅是“服务细节”,而且是商业模式能不能成立的关键变量。
第三是“硬件可靠+软件可迭代”的融合能力。一端要像汽车一样经得起长期运行、供应链和安全考验,另一端又要像手机一样依托操作系统和生态持续更新。如果一个团队只会做样机,不会做运维,或者只会做算法,不会做可靠性,两三轮迭代之后,就很难扛得住真正规模化应用的压力。某种意义上,行业里谁最终能留下来,并不取决于谁的视频更酷,而取决于谁能在真实场景里撑起一套可持续的工程和运营体系。
澎湃城市报告:您一直强调“安全是人形机器人量产的首要条件”。在走向规模交付前,行业应优先在哪些安全与可靠性指标上达成共识?这会如何反向影响产品设计?
李清都:一旦进入“有人在场”的场景—工厂、商场、校园、医院、家庭等—安全就不再是一个合规选项,而是“能不能售卖、能不能大规模部署”的前置条件,安全底线守不住,ROI根本无从谈起。
我们可以分三个层次来看机器人的安全问题。第一层是本质安全设计,这可谓是底线之底。极端情况下,即便控制程序“跑飞”,机器人也不应对人造成难以接受的伤害,这会直接约束质量分布、结构形式、材料选择和驱动方式,不能简单追求“越大越有力”,而要控制整体重量,避免尖锐结构,并在关节里引入一定柔顺性。
第二层是控制与感知层的安全边界,包括速度、力矩、活动空间的限幅与冗余,以及异常情况下的紧急制动、故障自诊断和“安全退场”机制。机器人领域已有一套碰撞检测和功率限制的经验,人形机器人自由度更多、动作更复杂,更需要在这一层形成专门的测试方法和认证规范。
第三层是标准与评估体系。不论是国际标准化组织的机器人技术标准,还是各国对服务机器人的规范,实质都是在回答一个问题:在什么条件下,这个机器人可以贴近人、长期和人在一起工作和生活。如果行业在能力分级、测试场景、失效模式上没有形成广泛认可的参考系,很多高价值场景就不会真正对机器人开放。
一旦把这三层要求当成“硬约束”,机器人产品的开发流程就会被深度影响:方案选型阶段必须把安全冗余摆在前面,而不是事后补丁;架构设计上,安全相关控制逻辑要拥有最高优先级;验证环节则要引入极端工况测试和故障注入测试,而不是只看常规指标。安全如果只是“贴标签”,迟早会反噬;但如果被当作产品能力的一部分来打造,它会带来更高的可靠性、更少的停机时间和更强的客户信任。这些看不见的“隐性资产”,恰恰是规模交付最离不开的基础。
「人形机器人还在“从0到1”的扩散阶段」
澎湃城市报告:在人形机器人落地路径上,您认为哪些场景更适合作为“首批可复制模板”?
李清都:我一直主张,应该先把机器人放到“犯错成本可接受”的地方成长,再逐步走向高要求、高强度岗位。从这个逻辑看,情绪/表演型场景和特定重复性劳动场景,目前更有机会率先跑出可复制模板。
情绪/表演类,比如展陈导览、文旅表演、公共空间互动服务等,对安全和稳定性有要求,但对“每一次动作都绝对精准”的刚性要求相对没那么高,偶尔的小失误往往被理解为“拟人化表现”,容错空间更大,非常适合作为多模态感知和人机交互的训练场。
特定重复性劳动场景,如园区巡检、物料搬运、部分3C装配工位,则依托的是“可结构化+高重复度”,即可以围绕少数典型任务,把一套任务栈打磨得非常成熟,再横向复制到更多类似工位。这类场景对稳定性和MTBF(Mean Time Between Failures,平均故障间隔时间)要求更严,但一旦打通,复制效率会很高,更接近工程意义上的“规模应用”。
澎湃城市报告:从企业视角看,人形机器人的ROI要“算得清”,要先盯住哪些核心指标?
李清都:如果ROI(投资回报)跑不通,人形机器人就很可能长期停留在示范项目和财政支持阶段。对企业而言,量产的投入与产线爬坡难以成立;对行业而言,也难以跨过市场化扩张的门槛。其背后既有物理层面的硬约束,也有商业层面的“算术题”。
物理侧,关键在于执行器的功率密度和电池的能量密度。功率密度不够,很难在限定体积和重量内同时做到“动作有力、响应灵敏、结构紧凑”;能量密度不够,续航上不去,“干一会儿就得去充电”,很多场景在经济性上就站不住脚。
在此基础上,工程上还要在五个维度寻求“综合最优解”:平衡性、能效、智能水平、安全性和经济性。很多团队可以把其中一两项做到极致,但要把五个指标同时拉到“可用”的水位,往往就会出现“按下葫芦浮起瓢”的局面。不是太重,就是太贵;不是性能不够强,就是安全边界太紧,进而导致完成任务的能力不足。因此,真正重要的,是找到那个工程上可持续的平衡点。
和B端客户一起成本算账,我们一般会把传统的人力花费“摊开看”:不仅是工资,还包括加班、社保、培训、管理成本,以及夜班、危险工种的隐性成本;再对比一台机器人在“采购+运维+能耗”上的年支出,结合其有效工作时长和任务质量,估算一个相对保守的回本期。对大多数客户来说,第一关注点永远是“干活能力”和稳定性,其次才是价格和金融工具。换句话说,ROI并不是财务部门一个表格就能算出来的结果,而是对物理约束、工程实现、商业选择的系统性检验,最终要落到能否支撑规模化量产与可持续交付上。
澎湃城市报告:很多人关心,人形机器人离真正进入家庭场景还有多远,消费级突破大致需要满足怎样的价格与能力门槛,对此您怎么看?
李清都:人形机器人的一个完整产业周期大概率需要十年,现在还只是开头的前两年:玩家众多、话题很多,但整体还停留在“从0到1的扩散”,距离“从1到100的规模化”还有不小距离。
实现消费级突破,我认为需要分两步走。第一步,是在B端把ROI跑通,在工业、园区、文旅、公共服务等高价值场景中证明,在一个合理周期内,这台机器人确实“挣得回自己的成本”。第二步,是在生产规模和供应链成熟的基础上,逐步把一部分能力下沉到C端。就价格区间而言,马斯克曾提出约2万美元的目标价。在中国语境下,我觉得全尺寸人形机器人如果能稳定在10万元以内,甚至5-9万元区间,才有可能真正触达一部分家庭用户。
不过,价格从来不是唯一门槛。走进家庭之前,至少还有三道“能力线”必须先跨过:第一,人机交互自然度要明显优于今天的语音助手和简单服务机器人;第二,在若干典型家务或陪护任务上,要有稳定、可验证的真实能力,而不是偶尔“闪光”;第三,在隐私和安全上,要有比较清晰的制度与技术双重防线。
总体而言,未来几年更现实的路线,是先把人形机器人在科教、文旅表演、康养服务、园区巡检等B端场景做深做透,用一批可量化的实践把整条应用和运维链条打牢。等到那一步做好了,“进家庭”才会水到渠成,而不是通过一两场惊艳发布会“强行宣布到来”。
「从单点创新到区域接力,构建人形机器人的“长三角路径”」
澎湃城市报告:从区域生态看,要让长三角在人形机器人上形成真正的比较优势,各类主体应该如何分工协作?当前最需要补的短板是什么?
李清都:在人形机器人这样链条长、试错贵的产业里,我更关心的是形成“分工清晰的闭环”,而不是谁来当唯一主角。目前大致可以分成三类角色:功能型平台负责起跑,创业公司负责中段加速,地方园区负责放大与复制。
功能型平台—包括高校、科研院所和共性技术平台等——要盯住源头创新和人才培养,重点投入执行器新材料、多模态感知与控制等底层能力,解决从0到0.1的问题,并持续输出既懂算法又懂机械、电机、控制和工程实现的复合型人才。
创业公司要及时“接棒”,贴着场景做减法:选准一两类关键任务栈,把可靠性、运维体系和商业模型打透,完成从0.1到1的工程与商业验证。
地方园区则要在“1”之后把它放大到“100”:一方面整合厂房、供应链、物流、金融等资源,降低规模化生产和部署成本;另一方面,把园区和工厂组织成标准化、可复用的测试与示范场景,叠加安全、标准和数据等公共底座,形成统一的测试规范和任务标尺。
以卓益得为例,我们总部已迁入上海张江机器人谷,正依托这一国内机器人产业创新高地的集聚优势,整合顶尖技术、产业链与人才资源,加速核心技术研发与商业化场景拓展。
说到补短板,我建议长三角城市重视这三件事第一,让人才体系真正对口具身智能,把“毕业就能上手系统工程”从个案变成常态;第二,在政策和资金上刻意给中小企业和“非主流路线”留下生长空间,避免技术多样性过早被挤压;第三,在区域层面建设开放的测试场和数据、标准平台,把科研成果从“论文+样机”推向“中试+规模运维”。在同一套公共规则和能力底座之上,让不同城市、不同类型主体各展所长,跨过落地与ROI的那道坎,人形机器人才有可能从个别示范项目演化为长三角整体的体系化优势。