前Figure AI 负责人创业做机器人,获阿里投资 | 涌现New Things

智能涌现 2025-09-27 15:11
前Figure AI 负责人创业做机器人,获阿里投资 | 涌现New Things图1

在连文昭看来,比“谁先造出通用机器人”更重要的,是在特定场景中真正创造价值


王方玉

编辑苏建勋

作为一名深耕具身智能的创业者,连文昭拥有超过十年的一线经验——他先后在多家硅谷机器人公司担任重要角色——曾任硅谷公司Vicarious机器人团队负责人、Google X 机器人算法专家,以及人形机器人公司Figure AI(如今估值390亿美元)的首位 AI 负责人。

在这些经历中,连文昭多次带领团队完成从0到1的突破:研发机器人操作系统平台,搭建软硬一体的类人形机器人,也落地了多种形态的工业级产品。这些积累让他深刻理解了具身智能的技术底座从模仿学习到实时运动规划,从感知融合到泛化操作能力。

然而,在充分熟悉了美国机器人创业生态后,连文昭却意识到,在美国做机器人“未必是最合适的选择”。

在他看来,美国在机器人硬件、供应链和下游用户层面存在短板,项目整体迭代速度偏慢。要让机器人真正走向可靠和实用,必须更贴近产业场景。这成为他2023年回国创业的起点。他拉来了高中同学谢铮共同创办了源络科技,两人技术栈一软一硬,刚好形成互补。

谢铮曾任优必选Walker系列人形机器人产品线负责人。而在过往论文和研究中,连文昭最擅长的路径,是通过单一样本示教,让机器人习得可泛化的复杂操作技能。源络延续了连文昭在学术和工业界的技术优势:通过“少量数据示教+窄域模型”,快速打造适用于特定任务的机器人技能。这一思路不仅曾为他赢得 RSS 最佳论文提名,也成为源络落地的核心路径——即通过“多模态大语言模型+实时运动规划”落地到具体场景,并在场景中不断“学习”。

截至目前,源络科技已完成四轮融资,投资方包括了阿里巴巴、峰瑞资本、北京市人工智能基金、坚果资本、元禾原点、戈壁创投、水木创投、顺禧基金等。

具身智能尚处很早期,很多问题远未形成共识。一些创始人在公开采访时往往对其他路线言辞犀利,甚至“杀气腾腾”。连文昭恰恰相反。对谈中,他强调:没有绝对对错,也不存在唯一解,探索了、验证了才知道。

公司从创立之初,就锚定生命科学实验室这一场景,提出“多模态大语言模型 + 实时运动规划”的技术路线,强调在具体场景中验证和迭代。不久前,源络也与华大智造深入合作,探索用机器人提高实验室的自动化水平和研发效率。

在连文昭看来,通用机器人是陷阱,可靠性才是第一位比“谁先造出通用机器人”更重要的,是在特定场景中真正创造价值。

同时,源络也积极拥抱目前业内主流的端到端VLA路线。连文昭表示,源络也在与高校合作,开展端到端方向的前瞻研究,未来不排除训练自己的端到端大模型。对于同行通过大量采集真机数据训练端到端VLA模型的做法,连文昭也认为“有必要尝试”。

“我希望大家去探索不一样的技术路径、运营路径等。从全社会来看,多方案和多技术路线,肯定是更优的资源配置,而不是把所有资源都押在一条目前看起来‘对’的路上。”连文昭说。

前Figure AI 负责人创业做机器人,获阿里投资 | 涌现New Things图2

以下是《智能涌现》和源络科技创始人连文昭的对话。内容略经编辑:

机器人的可靠性是第一位

《智能涌现》:你之前在Figure AI,它现在是一家近400亿美元估值的机器人独角兽,为什么会选择回国?

连文昭:在Figure待到后面,我觉得在美国做机器人并不合适。美国在模型、算法层面没有问题,但在硬件、供应链和下游用户层面,缺乏体系。中国是唯一同时具备硬件、软件、模型算法人才和丰富应用场景的国家迭代效率远高于美国。美国一个6个月到一年的项目,国内可能一个月以内就能完成。

《智能涌现》:这背后,你看到了什么重大机会?

连文昭:主要还是AI大模型爆发带来的新机会。大语言模型带来了革命性的人机交互方式,能把复杂任务用自然语言分解。这与我过去在实时运动规划、环境理解和物理交互等底层机器人技能上的积累,刚好形成互补。

过去我做的是“小局部的泛化性”:比如向机器人示范“如何插一个电池”,机器人就能“学会”插各种各样的电池,再泛化到插拔各种线缆。同一套软件可迁移到不同硬件与相似任务,扩展了传统工业自动化“写死”的场景。

有了大模型,就可以根据人说的话自动生成任务序列,并在执行过程中推理。我看到的机会是:大模型能力会放大既有积累。随着模型不断升级,我们能被放大的倍数也会越来越大。

《智能涌现》:国外比较流行的VLA路线对你有影响吗?

连文昭:影响还是很大的,比如我们会利用多模态大语言模型,结合我过去做的底层实时运动规划,能解锁很多场景。

我们现在做的是“多模态高阶智能”。“高阶”指多层:底层多模态模型做场景理解、物体识别、状态分析,把原始图像、力、触觉等信号抽象为精确且完备的任务状态表征;在此基础上做高阶推理:任务处于何种状态,下一步该做什么,从而提升推理的鲁棒性。我们希望优先解决最关键一环——可靠性。在机器人犯错时知道自己“可能错了”,这是最关键的。这与采用端到端,还是分层,用什么模态,是相互独立的命题。

通用机器人是陷阱,要用场景驱动

《智能涌现》:你在Vicarious、Google X、Figure AI都工作过,中美在具身智能领域落地进展,哪边更快?

连文昭:现在两边都处于摸索阶段,没有明显高下之分,大家还在一个起跑线,可能才刚开始跑。甚至这都不太像比赛,更像是在地球上发火箭:200多个火箭发射站同时点火,难点还是在于各自能不能点好火,能飞多高。

这是一个比较模糊的阶段,并且距离技术的收敛还很远。

《智能涌现》:应用场景和下游市场方面有差距吗?

连文昭:美国在某些方面比中国更难。中国拥有世界上最齐全的制造业门类,应用场景非常丰富。美国则在某些领域较为稀疏,市场空间较小。美国的优势在于其劳动力成本相对较高,大约是中国的三四倍甚至更多,这使得其对机器人技术和成本的容忍度更高。

不管从哪个维度,做低价值还是高价值的事情,中国的刚需都更大。我认为,国内的机会、潜力、市场空间都远大于美国。

《智能涌现》:做具身创业时,你在细分方向上怎么思考,比如本体或模型,大脑或小脑?

连文昭:我一直想做能自主规划、决策、运动的智能机器人。一个智能机器人既包括硬件也包括软件。我擅长软件,但当时市面上没有成熟的硬件可供选用,协作臂也极不成熟。就找了之前在优必选负责人形机器人的谢铮,一起我们自研机器人本体。

还是那句话,通用机器人是陷阱,“什么都能干但什么都干不好”。我们必须锚定一个场景,让场景牵引硬件形态、软件模型和算法设计,以及数据的收集。

所以我们从创业之初,就切入生命科学这个场景,作为第一步,首先可用,然后逐步走向通用。

《智能涌现》:为什么重点选择生命科学场景?

连文昭:生命科学领域有大量高学历科研人员,从事相对低效的重复劳动(如培养细胞、操作仪器),脑力和体力劳动混在一起,难以解耦。人为误差导致实验复现性差,研发效率低。

我们希望能用智能机器人来解决这个问题,提升做实验、做科学探索、做研发的效率,以及一致性和标准可复现性。一旦能改变这个范式,宏观的说这就是科研领域的“工业革命”。

从机器人角度看,实验室是"半限定环境",仪器和流程相对规范,但操作精度要求极高(毫米级)。这种"有边界的高难度"场景既能验证技术能力,又避免完全开放环境的复杂性。

它是一个很好的考验场,一旦我们能生命科学实验室场景验证机器人的实时运动控制能力,有不错的表现,我们就能把它迁移到一些更多样的场景(3C工厂做装配,家里去做饭),就会变得简单。

《智能涌现》:源络科技跟华大智造是联合开发交付给客户吗?

连文昭:是的,我们目标把产品打包交付给第三方客户。AI在药物发现、蛋白预测等方面已经出现不错进展,但在实验室实际操作仍比较原始;现有生命科学实验室自动化系统集成成本很高、部署复杂,自动化反而失去优势。针对这些问题,我们与华大智造合作,目标打造下一代“精智”自动化实验室。

让机器人自己与环境交互,用具身获取智能

《智能涌现》:从2023年成立至今,源络在技术和产品上有哪些进展?

连文昭:技术层面,我们在底层运动控制、实时轨迹生成等几个关键领域取得了突破;融合多模态的视觉和力觉数据,包括部分触觉,实现低频实时运动控制;当操作不准确时,系统能够实时响应并调整位置。

在此基础上,我们融合模仿学习、遥操作动补及视频学习等方法,用少量数据使机器人快速把基座模型微调为适用特定任务的窄域模型。我们在柔性物体上也做了测试,如农业场景中的摘果、授粉等。

第三个层面就是AI多模态高阶模型,它赋予机器人对任务的理解能力,使我们可以真正实现全闭环。

产品层面,我们2024年正式运营。第一代机器人大概花了4个月完成,可执行拉冰箱门、分拣物品、打开抽屉,样本搬运等相对简单的任务。第二代机器人今年5月推出,能够做像我们世界机器人大会上展示的操作工具等更复杂精细的操作。

《智能涌现》:具身智能是否也存在类似大模型的Scaling Law,大量真实数据堆叠,是否真的可以把模型的泛化性带到新的高度?

连文昭:关键在于Scaling Law后续如何走:在项目初期,几乎所有措施和努力,都会推动曲线向上涨,但究竟是J曲线还是S曲线,我们并不知道。

建设大规模数采中心、用大量真机数据训练、追求Scaling Law,这种方式是有必要尝试的,因为目前技术尚未收敛,验证假设是否成立,探索天花板在哪里,这很重要。

《智能涌现》:你说不喜欢“具身智能”这个概念,更主张机器人智能应该源自具身交互,而非语言模型的堆叠模仿。可以展开解释下吗?

连文昭:现在大家把大语言模型这套直接复用到做机器人上,这种做法有一个危险是:语言的颗粒度可能没有那么细,难以捕获物理世界交互中所需的信息。

我更认可让机器人与环境交互:理解什么叫碰撞、什么是高摩擦。很多交互经验,有时候语言是很难准确描述的。

《智能涌现》:你们目前的节奏是沿途下蛋:先通过有限数据训出可用的模型,在合适场景优先落地。未来会自己训练基座大模型吗?

连文昭:不排除。如果看到足够信号,我们肯定会去做。

《智能涌现》:现在有些具身企业在做“防御性融资”,为后续可能长达数年的长跑做准备,你怎么看?

连文昭:我之前在硅谷也见过很多的起起落落。我的看法是,“拿自己应该拿的钱”。我们过去融了几轮,也会持续融资。但是否要高举高打,看各个公司的选择,没有对错之分。归根结底,持续创造价值的具身智能,才是稳健的长期主义。


封面来源企业官方


👇🏻 AI👇🏻
前Figure AI 负责人创业做机器人,获阿里投资 | 涌现New Things图3

前Figure AI 负责人创业做机器人,获阿里投资 | 涌现New Things图4
前Figure AI 负责人创业做机器人,获阿里投资 | 涌现New Things图5
36AI
👇🏻  👇🏻
前Figure AI 负责人创业做机器人,获阿里投资 | 涌现New Things图6
前Figure AI 负责人创业做机器人,获阿里投资 | 涌现New Things图8

前Figure AI 负责人创业做机器人,获阿里投资 | 涌现New Things图9
前Figure AI 负责人创业做机器人,获阿里投资 | 涌现New Things图10

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 投资 机器人
more
科技快讯 | 宇树科技 CEO 王兴兴:下半年将发布身高 1.8 米的人形机器人;美团外卖宣布升级“1对1急送”...
Humanoid推出双臂移动机器人;台湾机器人第一股!达明机器人今日上市
【AI加油站】机器人设计系列二十:乐高筑梦:从趣味入门到创新实践的机器人探索之旅(附下载)
2025中关村具身智能学术前沿赛:聚焦技术突破,共探机器人创新未来
快讯|小鹏汽车公布人形机器人专利;宇树科技下半年将推1.8米高人形机器人;DeepMind发布模型赋能机器人与具身智能
谷歌掏出自家最强机器人大脑,一句话完成垃圾分类,关键技术解析来了
被Nature亮点报道,登Science子刊!机器人插管急救新技术!
第十一届中国机器人高峰论坛暨第八届CEO圆桌峰会顺利举办
RoboDexVLM:基于VLM分层架构的通用灵巧机器人操作
雷军称与苹果竞争漫长且痛苦/微信推出长按图片搜一搜/宇树将发布身高1.8米人形机器人
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号