WDC 2026｜高继扬：从开发者到生产力，具身智能的三重跃迁

微信改版啦！想第一时间接收机器人行业最新资讯，请点击蓝字关注维科网机器人→并点击主页右上角→将公众号设为星标

6月16日，星海图全球开发者大会（Galaxea WDC 2026）在北京亦庄举行，以“Build with Galaxea”为主题，600余位全球开发者、顶尖学者、产业链伙伴及媒体代表共同参会。大会发布新一代VLA基础模型G0.5并开源，公布世界模型Fast-WAM与全身控制基础模型，双足人形机器人Kengo（行客）现场首秀，数据公司“亦数智能”正式揭牌，“星途计划”同步启动。

大会上，星海图CEO高继扬发表主题演讲，系统回顾了公司三年来走过的路，并完整阐述了对具身智能未来的判断。外界曾说星海图是硬件公司、又说是数据公司，但我们所做的一切都围绕同一个核心——具身智能基础模型，而模型最终要回答的，是机器人如何在真实世界里创造生产力。

沿着这条主线，他抛出了一系列判断：具身智能正经历“本能智能—作业智能—进化智能”的三重跃迁，未来将从“人定义机器人”走向“AI定义机器人”；商业化则沿“从开发者到生产力”逐级展开。随着Kengo发布，三年前确立的“整机＋智能”战略正式闭环——模型与本体，第一次在同一家公司里跑通。

我们始终相信，没有任何一家公司能够独自定义具身智能。唯有与全球开发者、客户和产业伙伴携手，才能让具身智能真正成为生产力。以下为高继扬演讲全文——Build with Galaxea，让新世界来得更快一些。

欢迎大家来到星海图2026具身智能开发者大会。今天我非常开心能够有机会和大家做一个分享，分享公司过去一段时间走过的路，也分享公司未来对于具身智能的展望。

首先，我想先从一张照片开始。这张照片是我、赵行，还有天威，拍摄于2023年8月份。当时我们是刚从上海的一家投资机构里走出来。虽然这家机构后来并没有投资我们，但这确实是一切的起点和原点。

回想当时，"具身智能"这个词被使用的频率还没有那么高，大部分时候大家用的是"人形机器人"这个词。所以坦率讲，在那个时间点，激昂和迷茫同时交织在心中。但是，有两件事那个时候想得很清楚，而且到现在为止我没有改变过：

第一，我们相信具身智能的未来是一脑多形，人形尤其是双足人形只会是其中的一种形态。

第二，具身智能未来的长期壁垒来自于构建物理世界的数据闭环，而为了构建这个闭环，我们最重要的路径是“整机+智能”。后来，这也成为了星海图发展过程当中的坚持。

很幸运，2023年的10月份，我们拿到了第一笔融资。当时我们的两位股东是IDG和百度风投。后来我慢慢理解了什么叫"天使投资"——大概就是在你还很无知的时候，便选择相信和押注。

时间来到2024年，我们开始做研发。但不同于大部分的具身智能大脑企业，我们并没有选择从我们更舒适、更熟悉的智能开始，而是选择从整机开始做研发。

在做整机的形态选择上，我们没有选择当时更主流或更流行的双足人形，而是开辟了轮式双臂这样的一个品类。为什么呢？因为从创业之初到现在，我们一直坚持：智能的问题，就要围绕智能的边界和需求去看我们的本体应该怎么做，而不是盲目地去做一个造型。虽然今天我们外面也有一个人形的产品，一会儿我会讲为什么我们会做双足。

2024年不仅仅是星海图在努力。回看这段时间，其实很幸运，因为我们选择了开始做整机。2025年我们推出了升级款，而且迅速进入了全球市场，我们有幸成为了轮式双臂品类的开创者。

回想2025年第一季度，我们还做了很多重要决定。比如，因为做了整机，所以发现制约整机性能的关键在于动力模组，所以我们选择自研动力模组。后来又发现光做整机也不够，所以我们决定在其中补充资源。同时，我们发现数据这件事非常关键，我们没有选择当时更加主流的数采厂模式，而是和亦庄合作，用了真实场景数据采集这样的方式。

随着我们的技术和产品发布，2025年上半年我们也陆续完成了A轮系列的多轮融资交割，当时创纪录地完成了总共15亿元融资，包括蚂蚁、今日资本、美团、高瓴、凯辉基金、北京机器人产业基金、亦庄国投等一系列伙伴，在那个时间点成为了我们的股东。

时间来到2025年下半年，我们开始在智能方面全面发力。2025年8月份，也就是不到一年前，我们发布了两个重要成果：一个是全球首个大规模开放场景真机数据集GOD；第二个是全国首个大规模真机数据预训练模型G0。

这两个成果一经发布，在开源社区反响巨大。我们的数据集在一个月左右的时间里，全球下载量就将近60万次。这个数字代表什么？大家可以想：总共大概有500小时、10个TB的数据，普通的个人开发者是不会下载的，所以我们后来判断，这基本上是全球的机构类型开发者人手一份。我们的G0系列模型从发布开始，引领了国内具身智能基础模型的开源浪潮。

智能的迭代一旦启动，便会越来越快。4个月之后，2026年1月份，我们发布了全球首个开箱即用的万物抓取基础模型G0 Plus。在这里面我特别想强调，我们一直相信具身智能要有泛化性，那泛化性应该怎么体现呢？我们当时定了一个很重要的标准，叫开箱即用。我们不希望这个demo只在我们自己的实验室、自己的办公室里面能展现出来，而是希望它能够在我们客户的办公室里，也能做出一样的效果。所以我们当时请了新加坡、韩国、美国以及国内外很多客户来做实验，体验效果都非常好。这也是我们第一次把泛化性真正带到产品当中。

半年之后，也就是2026年6月份，就在这个月的月初，我们发布了更新一代的G0.5。在这一代模型里面，不仅数据量全面提升，而且我们的模型架构上也做出了诸多创新。结果就是在更多的数据、更好的算法架构加持下，我们的模型能力在全球六大榜单取得第一名的好成绩，稳居国际第一梯队和国内第一。

同步2026年6月份，我们还发布了首款双足机器人产品，叫Kengo，就在外面展示区。很多同学或朋友不理解：你一直搞操作、搞B端整机，怎么搞起双足、搞起跳舞来了？这里面的逻辑是什么？

因为我们发现，轮式双臂品类适合于结构化场景，而我们未来的目标是通用场景的生产力。通用场景里面有一类很重要的叫非结构化场景，一定需要像人一样的人形结构才能发挥作用。所以我们在2025年春节前后就做了决定，一定要做双足。而且在这款产品里面，我们所有的动力单元——模组、齿轮、电机都是自研或产业链共研的，这是我们非常骄傲的一点。

随着Kengo的发布，现在我们成为了唯一一家同时拥有顶尖模型和顶尖本体的具身智能企业。在三年前我们定下的"整机+智能"的战略正式闭环。

回顾过去几年，不同阶段大家对于星海图的认知和判断不一样。2024年很多人说星海图是卖硬件的，2025年我们开始搞数据了，很多人又说星海图是搞数据的、卖数据的。但其实不是，我们所有的路径都是围绕着具身智能的生产力、具身智能的基础模型而展开的。随着我们这一系列成果的发布，到了2026年上半年，我们又陆续完成了一系列融资，估值突破了200亿人民币，引领了国内具身智能行业。

如何定义今天的星海图

时间来到2026年6月16日，星海图首届开发者大会。我相信我们这个大会今年是第一届，未来会办很多很多届，因为具身智能这个行业还很长很长。

在说未来之前，我想回到一个比较基本的问题：我们应该怎么定义今天的星海图？我们到底想做一家什么样的公司？我想可以用三句话：

第一句话，首先我们是一个具身智能大脑企业。在这里面我得多定义一句：什么叫具身大脑？做了什么才算作基础大脑？最重要的事就是做具身智能基础模型的预训练。为什么基础模型的预训练这么重要？因为它会在发展过程当中赋予我们一个非常不一样的规模效应，这个规模效应叫做"学得越多越聪明"。而历史上我们看到的大部分成熟行业的企业的规模效应，都来自于"造得越多越便宜"。"学得越多越聪明"和"造得越多越便宜"，这是区分人工智能企业和非人工智能企业的一个关键的规模效应不同。

第二句话，具身智能不是一个纯软的智能，它是软硬结合的。在这一点上，我们从Day 1就开始坚持，所以发展到今天，在所有具身大脑企业当中，我们的整机和供应链是最扎实的。到今天为止，我们有80%的动力单元是自研或者和产业伙伴共研的。未来在这个方向上，我们坚定不动摇。

第三句话，在做具身大脑的技术路径上面，我们是国内最早押注真实数据的公司。2023年我们开始创业的时候，我们讲的是"真实数据是通往未来的最重要的路径"，今天这条路径被全球证明是最有希望、最有可能通往智能未来的技术路径。而在这条路径上，我们是国内布局最全、规模最大、技术最领先的企业。最近发布的G0.5就是最好的成绩。

智能：本能、作业、进化

展望未来，我们先从智能开始讲起：具身智能到底代表什么样的智能？怎么拆解？今天我们把具身智能分成三部分：本能智能、作业智能、进化智能。

本能智能，是直接作用于本体的，相当于让机器人学会驾驭自己的身体，就像人一样天然就会保持平衡，就会走、跑、跳，不需要别人用很长的时间去教。

建立在本能智能之上的、更重要的是作业智能。为什么我们特别强调作业智能？因为具身智能对于人类社会来说，最重要的使命是提供生产力。生产力的背后一定是一个有序的作业过程，而为了完成这个有序作业过程，调动模型的接口一定是一个语言接口。所以我们需要一直用语言作为主要接口来完成任务。我们从去年8月份开始，G系列模型重点就是作业智能这个主线方向。

展望未来，今天AI的身体还是由我们人类工程师去设计的——我们理解智能的边界需要一个轮式双臂产品，所以设计了这个形态；因为人长成双足人形，所以给机器人设计双足形态。但未来不会是这样。未来，AI会定义和设计自己的身体，这一部分我们把它称之为进化智能。人的这副身体是大自然和基因互相作用了几千万年进化迭代而成的，未来的这个迭代进化过程会被AI取代。AI会围绕着我们要应用的场景和要执行的任务，去设计一个更好的自己的身体。

再说整机。整机是智能的基础。为什么我们公司的战略一直是"整机+智能"？整机的作用主要有两个：第一，整机是智能的数据载体；第二，整机是智能的商品载体。

我想和大语言模型稍微做一个类比：大语言模型在发展之初有两个重要优势或条件——第一个是互联网已经把人产生的文本、逻辑数据给数字化了，99%都是现成的；第二个是我们每个人的手机、电脑其实是运行和传递大语言模型的终端。但是对于具身智能而言，这两个重要载体其实都没有——过去物理世界的数据没有被数字化，也没有一个好的载体可以承接具身智能的技术表达。所以这就是为什么我们从Day 1开始就特别重视整机。

驱动我们这个行业背后的还是AI的Scaling Law，所以我们也要用Scaling Law的方式去看整机应该怎么做。这是为什么我们从第一天开始就叫"智能定义本体"。今天我们已经形成了轮式双臂品类、单臂品类和双足品类。在轮式双臂品类里面我们是引领者，在双足品类里面今天我们还是后来者或是追赶者。但是我们相信未来我们在所有品类上面都可以成为引领者，因为驱动这个行业背后最重要的动力来自于AI。我们不是一个研发制造机器人的企业，我们是一个人工智能企业，这个行业也不是研发制造型的行业，而是人工智能的行业。这就是为什么我们相信在未来整机上面我们也可以取得更好的成绩。

为了做好整机，从2025年开始我们逐渐发现只做整机也不够——智能定义本体，而本体定义动力模组。动力模组对于整机来说重要性有几点：第一，很多时候模型表现的好与坏，是由动力单元决定的。动力单元里面齿轮的背隙大了还是小了，直接影响模型最后表现的好坏。第二，动力模组在整机的BOM成本里面，面向未来3-5年看，基本上会维持在40%-45%的区间。所以这是为什么我们比较早就决定这事儿还得自己深入去做。而且做的过程当中，我们又发现这里面其实还有行业空白——因为整个行业缺乏一个动力模组的标准。为什么没有标准？因为模型还没做好。所以是"智能定义本体，本体定义模组"，是这样的链条。在这个过程当中，我们也特别希望和我们的产业链伙伴共同定义这个标准，加速产业发展。

整机与数据：智能定义本体

说了智能和整机，再说数据。数据这事儿现在基本上被大家认为是制约具身智能发展的最重要因素。过去几年（2024、2025年），整个行业的数据量基本上就是几千小时、几万小时、十几万小时，最多的也就这样。今年我们看到行业头部的企业一定都是百万小时量级的数据，未来两三年有可能会达到千万小时的量级。

百万小时、千万小时到底意味着什么？我给大家做一些类比：一个人从0到18岁，醒着的时间和物理世界交互的总时长大概是10万小时。也就是说，人的大脑用了10万小时学会了怎么驾驭自己的身体。100万小时相当于约8.3个人类的学习总时长，1000万小时相当于约83个人。另一个类比是GPT等大语言模型今天的训练Token数，如果转换到我们具身基础模型的训练小时数上面，大概就落在百万小时到千万小时之间。这就是为什么我们相信，在百万小时到千万小时之间的某一个数据量训练出来的具身基础模型，会给我们带来非常突破性的改变。

在数据这里面，我一直坚持真实数据。真实数据本身也是个金字塔：从最顶尖、最重要也是最难获取的以机器本体为中心的真机数据（Robot-Centric Data）、再到以人类为中心的数据采集（Human-Centric Data）。我想多说一点的是，过去行业一直很关注中国在硬件、在零部件供应链上面的优势，可是其实从今年开始，我们的数据供应链上的优势也会凸显出来。数据工程链的优势叠加上我们整机供应链的优势，会决定在未来两到三年的时间里面，中国的整个具身基础模型的能力会超过美国，拿到世界第一的位置。这件事我们特别有信心。

从开发者到生产力

在通往这个未来的过程里面，我们发现应用是逐渐发生的，伴随着智能的成熟。这个伴随而生的过程，我们总结为"从开发者到生产力"，这是我们从2024年开始进入市场就确定的主线。这个过程的背后，其实就是我们的技术从不成熟到成熟的过程。

过去我们服务了几百家机构开发者——学术型的、企业研究型的，还有很多创业公司。今年我们也发现了个人开发者的潜力，未来我们希望大家都能够像玩3D打印机一样把具身智能给玩起来。所以今年我们会针对个人开发者推出一系列产品，真正释放社区的力量。

在这边我们有一些过去开发者的案例，比如斯坦福李飞飞实验室，2024年跟我们开始进行了一系列学术类型的合作，英伟达和我们合作验证异构数据的有效性，REMY和SERVO7是两家美国YC孵化器的企业，用我们的产品做了一些仓储、搬运等方面的应用。在欧洲，我们也有多个合作伙伴，包括零售等等方面的应用，还包括日本、韩国的客户，我们已经看到了全球范围内具身智能的应用正在如火如荼的展开，明年开始我们相信就会看到有一系列的应用真正的落地，生产力层面的应用真正落地。

刚才我提到了一个关键词是基础模型。驱动我们这一切的原动力还是来自基础模型。我们看基础模型的边界，今天用三个要素刻画：精度、速度、泛化性。今年、明年我们身处的阶段是：厘米级别的精度，80%左右的人类操作速度，不超过100条数据的学习能够掌握新任务。

这三个边界刻画出来的基础模型，能够在什么样的场景里面释放价值？其实很多：工业场景里的上下料、搬运，物流场景里的码垛、拆垛，电商零售场景里的分拣、打包，它们都是厘米级别操作精度的应用。今天我们在外面的展厅里也有一些展示。随着我们从厘米级进化到毫米级精度，会进入中国制造业里面的操作——插拔、线束、装配、服装等等。而前面两步都是以制造业、服务业为主。

从制造业、服务业迈向农业、建筑业的过程，实际上是我们的机器人从结构化场景（人类改造过的场景）走向非结构化场景（人类没有改造过的、正在进行的场景）的过程，需要双足形态才能进入。所以这就是为什么我们在去年决定做Kengo——背后的逻辑就是未来的非结构化场景生产力。随着在非结构化场景里面动态适应能力的基础模型的出现，再往未来看，我们的最终目标是自我复制的生产力——即机器人自己制造机器人。到了这一点，就是具身智能的终极形态。

具身智能会怎么到来

很多人问我：具身智能的"GPT时刻"什么时候来？我的判断是——大概率不会有那样一个时刻。它会从 to B 开始，一个个场景相继解锁。等若干年后大家回头看，已经记不清具体是哪一年，但它已经无处不在了。这就是我们看到的具身智能的整个落地过程。

伴随着技术的进步、应用的展开，我们的商业模式会发生变化。我们把它分成三个阶段：第一阶段整机销售，第二阶段方案订阅，第三阶段Token销售。

此时此刻，我们处于整机销售阶段——坦率说，今天我们卖产品给开发者、科研教育、数据采集，其实和智能还没太大关系，主要是做应用。随着智能在一个生产力场景里面解锁，我们就会进入方案订阅阶段，整机会成为我们的收费入口，真正的毛利来源是方案。随着我们的智能从单一场景有用走向多场景、多任务通用，我们的收费单元就会从方案转向Token销售。

有趣的是，这三个阶段背后的增长率不同：第一阶段整机销售，年化自然增长30%-100%，这是行业规律；第二阶段方案订阅，参考过去两年里一些AI公司的爆发，每年3倍到10倍的增长；第三阶段Token销售，应该是10倍到100倍的增长。我们这个行业，前期是研发制造型行业，中后期是人工智能的规模化服务，所以速度会越来越快。基于这样的规律和趋势判断，我们公司并不追求在第一个阶段保持特别大的商业化业绩，因为我们觉得那意义不大。我们追求的是从第二个阶段开始的、真正的智能驱动商业化。

和大家共建生态

总结一下：具身智能的行业规模，是随着技术模型的能力边界明确而加速爆发的，增速越来越快，前景非常广阔。但是我们在做的事情，越来越需要我们不同类型的合作伙伴一起完成。我们自己也有一个认知：这个行业链条长、周期长，很多事并不是我们擅长的，特别需要在座的各位伙伴一起去合作才能做好。我们相信，产业成功的时候，不是我们一家企业的成功，而是一批企业的共同成功。所以我们特别愿意和大家共同建设具身智能的生态。

在此，我们今天发布两个非常重要的平台计划：

第一个，数据生态计划。今年上半年，星海图联合亦庄机器人公司和亦庄国投，共同发起了一个新的公司叫“亦数智能”，围绕着物理世界百万小时到千万小时的数据累积展开深入工作。同时，我们邀请了首批15家合作伙伴。我们希望今年做到百万小时，未来三年做到千万小时，真正加速这个行业的发展，并且回馈给行业。一会儿我们会有签约仪式和进一步的介绍。

第二个，星途计划。我们很幸运地和凯辉基金共同发起一个面向具身智能早期投资的产业基金，叫“星途计划”。过去一年里，我们陆续投资了七八家企业，在这个过程中我们发现具身智能在未来一段时间里新技术、新应用会不断涌现，所以我们希望能够系统化地展开这个过程。在未来3-5年的时间里，我们希望投资30-50家企业，甚至更多。更多的详细内容，一会儿由我们公司的CFO罗天奇和凯辉基金的段兰春总来共同揭牌。

最后，回到我们今天的主题：我们相信，没有任何一家公司能够独自定义具身智能。所以我们呼吁大家一起——Build with Galaxea，让新世界来得更快一些。

谢谢大家！

精彩推荐