当具身智能遇到“大脑”瓶颈，一家国家队公司决定拆掉围墙共筑基石｜甲子光年

以实干破局，打造中国具身智能自主通用底座。

作者｜云凡

编辑｜栗子

2月28日，一场名为“启智涌现”的机器人通用技术底座开发者大会如期举行。这不仅是一次硬核技术的系统发布，更像是一场针对具身智能行业集体焦虑的正面破局。

在近几年的科技头条里，机器人几乎成了全能的代名词：它们在春晚舞台上整齐划一地起舞，在马拉松赛道上奔跑，在商场展厅完成后空翻或是耍杂技。这些被精心设计、反复调优的视觉表演，给外界营造出一种智能机器人的繁荣感。

然而，当视觉滤镜褪去，产业界不得不直面一个尴尬的现实：一旦机器人进入非结构化、充满不确定性的真实作业环境时，往往会表现得无所适从。它们难以应对随机性的挑战，于是，我们在新闻里或工厂角落，经常能看到机器人突然踉跄摔倒、或者因抓取失败而导致物件滑落的无奈画面。

对于当前机器人的产业现状，业内有个形象的比喻：小脑过于发达，大脑却略显迟钝。这已成为大家心照不宣的共识。运动控制算法（小脑）的飞速演进，已经足以支持机器人完成复杂的肢体动作；但任务理解与自主决策能力（大脑）的发展却步履维艰。

更危险的暗礁隐藏在水面之下。

我国核心硬件的自主化率虽然在快速攀升，但支撑机器人思考与进化的核心软件平台，依然高度依赖国外的ROS（机器人操作系统）或英伟达的Isaac Sim等生态。这构成了随时可能引发“卡脖子”风险的命门。

在这种强烈的产业落差中，由中国工业机器人链主企业埃夫特联合多方孵化的「启智机器人」，选择了一条极其陡峭的攀登路线：启智并未将研发重心停留在硬件躯壳的内卷上，其核心愿景指向了更底层的“智能机器人通用技术底座”，要做产业的“奠基者”。

这家带有浓厚“国家队”基因的新锐企业，试图系统性地解决当前行业软硬件耦合深、开发效率低、技能无法复用等根本矛盾。2026年初的这场发布会，正是这套底座能力交出的首份实干成绩单。

启智机器人，这家坐落在安徽芜湖的公司，正在为中国机器人打响一场跨越“演示时代”、走向真实生产力的实干保卫战，试图让机器人真正融入千行百业。

1.撕掉“不大不强”标签的底层重构

回溯启智的诞生轨迹，这本身就是中国机器人产业一次带有极强预见性的底层重构。

客观审视当前的机器人行业，尽管热度极高，但按国际机器人联合会（IFR）相关报告估算，全球市场规模仅约600亿到800亿美元；而据中国电子学会等机构统计，中国市场真实口径不足1000亿元人民币。与汽车、手机等数万亿规模的支柱产业相比，整个行业依然贴着“不大不强”的标签。

道理很简单，产业不大的核心症结在于渗透率低，而渗透率低的原因在于机器人还“并不好用”，缺乏通用的开发生态。

作为启智的母公司，埃夫特在工业机器人领域是公认的“链主”企业。其16大系列、80款机器人产品矩阵中，大负载机型能扛起500公斤重物并保持±0.1mm的定位精度。同时，埃夫特在桥梁船舶智能焊接，高端家具智能喷涂、汽车零部件抛光等高价值工艺上积淀了海量的制造经验。

只是，在智能化浪潮席卷全球的今天，硬件与工艺固然重要，但软实力同样成为决定未来的关键。2017年，研发团队敏锐察觉到了这一点，开始探索基于云端的工艺技能架构，为后续智能机器人通用技术底座埋下伏笔。

2024年，启智机器人正式独立。

在产业分工中，埃夫特继续精研高价值工艺与硬件躯干；启智则专注于打造面向未来的智能机器人通用技术底座，全面接管操作系统、开发工具、数据平台等深层软件生态的构建，构成可复用的大脑侧能力。

这样的分工带有鲜明的国家队底气与担当。

要知道，启智机器人是由埃夫特联合国家先进制造产业投资基金等发起设立，为国资控股企业，并在Pre‑A轮融资中再次获得国家级基金领投，是典型的国家队加持的硬科技企业。公司承载着构建自主可控机器人软件生态的国家意志。

作为牵头方，埃夫特启智联合了包括哈工大、清华、上交、浙大、中科院沈自所，中科院自动化所等国内机器人和具身智能领域头部高校，以及埃斯顿、新松、遨博，极智嘉，奇瑞，富士康等国内头部机器人主机厂及生态伙伴，在国家级重大科技攻关项目的加持下进行联合研发和协同攻关。启智的定位极为清晰：不做机器人本体去抢夺市场，专门为行业提供“智能化升级”的武器。

也就是说，启智不涉足终端领域知识，不做具体车型焊接等工艺，而是专注提供焊缝跟踪、避障规划、柔顺抓取等原子级技能。

对于主机厂而言，自研一套智能底座投入巨大且周期漫长，容易陷入重复造轮子的内耗。启智通过开源接口与深度兼容，与伙伴共建产业基础设施。

这种软硬分离、专业协同的模式，让中国机器人的“大脑”扎根于自主可控的技术地基，也推动行业从封闭的“诺基亚时代”迈向开放的“安卓时代”：前者软硬件深度绑定、生态割裂；后者平台开放、分层解耦、软硬分离，协同共创、技能可复用，助力产业走向规模化、标准化、生态化。

2.从数据到技能，

启智如何构建具身智能的“全自动工厂”？

如果说底层技术的重构是夯实地基，那么如何高效生产机器人“技能”，则决定了技术的普及速度。

在2月28日的开发者大会上，启智机器人通过一场“商超理货”实景演练，向外界完整展露了其打磨多时的“核心武器库”：大衍数据平台、墨斗IDE与Openmind OS。这三大模块紧密咬合，构成了一套高速运转的“技能进化引擎”。

驱动这套引擎的内核，源于启智对底层技术路线的独到判断。

面对当前行业严重的“大脑萎缩”的痛点，启智没有盲目跟风市面上主流的“大语言模型+传统控制”路线，而是坚定地重兵投入HumanGPT原生世界模型。

语言大模型虽然“会说”，但由于缺乏物理常识，直接嫁接极易产生物理幻觉。相比之下，HumanGPT则从第一性原理出发，将4D时空结构与物理动力学规律内化。它能预判动作对周围场景的影响，并在抓取、搬运等强交互任务中保持极高的物理一致性。

有了这种具身智能不可或缺的“物理直觉”，整个技能引擎的运转逻辑便豁然开朗。

引擎的源头，是大衍数据平台与HumanGPT构筑的“技能炼丹炉”。

为什么有时候，我们在展会上看到一些机器人还是显得“笨笨的”？动作僵硬，反应迟钝，就像没开窍的孩子。这种“笨”的本质，是因为缺乏高质量、多维度的真实数据。

大衍数据平台颠覆了低效的数据采集逻辑，承担起繁重的数据清洗、自动标注与多模态对齐工作，专门负责提炼人类的隐性经验。

想象一下，一位拥有20年经验的老焊工，穿上启智的技能采集服，他手腕每一次的微妙转动、视线的聚焦点、脚步的进退——这些只可意会不可言传的“老手艺”，被完整捕捉并转化为数字信号喂给HumanGPT。

与此同时，模型将这些隐性知识浓缩、标准化，最终炼成一个个可复制、可迁移的“原子技能包”，比如“高精度弧焊v2.0”或“易碎品抓取v1.0”。

据悉，目前该平台已经沉淀数十项核心原子技能，并推出“快速模式”与“专业模式”，让技能的沉淀周期从过去的按月计算加速到按天甚至按小时。

引擎的调度端，是墨斗IDE与Vibe Coding组成的“应用指挥部”。

拥有了丰富的技能储备后，如何让千行百业的用户轻松调用它们？

启智用墨斗IDE与Vibe Coding搭建起零门槛的应用指挥部，让机器人开发告别代码壁垒。也就是说，Vibe Coding作为AI辅助编程范式，实现了“对话即开发” 的一键生成。

在商超理货演示中，一名毫无编程基础的店长只需用最自然的语言下达指令：“去冷链区取A品牌饮料，补充到B货架空位”。

话音刚落，系统内部的多智能体架构（Multi-Agent）便迅速将模糊语义解构成清晰的执行：识别机器人角色、目标对象、操作动作，随后自动从仿真环境中拉取物理属性（比如坐标、尺寸、承重），精准调用“自主导航”、“视觉识别”、“柔性抓取”等原子技能。

整个过程中，店长没有编写一行代码，在短短几分钟内，一个具备前端界面的“智能理货APP”就搭建好了。这让场景专家直接跨越了技术壁垒，化身为应用开发的主导者。

引擎的执行终端，是Openmind OS打造的“实时神经系统”。

毕竟，软件层写得再好，如果机器人在物理世界一走步就摔跤，一切都是零。Openmind OS正是兜底这“最后一厘米”问题的保障底座。

它的核心职能，是确保“大脑”的指令在下发给不同构型的机器人（无论是人形R2V2还是复合机器人W2）时，动作不走样、实时不卡顿。它解决了最底层的硬件接口标准化问题，屏蔽了不同电机、不同传感器的差异。

比如，在商超实景演示中，当总指挥部发出指令，Openmind OS立即进入毫秒级调度：它一边调度复合机器人平稳驶向冷链区，规划最优路径并实时避让行人；一边协调人形机器人的双臂准备接替后续的开箱和上架动作。

这一系列流畅的多机协同，全靠Openmind OS在底层进行任务级与动作级的精准控场。同时，它对ROS等现有生态的友好兼容，也大大降低了开发者的迁移门槛。

至此，三大工具链在商超理货场景中完成了无缝的实干闭环：大衍平台赋能机器人基础操作能力，墨斗IDE让店长用自然语言编排任务流，Openmind OS则在底层统一发号施令，全流程自主完成、一气呵成。

在硬核的技术攻坚之外，启智也在重塑机器人的产品哲学。大会上亮相的yobot家族——R2V1、W2、R2V2，分别被赋予了“少年、妈妈、爸爸”的人格化标签。这种设计理念跳出了传统工业机器人的“唯效率论”，转向“科技感与温度感并重”。

在医院承担导诊任务的W2，凭借具有亲和力的流式语音与精准语义理解，为患者带去如沐春风的交互体验；在商超负责高强度作业的R2V2，则展现稳定可靠的实干底色。通过在B端与G端公共服务场景中反复验证、沉淀人机信任关系，启智正在为机器人最终走入千家万户、成为人类的“家人”铺设一条坚实的道路。

从数据提炼到技能调用，再到物理世界的执行，启智正以“ABC+X”（AI+大数据+云+机器人）的立体架构，将具身智能复杂的流程转化为一条高效的“全自动工厂”。

当技能可以像APP一样被快速创建、调用、迭代和分发，那个机器人全面融入人类生产与生活的奇点时刻，正在被无限拉近。

3.未来：

如何用新的商业模式来构建生态飞轮？

在跨越技术原型的验证阶段后，商业化落地必然成为检验具身智能的核心命题。

启智判断，2026年到2027年，将是全球机器人产业从量变迈向质变的临界点。之所以锚定这个节点，是因为届时具身智能原生世界模型实现物理世界自主推理、自主决策，打破机器人依赖预设程序的局限。

当机器人不再只是机械地跳舞，而是能稳定地在仓库理货、在医院导诊时，行业的涌现临界点就真正到来了。

当然，要想接住这一爆发点，启智在打磨自身的同时，更在以前瞻性的商业逻辑构建一套自我进化的“生态飞轮”。

这个飞轮的轴心，是对高质量数据获取模式的颠覆。

当前行业最大的痛点之一，是数据采集长期停留在“人适应机器人”的低效模式。传统遥操作不仅流程繁琐，更会扭曲人类专家原本的作业逻辑，导致数据 “形似而神不似”，难以支撑机器人走向通用智能。

为此，启智推进了人类全模态技能采集服系统，将采集逻辑从“捕捉机器人动作” 转向“还原人类专家技能”，在自然作业状态下同步捕捉视觉、意图、轨迹、力觉与触觉信息，再通过跨具身迁移与标准化预处理，把老师傅的手艺、店长的流程、医护的规范，转化为机器人可直接学习的“黄金数据”。

与此同时，为了让数据来源可持续、规模化，启智给出了一套产业界极具想象力的解决方案——机器人未来社区 + 设备租赁 + 数据回购。

在芜湖落地的机器人未来社区，囊括家庭、商超、医疗、工业等全场景真实环境。通过与职业院校合作，启智向实训师生租赁标准化采集设备，让数据采集自然嵌入日常教学与作业流程。

紧随其后，大衍平台对数据进行智能质量评估，并实行“优质优价”的数据回购。这种模式既完美解决了数据隐私与合规问题，又让庞大的产业人口成为了具身智能最可靠的“训练师”，为模型输送源源不断的养料。

在商业化落地层面，启智用RaaS（Robot as a Service，机器人即服务）模式，彻底打开行业规模化落地的最后一道闸门。

长期以来，喷涂、焊接等高价值工业场景，以及商超、康养等服务场景，都面临中小微企业“买不起机器人、更用不好机器人”的困境。启智将重资产投入转为轻量化运营支出，提供按需租赁、按使用计费、技能订阅等灵活方式，把使用门槛降到最低。

更关键的是，这套模式并非简单的“以租代售”。机器人在真实场景持续作业的过程，也是高质量工艺数据、交互数据、场景数据持续回流的过程，数据反哺底座与模型，模型再提升机器人通用性与可靠性，形成“场景落地—数据积累—能力进化—更广泛落地”的正向循环。

简单来说，启智打的这张牌是：以服务换数据，以数据强生态，让商业价值与技术进化彼此咬合、不可分割。

在启智的生态版图中，开发者群体被视为最活跃的根系。

启智的生态合作极其务实，坚守“不做概念合作，只做场景共建”。针对清华、中科大等顶尖高校，启智全面开放底层工具与算力，联合攻关前瞻技术；面对华为、富士康等产业龙头，则采用POC验证加规模化复制的模式，深度嵌入真实工业场景。

同时，通过“开发者扶持计划”，启智正在为万千应用型开发者提供全套装备，鼓励他们在非结构化环境下开发出千姿百态的应用，共同构建起具身智能的繁荣生态。

4.写在最后

如果只用一个关键词来定义启智的2026年，那毫无疑问会是“实干”。

在这个充满喧嚣与泡沫的赛道里，启智给外界传递的印象是：不希望成为一棵孤傲的大树，而是要成为一片土壤，将所有的技术积累与生态布局，扎根在真实的场景、真实的营收与真实的价值上。

在具身智能的这场长跑中，谁能率先构建起让千行百业低门槛入场的底层生态，谁就有机会定义未来的规则。

2026年，当第一批真正能在非结构化环境下“实干”的机器人规模化上岗时，我们或许会回过头发现，这一刻的“底座建设”是关键的破题之策。

（本文封面图及文中图片来源：启智机器人）

END.