

以实干破局,打造中国具身智能自主通用底座。
作者|云凡
编辑|栗子
2月28日,一场名为“启智涌现”的机器人通用技术底座开发者大会如期举行。这不仅是一次硬核技术的系统发布,更像是一场针对具身智能行业集体焦虑的正面破局。
在近几年的科技头条里,机器人几乎成了全能的代名词:它们在春晚舞台上整齐划一地起舞,在马拉松赛道上奔跑,在商场展厅完成后空翻或是耍杂技。这些被精心设计、反复调优的视觉表演,给外界营造出一种智能机器人的繁荣感。
然而,当视觉滤镜褪去,产业界不得不直面一个尴尬的现实:一旦机器人进入非结构化、充满不确定性的真实作业环境时,往往会表现得无所适从。它们难以应对随机性的挑战,于是,我们在新闻里或工厂角落,经常能看到机器人突然踉跄摔倒、或者因抓取失败而导致物件滑落的无奈画面。
对于当前机器人的产业现状,业内有个形象的比喻:小脑过于发达,大脑却略显迟钝。这已成为大家心照不宣的共识。运动控制算法(小脑)的飞速演进,已经足以支持机器人完成复杂的肢体动作;但任务理解与自主决策能力(大脑)的发展却步履维艰。
更危险的暗礁隐藏在水面之下。
我国核心硬件的自主化率虽然在快速攀升,但支撑机器人思考与进化的核心软件平台,依然高度依赖国外的ROS(机器人操作系统)或英伟达的Isaac Sim等生态。这构成了随时可能引发“卡脖子”风险的命门。
在这种强烈的产业落差中,由中国工业机器人链主企业埃夫特联合多方孵化的「启智机器人」,选择了一条极其陡峭的攀登路线:启智并未将研发重心停留在硬件躯壳的内卷上,其核心愿景指向了更底层的“智能机器人通用技术底座”,要做产业的“奠基者”。
这家带有浓厚“国家队”基因的新锐企业,试图系统性地解决当前行业软硬件耦合深、开发效率低、技能无法复用等根本矛盾。2026年初的这场发布会,正是这套底座能力交出的首份实干成绩单。
启智机器人,这家坐落在安徽芜湖的公司,正在为中国机器人打响一场跨越“演示时代”、走向真实生产力的实干保卫战,试图让机器人真正融入千行百业。
1.撕掉“不大不强”标签的底层重构

回溯启智的诞生轨迹,这本身就是中国机器人产业一次带有极强预见性的底层重构。
客观审视当前的机器人行业,尽管热度极高,但按国际机器人联合会(IFR)相关报告估算,全球市场规模仅约600亿到800亿美元;而据中国电子学会等机构统计,中国市场真实口径不足1000亿元人民币。与汽车、手机等数万亿规模的支柱产业相比,整个行业依然贴着“不大不强”的标签。
道理很简单,产业不大的核心症结在于渗透率低,而渗透率低的原因在于机器人还“并不好用”,缺乏通用的开发生态。
作为启智的母公司,埃夫特在工业机器人领域是公认的“链主”企业。其16大系列、80款机器人产品矩阵中,大负载机型能扛起500公斤重物并保持±0.1mm的定位精度。同时,埃夫特在桥梁船舶智能焊接,高端家具智能喷涂、汽车零部件抛光等高价值工艺上积淀了海量的制造经验。
只是,在智能化浪潮席卷全球的今天,硬件与工艺固然重要,但软实力同样成为决定未来的关键。2017年,研发团队敏锐察觉到了这一点,开始探索基于云端的工艺技能架构,为后续智能机器人通用技术底座埋下伏笔。
2024年,启智机器人正式独立。
在产业分工中,埃夫特继续精研高价值工艺与硬件躯干;启智则专注于打造面向未来的智能机器人通用技术底座,全面接管操作系统、开发工具、数据平台等深层软件生态的构建,构成可复用的大脑侧能力。
这样的分工带有鲜明的国家队底气与担当。
要知道,启智机器人是由埃夫特联合国家先进制造产业投资基金等发起设立,为国资控股企业,并在Pre‑A轮融资中再次获得国家级基金领投,是典型的国家队加持的硬科技企业。公司承载着构建自主可控机器人软件生态的国家意志。
作为牵头方,埃夫特启智联合了包括哈工大、清华、上交、浙大、中科院沈自所,中科院自动化所等国内机器人和具身智能领域头部高校,以及埃斯顿、新松、遨博,极智嘉,奇瑞,富士康等国内头部机器人主机厂及生态伙伴,在国家级重大科技攻关项目的加持下进行联合研发和协同攻关。启智的定位极为清晰:不做机器人本体去抢夺市场,专门为行业提供“智能化升级”的武器。
也就是说,启智不涉足终端领域知识,不做具体车型焊接等工艺,而是专注提供焊缝跟踪、避障规划、柔顺抓取等原子级技能。
对于主机厂而言,自研一套智能底座投入巨大且周期漫长,容易陷入重复造轮子的内耗。启智通过开源接口与深度兼容,与伙伴共建产业基础设施。
这种软硬分离、专业协同的模式,让中国机器人的“大脑”扎根于自主可控的技术地基,也推动行业从封闭的“诺基亚时代”迈向开放的“安卓时代”:前者软硬件深度绑定、生态割裂;后者平台开放、分层解耦、软硬分离,协同共创、技能可复用,助力产业走向规模化、标准化、生态化。
2.从数据到技能,
启智如何构建具身智能的“全自动工厂”?
如果说底层技术的重构是夯实地基,那么如何高效生产机器人“技能”,则决定了技术的普及速度。
在2月28日的开发者大会上,启智机器人通过一场“商超理货”实景演练,向外界完整展露了其打磨多时的“核心武器库”:大衍数据平台、墨斗IDE与Openmind OS。这三大模块紧密咬合,构成了一套高速运转的“技能进化引擎”。
驱动这套引擎的内核,源于启智对底层技术路线的独到判断。
面对当前行业严重的“大脑萎缩”的痛点,启智没有盲目跟风市面上主流的“大语言模型+传统控制”路线,而是坚定地重兵投入HumanGPT原生世界模型。
语言大模型虽然“会说”,但由于缺乏物理常识,直接嫁接极易产生物理幻觉。相比之下,HumanGPT则从第一性原理出发,将4D时空结构与物理动力学规律内化。它能预判动作对周围场景的影响,并在抓取、搬运等强交互任务中保持极高的物理一致性。
有了这种具身智能不可或缺的“物理直觉”,整个技能引擎的运转逻辑便豁然开朗。
引擎的源头,是大衍数据平台与HumanGPT构筑的“技能炼丹炉”。
为什么有时候,我们在展会上看到一些机器人还是显得“笨笨的”?动作僵硬,反应迟钝,就像没开窍的孩子。这种“笨”的本质,是因为缺乏高质量、多维度的真实数据。
大衍数据平台颠覆了低效的数据采集逻辑,承担起繁重的数据清洗、自动标注与多模态对齐工作,专门负责提炼人类的隐性经验。
想象一下,一位拥有20年经验的老焊工,穿上启智的技能采集服,他手腕每一次的微妙转动、视线的聚焦点、脚步的进退——这些只可意会不可言传的“老手艺”,被完整捕捉并转化为数字信号喂给HumanGPT。

与此同时,模型将这些隐性知识浓缩、标准化,最终炼成一个个可复制、可迁移的“原子技能包”,比如“高精度弧焊v2.0”或“易碎品抓取v1.0”。
据悉,目前该平台已经沉淀数十项核心原子技能,并推出“快速模式”与“专业模式”,让技能的沉淀周期从过去的按月计算加速到按天甚至按小时。
引擎的调度端,是墨斗IDE与Vibe Coding组成的“应用指挥部”。
拥有了丰富的技能储备后,如何让千行百业的用户轻松调用它们?
启智用墨斗IDE与Vibe Coding搭建起零门槛的应用指挥部,让机器人开发告别代码壁垒。也就是说,Vibe Coding作为AI辅助编程范式,实现了“对话即开发” 的一键生成。
在商超理货演示中,一名毫无编程基础的店长只需用最自然的语言下达指令:“去冷链区取A品牌饮料,补充到B货架空位”。
话音刚落,系统内部的多智能体架构(Multi-Agent)便迅速将模糊语义解构成清晰的执行:识别机器人角色、目标对象、操作动作,随后自动从仿真环境中拉取物理属性(比如坐标、尺寸、承重),精准调用“自主导航”、“视觉识别”、“柔性抓取”等原子技能。
整个过程中,店长没有编写一行代码,在短短几分钟内,一个具备前端界面的“智能理货APP”就搭建好了。这让场景专家直接跨越了技术壁垒,化身为应用开发的主导者。
引擎的执行终端,是Openmind OS打造的“实时神经系统”。
毕竟,软件层写得再好,如果机器人在物理世界一走步就摔跤,一切都是零。Openmind OS正是兜底这“最后一厘米”问题的保障底座。
它的核心职能,是确保“大脑”的指令在下发给不同构型的机器人(无论是人形R2V2还是复合机器人W2)时,动作不走样、实时不卡顿。它解决了最底层的硬件接口标准化问题,屏蔽了不同电机、不同传感器的差异。
比如,在商超实景演示中,当总指挥部发出指令,Openmind OS立即进入毫秒级调度:它一边调度复合机器人平稳驶向冷链区,规划最优路径并实时避让行人;一边协调人形机器人的双臂准备接替后续的开箱和上架动作。
这一系列流畅的多机协同,全靠Openmind OS在底层进行任务级与动作级的精准控场。同时,它对ROS等现有生态的友好兼容,也大大降低了开发者的迁移门槛。
至此,三大工具链在商超理货场景中完成了无缝的实干闭环:大衍平台赋能机器人基础操作能力,墨斗IDE让店长用自然语言编排任务流,Openmind OS则在底层统一发号施令,全流程自主完成、一气呵成。
在硬核的技术攻坚之外,启智也在重塑机器人的产品哲学。大会上亮相的yobot家族——R2V1、W2、R2V2,分别被赋予了“少年、妈妈、爸爸”的人格化标签。这种设计理念跳出了传统工业机器人的“唯效率论”,转向“科技感与温度感并重”。
在医院承担导诊任务的W2,凭借具有亲和力的流式语音与精准语义理解,为患者带去如沐春风的交互体验;在商超负责高强度作业的R2V2,则展现稳定可靠的实干底色。通过在B端与G端公共服务场景中反复验证、沉淀人机信任关系,启智正在为机器人最终走入千家万户、成为人类的“家人”铺设一条坚实的道路。
从数据提炼到技能调用,再到物理世界的执行,启智正以“ABC+X”(AI+大数据+云+机器人)的立体架构,将具身智能复杂的流程转化为一条高效的“全自动工厂”。

当技能可以像APP一样被快速创建、调用、迭代和分发,那个机器人全面融入人类生产与生活的奇点时刻,正在被无限拉近。
3.未来:
如何用新的商业模式来构建生态飞轮?
在跨越技术原型的验证阶段后,商业化落地必然成为检验具身智能的核心命题。
启智判断,2026年到2027年,将是全球机器人产业从量变迈向质变的临界点。之所以锚定这个节点,是因为届时具身智能原生世界模型实现物理世界自主推理、自主决策,打破机器人依赖预设程序的局限。
当机器人不再只是机械地跳舞,而是能稳定地在仓库理货、在医院导诊时,行业的涌现临界点就真正到来了。
当然,要想接住这一爆发点,启智在打磨自身的同时,更在以前瞻性的商业逻辑构建一套自我进化的“生态飞轮”。
这个飞轮的轴心,是对高质量数据获取模式的颠覆。
当前行业最大的痛点之一,是数据采集长期停留在“人适应机器人”的低效模式。传统遥操作不仅流程繁琐,更会扭曲人类专家原本的作业逻辑,导致数据 “形似而神不似”,难以支撑机器人走向通用智能。
为此,启智推进了人类全模态技能采集服系统,将采集逻辑从“捕捉机器人动作” 转向“还原人类专家技能”,在自然作业状态下同步捕捉视觉、意图、轨迹、力觉与触觉信息,再通过跨具身迁移与标准化预处理,把老师傅的手艺、店长的流程、医护的规范,转化为机器人可直接学习的“黄金数据”。
与此同时,为了让数据来源可持续、规模化,启智给出了一套产业界极具想象力的解决方案——机器人未来社区 + 设备租赁 + 数据回购。
在芜湖落地的机器人未来社区,囊括家庭、商超、医疗、工业等全场景真实环境。通过与职业院校合作,启智向实训师生租赁标准化采集设备,让数据采集自然嵌入日常教学与作业流程。
紧随其后,大衍平台对数据进行智能质量评估,并实行“优质优价”的数据回购。这种模式既完美解决了数据隐私与合规问题,又让庞大的产业人口成为了具身智能最可靠的“训练师”,为模型输送源源不断的养料。
在商业化落地层面,启智用RaaS(Robot as a Service,机器人即服务)模式,彻底打开行业规模化落地的最后一道闸门。
长期以来,喷涂、焊接等高价值工业场景,以及商超、康养等服务场景,都面临中小微企业“买不起机器人、更用不好机器人”的困境。启智将重资产投入转为轻量化运营支出,提供按需租赁、按使用计费、技能订阅等灵活方式,把使用门槛降到最低。
更关键的是,这套模式并非简单的“以租代售”。机器人在真实场景持续作业的过程,也是高质量工艺数据、交互数据、场景数据持续回流的过程,数据反哺底座与模型,模型再提升机器人通用性与可靠性,形成“场景落地—数据积累—能力进化—更广泛落地”的正向循环。
简单来说,启智打的这张牌是:以服务换数据,以数据强生态,让商业价值与技术进化彼此咬合、不可分割。
在启智的生态版图中,开发者群体被视为最活跃的根系。
启智的生态合作极其务实,坚守“不做概念合作,只做场景共建”。针对清华、中科大等顶尖高校,启智全面开放底层工具与算力,联合攻关前瞻技术;面对华为、富士康等产业龙头,则采用POC验证加规模化复制的模式,深度嵌入真实工业场景。
同时,通过“开发者扶持计划”,启智正在为万千应用型开发者提供全套装备,鼓励他们在非结构化环境下开发出千姿百态的应用,共同构建起具身智能的繁荣生态。
4.写在最后
如果只用一个关键词来定义启智的2026年,那毫无疑问会是“实干”。
在这个充满喧嚣与泡沫的赛道里,启智给外界传递的印象是:不希望成为一棵孤傲的大树,而是要成为一片土壤,将所有的技术积累与生态布局,扎根在真实的场景、真实的营收与真实的价值上。
在具身智能的这场长跑中,谁能率先构建起让千行百业低门槛入场的底层生态,谁就有机会定义未来的规则。
2026年,当第一批真正能在非结构化环境下“实干”的机器人规模化上岗时,我们或许会回过头发现,这一刻的“底座建设”是关键的破题之策。
(本文封面图及文中图片来源:启智机器人)

END.





