大新闻!机器人"大脑"真能批量生产了!智元、宇树们开始共享"大脑"了?

机器人大讲堂 2025-07-31 22:30

具身智能产业发展确实快,展会上的机器人越来越炫酷,但真正能规模化应用的依然不多。


这个产业现在的状态,像极了2010年的计算机视觉——技术曙光初现,但整个行业还在"摸着石头过河"。不同企业用不同开发框架,数据格式五花八门,连对同一个任务的定义都能吵起来。


资讯配图


最要命的是,大家都在重复造轮子,却很难形成合力推动产业进步


上海AI实验室看不下去了


在刚刚结束的2025世界人工智能大会上,他们发布了『书生』具身全栈引擎Intern-Robotics这个平台的野心不小——要给具身智能建立标准化"生产线"。


资讯配图


有多猛?智元机器人、宇树科技、银河通用、国地共建人形机器人创新中心等15家头部玩家已经抢先上车。从人形到四足,从机械臂到轮式机器人,各种形态的机器人都在用同一套系统搞研发。


某种程度上说,这可能是具身智能领域的"安卓时刻"。


仿真引擎:让试错成本降低几个数量级


在传统的机器人开发中,每一次算法调整都需要在真实机器人上反复测试。这不仅烧钱烧时间,更要命的是——你敢让价值百万的人形机器人去试各种"花式摔倒"吗?


机器人领域有个特点,要求100%成功。大模型说错话,用户一笑了之;机器人摔一跤,可能就是几十万的损失。


这种对可靠性的极高要求,让充分的测试验证成为必需。但在现实中,你不可能让机器人真的去尝试所有可能的碰撞和失败情况。一个简单的抓取动作,可能涉及数百种不同的物体形状、材质和摆放角度,每种情况都需要反复测试。


Intern-Robotics的仿真引擎直接把这个问题给解了。基于升级版的桃源系统(现更名Intern·Utopia),上手门槛低到离谱:1行代码就能跨机器人部署算法,3行代码定义任务,5分钟直接开干。


资讯配图


这种极简设计背后,是对开发者痛点的深刻理解。传统仿真系统,光是环境配置就能折腾几天,更别提后续的参数调试和算法适配。现在,一个刚入行的工程师也能快速上手,把更多精力放在算法创新上。


技术上最狠的是"图式控制器级联设计"——翻译一下就是,你可以在一个环境里同时搞定路径规划、运动控制、精细操作,不用在不同仿真器之间反复横跳。


这解决了一个长期困扰行业的问题:高层规划与底层控制的耦合。以往,测试导航算法用一个仿真器,测试抓取用另一个,测试全身协调又得换一个。不同仿真器之间的数据格式、物理引擎、接口标准都不一样,光是做适配就要耗费大量时间。


更绝的是布式部署能力。想测试仓库里1000个机器人协同搬货?虚拟环境里随便造,各种极端情况任你折腾。反正是虚拟的,摔坏了不心疼。


这种能力对于多机协作场景尤其重要。在真实环境中,测试100个机器人的协同工作几乎不可能——光是场地和设备成本就是天文数字。但在虚拟环境中,你可以轻松模拟各种复杂场景:机器人之间的碰撞避让、任务分配、路径规划冲突等等。


仿真环境的另一个价值在于极端场景的测试。火灾、地震、设备故障——这些在现实中难以复现的情况,在虚拟世界里都能随意创建。这对于提高机器人系统的鲁棒性至关重要。


虚实数据贯通:用最小成本获得最大效果


数据是训练机器人的口粮,但这口粮在机器人圈贵得离谱。


完全靠真机器人采集数据?效率低不说,很多场景你根本采不到——总不能为了训练让机器人真的从楼梯上滚下去吧。


更现实的问题是成本。一个工业机械臂采集一天数据,需要专业操作员、场地租金、设备折旧,算下来成本可能上万。而要训练一个可靠的模型,往往需要数十万甚至数百万条数据。


Intern-Robotics的解法很巧妙:实融


庞江淼透露了个关键比例:"根据任务难度,真实数据与合成数据的比例在1:5到1:10之间。"这个比例不是拍脑袋想出来的,而基于大量实验得出的最优配比


对于导航这种主要靠"看"的任务,纯合成数据就能搞定。因为导航主要依赖视觉感知和空间推理,这些在虚拟环境中可以高度还原。但对于抓取这种需要"摸"的任务,物体的质地、重量、摩擦力等物理属性很难完全模拟,还是得有真实数据撑腰。


平台的数据引擎拥有10万级的场景物体资产,结合神经渲染技术Intern·LandMark和生成式世界模型Intern·WorldModel,可以生成高度逼真的训练场景。这些技术的结合,使得合成数据不仅在视觉上接近真实,在物理交互上也能准确模拟。


资讯配图


效果拉满:单台服务器每天能合成5万条数据,成本比半年前降了66%。整体数据采集成本更是直接干到传统方案的0.06%。


这意味着啥?原本需要砸百万的项目,现在几万块就能启动。对于资金有限的初创公司和研究团队来说,这简直是福音。


在和上海国家地方共建人形机器人创新中心的合作中,这套方法已经跑通。国地中心提供具体场景和高质量真实数据,实验室负责仿真数据合成和模型训练。通过这种虚实结合的方式,青龙机器人在极端场景下的表现提升了40%以上。


数据引擎还提供了完善的数据处理管线"大模型驱动、人工在环"的半自动化标注方式,既保证了标注质量,又大幅提高了效率。支持2D/3D框、轨迹、抓取点、语义掩码等常见标签,基本覆盖了机器人视觉任务的所有需求。


训测一体化:构建标准化的开发流程


资讯配图


有了数据和仿真,怎么高效训练模型?


传统方法的槽点太多:训练用一套工具,测试用另一套,转换过程不仅麻烦还容易出bug。更坑的是,没有统一评测标准,张三说自己的算法牛,李四说自己的更强,谁也说服不了谁。


这种混乱状态严重阻碍了技术进步。研究者发表论文时,往往会挑选对自己有利的测试场景和评价指标。企业宣传产品时,更是各说各话。结果是,外行看热闹,内行也糊涂。


庞江淼坦言:"评测体系确实很难做,这是领域内说了很多年但一直没做成的事。真实世界的机器人行为都是不可复现的,你怎么保证评测的公平性?"


他进一步解释:"评测是对方法进行排序的一种手段。一个合理的评测方式是能够通过分数,分辨出对整个系统做出改动后的好坏。它需要可复现,但真实世界的所有机器人行为都是不可复现的。"


Intern Robotics通过一体化设计解决了这些问题。平台提供了导航(Intern·Nav)、操作(Intern·Manip)、人形控制(Intern·Humanoid)、空间推理(Intern·SR)等专门工具库,从数据加载到模型训练再到性能评测,全流程覆盖。


每个工具库都针对特定任务进行了深度优化。比如导航工具库,不仅包含了主流的导航算法,还提供了10个标准化测试场景,涵盖室内导航、室外导航、动态避障等各种情况。操作工具库则包含了5种主流抓取算法和数百种标准测试物体。


资讯配图


最赞的是块化架构。感知模块、规划模块、控制模块随意组合,就像搭积木一样。你只需要专注自己的创新点,不用重新发明轮子。


这种设计理念带来的好处是显而易见的。一个做视觉感知的团队,可以直接使用平台提供的规划和控制模块,专注于提升感知算法的性能。一个做运动控制的团队,可以使用现成的感知模块,把精力放在控制算法的优化上。


基于这套系统训练的InternVLA系列模型已经开始秀肌肉。模型以InternVL3等多模态大模型为基座,设计了"感知-象-执行"一体化架在导航任务的10项基准测试中达到国际领先水平首次实现无需额外训练的"跨楼宇、长距离"自主行走;在操作任务的5项仿真评测中同样领先,真机成功率超过业界顶尖模型15%


还有跨平台能力"四足机器人和人形机器人在我们框架里其实一样,都用强化学习训练。"庞江淼说,"唯一区别是仿真环境里导入的描述文件不同。"


这种统一的训练范式意义重大。传统上,不同形态的机器人需要完全不同的开发流程和工具链。现在,一个模型可以方便地部署到10余种机器人形态上,大大提高了技术的复用性。


开源开放:构建具身智能的"基础设施"


技术再牛,不落地也是空谈。


Intern-Robotics选择了最硬核的验证方式:全面开源。GitHub和Hugging Face上,所有代码和模型都能下载。


这个决策背后,是对产业发展规律的深刻理解。封闭系统或许能在短期内保持技术优势,但开放生态才能推动整个产业的进步。就像Linux之于服务器、Android之于智能手机,开源往往能创造更大的价值。


目前平台已支持6大主流任务、20多种数据集、50多个模型的训练评测。6大任务包括感知(具身空间推理)、导航、交互操作、直接执行操作、世界模型以及人形机器人控制,基本覆盖了当前具身智能研究的主要方向。


资讯配图


数据资源同样给力:17类强推理任务、15种原子技能、10余种主流机器人本体、超2万种场景的200万仿真合成数据。这些数据不是简单的堆砌,而是经过精心设计和标注,可以直接用于模型训练。


据了解,"具身智能光合计划"把开放合作推向深水区。不只是提供工具,还在数据标准制定、采集工具供给、标注自动化等方面提供全方位支持。与成员单位在引擎开发、模型训练、场景落地等环节开展联合攻关,形成技术创新的合力。


资讯配图


不同类型的企业在平台上找到了不同的价值。本体厂商可以使用训练工具优化控制算法,提升机器人的运动性能;应用企业可以快速部署现有模型,加速产品落地;研究机构可以基于平台进行算法创新,推动技术边界。行业内的反馈印证了这种需求的迫切性:


越疆科技联合创始人郎需林直言:“在实际的应用场景中,往往需要多种形态的机器人共同完成一项复杂任务。比如人形机器人、机器狗和机械臂等,它们的算法如果通过统一的‘大脑’来训练,将会大大提高开发效率,业界需要这样更加泛用的具身大脑。


松灵机器人技术负责人谢志强也有类似感受:“现在具身智能的技术开发很碎片化,从仿真到训练各种工具五花八门,对开发者来说,希望能有一套从仿真到训练的全栈工具链,这将极大降低开发门槛和周期。


国家地方共建人形机器人创新中心副总经理刘宇飞表示,加入“具身智能光合计划”后,双方已经有了阶段性成果,联合研发的『书生』具身操作大模型InternVLA-A1及相关工具链,显著提升了青龙等异构机器人平台的数据采集多样性、复杂任务训练效率与测试准确率。接下来,双方将深化协同,共建人形机器人实训场、联合开发高价值场景的模型,以及探索新一代软硬件协同架构,打造自主进化智能体,共同推动具身智能技术创新突破与产业变革的深度融合。"


量产时代的技术基础:标准化与规模化


从某种意义上说,Intern-Robotics正在做的事,就像当年Android之于智能手机——建立统一的开发标准,降低进入门槛,让更多玩家能参与进来。


标准化是产业规模化的前提。USB接口统一了外设连接,HTTP协议统一了网络通信,而Intern-Robotics要统一的,是具身智能的开发流程。通过统一的数据格式、训练流程、评测标准,让不同的研究成果可以相互借鉴,不同的技术模块可以灵活组合。


"世界范围内首次完成导航、操作等六大具身主流任务的超大规模验证",这不仅是技术实力的体现,更重要的是验证了统一框架的可行性。当开发一套模型就能适配10余种机器人形态,当数据采集成本降到0.06%,当5分钟就能上手开发——具身智能的"iPhone时刻",或许真的不远了。


机器人大规模走进生活的那一天,可能就是从今天这个"安卓系统"开始的。


GitHub:https://github.com/InternRobotics
Hugging Face:https://huggingface.co/InternRobotics
官网:https://internrobotics.shlab.org.cn



如需咨询企业合作事宜,欢迎联系堂博士(13810423387,手机与微信同号)进行对接。


----------------END-------------------

资讯配图



工业机器人企业

埃斯顿自动化 | 埃夫特机器人 | 非夕科技 | 法奥机器人 | 越疆机器人 | 节卡机器人 | 松灵机器人 | 珞石机器人 盈连科技 集萃智造 | 优傲机器人 | CGXi长广溪智造 | 阿童木机器人 极智嘉

服务与特种机器人企业

亿嘉和 | 晶品特装 | 七腾机器人 史河机器人 | 九号机器人 | 普渡机器人 | 小笨智能 | 机器姬

医疗机器人企业

元化智能 | 天智航 | 思哲睿智能医疗 | 精锋医疗 | 佗道医疗 | 真易达 | 术锐®机器人 | 罗森博特 | 磅客策 | 柏惠维康 | 迪视医疗 | 水木东方

人形机器人企业

优必选科技 | 宇树 | 云深处 | 星动纪元 | 伟景机器人 | 逐际动力 | 乐聚机器人 | 大象机器人 | 中科深谷 | 魔法原子 | 众擎机器人 | 帕西尼感知 | 赛博格机器人 | 数字华夏 | 理工华汇 | 傅利叶智能 | 天链机器人 | 开普勒人形机器人 | 灵宝CASBOT | 清宝机器人 | 浙江人形机器人创新中心 | 动易科技

具身智能企业

跨维智能 | 银河通用 | 千寻智能 | 灵心巧手 | 睿尔曼智能 | 微亿智造 | 推行科技 | 中科硅纪 | 枢途科技 | 灵巧智能 | 星尘智能 | 穹彻智能 | 方舟无限 | 科大讯飞 | 北京人形机器人创新中心| 国地共建人形机器人创新中心 | 擎朗智能 | 戴盟机器人视比特机器人星海图

核心零部件企业

绿的谐波 | 因时机器人 | 坤维科技 | 脉塔智能 | 青瞳视觉 | 本末科技 | 鑫精诚传感器 | 蓝点触控 | BrainCo强脑科技 | 宇立仪器 | 极亚精机 | 思岚科技 | 神源生 | 非普导航科技 | 锐驰智光 | NOKOV度量科技 | 因克斯 | 褔德机器人 | 巨蟹智能驱动 | 微悍动力 | 元客视界 | 璇玑动力意优科技| 瑞源精密 | 灵足时代

教育机器人企业

硅步机器人 | 史河科教机器人 | 大然机器人

加入社群

欢迎加入【机器人大讲堂】读者讨论群, 共同探讨机器人相关领域话题,共享前沿科技及产业动态,添加微信“robospeak2018”入群!


资讯配图
资讯配图



看累了吗?戳一下“在看”支持我们吧

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
机器人
more
机器人不只会抓和放!北京大学X银河通用「世界-动作模型」赋能全面泛化的非抓握技能
全球最大VLA模型之一!字节40 亿参数GR-3:通用机器人精细操作成功率提升 250%!
押宝“具身智能”,扫地机器人巨头豪掷2亿元投向机器人项目
阿里、京东投了它,它造的人形机器人却不打工
15.8万就拥有一台1米65的人形,还免费送个机器人,这事儿靠谱吗?
一群00后半年造出人形机器人,今年交付500台!
ChatGPT 通过了「我不是机器人」验证,一个能骗过 CAPTCHA 的 AI 智能体,正在试探互联网的边界
签下360万美元大单,这家四川机器人企业全年产值有望翻番
EA200 轮式人形机器人:四大优势打通具身智能开发全流程,让科研创新更高效
人形机器人的一次重大拐点
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号