连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了

作者：彭堃方

编辑：吕鑫燚

出品：具身研习社

这是 RoboScience 机器科学连续两年出现在 ICRA 最佳论文的视野中。

如果说机器人学界每年都有一个时刻，会让全球高校实验室、产业公司、顶尖研究者同时把目光投向同一处，ICRA 一定是其中最重要的那个舞台之一。

ICRA，全称 IEEE International Conference on Robotics and Automation，是 IEEE 机器人与自动化学会旗下的旗舰会议，也是全球机器人与自动化领域最具影响力的顶级学术会议之一。

在这里，一篇论文面对的不是普通的同行评审，而是来自全球机器人学界最前沿的竞争。对于机器人研究者来说，能够被ICRA 接收已经是一次重要认可；能够进入最佳论文视野，则意味着这项工作被放进了全球机器人技术路线的风向标里。

正是在这个舞台上，ICRA 2026 年度奖项揭晓——“机器人操作与运动”方向的 Best Paper Finalist 名单里，与伯克利大学、斯坦福大学、麻省理工大学、清华大学等顶级机构并列出现的，是一支来自 RoboScience 机器科学的首席科学家邵林带领的 NUS 团队，论文名为《Bi-Adapt: Few-Shot Bimanual Adaptation for Novel Categories of 3D Objects Via Semantic Correspondence》。

这已经是邵林团队连续第二年站上 ICRA 最佳论文的舞台。

连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了图2

一年前的亚特兰大，他们的另一篇论文《D（R，O） Grasp》从全球数千篇投稿中突围，拿走了 ICRA 2025 “机器人操作与运动最佳论文奖”。ICRA 2025 官方获奖名单显示，这篇论文获奖的理由，是其对“跨不同机器人手与物体的可泛化灵巧抓取表征”作出了贡献。

换句话说，RoboScience 机器科学连续两年被 ICRA 看见，正是因为它持续在机器人操作最难的问题上给出答案。

全球 4000+ 投稿、获奖率不足 1%，更难得的是亚洲唯一连续两年入选——这件事的分量，在机器人学界不需要任何额外修饰。而最佳论文之外，邵林带领的团队仅在 ICRA 2026 一届就有 10 篇研究成果成功入选，覆盖灵巧抓取、社交导航、低成本力感知、混合任务规划等核心方向，系统性地推进具身智能的技术边界。

这说明，一家成立仅一年半的中国公司，正在把自己的技术路线放到全球机器人学界最激烈、也最严肃的竞技场里接受检验，并且成功说服了同侪。

回到论文本身会发现，这两篇论文在解的是同一个问题：让机器人从“一物一策”中走出来。

D（R，O） Grasp 让一个 AI 大脑可以驱动 3 指、4 指、5 指不同形态的灵巧手，跨本体抓取上百种物体，成功率 87% 以上、生成时间不到 1 秒。Bi-Adapt 让机器人只看几个示例，就能把已经学会的双臂协作动作迁移到从未见过的物体类别上——甚至零样本泛化到类别之外。

一个解决“换手”，一个解决“换物”。两条看似不同的技术路径，背后是同一个判断：具身智能的下一程，胜负在“泛化”。

而这也是 RoboScience 机器科学这家成立仅一年半的中国公司，对外讲的故事和押下的赌注——“打破泛化瓶颈”。两位创始人，首席科学家邵林、CEO 田野，分别代表着这个赌注里最重要的两端：前沿研究的方法论，和大规模工程的执行力。

一言蔽之，成立仅一年半，却能在最讲究路径长期主义的机器人学界，把最难攻克的泛化问题持续推向前台，并连续两年被 ICRA 认可。至少在这一层面上，RoboScience 机器科学已经不只是一个简单的初创公司名字，而是正在走向具身智能世界舞台中央的中国样本。

连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了图3

在过去两年的具身智能浪潮里，几乎所有头部玩家都在向同一个技术范式中争渡——VLA（Vision-Language-Action），用视觉和语言直接驱动机器人输出动作。RoboScience 机器科学是少数几家公开走出不同路线的公司，他们的核心技术架构叫 VLOA（Vision-Language-Object-Action）。多出来的那个 O，是 Object——物体。

这个看似只多出一个字母的差别，背后却是一个完全不同的判断：机器人要真正变得“通用”，先要学会理解物体在物理世界中会如何演化，再去决定该怎么做。

VLA 那条路上最大的问题，恰恰是它跳过了“对物理世界本身的理解”——从感知和语言直接跳到动作。在静态、固定的场景里它能工作，但只要换一个新物体、换一项新任务、换一台不同构型的机器人本体，就要重新采集数据、重新训练模型。说白了，VLA 给出的是一个个“实例-动作”的硬绑定，很难突破真正的“泛化”。

VLOA 想要解决的，正是这件事，即让一个大脑，指挥任意机器人、操作任意物体、完成任意任务。

具体到架构上，它由“具身世界模型”和“通用操作模型”两层组成，中间用一个叫 Object Trajectory（物体轨迹）的接口把两者打通：

上层的具身世界模型，负责“理解世界”。它让机器人在动手之前，先在脑子里预演一遍未来：哪个物体会往哪里去、姿态如何变化、和谁会发生接触。输出的是一种叫“3D 点云轨迹”的中间表示——既能直观看到物体的运动路径，又天然满足物理几何约束，不会出现 2D 视频生成里常见的重力错乱、物体穿模。

连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了图4

图注：具身世界模型输出3D 点云轨迹

下层的通用操作模型，负责“改变世界”。它把这条轨迹翻译成机器人的关节角度、接触点和力控信号，在物理世界里精准复现。它不再是“一个任务一个模型”的碎片堆砌，而是所有技能联合训练、共享同一套底层表征。

连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了图6

图注：通用操作模型根据输入的3D 点云轨迹驱动灵巧手

中间的 Object Trajectory，则是 VLOA 最精妙的一笔——它把“认知”和“执行”彻底解耦：上层不必关心你用什么硬件，下层不必关心你具体要做什么任务，两者之间用“物体的 3D 点云轨迹”这种既人类可读、又机器可执行的通用语言来交接。

这种解耦兑现的，正是 VLOA 真正想做的三件事：

跨物体：从光滑的洗发水瓶到透明的棉签盒、从硬质零件到软质布料，同一套模型自动适配，不必为每个新物体单独训练；
跨任务：开信封要毫牛级切入力、立硬币要动态平衡、抓薯片要避免压碎、用针管注射要精准控速——这些过去要分别开发算法的精细任务，被一个模型统一拿下；
跨本体：模型与硬件完全解耦，换一只灵巧手就能直接用。比如，同一套策略可以无缝迁移到 X-hand（12 个自由度齿轮准直驱）和 LEAP Hand（16 个自由度直驱）等完全不同形态的灵巧手。

最具说服力的案例是去年的 5 月，基于 VLOA，RoboScience 机器科学完成了全球范围内最复杂、精度最高、步骤最多的具身操作任务——拼家具。这件事几乎踩中了机器人操作的所有难点：手内操作、双臂协同、毫米级精度、长程任务规划、力反馈调控。模型读完说明书就能启动拼装，中途如果被人为拆解干扰，系统能自动恢复状态接续完成。

连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了图8

连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了图10

更关键的是，这种“通用性”的上限是可持续突破的。RoboScience 机器科学已为具身世界模型积累超过 100 万小时以物体为中心的多模态视频数据，并以每周数十万小时增长，目标 2026 年底构建千万小时级数据集；为通用操作模型，基于自研多模态物理仿真平台 RoboMirage，已积累 10B（100 亿次）高质量操作轨迹，目标 2026 年突破 1T（1 万亿次）。两个模型都已在工程上验证了 Scaling Law——数据规模越大，泛化能力越强，且呈可预测的幂律提升。

这意味着 RoboScience 机器科学押下的这条路线，不单是一个技术架构的巧思，而是一个可以持续滚雪球、规模越大优势越大的工程系统。

总之，VLOA 比 VLA 更激进、也更长远的地方在于，它是要让机器人真正摆脱遥控器，自主理解世界、自主改变世界。

这个模型和 RoboScience 机器科学那两篇连续获奖的论文放在一起看，其实是一脉相承的。它们都在做同一件事：把机器人从“实例-动作”的硬编码，重构为“关系-轨迹”的可泛化系统。这套底层范式，才是 RoboScience 机器科学押下的最具价值的赌注。

连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了图12

具身智能交叉学科的特质表明了，靠单一型的人才很难跑通闭环。

一个团队如果只擅长学术，能写出 paper却做不出产品；如果只擅长工程，能做硬件却写不出真正前沿的算法。具身大模型这种“既要前沿原创、又要规模化落地”的方向，注定要把两类罕见的人才装进同一支队伍里。

RoboScience 机器科学的稀缺性，恰恰在于它把这两端都凑齐了。

先看首席科学家邵林。他是中国具身智能“斯坦福系”里一个关键人物。本科南京大学，博士斯坦福大学，师从机器人领域知名学者 Jeannette Bohg，联合导师是 Leonidas J. Guibas——后者是美国三院院士、计算机图形学和几何处理领域的奠基性人物之一。如今，邵林在新加坡国立大学（NUS）担任助理教授。

斯坦福的机器人圈，在过去几年成了观察中国具身智能格局的一个绝佳坐标。苏昊（Hillbot 创始人）、王鹤（银河通用创始人）、卢策吾（穹彻智能创始人）等人和邵林同属一个学术谱系。这些人后来撑起了中国具身智能赛道的大半个版图——也意味着邵林天然在国内最前沿的学术圈拥有一个坐标级的位置。

更关键的是，邵林的研究主线，从博士时代就一直锁在机器人操作的“通用化”上：从早期的 UniGrasp，到 D（R，O） Grasp、Bi-Adapt，再到收录至 ICRA 2026 的 T（R，O） Grasp——你可以看到一条非常清晰的研究脉络：不断抽象、不断统一、不断追求跨本体跨物体的通用表征。

这种长期一致的研究方向，意味着 RoboScience 机器科学的技术底座不是临时拼凑的产物，而是一位顶尖学者花了近十年时间不断打磨出来的方法论沉淀。

再看田野。他身上最稀缺的，是从中科大物理、斯坦福 AI Lab 到苹果 AI Platform 一路走出来的工程化能力。田野本科毕业于中国科学技术大学物理系，硕士毕业于斯坦福大学 AI Lab，导师是被誉为“AI 布道者”的吴恩达。

毕业后田野进入苹果，担任 AI Platform 技术负责人——这个职位的分量，要在 AI 圈待过的人才掂量得出来。他主导打造的核心平台，被业内称为“苹果的 PyTorch 与 CUDA”：支撑了多项关键 AI 技术在苹果生态中的大规模落地，是苹果 AI 能够在数十亿台设备上稳定运行的基础设施。

换句话说，田野不是一般意义上“懂技术的 CEO”，而是既懂前沿算法、又懂如何把算法装进十亿级别工业系统的稀缺工程领袖。

具身智能的产业化，恰恰最需要这种能力。现在业内之所以对训模型这件过去看似高深莫测的事儿，如今祛魅后比喻成“工业生产”，就在于前沿模型要变成可以批量部署、稳定运行、持续迭代的产品，靠的不是某个聪明的算法巧思，而是工程地基——什么样的数据流水线能稳定喂模型、什么样的推理框架能支持实时控制、什么样的工程范式能在不同硬件上保持一致体验。这些都不是研究人员的强项，而是工业级 AI 工程师才能解决的问题。

也因此，邵林和田野的组合，构成了一种业内最为扎实的搭配：斯坦福学术大咖 × 硅谷工程领袖。

连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了图13

之所以这样说，是因为放眼中国具身智能这条赛道，多数公司要么以学术大牛为核心醉心于0-1的技术攻坚，要么以工程出身的创业者为核心，更擅长做1-10的扩张。像 RoboScience 机器科学这样把两个一线最强者放在同一张桌子上的组合，本身就是一种稀缺资源——它意味着这家公司既能持续在前沿原创上不掉队，又能在产品落地上不踩工程坑。

简言之就是，能够穿越技术周期，在长坡厚雪的具身智能赛道，行稳致远。

连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了图14

RoboScience 机器科学成立于 2024 年 12 月。短短一年半时间，这家公司已经迈步到了中国具身智能赛道的舞台中央。

先看资本结构。该公司已经披露完成多轮融资，投资方包括京东集团、商汤科技、达晨财智、招商局创投、零一创投、普华资本等多家 CVC 和财务机构。近期又获得了多家国内外产业龙头、互联网大厂、头部财务机构等多轮注资。

再看布局。RoboScience 机器科学已在北京、深圳、苏州、杭州铺开研发和生产网络。团队成员来自斯坦福、中科大、新加坡国立大学等顶尖学府，以及苹果、字节、腾讯、大疆等头部企业——既覆盖了 AI 算法的前沿研究力量，也覆盖了智能硬件量产的工程能力。

在产品路径上，RoboScience 机器科学走的是软硬一体的全栈路线：上层有 VLOA 大模型，下层同步布局机器人本体、末端执行器、自研多模态物理仿真平台 RoboMirage。这意味着公司不只想做“具身大脑”的供应商，而是想从模型、本体到末端、数据训练形成完整的产品闭环。

最后看落地。目前公司已经与多家零售、物流、康养服务企业，以及多家机器人本体、灵巧手公司开展试点合作。按照公开规划，今年还将面向工业与商业场景，实现标准化机器人本体产品的量产。

回到开头那个问题，一家成立仅一年半的中国公司，凭什么能在最讲究路径长期主义的机器人学界，连续两年被国际同行盖章？

答案现在不再玄妙：这家公司在做的事情，不是把现有零星技术包装成孤立产品，而是从最底层的方法论开始重新搭建一套具身智能的技术栈。在打造一个可适用于任何任务、任何对象与任何机器人的通用智能系统上，ICRA 的连续认可，只是这套技术栈对外露出的冰山一角。

项目地址：

Bi-Adapt 项目主页：https://biadapt-project.github.io
Bi-Adapt 论文：https://arxiv.org/pdf/2602.08425
D（R，O） Grasp 项目主页：https://nus-lins-lab.github.io/drograspweb/
D（R，O） Grasp 论文：https://nus-lins-lab.github.io/drograspweb/static/data/D(R,O)Grasp.pdf

加入社群&找我们玩👇👇👇

连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了图15

连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了图16

连续两年进入 ICRA 最佳论文视野，RoboScience 机器科学的“具身大脑”押对了图17