剑指万亿市场,英伟达如何重塑机器人开发全链路?

机器人前瞻 2025-07-15 12:00

机器人技术是NVIDIA下一个万亿美元级别的增长机会。
作者 |  许丽思
编辑 |  漠影
今年以来,人形机器人厂商频频高调宣布斩获大批场景订单,业内人士直言“不少企业订单都爆掉了”,让大规模商用的想象骤然升温。从工厂产线到酒店大堂,从零售柜台到电商仓储,机器人解决方案的密集落地,正逐步击碎关于人形机器人不过是个“大号电动玩具”的偏见。
不过,目前的人形机器人应用案例多集中于高度可控、标准化的工业场景,离真正实现对服务、家庭等多元化环境的无缝适配——即完整的产品市场匹配(PMF),还有相当漫长的路要走。
这一过程中,机器人在数据、训练及仿真上仍存在明显局限。
具体来说,机器人所需要的动作数据在规模上根本不存在,当前主流数据采集方式为人工采集,存在效率低、成本高的问题;机器人训练的泛化能力不足,且训练需要花费大量资源与时间;仿真环境与现实世界的差异,也易导致机器人在真实环境中遇到新场景时缺乏适应能力。
在此前的NVIDIA年度股东大会上,NVIDIA CEO黄仁勋谈道,机器人技术是NVIDIA下一个万亿美元级别的增长机会。NVIDIA早已不将自身视为一家芯片公司,而是“AI基础设施”或“计算平台”供应商。
凭借着自身在3D仿真、数字孪生、基础模型等方面的深厚技术储备,NVIDIA正在从机器人的底层架构与工具链入手,帮助行业解决在数据、训练及仿真等方面的短板,希望未来的数十亿机器人都能由其技术驱动。


01.

弥合机器人开发的数据鸿沟
训练效率提升高达百倍


机器人若想真正融入工厂、商场、家庭等多元场景,成为人类的得力助手,指尖的触觉闭环能力不可或缺。
但相较于视觉等可大规模采集的数据模态,触觉数据在具身智能中极为关键却又十分稀缺——它不仅要感知压力、纹理、温度等物理特征,还要将这些感知数据转化为精准的执行指令,以完成抓取易碎物品、装配精密零件等高难度任务。
最近,帕西尼感知将自研的触觉仿真器集成至NVIDIA Isaac平台。借Isaac Sim的3D场景生成技术构建包含不同材质、光照和物理特性的高精度仿真环境,帕西尼得以在虚拟环境中仿真多种材料与接触情况,再通过Isaac Lab的强化学习算法和数据增扩技巧,完成从接触仿真、触觉信号采样到模型训练的全流程GPU加速,实现训练效率100倍以上的飞跃。
同时,帕西尼利用NVIDIA Warp框架对柔性体接触计算进行高效并行,将研发周期从数月压缩至数周,成本降低超过40%。在NVIDIA GPU矩阵和AI加速方案加持下,帕西尼的触觉传感器能够在毫秒级响应物理接触,精准捕获并解析信号,为算法迭代提供源源不断的数据驱动力。
在机器人灵巧操作领域,银河通用基于Isaac Lab构建了全球最大的机器人抓握数据集DexGraspNet。通过自研高效合成技术,团队为5355个物体生成132万组抓握数据,实现了130多类物体、每个物体200余种抓握姿态的全覆盖,让这套数据集能直接适配任何型号的灵巧手。
依托NVIDIA Isaac系列以及Omniverse等,银河通用打造了10亿合成数据集,并训练出了全球首个纯合成数据驱动的机器人基础模型。该模型具备七大泛化能力:光照泛化、背景泛化、平面位置泛化、空间高度泛化、动作策略泛化、动态干扰泛化、物体类别泛化。
基于这一10亿级合成数据训练的模型,机器人只需100条真实数据,就能实现超过90%的灵巧抓取成功率,极大加速了在零售、酒店、养老、工业制造等领域的部署。
例如在药房场景中,机器人可自主完成盘点、补货、取送、打包等全流程操作,支持24小时不间断智能运营,真正实现了无人值守的高效管理。
在COMPUTEX 2025大会上,NVIDIA推出了Isaac GR00T-Dreams Blueprint。只需一张物体图片,便可通过Cosmos平台自动推理出其3D结构与物理属性,并生成机器人执行该任务的仿真视频,进一步提取动作tokens,用于教会机器人新的操作技能。
Isaac GR00T-Dreams Blueprint是NVIDIA在今年三月GTC大会发布的Isaac GR00T-Mimic Blueprint的补充。GR00T-Mimic使用NVIDIA Omniverse和NVIDIA Cosmos平台增强现有数据,而GR00T-Dreams则使用Cosmos生成全新数据。
全流程合成数据的理念正在重塑机器人开发逻辑,过去需要漫长的研发周期、高昂的成本,如今可实现极大程度的压缩,让机器人数据获取与应用迈向更为高效的智能化新阶段。


02.

从实验室走向产业落地
打造通用、可定制的基础模型


不同于年初忙着炫自家人形机器人的高难度技能,近来,不少厂商们把重心放在讲述人形机器人进生产线的故事上了。
这一重心的转变,也反映了人形机器人在产业落地层面的加速推进,尤其在工厂制造、物流配送及仓库分拣领域。比如,在工厂制造中,宝马、奔驰、比亚迪、东风等车企已宣布在车厂中引入人形机器人,实现精密装配、分拣搬运及多机协同作业等。
尽管大规模的应用仍受限于成本、场景泛化能力与技术成熟度,但人形机器人正展现出从实验室走向现实应用的强劲势头,有望率先在标准化场景中规模化落地。
在汽车制造领域,光轮智能已成功将NVIDIA GR00T N1人形机器人基础模型部署至生产线上,这也是GR00T N1在行业场景的首次应用实例。
GR00T N1是NVIDIA推出的全球首个通用人形机器人开源基础模型,能够流畅处理文本指令与图像等多模态输入,输出机器人动作指令。GR00T N1具有双系统架构:系统1是一个快速思考的动作模型,反映人类的本能反应或直觉;系统2是慢思考模型,由视觉语言模型提供支持,它会对所处环境和接收到的指令进行推理,从而规划行动。
光轮智能构建了物理交互真实、场景多样化的仿真环境,模拟了汽车工厂中的复杂任务场景,还生成了覆盖各类任务的大规模遥操作合成数据,并将这些遥操数据迁移至不同机器人本体上。
搭载了GR00T N1模型的人形机器人,能够精准识别装载框中的零部件以及质检台上的指定位置,完成抓取、搬运和放置等动作。在这个过程中,机器人的左右手相互协作,不仅提升了批量处理的工作效率和承重能力,更能在搬运物品时保持稳定性。
不久前,NVIDIA对GR00T N1进行首次更新,推出了Isaac GR00T N1.5。GR00T N1.5展现出更强的环境适应性与工作空间配置调整能力,可通过用户指令识别目标物体。此次更新借助GR00T-Dreams Blueprint生成合成训练数据,仅用36小时就完成了GR00T N1.5模型的开发。此次更新也大幅提升了模型在工业物料分拣、存放等常见制造场景中的任务成功率。
智元机器人基于GR00T技术,构建了支持高保真模拟和多维度泛化的大型机器人仿框架Genie Sim能够帮助开发者在短时间内积累海量机器人仿真数据,降低数据采集成本,同时提升数据多样性与质量。
它还构建了从轨迹生成、模型训练、基准测试到部署验证的完整评估闭环,并通过高效的仿真工具链,帮助用户快速验证算法性能并优化模型,为机器人技术的创新与应用落地提供了有力支持。
▲Genie Sim基于GR00T-Teleop的仿真远程操作架构

▲GR00T-Teleop中的仿真远程操作(动图)

相较于工业环境,家庭环境一直被认为是人形机器人商业化的终极挑战,物体材质多样、场景动态变化都对机器人的柔性操作能力、环境自适应能力等提出来更高要求。专注于打造认知机器人的德国企业NEURA Robotics正评估GR00T N模型性能,以加速家庭自动化系统的开发进程。
为了缩小机器人训练与实际应用中的sim2real gap,NVIDIA支持通过数字孪生环境进行物理世界中不可能的实验,开发了一项名为“MEGA”的技术。
Mega将机器人、环境和传感器集成在一个平台上,借助Mega驱动的数字孪生,企业可以进行大规模的仿真,在虚拟空间中批化机器人系统性能,不断构建和测试新的布局,大幅降低现实测试的成本与风险。


03.

结语:人形机器人加速迈向万亿级市场


从实验室Demo到产线落地,人形机器人的商业化征程已按下快进键。虽然各大厂商纷纷试水人形机器人商业化,但真正的大规模落地尚处于起跑阶段。
在工业制造中,标准化的流水线环境提供了相对可控的实验土壤,使得机器人能够在短期内看起来达成初步实用。但当镜头转向多元化场景时,数据稀缺、环境复杂、用户需求多样化的痛点就显得更为突出。
在数据端,合成数据与物理仿真为触觉感知与灵巧操作提供了可行之道。NVIDIA通过Isaac Sim、Omniverse、Warp、Cosmos等工具,已搭建起一条从数据生成到模型训练的闭环流程,为厂商缩短研发周期、降低试错成本提供了有力支撑。
在模型层面,GR00T系列通用基础模型则让机器人厂商有了可即时调用的大脑,将复杂的多模态理解与高维动作规划封装成易用接口,重塑机器人开发范式。与此同时,开源与持续迭代的机制,使得产业链上下游能够共同完善泛化能力,助推规模化应用。
随着技术的发展,人形机器人将在更多细分场景实现突破。从标准化的工业应用到柔性化的物流分拣,再到充满不确定性的服务业与家庭陪伴——每一次技术跨越,都将推动行业迈向万亿级市场的大门。
图片
图片

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
机器人
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号