NVIDIA 研究中心的最新研究成果表明,通过在不同夹爪类型、驾驶场景及虚拟世界中进行规模化训练,能够打造出具备强大泛化能力、可适配多样化应用场景的 AI。

衡量机器人夹爪是否真正实用,关键不在于它能否抓起某个特定物体,而在于它能否使用从未接触过的工具,连续抓取多个物体。
评估辅助驾驶系统是否安全可靠,不仅在于它能否对场景做出分析推理,更在于它能否在车辆实际搭载的硬件上足够快地作出响应。
而要让虚拟智能体真正具备落地能力,需要在进入现实世界之前,让它尽可能多地经历各种不同环境的历练。
在今年的国际计算机视觉与模式识别大会(CVPR)上,NVIDIA 研究中心发表了三篇论文,分别针对上述三大挑战提出了解决方案。这三项研究揭示出一个共同理念:大规模训练是打造适用于不同应用且具备泛化能力的关键。
这三篇论文聚焦物理 AI 研究中的不同技术瓶颈:
GraspGen-X:首个面向零样本抓取的基础模型,基于数十亿次仿真抓取训练而成,可适配任意类型的夹爪。
LCDrive:推出了一种全新模型,用紧凑的潜在表征替代高成本的文本推理,使智能汽车能够在嵌入式硬件上实现更快的思考与决策。
NitroGen:一种游戏 AI 通用基础模型,基于 NVIDIA Isaac GR00T 机器人基础模型架构,在虚拟环境中通过数万小时的交互数据,助力高效训练具身智能。
此外,NVIDIA 还在 CVPR 上发布了全新的物理 AI 智能体技能(Agent Skills),助力研究人员和开发者加速开发智能汽车、机器人及视觉 AI 系统。
以上为摘要内容,点击“阅读原文”或扫描下方二维码阅读完整内容:

扫描下方海报二维码,观看 NVIDIA CEO 黄仁勋在 GTC 台北大会现场发表的主题演讲回放,深入了解推动新一代 AI 的突破性成果。
