NVIDIA 研究中心在高级抓取、更智能辅助驾驶及大规模智能体训练领域取得新突破

NVIDIA 研究中心的最新研究成果表明，通过在不同夹爪类型、驾驶场景及虚拟世界中进行规模化训练，能够打造出具备强大泛化能力、可适配多样化应用场景的 AI。

衡量机器人夹爪是否真正实用，关键不在于它能否抓起某个特定物体，而在于它能否使用从未接触过的工具，连续抓取多个物体。

评估辅助驾驶系统是否安全可靠，不仅在于它能否对场景做出分析推理，更在于它能否在车辆实际搭载的硬件上足够快地作出响应。

而要让虚拟智能体真正具备落地能力，需要在进入现实世界之前，让它尽可能多地经历各种不同环境的历练。

在今年的国际计算机视觉与模式识别大会（CVPR）上，NVIDIA 研究中心发表了三篇论文，分别针对上述三大挑战提出了解决方案。这三项研究揭示出一个共同理念：大规模训练是打造适用于不同应用且具备泛化能力的关键。

这三篇论文聚焦物理 AI 研究中的不同技术瓶颈：

GraspGen-X：首个面向零样本抓取的基础模型，基于数十亿次仿真抓取训练而成，可适配任意类型的夹爪。
LCDrive：推出了一种全新模型，用紧凑的潜在表征替代高成本的文本推理，使智能汽车能够在嵌入式硬件上实现更快的思考与决策。
NitroGen：一种游戏 AI 通用基础模型，基于 NVIDIA Isaac GR00T 机器人基础模型架构，在虚拟环境中通过数万小时的交互数据，助力高效训练具身智能。

此外，NVIDIA 还在 CVPR 上发布了全新的物理 AI 智能体技能（Agent Skills），助力研究人员和开发者加速开发智能汽车、机器人及视觉 AI 系统。

以上为摘要内容，点击“阅读原文”或扫描下方二维码阅读完整内容：

扫描下方海报二维码，观看 NVIDIA CEO 黄仁勋在 GTC 台北大会现场发表的主题演讲回放，深入了解推动新一代 AI 的突破性成果。