【科技纵览】当自动驾驶从单纯的轨迹跟随迈向具备自主逻辑的“物理AI”阶段,基础设施的重构便成了行业分水岭。6月1日,英伟达正式揭晓Alpamayo 2 Super,这款拥有320亿参数的视觉-语言-动作(VLA)开源模型,不仅将前代百亿参数规模提升了三倍,更标志着汽车开始具备类人的感知、推理与行动能力。作为英伟达Alpamayo系列的最新迭代,该模型基于Cosmos世界基础模型构建,旨在为L4级无人驾驶出租车的研发提供成熟底座,让车辆不仅能“看见”,更能“理解”并解释其决策逻辑,从而满足严苛的安全验证与合规监管要求。

值得注意的是,此次发布并非单一模型的更新,而是一套完整开发工具链的亮相。英伟达同步推出了NVIDIA AlpaGym、OmniDreams以及Omniverse NuRec等多款全新工具与智能体技能,打通了从真实场景数据采集、闭环训练到车载部署的全流程。其中,AlpaGym作为高算力吞吐的闭环强化学习框架,允许模型在仿真环境中持续循环完成“决策-感知”过程,暴露静态数据集难以发现的累积误差;而OmniDreams则能生成逼真的罕见长尾驾驶场景,结合NuRec的神经重建能力,大幅降低了高质量合成数据的获取门槛。这种从开环预训练到闭环精细化调优的完整链路,正是解决自动驾驶“长尾难题”的关键所在。
在具体性能表现上,Alpamayo 2 Super实现了多项核心突破。它不再局限于传统的轨迹生成,而是支持全车360度环视感知,覆盖前后及侧方视野,显著提升了变道、并线等复杂操作的安全性。新增的“元动作输出”能力,使模型能够预判礼让、停车等高层级驾驶行为,并为后续规划模块提供依据。此外,其搭载的推理式自动标注功能,可将数据标注周期从数月压缩至数日,极大优化了数据链路的成本与效率。针对传统模仿学习难以应对的极端场景,模型在因果链溯源与轨迹生成质量上也得到了显著增强,成为目前功能最强的开源驾驶基础大模型。
黄仁勋对此评价道:“Alpamayo标志着汽车开始具备自主推理能力,不再只是单纯行驶。”他强调,唯有英伟达能同步提供开源模型、仿真工具、真实场景数据与智能体能力,助力全球生态打造四级自动驾驶能力。这套系统可作为“教师模型”,通过知识蒸馏压缩为轻量化版本,部署在DRIVE AGX Thor芯片上运行。这意味着车企无需从零搭建核心基础设施,即可继承高水准的推理与感知能力。据悉,比亚迪、吉利、极氪、小米及小马智行等中国主流车企和自动驾驶公司,均已采用或正在基于NVIDIA Hyperion平台进行智驾开发。
从市场反馈来看,Alpamayo系列自发布以来下载量已接近40万次,并在近期台北国际电脑展(COMPUTEX)上斩获最佳选择奖。随着推理代码预计于今年夏季上线GitHub,模型权重同步发布于Hugging Face,这一开源生态将进一步加速L4自动驾驶技术的规模化落地。这不仅是技术参数的跃升,更是自动驾驶研发范式从“数据驱动”向“推理驱动”转变的重要信号。