
新智元报道

【新智元导读】四十年来第一次,整条PC产品线被推倒重来!英伟达RTX Spark超级芯片把6144个GPU核心、128GB内存塞进笔记本,数据中心级算力随身带走。
英伟达GTC大会,大幕拉开!
就在刚刚,老黄再次站上绝对C位,开启了震撼全场的主题演讲——
有用AI的时代,全面来临。

全场压轴好戏,是英伟达首款RTX Spark「超级芯片」!
它史无前例地搭载了6144个GPU核心、128GB统一内存,把过去只有数据中心才有的算力,塞进了一台笔记本。
全球首款专为Agent打造的Windows PC,此刻诞生了。

一眼看懂老黄这场2小时硬核演讲:
-
Vera Rubin全面量产,组装一个机架从两小时砍到五分钟
-
Vera CPU登场,第一颗不为人、只为Agent造的CPU
-
RTX Spark(N1X),全球首台为个人Agent打造的个人电脑
-
Nemotron 3 Ultra开源,英伟达最大模型,5500亿参数


这场大会最重量级的发布,非「超级芯片RTX Spark」莫属。
「四十年后,英伟达要和微软,一起重新发明PC」!
黄仁勋这句话一出口,全场炸了。
![]() |
![]() |
他先讲了段历史。Windows 3.1时代,PC还只是企业的工具,直到Windows 95,才把PC变成了人手一台的消费电子。
而今天,那个让一切发生的「DirectX加应用」组合,要被「LLM加Agent」彻底取代。
大模型,就是新时代的DirectX。Agent,就是新时代的应用。
然后,他掏出了那颗「超级芯片」RTX Spark,核心是和联发科联手打造的N1X CPU。
这是有史以来能效最高的PC芯片!

![]() |
![]() |
老黄说,这是英伟达把33年的全部积累,蒸馏进了一颗芯片。
-
Blackwell RTX GPU,6144个CUDA核心,1 PFLOP的AI算力
-
定制20核Grace CPU,与联发科联手打造
-
128GB统一内存,NVLink全程融合
-
台积电3nm工艺,700亿晶体管
英伟达100%的软件栈,全跑在这上面。

更重磅的是,这不止一台笔记本。
微软和英伟达一口气端出桌面、笔记本、工作站三件套,全部100% Windows兼容、100% CUDA、100% Tensor Core。


那台桌面机最有意思。它能让Agent7天24小时跑着,不计费。
没有额度焦虑,下载一个本地模型,这个Agent就彻底是你自己的。

而那台名叫DGX Station for Windows的怪兽,直接堆到768GB内存、20 PFLOPS算力、8TB/s内存带宽。
未来在个人桌面上,跑一个万亿参数的模型,都不是问题。
老黄说,这是四十年来第一次,整条PC产品线被推倒重来。一条新的产品线,一个新的开始。


接下来,当传闻中的「性能怪兽」Vera Rubin真机登场那一刻,全场瞬间沸腾。
老黄在台上掷地有声,「Vera Rubin不只是为了跑AI而生的,它是为了运行Agent而生」!
如今,Vera Rubin正全面投入量产。
供应链规模是上一代Grace Blackwell的两倍。过去组装一个机架要两个小时,现在只要五分钟。
你没看错,五分钟。

当场,他对Vera Rubin真机来了一次「解剖」。
-
Vera Rubin NVLink 72,整个系统的核心大脑,72块Rubin GPU加36颗Vera CPU
-
Vera CPU机架,256颗全液冷CPU
-
Vera BlueField存储与安全处理系统
-
Mellanox网络系统,世界上第一个CPO共封装光学
最抓眼球的,是Vera Rubin硬件形态的终极进化,无电缆、无软管、无风扇。
老黄把它从台上推走时还调侃,后面大概有2000个人在拉。


在Vera Rubin背后,植入的是英伟达专为Agentic AI时代打造的CPU,Vera CPU。
老黄的解释很深刻,「到今天为止,世界上所有的CPU都是为人造的。这一刻,Vera CPU是给智能体用的」。
既然是为Agent定制的CPU,Vera必须具备超越常理的特性。老黄总结了三个硬核指标。

第一,世界第一的单核性能。
Vera做到了每个时钟周期抓取、解码、执行10条指令,创下世界最高纪录。
第二,每核带宽和总线带宽,刷新天花板。
Vera内部用一张「光速级」的Scalable Coherency Fabric把所有核心连起来,没有chiplet税,没有跨芯片边界的损耗。
它还是第一颗用上PCIe Gen6的CPU,配1.2TB/s的LPDDR5X带宽,是市面最强x86 CPU的2到3倍。

第三,极致的能效。
要把尽可能多的CPU塞进AI数据中心,又不能抢走生成token那点宝贵的电力。


实测里,对比x86,Vera CPU跑SQL的速度狂飙3倍。盯纽交所那种实时流处理,更是直接拉到6倍。
老黄给了一个极致的比喻,「CPU是指挥家,GPU是交响乐团」。


老黄抛出了一个更底层的判断,「我们进入了全新的Agent时代,智能体就是未来的操作系统」。
传统时代,计算机的运行逻辑是,应用层加代码加操作系统。
而今天,这个架构变成了,智能体+Harness。

输入与感知、推理与规划、工具调用与行动,加上短期和长期记忆,构成了智能体完整的工作流。
这里面,LLM负责「思考」,而Harness就像一个操作系统,负责连接一切、调度信息。
硬件就位,还差软件生态。
现场,老黄端出了NVIDIA Agent Toolkit,四层架构。
-
模型层,Nemotron 3 Ultra,英伟达最大的开源模型,约5500亿总参数,每token激活550亿
-
框架层,支持Claude Code、Codex、OpenClaw等各种Agent直接运行
-
工具和技能层,CUDA X库全部附带skills文件,Agent自学即用
-
运行时层,OpenShell,英伟达的开源安全运行时,Apache 2.0

这四层叠起来,就是一个无敌的Agent系统。
就拿英伟达和Cadence联合打造的「芯片设计超级Agent」来说。
其中,Codex负责总指挥,Cadence ChipStack启动RTL验证循环,底层跑Nemotron模型,外层套OpenShell做安全。
Agent自己跑仿真、做形式化验证、发现设计缺陷、修复代码bug,整个过程自驱动,人类工程师可以在任何环节介入。
验证周期从数周压缩到数小时,加速超过40倍。

这就是Agentic AI。为了这一天,英伟达已经准备了整整两年!

对AI大厂来说,他们其实不想买计算机,想要的是一座AI工厂。
于是英伟达又往上长了一层,叫DSX,一套AI工厂的施工蓝图。

先在Omniverse里建一座数字孪生工厂,电力、散热、网络全部模拟验证一遍,一个机架还没运到,整座工厂已经在虚拟世界里跑通了。

工厂一通电,DSX OS接管运营。
DSX Max LPS负责榨电,今天的AI工厂普遍超配电力高达40%,而它能在同样的电力预算下塞进更多GPU,45度的热液冷更省水更省电。

老黄说,到本世纪末,100吉瓦的AI工厂要陆续上线。
算力就是营收,算力就是利润。没有营收和利润,就是亏损。
这一层,把英伟达从一家卖芯片的公司,彻底变成了一家卖整座工厂的公司。

这里,老黄再次祭出了自己的经典语录:「买越多,赚越多!」

两个小时,几十个发布点砸下来。
但老黄从头到尾,其实只讲了一句话。
过去四十年,计算机是为人造的。从今天起,它要为Agent造。
CPU重做,PC重新发明,数据中心重构,软件栈重搭,全是这一句话的注脚。
上一个敢说「重新发明PC」的人,掏出来的是iPhone,它重新定义了人和设备的关系。
这一次,老黄掏出来的东西看着没那么性感,但它要重新定义的是另一件事。
谁,才是这台设备真正的主人。
参考资料:
https://www.youtube.com/watch?v=wSp6AiNIrsY
编辑:摩西 桃子



