黄仁勋 GTC大会演讲精华：超级芯片、AI工厂与“美国利益”

本文由半导体产业纵横（ID：ICVIEWS）综合

预计Vera Rubin“超级芯片”将在明年进入量产阶段。

黄仁勋 GTC大会演讲精华：超级芯片、AI工厂与“美国利益”图3

2025年10月29日清晨，英伟达创始人兼首席执行官黄仁勋在华盛顿举行的GTC华盛顿技术峰会上发表了重要演讲。

计算架构范式转移

演讲中，黄仁勋回顾了计算行业的历史转折点。数十年来，CPU的性能一直遵循着可预测的纵向扩展（scale-up）增长轨迹。然而，随着登纳德缩放定律（Dennard scaling）——即通过不断缩小晶体管尺寸来维持功率密度，从而降低功耗并提升性能——的终结，传统的发展路径已难以为继。

面对这些挑战，英伟达的答案是并行计算、GPU和加速计算架构。

黄仁勋宣称：“这个转折点已经到来，而英伟达已经准备就绪。我们认识到，通过引入能够充分利用指数级增长晶体管的处理器，应用并行计算技术，并与顺序处理的CPU协同工作，我们可以将计算力推向一个全新的维度——这个时代真正来临了。”

加速计算的实现，有赖于英伟达精心构建的软件基石——CUDA-X全栈加速库。这个庞大的软件生态系统涵盖了深度学习领域的cuDNN和TensorRT-LLM、数据科学平台RAPIDS（cuDF/cuML）、决策优化工具cuOpt、计算光刻解决方案cuLitho，以及量子与混合计算框架CUDA-Q和cuQuantum等关键领域。

黄仁勋将这个完整的软件生态系统誉为“公司最宝贵的财富”。它构成了英伟达加速计算战略的技术核心，为各行各业的计算转型提供了底层动力。

AI原生6G技术栈ARC-Pro

演讲中，黄仁勋强调，电信技术是经济和国家安全的生命线，但目前全球大部分无线技术部署都依赖于他国的技术体系。

黄仁勋表示：“这种核心通信技术受制于人的局面必须结束，现在我们迎来了扭转局面的历史性机遇。”他相信，美国将“重新夺回通信技术的主导权”。

为实现这一战略目标，英伟达推出了革命性的NVIDIA ARC——一个以美国技术为核心的AI原生6G无线技术栈。该平台基于英伟达的Aerial平台构建，集成了Grace CPU、Blackwell GPU和先进的网络组件，并通过加速计算实现了性能突破。

据黄仁勋透露，英伟达已与通信设备巨头诺基亚（Nokia）达成深度战略合作。诺基亚将为其未来的基站系统中集成NVIDIA ARC解决方案，该平台将赋能精确机器人控制、高精度天气预报等关键应用。

根据英伟达官方博客文章，该公司计划将其商业级AI-RAN产品集成到诺基亚领先的无线接入网（RAN）产品组合中，使通信服务提供商能够在英伟达平台上部署AI原生的5G-Advanced和6G网络。作为合作的一部分，英伟达将以每股6.01欧元的价格认购1.664亿股诺基亚新股，总投资额达10亿美元。

NVQLink：打通量子计算的“经络”

在探讨计算科学前沿时，黄仁勋回忆起量子物理学家理查德·费曼四十年前的愿景：创造一台能够直接模拟自然规律的量子计算机。

“现在我们能够制备稳定、相干且可纠错的逻辑量子比特，”黄仁勋指出。“然而，这些量子比特极其脆弱，需要强大的技术来支持量子纠错和状态解读。”

为实现量子计算与GPU计算的无缝融合，英伟达推出了量子-GPU互连技术NVQLink。这项创新使得量子处理单元（QPU）能够实时调用CUDA-Q计算框架，将通信延迟降低到约4微秒的极致水平。

NVQLink将量子处理器和控制硬件系统的多种方法直接连接到 AI 超级计算机上，能够帮助量子从业人员克服在扩展硬件时所面临的集成难题。作为一种开放系统架构，它可以将 GPU 计算与量子处理器进行紧密结合，从而为量子超级计算机带来加速。

在现场演示中，黄仁勋身后的大屏幕展示了一个包含17家领先量子计算公司和多家美国能源部实验室的协同创新生态网络。“几乎所有美国能源部下属的实验室都在与我们的量子计算生态系统合作伙伴紧密协作，将量子计算融入未来的科学发展蓝图。”

携手能源部共建新一代超算集群

黄仁勋宣布，美国国家实验室正步入由AI基础设施驱动的科研新纪元。英伟达已与美国能源部（DOE）达成战略合作，将共同建造七台新一代超级计算机，为未来的科学研究提供强大的算力支撑。

在具体布局上，英伟达将联合美国能源部及甲骨文，在阿贡国家实验室内建造DOE体系内规模最大的AI超级计算机集群。

该超算网络由两大核心系统构成：

Solstice系统将部署100,000颗英伟达Blackwell GPU。建成后，它将成为全球最大的、面向公共研究的智能体科学平台。
Equinox系统配备10,000颗Blackwell GPU，提供高达2200 EFLOPS的AI算力，专门服务于前沿科学计算、仿真模拟和开放式研究。

这项重大的基础设施投资，标志着美国正式迈入“智能体驱动科学研究”的新时代，将极大提升其在国家安全、能源战略、基础科研等关键领域的创新能力和发展速度。

本土制造战略：在美国本土量产Blackwell芯片

在产业布局方面，黄仁勋透露了重要进展：Blackwell GPU已在美国亚利桑那州实现规模化生产，基于该芯片的整机系统也将在美国本土组装。此举标志着英伟达成功将其旗舰产品的制造从完全依赖台积电，转向了美国本土的供应链体系。

值得注意的是，本次发布会的许多公告都带有明确的政策导向。通过展示其在美国科技生态系统中的核心地位，英伟达向政策制定者传递了一个关键信息：限制芯片出口将直接损害美国的利益。黄仁勋在会前透露，选择华盛顿作为会议地点是为了方便特朗普总统出席，但由于总统的亚洲之行未能如愿。

在市场表现方面，黄仁勋透露GPU需求依旧强劲：过去四个季度，英伟达已出货600万颗Blackwell GPU，预计Blackwell及下一代Rubin芯片的总销售额将达到5000亿美元的规模。

Vera Rubin超级芯片明年量产

黄仁勋在会上展示了下一代Vera Rubin超级芯片，其上搭载了Vera CPU和两颗巨大的Rubin GPU。该主板还承载了大量的LPDDR系统内存，这些内存将与Rubin GPU上的HBM4内存协同工作。

黄仁勋还表示，Rubin GPU已经返回实验室，这意味着这些是由台积电生产的首批样品。每个GPU周围都有大量的供电电路，每个芯片将包含8个HBM4堆栈位点和两个光罩尺寸（Reticle-sized）大小的GPU裸片。Vera CPU将配备88个定制ARM核心和176个线程。

谈到推出计划，黄仁勋透露，他预计Rubin GPU将在明年大约同一时间或更早进入量产阶段，也就是2026年第三或第四季度。与此同时，英伟达的Blackwell Ultra “GB300” 超级芯片平台正在全速推出。

规格方面，英伟达Vera Rubin NVL144平台将采用两款新芯片。Rubin GPU将使用两个光罩尺寸大小的芯片，提供高达50 PFLOPS的FP4性能和288 GB的下一代HBM4内存。这些芯片将与一颗拥有88核定制Arm架构、176线程的Vera CPU以及高达1.8 TB/s的NVLINK-C2C互连技术一起配置。

在性能扩展方面，英伟达Vera Rubin NVL144平台将具备3.6 Exaflops的FP4推理能力和1.2 Exaflops的FP8训练能力，比GB300 NVL72提升3.3倍；拥有13 TB/s的HBM4内存带宽和75 TB的快速内存，比GB300提升60%；NVLINK和CX9的能力则提升2倍，分别达到最高260 TB/s和28.8 TB/s。

第二个平台将于2027年下半年问世，名为Rubin Ultra。该平台将把NVL系统从144扩展到576。CPU架构保持不变，但Rubin Ultra GPU将采用四个光罩尺寸大小的芯片，提供高达100 PFLOPS的FP4性能，以及分散在16个HBM位点上、总计1 TB的HBM4e容量。

在性能扩展方面，英伟达Rubin Ultra NVL576平台将具备15 Exaflops的FP4推理能力和5 Exaflops的FP8训练能力，比GB300 NVL72提升14倍；拥有4.6 PB/s的HBM4内存带宽和365 TB的快速内存，比GB300提升8倍；NVLINK和CX9的能力则分别提升12倍和8倍，达到最高1.5 PB/s和115.2 TB/s。

AI工厂革命：从工具到生产力实体

“AI不是工具，而是生产力实体，”黄仁勋在演讲中提出了这一革命性观点。“历史上第一次，技术拥有了执行劳动任务的能力，成为人类生产力的延伸。”这种从“工具”到“AI工人”的根本性转变，正催生着全新的计算范式，进而带来前所未有的职业形态和产业图景。

在黄仁勋的设想中，现代“AI工厂”远非传统数据中心所能代表。它是专为海量令牌（tokens）的生成、传输和服务而构建的全新综合计算平台。这种平台级架构旨在实现前所未有的计算密度和能效比。

面对AI算力需求的指数级增长，黄仁勋详述了英伟达的解决方案：“首先，我们重新定义计算机的形态，首次将单个计算系统扩展至整个机柜的规模；其次，通过创新的AI以太网技术Spectrum-X，实现多个系统之间的无损横向扩展。”

随着AI工厂的兴起，机器人工程、量子科学等新兴领域正在创造大量前所未有的就业机会。“创新的飞轮已经启动，”黄仁勋强调。“接下来的关键是通过成本控制，大幅降低运营成本，优化用户体验，维持这个创新循环的持续运转。”

实现这一愿景的关键在于“极致协同设计”，即同步设计全新的底层计算架构，涵盖芯片、系统平台、软件栈、AI模型和终端应用。

为了展示这一理念的实物成果，黄仁勋在台上展示了新一代NVIDIA BlueField-4 DPU。这款集成了64核Grace CPU和ConnectX-9网络芯片的数据处理器，计算性能是其前代的六倍，将成为未来AI工厂的“操作系统内核”。

这款革命性的DPU专为卸载和加速服务器的网络、存储和安全任务而设计。计划于2026年首先部署在英伟达的Vera Rubin机柜级AI平台上，随后向更广泛的服务器生态系统开放。

Omniverse DSX：AI工厂的蓝图

为应对大规模AI部署的挑战，黄仁勋正式推出了Omniverse DSX——一个全面覆盖从100兆瓦到数千兆瓦规模AI工厂设计与运营的综合解决方案。该蓝图已在弗吉尼亚州的AI工厂研究中心得到充分验证。

为了使DSX参考设计更能适应不同的数据中心，英伟达提供了两种配置框架：

DSX Boost（内部能效优化）：通过智能电源管理和动态工作负载分配，在相同算力输出下可降低约30%的能耗，或在相同功率预算下提升30%的GPU密度，实现令牌生成吞吐量的质的飞跃。
DSX Flex（外部能源整合）：将数据中心深度融入区域电网系统。通过智能调度可再生能源、平衡供需关系，可有效激活美国电网中约100吉瓦（gigawatts）的闲置容量。

Omniverse DSX旨在让新进入者能够快速构建AI工厂。该解决方案确保了英伟达及其合作伙伴的硬件在处理器、网络和冷却系统层面上开箱即兼容。即使没有专业经验，也可以按照蓝图进行部署，最大限度地减少了定制化需求。

值得注意的是，该架构不仅完美支持当前的Blackwell平台，还为下一代Vera Rubin等未来产品预留了兼容性，为投资者提供了长期的技术保障。

开放生态与产业融合

演讲中，黄仁勋强调了开放生态系统的核心价值：“开源模型和开放协作是全球创新的基石，为初创企业、研究机构和工业企业提供了持续的动力。”

据悉，英伟达今年已向开发者社区贡献了数百个高质量的开源模型和数据集。

英伟达构建了一个覆盖关键领域的开源模型体系：

Nemotron: 专注于智能体推理与决策的AI
Cosmos: 打破合成数据生成与物理AI的界限
Isaac GR00T: 赋能机器人技能学习与跨场景泛化
Clara: 重塑生物医药研究与临床工作流

这些模型家族将共同赋能下一代智能体系统、机器人技术和科学发现。黄仁勋强调：“我们持续投入开放生态，因为这是科研、创业和产业升级的共同需求。”

现场展示的合作伙伴成果显示了英伟达技术广泛的应用场景，涵盖了谷歌云、微软Azure、甲骨文等云计算巨头，ServiceNow、SAP等企业服务提供商，以及Synopsys、Cadence等专业领域的领导者。

黄仁勋还宣布了两项战略合作：

与CrowdStrike合作构建新一代网络安全体系，通过Nemotron模型和NeMo工具链，实现从云到边缘的“光速”威胁检测与响应；
与Palantir达成深度技术集成，将加速计算架构、CUDA-X库和开源模型融入Ontology数据平台，实现大规模数据处理的性能突破。

为美国再工业化打造数字孪生平台

物理AI正在推动美国的再工业化——通过机器人和智能系统改造工厂、物流和基础设施。在一段视频中，黄仁勋重点介绍了合作伙伴如何将其应用于实际工作中。

“工厂本质上是一个机器人，它指挥着其他机器人制造机器人的东西，”他说。“这需要大量的软件，除非你能在数字孪生中完成，否则几乎不可能实现。”

黄仁勋在台上特别提到了富士康的工作，该公司正在使用Omniverse工具设计和验证位于休斯顿的新工厂，该工厂将用于制造NVIDIA AI基础设施系统；卡特彼勒公司——该公司也在制造过程中应用数字孪生技术；布雷特·阿德科克，他在三年半前创立了Figure AI公司，该公司为家庭和工作场所制造人形机器人，现在价值近40亿美元；强生公司；以及迪士尼，该公司正在使用Omniverse训练“有史以来最可爱的机器人”。

自动驾驶：Uber和DRIVE Hyperion 10

黄仁勋宣布，Uber和NVIDIA正在合作构建自动驾驶出行的主干网，目标是打造约10万辆自动驾驶汽车，并从2027年开始扩展。NVIDIA DRIVE AGX Hyperion 10是4级参考架构：安全、可扩展、软件定义，在一个网络上统一人类和机器人驾驶员。

“未来，你就能叫到这样的车了，”黄仁勋说，“这个生态系统将会非常丰富，Hyperion 或自动驾驶出租车将会遍布世界各地。”

“人工智能时代已经开启。Blackwell是它的引擎。美国制造，服务全球，”黄仁勋总结道。“感谢大家让我们将GTC带到华盛顿特区。我们希望每年都能举办这样的活动，也感谢大家的贡献，让美国再次伟大。”

*声明：本文系原作者创作。文章内容系其个人观点，我方转载仅为分享与讨论，不代表我方赞成或认同，如有异议，请联系后台。

《2025 AI PC 产业研究报告》重磅发布

为帮助PC领域硬件层、软件层、模型层及终端层各类玩家更清晰地了解AI PC行业的发展现状及未来发展趋势，半导体产业纵横重磅发布《2025 AI PC产业研究报告》。报告主要围绕AI PC行业宏观环境、AI PC产业链、AI PC最终用户调研分析、AI PC产品评测以及AI PC未来发展趋势进行分析。AI PC最终用户调研覆盖了北京、上海及深圳等中国一线城市，共收集终端用户及门店销售人员有效样本数量千余份。调研内容涵盖用户基本信息、AI PC认知度、产品功能偏好及行业未来发展趋势判断等多个方面。AI PC产品评测针对联想ThinkPad X9 14（Intel）以及联想小新Pro16c AKP10(AMD)两大设备进行AI PC评测分析，评测维度包括同模型不同量化大小对比、同模型不同参数规模模型对比、同机器不同推理设备对比。

报告获取：

1.报告售价：纸质版599元/本

2.购买方式：请扫码填写报告购买意向表

3.报告咨询：

微信号icviews2 或者Joy8432211

报告目录：