从网络视角看英伟达Vera Rubin NVL72的变化

智猩猩 2026-07-02 19:49

文章转载自公众号:西贝吹风


本文只做学术/技术分享,如有侵权,联系删文。


2026CES展会上,英伟达发布了以Vera Rubin NVL72机柜级系统为核心的Rubin平台,该平台由六款专为打造AI超级计算机而设计的全新芯片组成。相信大家这两天也看到了不少的相关报道,今天我们主要从网络的视角来分析一下Vera Rubin NVL72有哪些不同之处。在这之前,还是简单浏览一下,Vera Rubin NVL72的基本情况。


01

Vera Rubin NVL72概览


Vera Rubin NVL72采用了“极限协同设计”的理念,通过将六款独立芯片统一开发,实现整体系统级协同运作。这六款新芯片分别是:


从网络视角看英伟达Vera Rubin NVL72的变化图1


Vera Rubin NVL72Blackwell的对比


从网络视角看英伟达Vera Rubin NVL72的变化图2


02

Vera Rubin NVL72的网络相关组件简介


计算托盘


一个计算托盘含2Superchip(每Superchip2×Rubin GPU + 1×Vera CPU),每个计算托盘有4Rubin GPU+2Vera CPU,通过 NVLink-C2C 互联(1.8TB/s)。


从网络视角看英伟达Vera Rubin NVL72的变化图3


每个计算托盘有4ConnectX-9网卡,每块ConnectX-9网卡(包含2CX9的芯片,224Gbps PAM4 SerDes速率,每颗芯片800Gbps)对应一个Rubin GPU,为每个Rubin GPU提供最高1.6Tbps2端口800Gbps)的Scale-out横向扩展能力。双端口的设计可以进行双平面的组网。


从网络视角看英伟达Vera Rubin NVL72的变化图4


同时每个计算托盘可以配备一块BlueField-4 DPU卡,BlueField-4基础了64Grace CPU1ConnectX-9芯片,BlueField-4作为智能网卡,可以负责存储卸载、网络虚拟化等相关工作,提供2400G接口或1800G接口。


从网络视角看英伟达Vera Rubin NVL72的变化图5


交换托盘(NVLink 6 Switch,用于单机柜内部Scale-up组网)


一个交换托盘含4NVLink 6 Switch芯片,单交换托盘容量为28.8TB/s


从网络视角看英伟达Vera Rubin NVL72的变化图6


Spectrum-X CPO交换机(用于Scale-out组网)


NVIDlA Spectrum-X CPO交换机通过800Gbps以太网端口与ConnectX-9 SuperNIC互联,实现机柜间无阻塞扩展,支持DGX SuperPod(多机柜集群)部署。


每颗Spectrum-6芯片提供102.4 TB/s带宽,英伟达基于该款交换芯片设计了两款交换机产品,其中,SN6810提供102.4Tb/s带宽(一颗Spectrum-6芯片),128800G端口或512200G以太网端口。SN6800提供409.6Tb/s带宽(四颗Spectrum-6芯片),支持512800G以太网端口或2048200G端口。


从网络视角看英伟达Vera Rubin NVL72的变化图7

从网络视角看英伟达Vera Rubin NVL72的变化图8



03

Vera Rubin NVL72的网络扩展


介绍Vera Rubin NVL72的网络扩展前,我们先回顾一下,AI智算集群的两种扩展模式,一种是Scale-up,另一种是Scale-outScale-up是向上扩展(纵向扩展),增加单节点内的GPU/NPU算卡数量(也就是通常所说的超节点的大小)。Scale-out是向外扩展(横向扩展),增加节点的数量,扩大整体组网规模。


从网络视角看英伟达Vera Rubin NVL72的变化图9


Scale-up扩展(单机柜内部互联)


我们先来看一下,上一代Blackwell Ultra NVL72Scale-up扩展,如下图所示:


从网络视角看英伟达Vera Rubin NVL72的变化图10


单个NVSwitch芯片与72GPU全连接,总交换容量 = 100GB/s * 72 = 7.2TB/s


单个交换托盘,2NVSwtich,总交换容量 = 7.2TB/s * 2 = 14.4TB/s


单个NVL72的总交换容量 = 14.4TB/s * 9 = 129.6TB/s(对外称130TB/s


铜缆数量 = 18(托盘数量) * 4GPU数量) * 4GPUNVSwtich铜缆数量) * 18NVSwtich数量) = 5184


Vera Rubin NVL72Scale-up扩展,如下图所示:


从网络视角看英伟达Vera Rubin NVL72的变化图11


单个NVSwitch连接72GPU,总交换容量 = 100GB/s * 72 = 7.2TB/s


单个交换托盘,4NVSwtich,总交换容量 = 7.2TB/s * 4 = 28.8TB/s


单个NVL72的总交换容量 = 28.8TB/s * 9 = 259.2TB/s(对外称260TB/s


铜缆数量 = 18(托盘数量) * 4GPU数量) * 2GPUNVSwtich铜缆数量)* 36NVSwtich数量) = 5184


注:GPU到每个NVSwtich的连接带宽仍为800Gbps100GB/s),Blackwell Ultra NVL72采用的是200G PAM4 SerDes速率,所以需要4根铜缆连接,Vera Rubin NVL72采用的是400G PAM4 SerDes速率,所以需要2根铜缆连接,但是Vera Rubin NVL72NVSwtich数量是36,比Blackwell Ultra NVL72NVSwtich数量多一倍,因此,两种情况下用总的铜缆的数量维持不变。


从网络视角看英伟达Vera Rubin NVL72的变化图12


另外,在本次发布中,提到了专为超大规模设计的无缆线机柜架构,这里指的是Vera Rubin NVL72的计算托盘采用模块化无缆线、无风扇、无软管托盘设计,仅通过PCB板(Middle Plane)与连接器实现内部互联,彻底摒弃内部线缆。计算托盘插入机柜时通过盲插连接器自动对接,无需人工布线,全系统仅保留两根外部液态冷却进出口管路与冷却模块连接。


从网络视角看英伟达Vera Rubin NVL72的变化图13


下图是之前的结构,之前的系统单个计算托盘的组装非常耗时,每个线缆连接点都可能成为故障源,在数十万GPU规模下这一问题尤为突出。Vera Rubin NVL72全新设计将组装维护时间缩短至原先的1/18


从网络视角看英伟达Vera Rubin NVL72的变化图14


DGX SuperPOD Scale-out扩展(跨机柜互联)


本次CES上,英伟达还推出了新一代DGX SuperPOD。它把多个装有72GPURubin NVL72连接起来,形成了更大的AI计算集群。在这次的DGX SuperPOD中,共有8Rubin NVL72机架,相当于有576GPU,可提供 28.8 ExaFlops  FP4 性能和 600TB 的高速内存。这样,SuperPOD就可以处理数千个Agentic AI智能体,以及数百万token上下文,机柜之间通过新推出的两款Spectrum-X以太网交换机进行扩展。DGX SuperPOD为英伟达Rubin GPU横向 (Scale-Out) 扩展提供了蓝图。


从网络视角看英伟达Vera Rubin NVL72的变化图15


END


从网络视角看英伟达Vera Rubin NVL72的变化图16



点击下方名片 即刻关注我们

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
英伟达
more
2027年AMD新款服务器CPU出货量将反超英伟达Vera
马斯克太空算力计划官宣命名「Starmind」;传英伟达算力租赁价格较高点下跌 31%;九个月流片,OpenAI 首秀自研 AI 芯片 | 极客早知道
OpenAI为何“造芯”?AI巨头苦英伟达久矣,闪存巨头又要赢麻了
IPO之后再举债,马斯克SpaceX首发投资级债券;机器人怕失控?英伟达Halos系统实现「智驾级」安全;AI巨头掏空软件公司高层丨硅谷大事件
英伟达豪掷20亿美元押注光互连,黄仁勋亲赴德州奠基磷化铟新厂
AMD和英伟达,势均力敌
英伟达MoE新开源:一行import,微调加速3.7倍
对话算苗科技CEO汪福全:英伟达CUDA已不是高不可攀的壁垒,Token使用成本是用户第一考量
锁定英伟达!磷化铟晶圆产能暴涨四倍
英伟达开始搞机器人自己研究机器人那套了…
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号