







-
英伟达Vera Rubin架构包含七款芯片、五套机架系统,以及一台用于AI Agent的超级计算机 -
七款芯片分别是NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink™ 6 交换机、NVIDIA ConnectX-9超级网卡、NVIDIA BlueField-4 DPU和 NVIDIA Spectrum™-6以太网交换机,以及新集成的NVIDIA Groq 3 LPU -
五个机架分别是NVIDIA Vera Rubin NVL72机架、NVIDIA Vera CPU机架、NVIDIA Groq 3 LPX机架、NVIDIA BlueField-4 STX存储机架,以及NVIDIA Spectrum-6 SPX以太网机架。





-
AI推理前半段的Prefill(预填充)和极其耗费算力的Attention(注意力机制),全部交给Vera Rubin这个性能王者来处理; -
后半段的Decode(解码),也就是生成Token的瞬间,直接卸载给Groq LPU来降低延迟。





























