刚刚！英伟达正式宣布，又一芯片亮相！

汇集半导体行业资讯技术前沿、发展趋势！

在刚刚落幕的 AI Infra Summit 上，英伟达再度成为全场焦点，正式宣布推出一款具有划时代意义的全新 GPU——NVIDIA Rubin CPX GPU。这款专为处理百万 token 级别的代码生成以及生成式视频应用而打造的 GPU，无疑将为人工智能领域带来全新的变革与突破。

Rubin CPX 是全球首款专为超大上下文 AI 精心设计的 CUDA GPU。它基于英伟达先进的 Rubin 架构，采用单芯片设计理念，展现出卓越的技术前瞻性与创新性。尽管目前英伟达尚未公布其 CUDA 核心数量，但已透露了诸多令人瞩目的关键配置。

在视频处理方面，Rubin CPX 配备了四个 NVENC 编码器和四个 NVDEC 解码器，这一强大的组合为视频工作流提供了高效、稳定的支持，无论是视频编码、解码还是转码等操作，都能轻松应对，满足生成式视频应用对高性能视频处理的需求。

显存方面，Rubin CPX 搭载了高达 128GB 的 GDDR7 显存。如此大容量的显存，能够为处理百万 token 级别的数据提供充足的存储空间，确保在复杂的数据处理过程中不会出现性能瓶颈，为超大上下文 AI 应用提供了坚实的硬件基础。

在性能表现上，NVIDIA Rubin CPX GPU 堪称卓越。在 NVFP4 数据精度下，其计算性能最高可达 30 PFlops（每秒 3 亿亿次），这一惊人的计算能力使其能够“一口气”实现百万级 token 的推理任务。对于代码生成和生成式视频应用而言，这意味着更快的处理速度、更高的效率和更流畅的用户体验。

在长上下文处理场景下，Rubin CPX 的表现同样出色。与 GB300 NVL72 相比，其注意力性能最高可提升 3 倍。这一显著提升使得 Rubin CPX 在处理复杂的自然语言处理任务和长序列数据时，能够更加精准地捕捉上下文信息，提高模型的准确性和可靠性，为人工智能应用的发展提供了更强大的性能支持。

Rubin CPX 不仅自身性能卓越，还具备出色的协同工作能力。它可以与 NVIDIA Vera CPU 和 Rubin GPU 紧密配合，形成强大的计算集群。英伟达宣称，全机架版本的 Vera Rubin NVL144 CPX 将拥有高达 8 exaflops 的 AI 性能。如此惊人的性能，将为大规模人工智能模型的训练和推理提供前所未有的计算能力，推动人工智能技术在更多领域的应用和发展。

尽管 NVIDIA Rubin CPX GPU 在今天的 AI Infra Summit 上只是以“纸面宣布”的形式亮相，正式推出要等到 2026 年底（此处按原文保留“明年底”表述，但结合上下文推测应为 2026 年底），但这并不影响业界对它的期待。值得一提的是，NVIDIA 日前透露，下一代 Rubin GPU 和 Vera CPU 都已经在台积电成功完成流片，且各项性能指标均符合预期。这一消息无疑为 Rubin CPX GPU 的未来增添了更多的确定性。

随着人工智能技术的不断发展，对硬件性能的要求也越来越高。NVIDIA Rubin CPX GPU 的出现，无疑为超大上下文 AI 应用提供了一款强大的硬件利器。它的推出将进一步推动人工智能技术在代码生成、生成式视频等领域的创新和发展，让我们共同期待它在 2026 年底的正式登场，为人工智能领域带来更多的惊喜和突破。

*声明：本文系原作者创作。文章内容系其个人观点，我方转载仅为分享与讨论，不代表我方赞成或认同，如有异议，侵权欢迎联系我们删除！

▎往期推荐