
汇集半导体行业资讯 技术前沿、发展趋势!
在刚刚落幕的 AI Infra Summit 上,英伟达再度成为全场焦点,正式宣布推出一款具有划时代意义的全新 GPU——NVIDIA Rubin CPX GPU。这款专为处理百万 token 级别的代码生成以及生成式视频应用而打造的 GPU,无疑将为人工智能领域带来全新的变革与突破。
Rubin CPX 是全球首款专为超大上下文 AI 精心设计的 CUDA GPU。它基于英伟达先进的 Rubin 架构,采用单芯片设计理念,展现出卓越的技术前瞻性与创新性。尽管目前英伟达尚未公布其 CUDA 核心数量,但已透露了诸多令人瞩目的关键配置。
在视频处理方面,Rubin CPX 配备了四个 NVENC 编码器和四个 NVDEC 解码器,这一强大的组合为视频工作流提供了高效、稳定的支持,无论是视频编码、解码还是转码等操作,都能轻松应对,满足生成式视频应用对高性能视频处理的需求。
显存方面,Rubin CPX 搭载了高达 128GB 的 GDDR7 显存。如此大容量的显存,能够为处理百万 token 级别的数据提供充足的存储空间,确保在复杂的数据处理过程中不会出现性能瓶颈,为超大上下文 AI 应用提供了坚实的硬件基础。
在性能表现上,NVIDIA Rubin CPX GPU 堪称卓越。在 NVFP4 数据精度下,其计算性能最高可达 30 PFlops(每秒 3 亿亿次),这一惊人的计算能力使其能够“一口气”实现百万级 token 的推理任务。对于代码生成和生成式视频应用而言,这意味着更快的处理速度、更高的效率和更流畅的用户体验。
在长上下文处理场景下,Rubin CPX 的表现同样出色。与 GB300 NVL72 相比,其注意力性能最高可提升 3 倍。这一显著提升使得 Rubin CPX 在处理复杂的自然语言处理任务和长序列数据时,能够更加精准地捕捉上下文信息,提高模型的准确性和可靠性,为人工智能应用的发展提供了更强大的性能支持。
Rubin CPX 不仅自身性能卓越,还具备出色的协同工作能力。它可以与 NVIDIA Vera CPU 和 Rubin GPU 紧密配合,形成强大的计算集群。英伟达宣称,全机架版本的 Vera Rubin NVL144 CPX 将拥有高达 8 exaflops 的 AI 性能。如此惊人的性能,将为大规模人工智能模型的训练和推理提供前所未有的计算能力,推动人工智能技术在更多领域的应用和发展。
尽管 NVIDIA Rubin CPX GPU 在今天的 AI Infra Summit 上只是以“纸面宣布”的形式亮相,正式推出要等到 2026 年底(此处按原文保留“明年底”表述,但结合上下文推测应为 2026 年底),但这并不影响业界对它的期待。值得一提的是,NVIDIA 日前透露,下一代 Rubin GPU 和 Vera CPU 都已经在台积电成功完成流片,且各项性能指标均符合预期。这一消息无疑为 Rubin CPX GPU 的未来增添了更多的确定性。
随着人工智能技术的不断发展,对硬件性能的要求也越来越高。NVIDIA Rubin CPX GPU 的出现,无疑为超大上下文 AI 应用提供了一款强大的硬件利器。它的推出将进一步推动人工智能技术在代码生成、生成式视频等领域的创新和发展,让我们共同期待它在 2026 年底的正式登场,为人工智能领域带来更多的惊喜和突破。
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,侵权欢迎联系我们删除!

▎往期推荐