英伟达推出面向大模型语境理解AI的Rubin CPX GPU,2026年底上市

半导体产业研究 2025-09-11 08:00

资讯配图

资讯配图

图片来源:AFP

英伟达发布Rubin CPX——专为大上下文人工智能设计的下一代GPU,该产品可使系统以空前的速度与效率处理百万token级的软件编码和生成式视频任务。这款GPU隶属于全新的Vera Rubin NVL144 CPX平台,预计于2026年底上市。

企业AI的性能飞跃

根据英伟达的新闻稿,Rubin CPX在集成的Vera Rubin NVL144 CPX系统中与英伟达Vera CPURubin GPU协同工作,可提供8 exaflopsAI计算能力——约为英伟达前代GB300 NVL72系统性能的7.5倍。该平台每机架还具备100TB的高速内存和1.7 PB/s的内存带宽。此外,将为希望扩展现有NVL144系统的客户提供独立的Rubin CPX计算托盘。

面向长上下文AI应用而构建

这款GPU专为长上下文AI任务设计,支持模型在软件开发和视频处理中对百万级token进行推理。Rubin CPX将视频解码器和编码器与长上下文推理集成,支持生成式视频、视频搜索和大规模代码优化等应用。其可提供高达30 petaflopsNVFP4计算能力,配备128GB GDDR7内存,注意力计算能力比GB300 NVL72快三倍。

早期采用者已准备部署

英伟达指出,多家AI公司已在探索将Rubin CPX用于企业级应用。软件开发AI公司Cursor旨在增强代码生成和开发者协作能力;专注于生成式视频的Runway期望实现更快且更逼真的内容创作;而Magic则计划利用该GPU训练具备1亿token上下文窗口的基础模型,以实现用于软件自动化的高级AI代理。

全面的生态系统支持

英伟达强调,Rubin CPX将获得英伟达全AI栈的支持,包括用于可扩展推理的Dynamo平台和用于企业AI推理的Nemotron多模态模型家族。企业可通过英伟达AI Enterprise软件、NIM微服务和CUDA-X库部署Rubin CPX,并接入英伟达拥有超600万用户和近6000CUDA应用的开发者生态系统。

Rubin CPX预计于2026年底商业化上市,将为企业和AI创新者提供一个平台,以空前的速度和效率扩展大上下文AI工作负载。

原文标题:

Nvidia unveils Rubin CPX GPU for massive-context AI, available end 2026

原文媒体:digitimes asia

资讯配图

芯启未来,智创生态

湾芯展2025与您相约!

资讯配图

资讯配图


资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI GPU 英伟达
more
0收入估值35亿元,国产GPU厂商再获5亿增资
阿里云否认采购15万片GPU,寒武纪大跌
AMD研发2.5D/3.5D chiplet架构封装GPU,或重返高阶GPU市场竞争
全流程国产GPU,上下文提速100倍!中国科学院发布「线性复杂度」类脑大模型
贵到离谱!英伟达下一代中国特供GPU价格曝光
红杉内部备忘录:GPU就是新蒸汽机,AI革命远超工业革命,引爆10万亿美元新浪潮
8月汽车销量/交付汇总;阿里否认采购寒武纪15万片GPU;续航最强特斯拉车型降价...
刚刚,英伟达发布全新GPU!
博通百亿芯片大单,拉响GPU警报
象帝先(5nm)GPU完成流片验证
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号