半导体行业圈 振兴国产半导体产业!
刚刚,在AI Infra Summit上,英伟达宣布推出专为处理百万token级别的代码生成和生成式视频应用的全新GPU——NVIDIA Rubin CPX GPU。这Rubin CPX是首款为超大上下文AI量身定制的CUDA GPU,它基于Rubin架构,单芯片设计,CUDA核心数量没公布,只是说配备四个NVENC编码器、四个NVDEC解码器用于视频工作流,搭配128GB GDDR7显存。NVIDIA宣称,它在NVFP4数据精度下,计算性能最高30 PFlops(每秒3亿亿次),“一口气”可以实现百万级token的推理。同时,在长上下文处理场景下,它的注意力性能相比GB300 NVL72提升了最高3倍。Rubin CPX还可以与NVIDIA Vera CPU和Rubin GPU协同工作,英伟达声称全机架版本 Vera Rubin NVL144 CPX 拥有 8 exaflops 的 AI 性能。Rubin CPX今天只是纸面宣布,正式推出要等到2026年底——你没看错,是明年底。NVIDIA日前透露,下代Rubin GPU、Vera CPU都已经在台积电完成流片,符合预期。
*免责声明:以上内容整理自网络,不代表半导体行业圈的观点和立场,仅供交流学习之用。如有任何疑问或异议,请留言与我们联系。
爆料|投稿|合作|社群
文章内容整理自网络,如有侵权请联系沟通
投稿或商务合作请联系xd211ic
有偿新闻爆料请添加微信
xd211ic