
【区角快讯】据3月13日披露的消息,英伟达将于3月16日至19日在美国加州圣何塞举办年度GTC大会,届时预计将推出至少两款重量级新品:一款聚焦AI推理的LPU芯片,以及下一代GPU架构“Feynman”。
该架构延续了英伟达以著名科学家命名的传统,致敬物理学家理查德·费曼。尽管其名称早在去年路线图中已出现,但当时仅透露将搭配新一代HBM内存,细节极为有限。
最新信息显示,Feynman GPU将率先采用台积电A16制程——全球首个1.6nm级工艺节点,并首次引入SRP背面供电技术。此举不仅可提升晶体管密度与运算性能,还能增强供电效率,主要面向高性能计算(HPC)场景。
然而,A16工艺的代工成本高昂。有消息称,为控制开支并提升产能弹性,英伟达正考虑将部分封装订单转移至英特尔,采用其EMIB-T封装方案,而非完全依赖台积电的CoWoS技术。
性能跃升的同时,功耗挑战亦不容忽视。当前Blackwell架构单卡功耗已逼近1000瓦,双芯版Blackwell Ultra更高达1400瓦;Feynman单卡功耗预计也将突破1000瓦,双芯版本或接近2000瓦。伴随高功耗而来的散热压力,促使液冷成为必然选择——此前Vera Rubin平台已全面转向液冷,Feynman大概率将沿用并优化该方案。
另据爆料,Feynman可能整合Groq的LPU技术。但分析指出,鉴于该架构设计或已定型,完整集成LPU存在时间冲突;且英伟达更倾向于将LPU发展为独立产品线,以区分训练与推理两类差异化AI负载需求。
值得注意的是,尽管Feynman性能强悍,但其定位面向2028年数据中心市场。消费级游戏显卡短期内仍将基于Rubin架构,预计2027年下半年推出,而搭载Feynman的游戏GPU最早也要等到2029年。
在AI算力竞赛白热化的当下,英伟达通过制程、架构与系统级创新持续构筑技术护城河,但高功耗与供应链多元化的平衡,将成为其下一阶段的关键课题。