电子发烧友网报道(文/黄山明)在当前,GPU已经从最初的游戏图形渲染工具,逐渐演变为智能时代的核心。简单来说,如果没有GPU,今天我们所熟知的ChatGPT、自动驾驶、AI绘画等技术根本无法在合理的时间和成本内实现。近日,据媒体报道,上海棣山科技有限公司(以下简称“棣山科技”)对外披露其2nm高端AI GPU芯片最新研发进展。据悉,该公司自主攻关的这款芯片已达到国际前沿设计水平,目前核心研发工作仍处于原型验证关键阶段。国产2nm高端AI GPU公开资料显示,棣山科技成立于2021年,定位为专注高端半导体芯片研发与制造的高新技术企业,业务包括CMOS图像传感器、MEMS陀螺传感器以及高算力AI GPU。从此次该公司公布的AI GPU芯片来看,采用2nm工艺,FinFET/GAA混合制程加上Chiplet异构集成,搭载公司自主研发的棣山智核(DS-Core),核心晶体管数量达1700亿颗,芯片面积约800mm²,采用2.5D CoWoSL封装,拥有1700亿晶体管。报道称,经多轮严谨仿真测试验证,该芯片算力表现突出,其中FP32单精度算力可达50 TFLOPS,FP16半精度算力达100 TFLOPS,FP4低精度算力高达400 TFLOPS,可灵活适配不同精度需求的人工智能大模型训练、推理等高端算力场景。同时能效比较上一代产品提升40%,典型功耗控制在350W以内,每瓦算力可达142 GFLOPS,实现性能与能效的平衡。并且研发团队还攻克了HBM封装互联、超低延迟片间通信(<0.25ns/mm)、微流道高效热管理三大核心技术瓶颈,其中搭载的HBM4内存单颗容量达48GB,引脚速率超11Gb/s,内存带宽可达3.2TB/s,相较上一代HBM3E带宽提升约2.5倍,可满足大模型训练时海量数据的高速传输需求。还采用了微流道热管理技术,宣称热失控风险降低68%,芯片温度控制在85℃以下,以帮助解决2nm高密度芯片的发热问题。还支持NVLink 6兼容互连协议,单链路达1.6TB/s,能兼容主流CUDA生态。这也是棣山科技在2025年首款自研2nm AI GPU原型芯片完成设计的第三阶段,但值得注意的是,截至目前为止,这颗芯片仍未进入正式流片阶段,未完成从设计到实体芯片的关键跨越。主要原因在于受到先进制程代工、EDA工具适配、量产良率爬坡等行业共性挑战的影响,棣山科技原计划在2025年底完成流片前验证,到2026年Q1实现量产,但这一目标显然已经延后。从行业的常规流程来看,高端AI芯片从原型验证到流片测试,再到量产良率提升,最后到客户导入及规模化商用,通常需要1-2年的时间。即便是英伟达的产品迭代周期也在10-24个月,例如从Hopper架构到Blackwell架构也经历了约2年的研发和验证周期。这意味着这颗国产AI GPU,想要实现量产,至少也需要等待2028年,并且还有几个巨大的难题需要解决。PPT造芯?尽管对于国内企业推出的高端AI GPU感到振奋,但理论和实际往往有着巨大的区别。目前棣山科技的这颗2nm AI GPU仍然存在于设计阶段,但问题在于当前全球公开量产最先进制程掌握在台积电/三星手中,2nm工艺在业内仍处于试产阶段,并且EDA工具、IP授权、关键工艺模块都受到了严格的出口管制。尤其是EDA,目前支持GAA的最新版EDA软件早已对华禁止出口, 而2nm工艺涉及复杂的量子效应和物理场分析,没有Synopsys或Cadence的顶级工具支持,纯靠国产EDA或旧版工具设计出1700亿晶体管的复杂芯片,成功率极低。而在国内的公开信息中,没有任何成规模的2nm产线公开宣布投产,那么棣山科技的这颗芯片要如何进行制造呢?并且Chiplet、2.5D/3D 封装(CoWoSL等)虽然国内有布局,但成熟度与台积电差距仍较大。棣山科技在这种情况下,能否拿到台积电的2nm产能?在没有公开技术路线和第三方验证的情况下,便宣称其“2nm AI GPU已达到国际前沿设计水平”,这一点值得商榷。另一方面,棣山科技宣称使用HBM4显存,带宽达3.2TB/s,但HBM4目前主要由SK海力士、三星和美光垄断,高端HBM显存属于美国对华出口管制的重点对象。国产HBM产业链虽然在发展,但要在2026年量产高性能HBM4,技术难度极高,目前尚未有成熟的公开量产消息。此外,NVLink是英伟达的专有互连技术,公开资料中各代协议和带宽都有明确版本,但是NVLink 6兼容在公开信息里几乎没有什么先例,更多是面向内部的生态。即使真有合作或者授权,通常也会在英伟达官方渠道或合作伙伴名单中看到痕迹,但这里面并未有棣山科技的身影。至于CUDA兼容,本身就可以通过自己的编译器/中间层实现,但真正好用、性能无损地跑主流框架和模型,需要大量工程和生态投入。国内目前公开的国产GPU宣布CUDA兼容的很多,但真正在生产环境大规模替代英伟达的案例极少,更多是能跑,但是迁移成本很高。也就是说,目前棣山科技所公布的这款产品,只是一个早期芯片项目,用作纸面设计、架构研究和仿真验证,是完全合理的。但是将2nm/GAA/HBM4/NVLink 6这种级别的指标,在未流片阶段就大规模对外宣传,很容易误导外界以为很快能量产,这与实际技术成熟度严重脱节。并且令人疑惑的是,天眼查显示公司参保人数为0(2024年报),即便后来有扩张,也说明团队规模和项目体量未必能够支撑2nm AI GPU 这种顶级工程的快速推进。总结如果从物理定律上来看,这颗芯片是可能的,但目前产品还主要停留在设计阶段,尚无第三方验证的实物与测试结果。它更像是一个展示技术的产品,对外披露国内企业在架构设计上的能力。但从现实角度来看,目前并不适合将其当做接近量产的产品,更不要基于这些宣传来做重大商业决策。声明:本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱wuzipeng@elecfans.com。更多热点文章阅读点击关注 星标我们将我们设为星标,不错过每一次更新!喜欢就奖励一个“在看”吧!