HBM迎头赶上!国产AI芯片飞跃

电子发烧友网 2025-09-22 07:00
电子发烧友网报道(文/黄晶晶)近日,阿里平头哥AI算力卡PPU在央视新闻被曝光,在“国产卡与NV卡重要参数对比”表格中显示,其PPU在显存、片间带宽等多项硬件参数均超越英伟达A800,介于英伟达A800和H20之间。

根据报道,平头哥PPU采用HBM2e显存,单卡显存容量96GB,片间带宽为700GB/s,采用PCIe5.0×16通道接口,单卡功耗为400W。英伟达A800显存同样采用HBM2e,单卡显存80GB,片间带宽400GB/s,接口规格是PCIe4.0×16,功耗400W;而H20的显存和片间带宽更强,单卡96GB HBM3显存,片间带宽为900GB/s,采用PCIe5.0×16接口,但功耗较高为550W。

另外还有,华为昇腾910B单卡采用64GB HBM2显存,片间带宽392GB/s,接口为PCIe4.0×16,功耗350W;壁仞104P单卡搭载32GB HBM2e显存,片间带宽256GB/s,采用PCIe5.0×16接口,功耗为300W。

我们可以看到,相当水平的AI算力卡,它们的存储规格基本在HBM2/2e、HBM3这一阶段。

资讯配图

HBM对于AI芯片的重要性

高带宽内存HBM是一种基于3D堆栈技术的DRAM,通过TSV(硅通孔)和芯片堆叠架构实现高速数据传输与低能耗特性。该技术由三星、AMD和SK海力士共同提出,2013年SK海力士首次量产HBM芯片,2015年首次应用于AMD Fiji GPU。

随着 AI模型向千亿、万亿级等大参数、以及 FP8/FP4 高精度低比特计算方向演进,传统内存方案已无法满足数据传输效率需求AI 计算需反复调用海量参数如 GPT-3的1750亿参数需占用数百GB内存,且计算单元呈大规模并行架构,每秒需从内存读取/写入TB级数据。若数据供给不及时,会造成芯片实际性能大幅低于理论峰值。

HBM在AI服务器GPU中成为主流解决方案,是当前AI算力芯片突破性能瓶颈的核心关键技术,其3D堆叠技术有效提升内存带宽并减少延迟。

HBM六代产品演进

目前HBM总共有六代产品,分别为HBM1、HBM2、HBM2E、HBM3、HBM3E、HBM4。SK海力士于2013年首次开发HBM DRAM(第一代)产品,随后以HBM2(第二代)、HBM2E(第三代)、HBM3(第四代)的顺序开发。

2018年SK海力士发布第二代HBM产品HBM2,2020年发布第三代产品HBM2E是HBM2的扩展版本,HBM2E速度更快、容量更大、散热性能更高。

SK海力士于2021年10月推出全球首款HBM3,并在2022年6月实现量产。该款HBM3每个引脚传输速率达6.4Gbps,1024位宽接口,最高带宽可达819GB/s,较HBM2E(460GB/s)高约78%。16Gb内核密度、尖端的TSV垂直堆叠技术,满足了系统对更高密度的要求,该技术可实现12层堆叠内存立方体,从而实现最大24GB封装密度。

2024年,SK海力士全球率先开始量产 8/12层HBM3E,实现了现有HBM产品中最大的36GB容量。11月4日,海力士正式宣布开发全球最大容量16层堆叠HBM3E。

资讯配图
图源:SK海力士
SK海力士2025年9月宣布,已成功完成面向AI的超高性能存储器新产品HBM4的开发,并在全球首次构建了量产体系。这次全新构建量产体系的HBM4采用了较前一代产品翻倍的2048条数据传输通道(I/O),将带宽扩大一倍,同时能效也提升40%以上。凭借这一突破,该产品实现了全球最高水平的数据处理速度和能效。公司预测,将该产品引入客户系统后,AI服务性能最高可提升69%,这一创新不仅能从根本上解决数据瓶颈问题,还可显著降低数据中心电力成本。

与此同时,此次HBM4实现高达10Gbps(每秒10千兆比特)以上的运行速度,这大幅超越JEDEC标准规定的8Gbps(每秒8千兆比特)。公司在HBM4的开发过程中采用了产品稳定性方面获得市场认可的自主先进MR-MUF技术和第五代10纳米级(1b)DRAM工艺,最大程度地降低其量产过程中的风险。

华为自研HBM

根据华为近日在全联接大会2025上公布的信息,昇腾950PR芯片架构新增支持低精度数据格式,其中FP8/MXFP8/HIF8: 1 PFLOPS,MXFP4: 2 PFLOPS,重点提升向量算力,提升互联宽带2.5倍,支持华为自研HBM高带宽内存,分为HiBL 1.0和HiZQ 2.0两个版本。HiBL 1.0容量128GB,带宽1.6TB/s。HiZQ 2.0容量144GB,带宽4TB/s。

昇腾950PR芯片采用950核心+HiBL 1.0内存,可提升推理Prefill(预填充)性能,提升推荐业务性能。昇腾950DT采用HiZQ 2.0内存,可提升推理Decode(解码)性能,提升训练性能,提升内存容量和带宽。

根据规划,2026年第一季度将推出昇腾950PR,2026年第四季度计划推出昇腾950DT。2027年第四季度将推出昇腾960芯片,预计在各项规格上相比前代产品将有大幅提升。2028年第四季度规划推出昇腾970芯片,这将是该系列中的高端产品,预计在算力和互联带宽等方面实现全面升级。

远见智存HBM2/2e已完成终试

此前有报道,深圳远见智存成功实现HBM2e芯片量产,并计划于2025年春节前后初步完成下一代HBM3/HBM3e前端设计。

远见智存成立于2023年拥有一支由行业精英组成的团队,团队成员在HBM技术方面具有深厚的积淀和丰富的经验。据介绍,通过技术创新,公司成功绕开TSV(Through-Silicon Via)及CoWoS(Chip-on-Wafer-on-Substrate)等关键技术瓶颈,使得HBM2e的国产化得以顺利实现。

同时,远见智存依规提供符合高堆叠JEDEC标准的HBM产品,并整合国内高端封装资源,推出自主可控的HBM3/3e产品,为AI训练芯片产业注入动力。

针对远见智存的HBM存储芯片的研发进度,目前公开信息显示,中天精装间接持有深圳远见智存股权,穿透计算的持股比例为6.71%。中天精装表示,公司参股企业深圳远见智存科技聚焦高带宽存储芯片(HBM)领域,目前HBM2/2e产品已完成终试,正在推动量产和升级;HBM3/3e处于研发阶段,已完成前期预研和部分设计工作。

另外,今年7月,赛博格机器人与芯玑半导体和量子芯云联合推出内置DNPU和LPDDR5的存算一体化芯片和全球首颗移动HBM。

随着AI大模型向更大参数、更多模态演进,HBM与AI 芯片将深度绑定,HBM的技术迭代将为AI算力推波助澜。

资讯配图

声明:本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。


更多热点文章阅读


点击关注 星标我们



将我们设为星标,不错过每一次更新!
资讯配图

资讯配图喜欢就奖励一个“在看”吧!

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 芯片
more
芯报丨甲骨文计划与Meta达成200亿美元AI云计算协议
首创双NPU架构一鸣惊人!联发科天玑9500重磅加码主动式AI体验
百年不遇!3.7万亿AI基建砸下,美国人也坐不住了
AI智能机器人独角兽,100%控股宝马子公司!
E周视界:中望新LOGO正式发布;Figure AI估值达390亿美元;英伟达入股英特尔...
英伟达 GB10 与 DGX Spark 开启 AI 战略新阶段
Credo:刷新高速互连极限,为AI引擎铺设实时“光”跑道
快讯|周鸿祎直播试吃机器人炒菜;优必选与富士康云智汇达成战略合作;OpenMind开源全球首个AI原生开源机器人系统发布
行业资讯 I Meta AR眼镜供应链收益远高于AI眼镜;RayBan 和 Oakley 智能眼镜允许外部开发人员接入其应用程序
AirPods Pro 3开售即陷质量争议:多用户首日使用遇耳塞断裂…
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号