电子发烧友网报道(文/黄晶晶)近日,阿里平头哥AI算力卡PPU在央视新闻被曝光,在“国产卡与NV卡重要参数对比”表格中显示,其PPU在显存、片间带宽等多项硬件参数均超越英伟达A800,介于英伟达A800和H20之间。根据报道,平头哥PPU采用HBM2e显存,单卡显存容量96GB,片间带宽为700GB/s,采用PCIe5.0×16通道接口,单卡功耗为400W。英伟达A800显存同样采用HBM2e,单卡显存80GB,片间带宽400GB/s,接口规格是PCIe4.0×16,功耗400W;而H20的显存和片间带宽更强,单卡96GB HBM3显存,片间带宽为900GB/s,采用PCIe5.0×16接口,但功耗较高为550W。另外还有,华为昇腾910B单卡采用64GB HBM2显存,片间带宽392GB/s,接口为PCIe4.0×16,功耗350W;壁仞104P单卡搭载32GB HBM2e显存,片间带宽256GB/s,采用PCIe5.0×16接口,功耗为300W。我们可以看到,相当水平的AI算力卡,它们的存储规格基本在HBM2/2e、HBM3这一阶段。HBM对于AI芯片的重要性高带宽内存HBM是一种基于3D堆栈技术的DRAM,通过TSV(硅通孔)和芯片堆叠架构实现高速数据传输与低能耗特性。该技术由三星、AMD和SK海力士共同提出,2013年SK海力士首次量产HBM芯片,2015年首次应用于AMD Fiji GPU。随着 AI大模型向千亿、万亿级等大参数、以及 FP8/FP4 高精度低比特计算方向演进,传统内存方案已无法满足数据传输效率需求。AI 计算需反复调用海量参数,如 GPT-3的1750亿参数需占用数百GB内存,且计算单元呈大规模并行架构,每秒需从内存读取/写入TB级数据。若数据供给不及时,会造成芯片实际性能大幅低于理论峰值。HBM在AI服务器GPU中成为主流解决方案,是当前AI算力芯片突破性能瓶颈的核心关键技术,其3D堆叠技术有效提升内存带宽并减少延迟。HBM六代产品演进目前HBM总共有六代产品,分别为HBM1、HBM2、HBM2E、HBM3、HBM3E、HBM4。SK海力士于2013年首次开发HBM DRAM(第一代)产品,随后以HBM2(第二代)、HBM2E(第三代)、HBM3(第四代)的顺序开发。2018年SK海力士发布第二代HBM产品HBM2,2020年发布第三代产品HBM2E是HBM2的扩展版本,HBM2E速度更快、容量更大、散热性能更高。SK海力士于2021年10月推出全球首款HBM3,并在2022年6月实现量产。该款HBM3每个引脚传输速率达6.4Gbps,1024位宽接口,最高带宽可达819GB/s,较HBM2E(460GB/s)高约78%。16Gb内核密度、尖端的TSV垂直堆叠技术,满足了系统对更高密度的要求,该技术可实现12层堆叠内存立方体,从而实现最大24GB封装密度。2024年,SK海力士全球率先开始量产 8/12层HBM3E,实现了现有HBM产品中最大的36GB容量。11月4日,海力士正式宣布开发全球最大容量16层堆叠HBM3E。图源:SK海力士SK海力士2025年9月宣布,已成功完成面向AI的超高性能存储器新产品HBM4的开发,并在全球首次构建了量产体系。这次全新构建量产体系的HBM4采用了较前一代产品翻倍的2048条数据传输通道(I/O),将带宽扩大一倍,同时能效也提升40%以上。凭借这一突破,该产品实现了全球最高水平的数据处理速度和能效。公司预测,将该产品引入客户系统后,AI服务性能最高可提升69%,这一创新不仅能从根本上解决数据瓶颈问题,还可显著降低数据中心电力成本。与此同时,此次HBM4实现高达10Gbps(每秒10千兆比特)以上的运行速度,这大幅超越JEDEC标准规定的8Gbps(每秒8千兆比特)。公司在HBM4的开发过程中采用了产品稳定性方面获得市场认可的自主先进MR-MUF技术和第五代10纳米级(1b)DRAM工艺,最大程度地降低其量产过程中的风险。华为自研HBM根据华为近日在全联接大会2025上公布的信息,昇腾950PR芯片架构新增支持低精度数据格式,其中FP8/MXFP8/HIF8: 1 PFLOPS,MXFP4: 2 PFLOPS,重点提升向量算力,提升互联宽带2.5倍,支持华为自研HBM高带宽内存,分为HiBL 1.0和HiZQ 2.0两个版本。HiBL 1.0容量128GB,带宽1.6TB/s。HiZQ 2.0容量144GB,带宽4TB/s。昇腾950PR芯片采用950核心+HiBL 1.0内存,可提升推理Prefill(预填充)性能,提升推荐业务性能。昇腾950DT采用HiZQ 2.0内存,可提升推理Decode(解码)性能,提升训练性能,提升内存容量和带宽。根据规划,2026年第一季度将推出昇腾950PR,2026年第四季度计划推出昇腾950DT。2027年第四季度将推出昇腾960芯片,预计在各项规格上相比前代产品将有大幅提升。2028年第四季度规划推出昇腾970芯片,这将是该系列中的高端产品,预计在算力和互联带宽等方面实现全面升级。远见智存HBM2/2e已完成终试此前有报道,深圳远见智存成功实现HBM2e芯片量产,并计划于2025年春节前后初步完成下一代HBM3/HBM3e前端设计。远见智存成立于2023年,拥有一支由行业精英组成的团队,团队成员在HBM技术方面具有深厚的积淀和丰富的经验。据介绍,通过技术创新,公司成功绕开TSV(Through-Silicon Via)及CoWoS(Chip-on-Wafer-on-Substrate)等关键技术瓶颈,使得HBM2e的国产化得以顺利实现。同时,远见智存依规提供符合高堆叠JEDEC标准的HBM产品,并整合国内高端封装资源,推出自主可控的HBM3/3e产品,为AI训练芯片产业注入动力。针对远见智存的HBM存储芯片的研发进度,目前公开信息显示,中天精装间接持有深圳远见智存股权,穿透计算的持股比例为6.71%。中天精装表示,公司参股企业深圳远见智存科技聚焦高带宽存储芯片(HBM)领域,目前HBM2/2e产品已完成终试,正在推动量产和升级;HBM3/3e处于研发阶段,已完成前期预研和部分设计工作。另外,今年7月,赛博格机器人与芯玑半导体和量子芯云联合推出内置DNPU和LPDDR5的存算一体化芯片和全球首颗移动HBM。随着AI大模型向更大参数、更多模态演进,HBM与AI 芯片将深度绑定,HBM的技术迭代将为AI算力推波助澜。声明:本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。更多热点文章阅读半年5起并购引震动!高通、晶晨入局,AIoT芯片赛道洗牌开启被美国列入实体清单!复旦微强势回应的底气是什么?突破10Gbps带宽!车载光通信新品正登场,“光纤上车”成新趋势创346万美元众筹记录,扫雪机器人成现象级产品,电池、电机是关键突发!存储全面涨价!点击关注 星标我们将我们设为星标,不错过每一次更新!喜欢就奖励一个“在看”吧!