6月26日消息,现在AI算力越做越强,但一直有个绕不开的瓶颈就是“内存墙”。简单来说,内存带宽提升速度跟不上算力消耗速度,就算是HBM高带宽内存,很多时候也顶不住压力,而且HBM发热问题越来越棘手。
高通在投资者交流会上亮出了一套全新架构HBC,也就是高带宽近内存计算架构,打算用这套方案破解内存墙,针对部分AI任务实现性能近乎同步上涨。
HBC的设计思路并不难懂:把原本集成在SoC芯片里的AI加速器单独拆分出来,叠在LPDDR内存堆栈下方,依靠TSV硅通孔技术直接连通。这么设计之后,数据延迟能压到和SRAM差不多的水平,同时保留堆叠内存容量大、集成度高的优势。对比HBM方案,它不用硅中介层,省去复杂封装工序,成本更低,功耗和发热也能得到明显控制。
当然论极限带宽、最大存储容量,HBC还是比不上HBM,高通也没有放出具体实测数据。不过能效优势很突出,单位功耗下的带宽能达到HBM的5到7倍,存储容量更是芯片内置SRAM的200倍以上。

这种近内存计算的思路并不是高通第一个想到的,不少存储厂商都做过相关研发,只是一直没能大批量商用落地。比如ASIC设计企业智邦集成电路(GUC)前段时间推出DoL技术,可以在逻辑芯片上堆叠1至4层DRAM,带宽最高接近5TB/s,性能甚至比一部分HBM3E产品更好。
按照高通的产品规划,旗下Dragonfly飞龙系列AI加速器,今年会推出AI200型号,搭配常规LPDDR5X内存,最大容量43TB,风冷、液冷两种散热方式都能用。第一款搭载HBC架构的AI250要等到明年推出,最大容量依旧是43TB,有效带宽相比AI200最多提升18倍。第二代HBC产品AI300则安排在后年发布,官方暂时没有公布具体容量,主要优化拓展能力,带宽相比AI200最高能提升54倍。
