重磅！高通发明全新内存架构：带宽提升54倍

　　6月26日消息，现在AI算力越做越强，但一直有个绕不开的瓶颈就是“内存墙”。简单来说，内存带宽提升速度跟不上算力消耗速度，就算是HBM高带宽内存，很多时候也顶不住压力，而且HBM发热问题越来越棘手。

　　高通在投资者交流会上亮出了一套全新架构HBC，也就是高带宽近内存计算架构，打算用这套方案破解内存墙，针对部分AI任务实现性能近乎同步上涨。

　　HBC的设计思路并不难懂：把原本集成在SoC芯片里的AI加速器单独拆分出来，叠在LPDDR内存堆栈下方，依靠TSV硅通孔技术直接连通。这么设计之后，数据延迟能压到和SRAM差不多的水平，同时保留堆叠内存容量大、集成度高的优势。对比HBM方案，它不用硅中介层，省去复杂封装工序，成本更低，功耗和发热也能得到明显控制。

　　当然论极限带宽、最大存储容量，HBC还是比不上HBM，高通也没有放出具体实测数据。不过能效优势很突出，单位功耗下的带宽能达到HBM的5到7倍，存储容量更是芯片内置SRAM的200倍以上。

　　这种近内存计算的思路并不是高通第一个想到的，不少存储厂商都做过相关研发，只是一直没能大批量商用落地。比如ASIC设计企业智邦集成电路（GUC）前段时间推出DoL技术，可以在逻辑芯片上堆叠1至4层DRAM，带宽最高接近5TB/s，性能甚至比一部分HBM3E产品更好。

　　按照高通的产品规划，旗下Dragonfly飞龙系列AI加速器，今年会推出AI200型号，搭配常规LPDDR5X内存，最大容量43TB，风冷、液冷两种散热方式都能用。第一款搭载HBC架构的AI250要等到明年推出，最大容量依旧是43TB，有效带宽相比AI200最多提升18倍。第二代HBC产品AI300则安排在后年发布，官方暂时没有公布具体容量，主要优化拓展能力，带宽相比AI200最高能提升54倍。