
随着直接在设备上运行人工智能的“设备端人工智能”(On-Device AI)市场呈现爆炸式增长,内存处理(Processing in Memory,PIM)作为针对此环境优化的硬件技术脱颖而出。海量数据带宽对于在设备内流畅运行大型语言模型(LLM)至关重要,而集成了自身计算能力的PIM被视为解决这一瓶颈的救星。为了在设备端人工智能市场占据领先地位,三星电子和SK海力士正投入大量资源开发PIM技术。
12日在韩国科学技术院首尔校区举行的“第一届AI-PIM半导体研讨会”上,两家韩国国内半导体公司并排展示了智能存储器研究的现状和未来战略。
三星电子引领“LPDDR6-PIM”标准化,基于模拟器演示
三星电子将技术的普适性和生态系统标准化作为其竞争武器。
三星电子高级工程师李锡汉介绍了软硬件集成模拟器“LPDDR5X-PIM Sim”。通过该模拟器,三星电子展示了在虚拟环境中运行PIM技术并显著降低数据传输功耗,从而提高了整体能效。
“对于客户或SoC制造商而言,从零开始学习和应用全新的PIM指令是一大障碍,”这位高级工程师解释道。“‘LP5X-PIM Sim’模拟器的关键特性在于,它在设计之初就保持了自HBM-PIM时代以来建立的相同标准协议(BCPP)兼容性,从而能够在虚拟环境中实现数据类型(FP16、BF16、INT32)和布局兼容性的无缝预匹配,而无需实际的半导体器件。”
这位高级官员特别提出了下一代“LPDDR6-PIM”的具体标准化展望。
他表示,“JEDEC(国际半导体标准组织)工作组目前正在讨论LPDDR6-PIM的标准化”,并预测,“未来将会出现一场有趣的竞争,指令集标准将像过去的x86 CPU市场一样共享,但内部架构设计将完全取决于各个供应商(例如三星和SK)的能力和战略。”
SK海力士专注于“注意力加速”……凭借双级处理器突破产能极限
SK海力士奉行务实且以应用为导向的策略,专注于加速LLM运行环境中负载最重的核心计算领域。其自主研发的“GDDR6-AiM”架构便是一个典型的例子,该架构专门加速占推理过程80%至90%的“注意力计算”。通过对数据库内部数据进行复用,该架构实现了16倍的内部带宽提升,并将能效提高了近4倍。
特别是,SK 海力士通过直接生产“AX 系统”(一种 PCIe 卡形式的加速器基础设施)来证明其性能,从而打破了全球客户的准入门槛,这些客户不愿轻易将主控制器更换为未经验证的内存。
SK海力士团队负责人崔海朗强调:“我们通过软件层面控制双层GDDR6系统,成功突破了GDDR6标准规范的限制,将容量扩展至32GB。如果全面应用于物理芯片,性能提升幅度可达标准系统的12倍。”
商业化面临的“制造挑战”,包括物理变化和网格设计
然而,在当天举行的研讨会上,两家公司的官员都表示,PIM半导体要进入全球商业化和大规模生产,还有一些挑战必须解决。
这位高级主管指出了DRAM的物理变化以及计算单元集成带来的权衡取舍。
他透露:“随着计算模块被放置在内存内部,DRAM芯片面积增大,导致成本上升,而电网无法承受瞬时大规模计算带来的冲击,功率下降和波动也必然伴随而来。” 他补充道:“尤其值得注意的是,由于计算过程中产生的热量会加剧DRAM单元的数据泄漏,因此,除非在系统电源管理半导体(PMIC)容量扩展或封装阶段的散热控制方面得到充分的研究支持,否则很难实现实际的商业化。”
点这里👆加关注,锁定更多原创内容
*免责声明:文章内容系作者个人观点,半导体芯闻转载仅为了传达一种不同的观点,不代表半导体芯闻对该观点赞同或支持,如果有任何异议,欢迎联系我们。
推荐阅读

喜欢我们的内容就点“在看”分享给小伙伴哦~![]()
