公众号记得加星标⭐️,第一时间看推送不会错过。

人工智能的发展并非仅仅取决于GPU的计算能力。无论人工智能芯片的性能多么强大,如果无法以足够快的速度提供必要的数据,其全部潜能都无法得到充分发挥。
正是在这种情况下,HBM、DRAM 和 NAND 闪存等存储技术变得至关重要。
目前的AI系统采用多层架构,将高带宽HBM(高带宽内存模块)紧邻GPU放置,DRAM位于外部,最上层则是大容量SSD。然而,随着AI模型规模的不断扩大,传统的内存配置已无法满足需求。
HBM速度快但价格昂贵,且容量有限。DRAM速度也很快,但在功耗和容量方面存在挑战。另一方面,NAND闪存容量大、成本低,但速度比DRAM慢。
我们如何才能弥合内存性能方面的差距?
为了应对这一挑战,主要专注于 NAND 闪存的铠侠公司开始向新的方向发展。
全球DRAM市场由三星、SK海力士和美光三家公司主导。考虑到它们拥有悠久的制造技术、巨额资本投入和大规模生产能力,新公司很难与它们正面竞争同类产品。
铠侠(Kioxia)是一家最初专注于NAND闪存的公司。虽然它在智能手机、固态硬盘和数据中心存储中使用的闪存方面拥有先进技术,但直到现在,它都还不是DRAM市场的主要参与者。
铠侠正在开发“OCTRAM”,这是一种采用氧化物半导体的下一代DRAM技术。
然而,这并非仅仅是铠侠直接进入现有的DDR DRAM和HBM市场的问题。
当前的人工智能系统开始需要比传统NAND闪存速度更快,但又不像HBM那样昂贵的内存。这是因为HBM无法存储所有数据,而且从普通固态硬盘读取数据也越来越不足以充分利用GPU的性能。
换句话说,需要在 HBM、DRAM 和 NAND 之间建立一个新的性能范围。
如果把铠侠的目标看作是这片空白区域,就更容易理解了。
OCTRAM改变了DRAM本身的结构,XL-FLASH使NAND更接近DRAM,而AiSAQ则改变了SSD的使用方式。这些技术本身各不相同,但它们有着共同的目标。
这意味着在人工智能时代,内存和存储层次结构需要以一种与我们以往所见不同的方式进行重组。
OCTRAM是“氧化物半导体沟道晶体管DRAM”的缩写。铠侠公司正与台湾南亚科技合作开发这项技术。
在传统的DRAM中,硅主要用作构成存储单元的晶体管的沟道材料。
相比之下,OCTRAM 使用一种名为铟镓锌氧化物(简称 InGaZnO)的氧化物半导体。
这种材料的关键特性是能够在晶体管关闭时最大限度地减少漏电流。
DRAM通过将电荷存储在电容器中,以0和1的形式存储信息。然而,这些电荷会随着时间的推移逐渐损耗。
因此,必须进行“刷新”过程,即在数据丢失之前多次读取和写入数据。
在典型的DRAM中,这种刷新过程会以极短的间隔重复进行。由于即使在内存未被使用时也会进行处理,因此会导致待机期间功耗增加。
OCTRAM已被证明能够保存数据超过100秒。
这并不意味着 OCTRAM 将完全消除刷新的必要性。但是,如果数据能够保留更长时间,刷新次数就可以显著减少。
在配备大量内存的人工智能服务器和数据中心中,即使每个内存单元的功耗很小,整体性能也会受到显著影响。OCTRAM之所以备受关注,不仅是因为它的性能,还因为它与人工智能时代日益严峻的功耗问题息息相关。
另一个特征是Cell面积。
OCTRAM 采用一种称为 4F² 的单元结构。F 代表半导体制造中的最小加工尺寸,4F² 代表单个存储单元所占的面积。
由于它比传统DRAM典型的6F²尺寸要小,因此可以在相同的面积内放置更多的单元。
换句话说,OCTRAM 是一种旨在降低功耗并提高内存密度的技术。
更重要的是它与 3D 堆叠的兼容性。
目前的NAND闪存之所以能实现高容量,是因为它垂直堆叠了存储单元。由于简单地缩小平面上存储单元的尺寸存在局限性,因此这项技术已经发展到垂直堆叠的方式,就像增加建筑物的楼层数一样。
铠侠是一家在该领域积累了多年技术的公司。
OCTRAM 已经证明,八层氧化物半导体晶体管可以堆叠并正常工作。这表明,DRAM(动态随机存取存储器)和 NAND 闪存一样,也可能能够垂直堆叠。
OCTRAM 的意义不仅仅是让传统的 DRAM 更节能一些。
通过使用氧化物半导体,可以抑制漏电流,缩小单元尺寸,并实现垂直堆叠。这项技术的关键在于它试图改变DRAM的固有结构。
然而,OCTRAM目前仍处于研发阶段。
虽然长期数据保持和8层堆叠技术是显著的成就,但这本身并不足以使其成为量产产品。在实际应用之前,仍存在诸多挑战,包括大规模生产的良率、重写耐久性、运行速度、制造成本以及与现有内存控制器的兼容性。
因此,现在就断言 OCTRAM 将立即取代当前的 DDR DRAM 和 HBM 还为时过早。
值得称赞的是,铠侠已经开始展现出将其在 NAND 中开发的 3D 堆叠技术扩展到下一代 DRAM 的路径。
铠侠的战略并非完全依赖于尚未商业化的OCTRAM。该公司还在努力提高其目前旗舰级 NAND 闪存的速度,并使其在人工智能系统中发挥更重要的作用。
XL-FLASH 就是一个绝佳的例子。
传统NAND闪存的主要优势在于容量大、成本低。但另一方面,它在高速读写小数据方面无法与DRAM相媲美。
XL-FLASH 是一种改进 NAND 闪存弱点的存储技术,可实现更低的访问延迟。
从定位上看,它更接近存储级内存,介于 DRAM 和典型的 NAND 闪存之间。
虽然速度不如DRAM,但比普通固态硬盘快。此外,与DRAM相比,它更容易扩展容量并降低成本。
这种中等水平的性能在人工智能系统中正开始变得重要。
不可能将人工智能模型的所有数据都存储在 HBM 中。然而,不断地从标准 SSD 读取数据会增加 GPU 等待数据的时间。
这就引出了一个想法,即在 HBM 外部放置一个比普通 SSD 速度更快的大容量内存。
KIOXIA GP 系列固态硬盘于 2026 年发布,采用 XL-FLASH 技术,旨在支持 NVIDIA 的 Storage-Next 架构。
目标是直接从 GPU 访问高速闪存,并高效地提供 AI 处理所需的数据。
但这并不意味着 XL-FLASH 将取代 HBM。
HBM位于GPU附近,以极高的带宽提供数据。它们是影响AI加速器性能的核心内存组件,其作用难以替代。
XL-FLASH 的作用是在外部存储大量数据,并在需要时相对快速地将其传输到 GPU。
换句话说,他们试图通过使用闪存来弥补 HBM 容量有限的不足。
考虑到铠侠生产的产品与三星、SK海力士和美光的产品相同,并且在DRAM市场展开正面竞争,这种策略就很难理解了。
相反,如果将 OCTRAM、XL-FLASH 和 AiSAQ 视为旨在抢占 HBM、DRAM 和 NAND 之间新兴存储层的公司,那么它们之间的关系就更容易理解了。
高性能但昂贵的 HBM 本身无法支持不断增长的 AI 模型。
但是,如果把所有东西都放在速度慢的存储设备上,就无法利用 GPU 的性能。
如何利用技术弥合这一差距,对未来的人工智能基础设施至关重要。
铠侠正利用其在 NAND 闪存领域积累的堆叠技术、高容量和存储控制专业知识,瞄准尚未开发的市场领域。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
END
今天是《半导体行业观察》为您分享的第4438内容,欢迎关注。
推荐阅读
★
★
★
★
★
★
★
★

加星标⭐️第一时间看推送


