
·聚焦:人工智能、芯片等行业
欢迎各位客官关注、转发


数据洪流:AI时代的存储刚需
2025年,全球数据总量将攀升至175ZB,这一数字让任何传统存储方案都望而却步。
其中,视频、文本、图像等非结构化数据占比高达80%,且年均增长率保持在55%至65%的惊人水平。
在AI技术的推动下,各行各业的多模态数据正从PB级别向EB级别爆发式增长。
自动驾驶车辆每秒产生20GB感知数据,AI大模型训练需调用百万级病例切片等场景不断刷新着存储需求的上限。
传统HDD在这场数据洪流中逐渐力不从心。机械硬盘依赖物理磁头读写数据,吞吐量和延迟性能根本无法满足AI训练的高频需求。
一次AI气象预测需连续读取50PB历史数据,若用HDD,仅数据加载时间就可能拖慢整个训练进程;
在高频交易、自动驾驶等对延迟敏感的场景中,HDD的毫秒级延迟更是致命短板。
与HDD相比,SSD没有机械部件,数据通过电子信号传输,顺序读写速度可达7000MB/s以上,是高端HDD的数十倍;
随机访问延迟低至微秒级别,完美适配AI模型[即取即用]的数据调用需求。
实际应用中,采用SSD的AI数据中心数据流通效率提升3-4倍,让30年气象数据等历史资料从[囤积]状态快速转为[激活]状态,为AI训练提供即时支撑。
成本层面的优势也让SSD替代HDD的时机成熟。
虽然HDD仍保持单位存储成本的6倍价格优势,但在AI数据中心的全生命周期成本(TCO)计算中,SSD的优势逐渐凸显。
商用61.44TB大容量SSD单盘容量是HDD的2-3倍,配合压缩算法,单位容量成本仅为HDD的1.2倍;存储密度达2PB/2U,是HDD的近10倍,大幅节省机房空间。
按数据中心成本模型计算,SSD五年可降低70%功耗费用、节省90%空间费用,总体TCO与HDD基本持平,但性能提升3-4倍,还能减少70%运维人力成本,隐性成本优势十分突出。

面对AI带来的存储挑战,SSD行业正经历多维度技术跃迁,从存储介质到主控架构,从接口协议到传输方式,创新成果层出不穷,共同构筑起AI时代的存储基石。
在存储介质领域,QLC(四级单元)技术的崛起是最大亮点。
闪存技术从SLC(单级单元)、MLC(多级单元)到TLC(三级单元)再到QLC的演进,看似是每单元存储比特数的增加,实则是存储密度与成本控制的精妙平衡。
尽管QLC在理论性能上低于前代产品,但技术迭代让2025年的QLC SSD速度已超越2017年的TLC产品。
当前QLC SSD顺序读写速度达7000MB/s,完全满足AI模型的数据存储与调用需求。
预计2025年QLC SSD总产能的45%将应用于服务器领域,这背后是3D NAND堆叠技术的突破。
三星、SK海力士等企业已推出300+层堆叠NAND产品,2025年NAND产业将全面跨入300+层时代。
Solidigm采用192层3D NAND技术推出的61.44TB QLC SSD(D5-P5336),顺序读性能达7GB/s,顺序写性能为3GB/s;
其122.88TB QLC SSD计划于2025年上半年量产,国内厂商大普微也基于QLC介质推出61.44TB SSD(J5060),大容量QLC SSD正成为AI推理场景的理想之选。
主控芯片作为SSD的[大脑],其架构创新同样关键。
传统固态硬盘多采用ARM或专有架构,存在授权费用高昂、定制化难度大等问题,而RISC-V的开源特性为SSD带来了新的发展路径。
接口协议的升级为SSD性能释放开辟了新通道。
前端接口协议正从PCIe 3.0、4.0快速升级至PCIe 5.0,后者性能较前代翻倍。
SK Hynix的PS1010 PCIe 5.0 SSD顺序读取达15000MB/s,顺序写入为10200MB/s,已被多家AI数据中心采用。
更值得期待的是CXL协议的演进,CXL 3.0版本传输速率达64GT/s,实现设备与CPU间互联及存储计算分离;
支持CPU以低延迟高带宽访问更大内存池,突破DDR通道限制,扩展内存容量与带宽。
光学技术的融入让SSD突破了物理传输的边界。
光学固态驱动器利用光信号代替传统电信号传输数据,融合光学存储介质与半导体存储芯片,通过光纤或光波导实现数据读写。
相较于传统SSD,光学SSD的单通道带宽速度在PCIe 7.0光学方案下可达128GT/s,是当前PCIe 5.0 SSD的4倍;
光传输延迟控制在纳秒级别,适用于高频交易、人工智能训练等对低延迟要求高的场景;
同时具备强大的抗干扰能力,不受电磁干扰影响,散热性能更优,支持远程部署存储设备,有助于减少数据中心局部热密度问题。
铠侠与京瓷合作研发的PCIe 5.0光学SSD原型传输距离达40米,未来计划升级至PCIe Gen8及以上版本,传输距离将扩展到100米;
三星也在开发基于光学互连的SSD产品,目标支持PCIe 7.0及以上标准,传输距离同样可达100米,光学SSD正成为存储市场的关键力量。

AI数据中心的架构正在SSD的推动下发生根本性变革。
传统数据中心架构中,远程存储系统的数据传输导致GPU效率低下。
当GPU需要调用数据时,需从远端存储缓慢加载,大量计算资源在等待中被浪费。
而新型解决方案通过在服务器与数据湖之间部署高容量SSD,构建智能数据缓存层,使GPU能以[小数据包连续读取]方式高效获取数据块,显著提升计算资源利用率,让AI训练和推理效率实现质的飞跃。
全闪分布式存储成为这一变革的核心载体,它具备三大核心优势。
①弹性扩展能力,支持容量年增20%以上的线性增长,而HDD因技术局限需频繁升级。
②性能与容量同步增长,适配AI实时分析的低延迟、高吞吐需求,无论数据量如何增长,都能保持稳定的响应速度。
③高可靠性,当AI训练需调用百万级病例切片或50PB气象数据时,全闪存储确保数据长期稳定留存,成为AI基础设施的核心支撑。
硬件创新进一步夯实了全闪数据中心的根基。
商用61.44TB大容量SSD的普及,让单盘存储能力实现质的突破,配合先进的RAID技术和分布式算法,可构建EB级别的存储池;
华为OceanStor Pacific 9928通过动态休眠算法实现0.25W/TB的业界最低能耗,大幅降低数据中心的电力成本;
铠侠通过创新的CBA(CMOS直接键合到阵列)技术,在154球栅阵列(BGA)的小型封装中实现8TB容量,为高密度存储提供了新方案。
成本结构的优化让全闪数据中心的大规模部署成为可能。
虽然单块SSD的采购成本高于HDD,但全生命周期的综合成本优势显著。
以阿里云构建10PB存储方案为例,AI服务器若过度配置HDD以满足IOPS需求,会大幅增加TCO;而SSD功率密度更优,五年TCO可节省46%。
从[数据囤积]到[数据激活],全闪存储正在改变企业对待数据的方式。
过去,企业因存储性能限制,不得不将大量数据冷备份,难以充分挖掘价值;
而全闪存储让海量数据随时可用,AI模型能实时分析历史数据、挖掘隐藏规律,推动数据从成本中心转向价值中心。

未来已来:全闪存时代的重要发展方向
在容量方面,得益于3D NAND技术的持续突破,SSD单盘容量将不断攀升,128TB、256TB甚至1PB容量的SSD有望在未来几年成为现实。
SK Hynix开发300TB超大容量SSD的计划已提上日程,这将为EB级AI数据湖的构建提供硬件基础。
性能方面,PCIe 6.0、PCIe 7.0及CXL 3.0协议的普及将让SSD带宽持续提升,光学SSD技术的成熟则将突破物理传输距离限制;
实现数据中心内100米级的高速存储互联,为分布式AI训练集群提供更灵活的存储架构。
存算一体化成为重要发展方向。
随着AI大模型参数规模持续扩大,数据搬运成本成为性能瓶颈,将计算能力融入存储设备的[以存代算]模式逐渐兴起。
华为、铠侠、美光及英伟达等企业均在发力这一方向,通过长记忆内存型存储优化推理体验并降低系统成本。
未来,SSD可能不仅是数据存储介质,更将承担部分简单计算任务,减少数据在存储与计算单元间的传输,大幅提升AI推理效率,这一技术变革有望重构AI服务器的硬件架构。
AI SSD的应用场景将进一步拓展。
除了数据中心,AI技术从云端向终端设备的迁移也利好闪存产业,智能汽车、边缘计算设备、工业互联网终端等都将成为SSD的新战场。

海量数据与AI的结合,正推动全闪存时代如洪流般汹涌而来。
头部厂商的集体发力推动AI SSD市场规模快速增长。
这场厂商竞逐不仅加速了技术创新,更推动AI SSD的成本持续下降、性能不断提升,为全闪存时代的到来注入强劲动力。
从技术突破到架构重构,从厂商竞逐到场景拓展,AI SSD的每一步发展都在为AI时代的存储需求提供支撑。
部分资料参考:雷科技:《在存储行业顶尖峰会CFMS上,我看到了[AI存储]的巨浪滔天》,全球半导体观察:《颠覆传统存储,SSD加速创新》,全球存储观察:《AI革命,分布式存储也在革命,全闪化拐点已至》,海峰看科技:《数据存储江湖风云变:SSD以快破阵,终结HDD时代》,中电标协数据存储专业委员会:《AI大模型时代,存储介质将如何演绎新方向?》,智研咨询:《全球及中国AI SSD行业发展现状及趋势分析》,半导体产业纵横:《AI SSD,热闹了起来》
本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。
推荐阅读:



商务合作请加微信勾搭:
18948782064
请务必注明:
「姓名 + 公司 + 合作需求」