GPU成本高企、显存墙难破,国产存储如何推动AI普惠化进程?

全球半导体观察 2025-10-16 13:33


当前,AI应用市场的爆发式增长正在催生对高性能存储的巨大需求,但高昂的GPU采购成本和难以逾越的“显存墙”,却使许多渴望创新的企业望而却步。面对这种结构性挑战与增长机遇并存的产业现状,国产存储新势力如何凭借新的系统级思维破局?


为了探寻“从存储入手实现AI项目降本增效”的创新路径,我们与铨兴科技eSSD产品线副总经理邱创隆和AI产品总监王瑜琨进行了深度对话,共同解码AI时代下存储的系统级创新与成本致胜的底层逻辑。



重塑价值:

存储成为TCO和效率的核心驱动力


在AI的浪潮下,存储的价值被彻底颠覆。铨兴科技eSSD产品线副总经理邱创隆指出,过去存储像是一个IT系统里的“仓库”,是配角。然而,随着AI训练和推理负载的加重,存储不再仅仅是数据容器,它已成为提升AI系统效率、降低总体拥有成本(TCO)的关键战略环节


GPU成本高企、显存墙难破,国产存储如何推动AI普惠化进程?图2

△铨兴科技eSSD产品线副总经理邱创隆


邱创隆进一步阐明,AI时代存储模组厂商主要扮演着“承上启下”的关键作用。这要求企业必须洞察AI数据流五个阶段(数据读取、数据准备、模型训练、模型推理、数据归档)的差异化需求,将主控和闪存芯片进行深度调优和验证,确保企业提供给客户的是符合未来应用趋势的解决方案。


AI工作流正在驱动存储产品走向进一步分化。邱创隆表示,单一的存储方案已无法实现最优的成本效益,因此铨兴科技提供了层次清晰、精准匹配应用场景的eSSD产品矩阵,为不同需求的企业提供“速度阶梯”。



在AI推理(Inference)和检索增强生成(RAG)的应用阶段,负载特性显著转向“读取密集型”,对容量和总体拥有成本(TCO)的要求达到极致。为此,铨兴科技推出了高密度的 PCIe 5.0 QLC eSSD系列,其容量高达122.88TB,并具备14,000MB/s 的顶级顺序读取速度。这款百TB级容量产品,相较传统硬盘能带来6倍的容量提升,不仅能显著节省机柜空间和电力消耗,更从根本上优化了AI应用长期运行的TCO


GPU成本高企、显存墙难破,国产存储如何推动AI普惠化进程?图3


GPU成本高企、显存墙难破,国产存储如何推动AI普惠化进程?图4


而针对AI训练和HPC负载要求严苛的“混合读写”性能和高可靠性需求,铨兴则提供了旗舰级的 PCIe 5.0 TLC eSSD系列。该系列具备超14GB/s的连续读速和高达3300K的随机IOPS,提供极致的性能保障。同时,该产品还创新性地配备了Dual Port(双端口)设计,能为长时间、不间断的AI训练任务提供企业级的可靠性与高可用性保障。



系统革命:

“以存强算”,突破GPU显存墙


尽管通过eSSD产品矩阵解决了AI数据流在容量和速度上的分化需求,但对于大模型部署而言,显存墙仍是AI普惠化最难逾越的障碍。


铨兴科技AI产品总监王瑜琨指出,AI模型参数的增长速度已远远甩开顶级显卡显存的线性扩容,形成了难以跨越的结构性鸿沟。他援引数据强调:过去几年模型规模暴涨了约10倍,而显存容量仅微增2到3倍。鉴于模型规模在未来只会继续指数级攀升,对显存的爆炸式需求,使得传统“算力派”直观堆叠天价显卡的策略,不仅带来了巨额的硬件采购成本,也注定无法长久支持行业未来AI普惠化的目标。


GPU成本高企、显存墙难破,国产存储如何推动AI普惠化进程?图5

铨兴科技AI产品总监王瑜琨


因此,铨兴科技则选择了更具战略价值的“系统派的折叠梯”战略,推出了“添翼AI 超显存融合解决方案”。王瑜琨进一步表明,该方案的核心在于“以存强算”的软硬一体架构,这一架构由两大部分紧密耦合而成。


GPU成本高企、显存墙难破,国产存储如何推动AI普惠化进程?图6


硬件基础是一块专为AI负载设计的“添翼AI扩容卡”。它本质上是给GPU加装了一个超高速、高寿命的“外挂”缓存,将单卡的等效显存容量有效扩展了 20倍,从而解决了传统闪存的寿命瓶颈。



软件核心则是“AI Link算法平台”。该平台通过高度并行化的冷热存储智能调度,能够自主判断下一步运算所需数据,提前将存储在扩容卡中的“冷数据”高效搬运到GPU的“热环境”中,最终突破了带宽墙的限制 。


这种系统级的架构重构带来了惊人的效益。王瑜琨透露,以训练 671B参数大模型为例,原先需要 168张顶级显卡(部署成本大于4200万元)的任务,如今仅需16张中阶显卡+ 8张添翼扩容卡(造价不到200万元)即可胜任。这使得企业的训练成本可锐减约95%,同时模型推理的并发性能还能获得高达50% 的提升,实现了成本与效率的双重突破


王瑜琨明确指出,面对显存的结构性挑战,行业必须采纳更为高效的折中方案。他强调,将更大规模的模型参数迁移至Flash闪存上,是推动AI普惠化进程、实现成本效益的未来必然趋势。



国产AI的底气:

从显存突破到全体系兼容性


为了将技术转化为生产力,铨兴推出了覆盖全场景的“Super AI”训推一体机系列(涵盖PC、工作站和服务器),旨在将AI普惠化下沉到中小企业、研究机构乃至个人。凭借显著的成本优势,“添翼AI”解决方案已经在高校教学、政务、法律等垂直行业实现了成功落地。


与此同时,铨兴始终将多平台兼容性作为产品的基础。其eSSD产品矩阵的广泛适用性已通过了包括飞腾(Phytium)、龙芯(Loongson)、海光(Hygon)、兆芯在内的多家国产CPU平台和联想、新华三、宁畅、超云、长城、金舟远航等服务器平台的验证,以及中泰证券、北京邮电大学等行业客户的严格验证。这确保了无论是基础存储还是AI加速方案,都能在主流计算环境中稳定运行,为“Super AI”系列方案的推广奠定了坚实的基础。


对于行业未来,铨兴科技采取了eSSD产品矩阵持续升级和存算深度耦合技术集成两条清晰的迭代路线。


邱创隆副总经理披露了铨兴科技在存储产品升级方面的路线图。他预计,存储产业明年 PCIe 5.0 将取代4.0成为市场主流。在此背景下,铨兴科技计划在明年下半年推出下一代速度更快的 PCIe 6.0接口产品,以持续巩固其在高性能存储市场的地位。


针对AI存算融合的长期趋势,王瑜琨认为,“以存强算”将毫无疑问成为AI行业的主流,并与算力实现更深层次的集成。他指出,从技术前景看,未来随着PCIe 7.0等技术的逐步落地,闪存的带宽将更加接近DDR5,而容量却能达到数十倍,这将从根本上为AI普惠化奠定技术基础。


基于此,铨兴科技制定了清晰的长期目标:到2026年,实现将200B规模的模型部署到一台PC中,达成万元以下的千亿模型部署;到2027年,则计划将万亿级别的参数搬到个人PC中,最终推动AI的广泛普惠。


结 语


随着AI浪潮深入产业腹地,基础设施的成本与效率已成为决定其应用广度的胜负手。铨兴科技凭借eSSD产品矩阵的持续升级和“添翼AI超显存融合解决方案”的系统级创新,成功打通了“算力”与“存储”之间的结构性瓶点。这不仅为AI大模型部署提供了一条成本锐减90%的新路径,更将万亿参数模型由云端拉向了终端,极大地拓宽了AI技术的应用范围。


放眼业界,在AI普惠化的时代背景下,“以存强算”和“软硬协同”已成为全球存储厂商共同发力的创新赛道。各方正积极探索创新介质和深度算法,致力于突破显存价格的高墙,推动AI应用真正普及。


 



点击下图,获取更多企业级存储&AI解决方案↓



声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI GPU 存储
more
88天创最快纪录!国产GPU第一股呼之欲出
深度解析:从英伟达与xAI的20亿美元交易,看懂AI巨头如何用GPU印钞
英伟达下一代GPU,巨幅升级!
与OpenAI签订巨额合作,博通股价大涨!剑指英伟达——ASIC 替代 GPU!
英特尔发布新款GPU
聊聊大模型推理系统之Hetis:如何让“高低配”GPU集群跑出2.25倍吞吐?
北极雄芯GPU芯粒点亮
刚刚,国产GPU龙头IPO过会!
刚刚,全球首个GB300巨兽救场!一年烧光70亿,OpenAI内斗GPU惨烈
国产领军全功能 GPU “风华3号” 重磅发布,多个第一赋能千行百业人工智能+
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号