电子发烧友网综合报道,受零部件成本持续高企的影响,全球算力荒引发的AI服务涨价潮仍在持续。当地时间4月14日,Claude母公司Anthropic调整了旗下企业级产品Claude Enterprise订阅模式,从每月每用户最高200美元的固定费用,转变为按照实际算力消耗收费,此外用户每月还需要固定缴纳20美元——软件授权谈判协助公司Redress Compliance联合创始人Fredrik Filipsson表示,对于重度用户而言,新定价可能导致成本翻倍甚至三倍。 国内方面,阿里云也在四天内连发三条产品涨价公告,调整百炼部分模型单元服务价格:比如百炼的MU模型单元服务价格方面,在包年包月的模式下,III型模型单元从原来的每月63000元/个调整到每月65969元/个,涨价幅度约5%;IV型模型单元每月的价格从19000元/个上涨到19914元/个,涨幅也约为5%;V型模型单元则从每月9500元/个涨价到每月10139元/个,涨幅高达7%。 在Anthropic和阿里之前,腾讯云、百度智能云、科大讯飞以及智谱等AI大厂已纷纷官宣了涨价。早在今年3月,百度智能云便将AI 算力相关产品服务价格上调了约 5%-30%,并行文件存储等服务价格上调约 30%;科大讯飞则于3月底便将智算平台AI推理服务涨价8%;智谱今年以来也已经经过了3次提价;4月9日,腾讯云也宣布了AI算力、容器、EMR价格全线上调5%的消息。 AI服务费的持续高企,背后是持续井喷的Token消耗需求。国家数据局局长刘烈宏在今年3月24日的国新办新闻发布会上就曾披露:“到今年3月,我国日均Token的调用量已超过140万亿,相比2024年初的1000亿增长了1000多倍,相比2024年底的100万亿,三个月时间又增长了40%多。” 即便如此,现阶段的Token消耗量也尚未达到真正的高潮。从目前国内应用最为火爆的即梦AI上就可一窥端倪,笔者实际体验发现,现阶段即便是即梦会员用户,日常生成视频的排队时间都长达数小时,有的时候甚至长达一天时间,使用高峰期数千甚至一万人排队的情况并不少见,这也凸显出当前Token的消耗量依然有继续攀高的趋势,同时也进一步暴露出AI大模型服务商现有的算力规模远不足以满足市场需求的痛点。 即便现阶段AI大模型厂商想扩充算力,也需要付出比以往更大的投入成本。根据半导体研究机构Semi Analysis发布的数据,英伟达H100一年期租赁合同价格从2025年10月的低点1.70美元/小时/GPU飙升至2026年3月的2.35美元/小时/GPU,短短半年时间涨幅近40%,该指数是Semi Analysis基于对100多家云服务商、算力买家与卖家的月度直接调查构建。 尽管价格上涨,但相关GPU租赁容量都已全部售罄,且AI加速卡销售量也持续狂飙。IDC数据显示,2025年中国市场AI加速卡总出货量约为400万张。英伟达出货约220万张,市场份额55%;AMD出货约16万张,市场份额4%。中国本土厂商合计出货约165万张,市场份额约41%。其中,华为出货约81.2万颗AI芯片,约占整体市场20%,接近国内供应商总出货的一半。阿里巴巴旗下平头哥以约26.5万颗居次,市场份额约7%。百度昆仑芯与寒武纪各约11.6万颗,并列第三。因此,现阶段,除了采购AI加速卡需提前排队下单之外,想要寻找其他新的GPU算力租赁资源也难上加难,不仅价格高昂且几乎无余量可选。 另一方面,是存储价格的持续飙涨。高带宽内存(HBM)存储如今处于绝对的卖方市场,2026年第一季度存储价格翻倍。具体来看,根据集邦咨询数据,2026年第一季度,常规DRAM合约价涨幅达90%—95%,NAND Flash合约价涨幅达55%—60%;进入第二季度,涨价态势仍在延续,DRAM合约价预计环比再涨58%—63%,NAND Flash涨幅进一步扩大至70%—75%。而存储芯片产能的扩张通常需要3年左右,即便考虑到厂商已提前布局,至少也需要1-2年才能有效缓解供给压力。因此接下来,即便中间可能会有阶段性的价格回调,但长期来看围绕着存储的超级市场周期依然会持续。 总之,Token消耗需求的火爆将继续引导全球AI芯片和存储市场延续当前的疯涨势头,直至AI算力资源与Token消耗规模最终达到一个动态平衡为止。但短期来看,受全球AI芯片和存储芯片产能的限制(主要是先进制程和CoWoS先进封装产能),加之各种零部件成本持续高企,算力依旧会是当下AI大模型巨头竞相角逐且最难获得的战略级资源,作为各路AI巨头算力规模扩张必需品的AI芯片与存储芯片,也将跟随着整个产业的上行而加速腾飞,并成就一个又一个“AI造富神话”。