
近年来,缺乏可供出租给客户的服务器一直是云服务提供商反复面临的问题。

微软公司的数据中心产能紧缩问题将比该公司先前概述的持续更长时间,这凸显了这家软件巨头在跟上云需求方面的困难。
据熟悉该公司内部预测的人士透露,微软在美国的许多数据中心区域正经历物理空间或服务器的短缺。这些要求匿名的消息人士称,在明年上半年,包括北弗吉尼亚州和德克萨斯州在内的一些关键服务器集群中心,Azure云服务的新订阅将受到限制。
这一时间框架比该公司先前概述的要长。今年7月,首席财务官艾米·胡德(Amy Hood)曾表示,当前的限制将持续到2025年底。消息人士称,产能短缺不仅影响了通常用于人工智能的、运行图形处理单元(GPU)的机器,也影响了以中央处理单元(CPU)为主导的数据中心,而CPU长期以来一直是传统云服务的主力芯片。
Azure是微软最重要的增长引擎——该云部门在2025财年创造了超过750亿美元的收入。其扩张速度已超过其最大的竞争对手亚马逊公司(Amazon.com Inc.)和Alphabet旗下的谷歌。
近年来,缺乏可供出租给客户的服务器一直是云服务提供商反复面临的问题。在过去六次的季度财报电话会议上,微软都表示无法满足所有客户的云需求。亚马逊和谷歌也描述了类似的限制。
一位微软发言人表示,美国大多数Azure服务和区域“都有可用容量,以便已部署工作负载的现有客户可以继续增长”。发言人称,在某些意外的需求高峰情况下,公司将引入“容量保留方法”,以平衡其数据中心集群中的客户需求。

Azure客户根据物理邻近性和可用的软件来选择数据中心区域。据熟悉内部指导方针的人士称,当首选设施缺乏空间时,微软的销售人员会将客户引导至其他有容量的区域。但熟悉这项工作的人士表示,这些变通方法可能会增加复杂性,并延长数据在服务器集群和客户之间传输的时间。
Hexaware Technologies的云与合作伙伴关系全球主管Apurva Kadakia表示,在某些情况下,遇到Azure容量问题的客户会转向其他服务商。他说,一些客户会利用多个Azure区域,或者在更多容量可用之前仅将关键工作负载发送到云端。
“我们的团队会定期与大客户合作,围绕像节假日这样的需求高峰进行规划,以引导他们到最合适的区域”和产品,微软发言人说。“在客户面临成本或延迟增加的特殊情况下,微软将对他们的额外费用进行补偿。”
传统云需求同样紧张
微软一直在进行历史性的建设热潮以使数据中心上线——在过去一年中增加了超过2吉瓦(gigawatt)的容量,大约相当于胡佛大坝的发电量。
“自从ChatGPT和GPT-4推出以来,要足够快地建设容量几乎是不可能的,”首席技术官凯文·斯科特(Kevin Scott)在10月初表示。“即使是我们最雄心勃勃的预测,也经常被证明是不够的。”
对AI的巨大计算需求是新数据中心需求的主要驱动力。但微软在传统云基础设施方面的需求也面临紧缩,这些基础设施支撑着互联网上的各种应用程序和网站。
据熟悉公司运营的人士称,对于这些基于CPU的工作负载,OpenAI是微软最大的客户。
从初步规划到启动服务器,一个数据中心的上线可能需要数年时间。据熟悉流程的人士称,数据中心的几个关键组件,从半导体本身到像变压器这样的电力基础设施,都存在交付时间长的问题。
消息人士称,对于希望在供应紧张的Azure区域增加额外容量的关键客户,可以有例外。在美国以外,可用性要好得多。例如,微软在欧洲的许多区域可以无限制地处理新的客户订阅。
在7月的财报电话会议上,首席财务官胡德表示,持续的供应短缺是由于需求不断增加。“天哪——我在1-月份就谈到过这个问题,并说我认为到6月份我们的供需状况会更好,”她在7月的电话会议上说。“而现在我说——我希望到12月份我们的状况能更好。”
9月18日,微软表示,计划在美国威斯康星州建造第二个大型人工智能数据中心,使其在该州的总投资额超过70亿美元。这个耗资40亿美元的新项目,将与去年宣布的位于该州东南部芒特普莱森特的一个价值33亿美元的数据中心相邻。
微软表示,首个数据中心仍按计划于明年开放,在建设高峰期将雇佣约500人,待第二个数据中心建成后,总员工数将扩大至约800人。该公司称,随着第二个大规模数据中心的加入,该地点最终将容纳世界上最强大的人工智能超级计算机,连接数十万颗来自英伟达的强大芯片。





