马斯克2GW超级电厂曝光,为xAI的100万块GPU买下整座发电厂,AI巨兽Grok算力将无限,跨海搬运!

智能情报所 2025-07-08 15:34

这座史诗级数据中心计划容纳100万个AI GPU,功耗或高达2吉瓦,与190万户家庭的用电量相当。

xAI Colossus Memphis Supercluster

 (图片来源:xAI)

一则震撼的消息得到了埃隆·马斯克的亲口证实。据半导体分析机构 SemiAnalysis 透露,马斯克旗下的 xAI 公司为应对下一代数据中心庞大的能源需求,已在海外购买了一座发电厂,并计划将其整体运至美国。该数据中心预计将容纳数百万个人工智能芯片,其能耗将是天文数字。

马斯克的 Colossus AI 超级计算机,已是当今全球最强大、也最耗电的机器之一。它内部署了约 20万块英伟达 Hopper GPU,耗电量高达惊人的 300 兆瓦。即便如此,为其保障电力供应已让 xAI 团队面临重重阻碍。

随着公司蓝图的推进,挑战只会愈发严峻。为下一代 AI 数据中心供电,是马斯克面临的一项艰巨任务——该中心预计将容纳 100万个AI GPU,其潜在功耗足以媲美 190万户家庭的用电总和。如此庞大的能源需求从何而来?马斯克又将如何化解?

为了推进其 Grok AI 大模型,xAI 已汇集了海量的计算资源和一支才华横溢的研究团队。然而,更艰巨的挑战,还在前方。

xAI 为现有数据中心供电已是焦头烂额,这早已不是秘密。其主力数据中心 Colossus 坐落于田纳西州孟菲斯附近,为了驱动其中 20 万块英伟达 Hopper GPU,xAI 不仅安装了 35 台总发电量达 420 兆瓦的燃气轮机,还部署了特斯拉 Megapack 储能系统来平抑用电峰值。但未来的局面,将远比现在严峻。

在 Colossus 之外,xAI 还在迅速收购和开发新设施。该公司已在孟菲斯购入一家工厂,正将其改造为新的数据中心空间,其规模足以支撑约 12.5万台八卡GPU服务器及其所有配套的硬件,包括网络、存储和冷却系统。

仅仅一百万块英伟达 Blackwell GPU,其基础功耗就将在 1,000兆瓦(1吉瓦)至1,400兆瓦(1.4吉瓦)之间,具体数值还取决于所用加速器的型号(如 B200, GB200 等)及其配置。

然而,GPU 远非唯一的“电老虎”。整个系统的能耗还必须计入CPU、内存、存储、网络、冷却、空调,以及电源自身效率损耗等诸多因素。在大型 AI 集群中,一个实用的估算方法是:这些配套设施的开销会在 GPU 功耗基础上再增加 30% 到 50%。这一指标在业内通常用电源使用效率(PUE)来衡量。

这意味着,若以 1.4 的 PUE 值计算,一个拥有百万级 GPU 的数据中心,其总功耗将攀升至 1,400兆瓦至1,960兆瓦。为一个用于 AI 训练和推理、拥有百万块高性能 GPU 的数据中心供电,其难度不亚于为近两百万户家庭提供电力。这个问题,该如何破解?

唯一的答案:自建发电厂?

对于如此规模、需要全天候不间断运行的计算负载,单纯依赖大型太阳能发电厂并不可行。这不仅需要数吉瓦的太阳能电池板阵列,还需要配备规模庞大的电池储能系统,其成本之高、占地之广令人望而却步。

最现实且普遍的选择,是建造多个联合循环燃气轮机(CCGT)发电厂。每个发电厂能产生 500 至 1,500 兆瓦的电力,部署速度相对较快(数年内即可完成),可分阶段扩展,且易于并入现有电网。xAI 计划进口到美国的,很可能就是此类设备。

至于核反应堆等替代方案,虽然单个机组(通常能产生约 1,000 兆瓦电力)就能满足需求且无直接碳排放,但其设计、审批和建造周期极为漫长,通常长达十年之久。因此,马斯克从海外购买并运回一座核电站的可能性微乎其微。

在现实中,任何试图部署 1.4至1.96吉瓦 级别项目的组织(如 xAI),都将摇身一变,成为一个举足轻重的工业级能源巨头。目前,Colossus 超级计算机已采用“现场发电+电网购电”的混合模式。因此,xAI 的下一座数据中心极有可能沿用此策略,即将专用的现场发电厂与电网连接相结合

显然,正是因为在美国本土获取发电厂的流程过于漫长,xAI 才选择从海外购买并整体运回。这一前所未有的举动深刻地揭示了一个新现实:人工智能竞赛的瓶颈,已不再仅仅是计算硬件和软件,更在于能否快速、稳定地确保大规模能源供应。

别无选择,唯有向前

为一个拥有百万 AI 加速器的数据中心配备一座专用发电厂,听起来像是一个极端的解决方案。然而,这恰恰是所有顶尖 AI 公司殊途同归的战略终局:集中化部署超大规模的计算集群,不惜代价招募顶尖人才,并训练日益庞大的 AI 模型。

因此,对于志在必得的 xAI 而言,建造更先进、更强大的数据中心,是其在这场终极竞赛中唯一的出路。


本期推荐其他阅读:

无需等待7月10日!Grok 4内部版跑分流出,HLE得分远超o3 Pro,SWE-Bench跑分75%震惊开发者社区

Grok 4基准测试被曝光,人类终极考试成绩拿下45%,O3和Gemini 2.5 Pro被远远甩开

刚刚,美国政府承认:硅谷科技巨头被电网卡住脖子,数万亿美元的的AI产业无电可用,矛盾该如何解?

500块GPU烧了4天,谷歌Deepmind的AI学会了自己设计AI,新架构NASNet横空出世

AI,当前GPT范式能走多远?OpenAI前董事万字演讲信息量巨大,你关心AI的未来在这三大辩论里


一键三连点赞」「转发」「小心心

欢迎在评论区留下你的想法!


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI GPU
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号