
【编者按】
本文深度剖析了xAI在算力竞赛中的战略布局,揭示其如何以惊人的速度建设超大规模AI训练集群“Colossus 2”,并挑战OpenAI、Meta等巨头。文章不仅探讨了xAI在资金、能源与数据中心建设上的“天才策略”,也分析了其商业模式、市场定位及独特的强化学习路径。旨在为读者呈现一幅xAI如何以“硬核”姿态冲击AI前沿的完整图景,并引发对AI行业未来格局的思考。
关于xAI的Colossus 1已有大量论述。孟菲斯建设项目已被载入史册:这是规模最大的人工智能训练集群,在122天内从零建成。该集群拥有约20万个H100/H200 GPU以及约3万个GB200 NVL72,至今仍是完全运行且单一连贯的最大集群(不包括擅长多数据中心训练的谷歌)。
然而,与OpenAI、Meta和Anthropic正在建设的千兆瓦级集群相比,Colossus 1的约300兆瓦功耗显得相对有限。这些公司的超大规模合作伙伴乐于利用其资产负债表,通过大量资金投入来赢得市场份额。
xAI的卓越表现是否仅为一次性的奇迹?今日,我们将公布过去一年中我们行业领先的数据中心模型的部分数据,这些数据可供客户访问。这正是我们专有的同一数据,它在甲骨文交易宣布前数月就已预测到该交易。

来源:SemiAnalysis数据中心行业模型——注:数据中心运行与GPU运行之间存在延迟——谷歌及具体数据可在模型中获取
关于上个问题的简短回答是“否”。xAI依然稳固地位于前沿AI竞赛中,并有望在计算能力上再次超越大多数竞争对手。根据我们的估计,到2025年第三季度,其单一训练集群的总数据中心容量将超过Meta Superintelligence和Anthropic。数据中心容量将为GPU的迁入做好准备,从而再次打造全球最大的单一数据中心。xAI需要为这些GPU筹集资金,但他们已获得英伟达的分配额度,以便在明年初全面训练大规模模型。
马斯克提出了一项高明的策略,以在上市时间上击败对手。Colossus 2将比xAI的第一个集群更令人印象深刻。让我们深入探讨。
本报告前半部分将深入分析Colossus 2的卓越性能。后半部分将讨论Grok模型、我们对xAI的中长期看法,以及xAI正在使用的独特强化学习方法,该方法可能使其超越OpenAI、Anthropic和谷歌。
Colossus 2:六个月内从零到200兆瓦
Colossus 2项目于2025年3月7日启动,当时xAI在孟菲斯收购了一个100万平方英尺的仓库和两个相邻地块,总计100英亩。截至2025年8月22日,我们统计到现场有119台风冷式冷却机,即约200兆瓦的冷却能力。这足以支持约11万台GB200 NVL72。而埃隆的一条推文显示,一些机架已在7月安装完毕。

xAI在六个月内建成了Oracle、Crusoe和OpenAI花费15个月才完成的项目!
仔细查看上图,熟悉我们数据中心解剖系列的读者可能想知道电力基础设施的位置。图片中没有显示任何现场变电站,也没有显示现场涡轮机……数据中心应该如何供电?
Colossus 2:位于田纳西州、密西西比州……还是两者兼有?
一旦考虑到大孟菲斯商会五月的声明,即不会有涡轮机设在孟菲斯,事情就更加令人困惑。他们并未说谎。孟菲斯和田纳西州遭遇了诸多阻力,因此xAI的高明之举是在边界对面的密西西比州南黑文开发一个千兆瓦级能源中心。2025年中,该公司收购了南黑文一座前杜克能源发电厂。不久后,密西西比州监管机构批准xAI在那里临时运行燃气涡轮机,最长12个月,无需许可!

为了输送和管理密西西比发电厂产生的电力,xAI正在Colossus 2附近建设基础设施。我们在下面展示了特斯拉Megapacks的首次部署,以及连接两个站点的中压电力线路。

从200兆瓦到1.1千兆瓦以及与Solaris Energy Infrastructure的合作
在密西西比州的南黑文,xAI正以极快速度推进。已停产的发电厂现在有七台35兆瓦涡轮机在运行。

为了比同行更快部署,xAI依赖租赁涡轮机公司。纽约证券交易所上市的Solaris Energy Infrastructure拥有600兆瓦的燃气涡轮机舰队,其中约400兆瓦目前服务于xAI。马斯克的公司占SEI 1700兆瓦订单簿的67%,即1140兆瓦。孟菲斯Colossus 1站点有约240兆瓦,而剩余的900兆瓦将由一家合资企业拥有,Solaris持股50.1%,xAI持股49.9%。

如下所示,约460兆瓦目前已安装并处于运行或建设中。

新成立的合资企业在2025年第二季度已支出1.12亿美元的资本支出。在缓慢的第三季度后,支出将在2025年第四季度和2026年第一季度再次增加。Solaris预计到2027年第二季度为xAI提供超过1.1千兆瓦的完全运行涡轮机。仍有约425兆瓦可供签约,我们认为xAI很可能采取行动以达到超过1.5千兆瓦的总电力。Solaris似乎还临时从第三方租赁发电能力以更快交付:
在第二季度,电力解决方案部门从约600兆瓦的容量产生收入,较前一季度增长超过50%。这一增长是由客户需求增加推动的,我们通过新设备交付以及选择性短期采购第三方发电能力来满足需求。

Solaris Energy Infrastructure,2025年第二季度
因此,xAI已经从电力角度找到了如何扩展到超过1千兆瓦的方法。在数据中心空间方面,我们看到四个选项:
·鉴于40英尺的高度,xAI可以将其100万平方英尺的仓库改造成两层数据中心,使空间翻倍。鉴于超高密度,200万平方英尺可能足以支持超过1千兆瓦。
·xAI可以在地块3建设第二个较小的设施。
·他们可以收购更多土地,可能在密西西比州南黑文电厂附近。
·使用非标准的数据中心布局,他们可以在现有条件下实现超过1千兆瓦。

xAI在Colossus 2站点拥有的土地地块
原文媒体:SemiAnalysis
原文作者:Jeremie Eliahou Ontiveros; Dylan Patel; Wei Zhou
原文链接:
https://newsletter.semianalysis.com/p/xais-colossus-2-first-gigawatt-datacenter
芯启未来,智创生态
