梦晨 发自 凹非寺
量子位 | 公众号 QbitAI
马斯克“巨硬计划”(MACROHARD)新动作曝光:
6个月从0建起算力集群,已完成200MW供电规模,足以支持11万台英伟达GB200 GPU NVL72。
仅用6个时间,完成了OpenAI和甲骨文等合作花费15个月完成的工作,再次创造纪录。
在回答网友提问时,马斯克透露Colossus II算力集群正是与巨硬计划有关。

虽然尽管名字带有对微软的戏谑意味,但马斯克对这件事是认真的,而且最早从2021年就有这个想法了。

其核心逻辑为:既然软件公司不生产实体硬件,那么从编码、设计、测试到管理的全部流程,理论上都可以被AI复制。
“巨硬”将基于xAI的大型语言模型Grok构建多智能体系统。马斯克透露,项目将部署数百个专门的智能体,有的专精于编码,有的负责图像视频生成,有的专注软件测试。它们将协同工作,模拟一个完整的软件开发团队。
系统还会模拟人类用户在虚拟机中与正在开发的软件进行交互,通过不断的迭代和反馈来打磨产品。整个软件开发生命周期,从最初的需求分析、产品设计、编码实现,到质量保证和用户测试,都将由AI智能体自动化完成。
那么要让数百个复杂的AI代理同时工作并进行大规模软件模拟,没有超强算力是不可能实现的。
Colossus II正是为此存在。
史无前例的算力巨兽
关于xAI的Colossus I大家已经很熟悉,仅用122天建成约20万台H200 GPU的算力集群,随后的92天内将规模翻倍至20 万台GPU。
Colossus I至今仍是规模最大的AI训练算力集群。

现在马斯克正按“第一性原理”把成功经验迁移到到Colossus II,规模扩大几十倍,这次是为了AI推理。
Colossus II项目于2025年3月7日启动,当时xAI在孟菲斯收购了一座100万平方英尺的仓库和两块相邻地块,总面积达100英亩。
马斯克在7月份表示,部分机架已经开始安装。
到8月22日,现场已经安装了119台风冷式冷水机组,提供约200MW的冷却能力,足以支持约11万个GB200 NVL72 GPU。
按照规划,Colossus II第一阶段将部署11万个英伟达GB200 GPU,最终目标是超过55万个GPU,峰值功率需求预计超过1.1吉瓦。
更长远的路线图甚至计划将GPU总量扩展至100万个。
为解决巨大的电力需求,xAI采用了跨区域能源策略。
由于在孟菲斯当地获取吉瓦级电力面临阻力,xAI索性在州界对面的密西西比州收购了一座前杜克能源的发电厂。密西西比州监管机构已临时批准xAI在该地块运行燃气轮机长达12个月,无需正式许可。目前该发电厂已有7台35MW的涡轮机在运行。
为了在部署速度上超过竞争对手,xAI依赖租赁的燃气涡轮机。供应商Solaris Energy Infrastructure(SEI)拥有600MW的燃气涡轮机,其中约400MW目前服务于xAI,占67%。双方新成立的合资公司(Solaris持股50.1%,xAI持股49.9%)已在2025年第二季度投入1.12亿美元的资本支出。
另外,为避免对当地电网造成冲击,xAI还在Colossus II场址部署了168个特斯拉Megapack电池储能系统,在用电高峰期提供电力支持,确保当地居民不会遭遇停电。
马斯克亲自督战,项目进入冲刺阶段
就在昨天,马斯克晒出一份疯狂的工作日程表:
周五晚上和Optimus工程团队熬夜工作,乘红眼航班飞往奥斯汀,凌晨5点到达,醒来后和孩子们共进午餐 整个周六下午都在进行特斯拉AI5芯片设计的深度技术评审。 周一飞往Colossus II,走遍整个数据中心楼层,审查变压器和电力生产(进展出色),午夜离开。” 接着是长达12小时与特斯拉各个部门的会议,重点在AI/自动驾驶,机器人生产和汽车生产/交付。

可以看出,巨硬已经成为马斯克商业版图中的关键一环。
特斯拉已将自身定位为“AI机器人公司”,未来80%的价值在机器人,巨硬开发的AI软件可用于优化特斯拉的自动驾驶算法、工厂自动化和人形机器人Optimus的功能。反过来,特斯拉海量的真实世界数据将为巨硬提供宝贵的训练数据。
参考链接:
[1]https://x.com/elonmusk/status/1967800687431127265
[2]https://semianalysis.com/2025/09/16/xais-colossus-2-first-gigawatt-datacenter/
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
🏆 年度科技风向标「2025人工智能年度榜单」评选报名开启啦!我们正在寻找AI+时代领航者 点击了解详情
❤️🔥 企业、产品、人物3大维度,共设立了5类奖项,欢迎企业报名参与 👇
一键关注 👇 点亮星标