
全球顶尖的两款模型——Anthropic的Claude 4.5 Opus与谷歌自身的Gemini 3,其训练和推理基础设施主要部署于谷歌TPU和亚马逊Trainium之上。如今,谷歌开始向多家企业实体销售TPU硬件。这是否预示着英伟达主导地位的终结?
人工智能时代已至,关键在于理解:AI驱动软件的成本结构与传统软件存在根本性差异。芯片微架构与系统架构对这些创新软件的开发与规模化扩展起着至关重要的作用。与传统软件更依赖于开发人力成本不同,AI软件所依托的硬件基础设施对资本支出与运营支出的影响显著增大,进而直接影响毛利率。因此,投入大量精力优化AI基础设施以部署AI软件变得尤为关键。在基础设施上占据优势的企业,于部署和扩展AI应用的能力上也必将赢得先机。
谷歌早在2006年便已提出构建专用AI基础设施的构想,但问题在2013年激化。他们意识到,若要规模化部署AI,需将数据中心数量翻倍。为此,他们着手为TPU芯片研发奠定基础,该芯片最终于2016年投产。值得注意的是,亚马逊在同一年也认识到定制芯片的必要性。2013年,亚马逊启动了专注于优化通用CPU计算与存储的“Nitro项目”。两家截然不同的公司,为适应不同计算时代与软件范式,各自优化了其基础设施的建设路径。
我们长期认为,TPU是全球最卓越的AI训练与推理系统之一,与业界霸主英伟达并驾齐驱。两年半前我们曾论述TPU的优越性,这一观点已被证明相当正确。
TPU的成果有目共睹:世界顶级模型之一的Gemini 3完全基于TPU训练而成。本报告将探讨谷歌战略的重大转变——即积极推进TPU对外商业化,使其成为英伟达最新且最具威胁的商用芯片挑战者。
我们计划:
• 向客户与新读者(重新)阐述外部TPU客户迅速增长的商业成功案例,从Anthropic开始,延伸至Meta、SSI、xAI乃至潜在的OpenAI。
• 证明:购买越多(TPU),则节省越多(英伟达GPU资本支出)!OpenAI虽尚未部署TPU,但因竞争压力已在其计算集群上获得约30%的折扣,从而提升了总拥有成本效率。
• 阐释AI基础设施领域的循环经济交易模式。
• 重温我们早前的TPU深度分析,更新从芯片到软件层的TPU硬件堆栈知识。
• 介绍开放软件生态的积极进展,以及谷歌欲使TPU生态成为CUDA护城河有力挑战者所缺失的关键一环:开源其XLA:TPU编译器、运行时及多pod“MegaScaler”代码。
• 同时分析对英伟达构成的长期威胁。
首先,探讨此消息对生态的影响。TPU的性能已引起竞争对手的密切关注。萨姆·奥特曼承认,由于Gemini抢占了风头,OpenAI将面临“艰难时期”。英伟达甚至发布安抚性声明,呼吁各方保持冷静、继续前行——声称自身仍遥遥领先于竞争。

来源:英伟达
我们理解其缘由。过去数月,谷歌DeepMind、GCP及TPU体系捷报频传:TPU产量预期大幅上修、Anthropic超1吉瓦的TPU建设规模、基于TPU训练出的顶尖模型Gemini 3与Opus 4.5,以及不断扩大的目标客户群(Meta、SSI、xAI、OAI)排队采购TPU。这推动了对谷歌及TPU供应链价值的重估,其代价则是以英伟达GPU为核心的供应链。尽管谷歌与TPU供应链的“突然”崛起令许多人意外,但SemiAnalysis机构产品订阅者在过去一年已对此有所预见。

来源:SemiAnalysis 与 彭博社
英伟达处于守势的另一原因,是日益增多的怀疑论者指责其通过资助亏损的AI初创公司来支撑“循环经济”,实质是经过额外步骤将资金从一账户转移至另一账户。我们认为此观点有失偏颇,但它显然触动了英伟达的神经。其财务团队已发布详细回应,转载如下。

来源:英伟达FY26Q3财报问答,伯恩斯坦研究
我们认为更现实的解释是:英伟达旨在通过股权投资(而非降价)来维护其在头部实验室的主导地位,因降价会侵蚀毛利率并引发投资者普遍恐慌。下文我们将概述OpenAI与Anthropic的相关安排,展示头部实验室如何通过购买或威胁购买TPU来降低GPU总拥有成本。

来源:SemiAnalysis TCO模型、Anthropic与OpenAI
OpenAI甚至尚未部署TPU,便已在其整个实验室的英伟达集群上节省了约30%成本。这证明TPU在单位总拥有成本上的性能优势如此显著,以致于在实际启用前,用户便能从中获益。
我们的加速器产业模型、数据中心产业模型及核心研究订阅者,在此消息公布并成为市场共识前,便已洞察其行业影响。八月初,我们向加速器模型客户指出,观察到供应链中对博通/谷歌TPU的2026年订单出现大规模上修。我们同时揭示,订单增长源于谷歌将开始向多家外部客户销售系统。九月初,我们披露Anthropic将成为主要外部客户之一,需求至少100万颗TPU。该信息于十月获Anthropic与谷歌官方证实。我们亦在11月7日(早于其他机构数周)指出Meta将成为TPU大客户。此外,我们还讨论过其他潜在客户。
因此,我们的机构客户得以提前洞察这场迄今为止AI领域最大规模的市场表现分化之一。在后文中,我们将进一步深入探讨这笔交易。
原文媒体:SemiAnalysis
原文作者:Dylan Patel; Myron Xie; Daniel Nishball