公众号记得加星标⭐️,第一时间看推送不会错过。

AI 芯片市场正在出现一个重要变化:挑战英伟达的,不只是 AMD、博通、Cerebras 等传统或新兴芯片厂商,更是手握云计算入口、客户资源和资产负债表能力的云巨头。
亚马逊和谷歌正在把过去主要服务于自身云平台的定制 AI 芯片,推向更广阔的外部市场。这意味着,云厂商不再只是英伟达 GPU 的大客户,也开始试图成为 AI 基础设施的芯片供应商和系统方案提供者。
亚马逊正在与潜在客户谈判,计划将其自研 AI 加速器 Trainium 销售给其他公司的基础设施数据中心。亚马逊人工智能业务负责人 Peter DeSantis 表示,AI 基础设施正在快速演变,AWS 一直在寻找触达更多客户的方法。
Trainium 于 2020 年推出,最初主要通过 AWS 提供给客户调用。目前,包括 OpenAI、Anthropic 和 Uber 在内的公司都已使用这一硬件。亚马逊此前表示,与该芯片相关的 AI 基础设施需求已经带来了超过 2250 亿美元的营收承诺。亚马逊 CEO Andy Jassy 也曾在致股东信中明确表示,公司“极有可能”将成机架的芯片出售给第三方。
过去,亚马逊的自研芯片更多是 AWS 内部降本增效的工具,例如面向通用计算的 Graviton,以及面向 AI 训练和推理的 Trainium、Inferentia。但现在,亚马逊正在尝试把这些芯片从“云服务能力”变成“可外售的基础设施产品”。
DeSantis 表示,今年早些时候开始出货的第三代 Trainium 已经“基本售罄”,市场对预计明年亮相的第四代 Trainium 也已经表现出浓厚兴趣。对于外售芯片是否会蚕食 AWS 云业务的问题,他并不担心,理由是 AI 领域的算力消费需求仍远未被满足。
亚马逊之外,谷歌也在加速推动 TPU 商业化。TPU 最早是谷歌为内部 AI 任务开发的专用芯片,用于支撑搜索、推荐、语音识别和大模型训练等业务。随着 AI 算力需求激增,谷歌开始通过 Google Cloud 向外部客户开放 TPU,如今又进一步计划向特定客户直接交付芯片,供其在自有数据中心使用。
谷歌的打法不只是卖芯片,而是模仿英伟达近年来建立生态的方法:用资金、算力租赁、数据中心项目和核心客户绑定来扩大芯片落地规模。
在纽约州西部的 Lake Mariner AI 数据中心项目中,谷歌为相关项目提供了 32 亿美元的财务担保,项目开发商将向 Anthropic 出租搭载谷歌 TPU 的计算能力。谷歌还与黑石达成 50 亿美元交易,建立新的云服务公司,参与和 CoreWeave、Nebius 等英伟达生态云服务商的竞争。此外,谷歌还在路易斯安那州、得克萨斯州等地支持多个 AI 计算基础设施项目。
这套打法背后,是 AI 算力供给不足带来的市场窗口。过去,英伟达凭借 GPU 性能、CUDA 软件生态、网络互连和整机系统能力,几乎垄断了高端 AI 训练和推理市场。很多 AI 实验室和云服务商不仅需要购买英伟达芯片,还需要采购完整硬件栈,以确保性能、供货和生态兼容。
但随着 AI 竞赛变成一场算力军备竞赛,客户开始寻找更多选择。成本、供货、数据主权、本地化部署以及供应链安全,正在成为非英伟达方案切入市场的重要理由。
亚马逊外售 Trainium 的一个重要背景,就是美国以外市场对本地化控制计算资源的需求上升。尤其在欧洲,“主权云”和“主权 AI”概念升温,部分政府和企业希望数据、模型训练和推理过程尽可能留在本地司法管辖范围内。这为亚马逊、谷歌等云巨头提供了新的商业切口:它们既可以提供云服务,也可以把自研芯片和系统交给本地数据中心或合作伙伴部署。
谷歌则更进一步,试图用资产负债表能力打开客户市场。相比一般芯片初创公司,谷歌拥有更强的资金实力、长期芯片研发积累,以及 Anthropic、Gemini 等模型生态资源。它既是英伟达客户,也是英伟达竞争对手;既在自家数据中心使用 GPU,也在推动 TPU 成为替代方案。
不过,这并不意味着英伟达的护城河会迅速瓦解。英伟达真正强大的地方,不只是芯片本身,而是 GPU、CUDA、NVLink、网络设备、服务器系统、软件库和开发者生态共同构成的完整平台。对于很多客户来说,切换到 TPU、Trainium 或其他 ASIC 方案,不只是采购另一颗芯片,而是要重新评估模型适配、软件迁移、工程效率和长期供货风险。
黄仁勋也多次强调,英伟达的市场触达能力和生态广度远超单一 TPU 或 ASIC 方案。换言之,英伟达并不认为云巨头自研芯片能在短期内撼动其核心地位。
但亚马逊和谷歌的进攻仍然值得重视。它们瞄准的并不是简单复制英伟达,而是在 AI 算力供不应求、客户成本压力上升、主权云需求扩张的背景下,切出一部分更适合定制芯片的市场。
对亚马逊而言,Trainium 外售意味着 AWS 自研芯片战略从“内部降本”走向“外部变现”;对谷歌而言,TPU 直销和数据中心融资意味着其正在把多年积累的 AI 硬件能力转化为更具侵略性的商业模式。
AI 芯片竞争正在从单点性能竞争,转向“芯片+云+资金+客户+数据中心”的系统竞争。英伟达仍然是这个市场最强的玩家,但它面对的对手,已经不再只是传统意义上的芯片公司,而是那些既有模型、又有云平台、还有资本能力的超级科技公司。
参考链接
https://www.wsj.com/tech/ai/google-is-using-nvidias-playbook-to-build-a-rival-ai-chip-business-1eac86f9
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
END
今天是《半导体行业观察》为您分享的第4442内容,欢迎关注。
推荐阅读
★
★
★
★
★
★
★
★

加星标⭐️第一时间看推送


