谷歌TPU 8代双芯齐发：训练推理分道扬镳，英伟达仍是“最大赢家”？

【科技24时区】周三，谷歌云正式揭开了其第八代定制AI芯片——张量处理单元（TPU）的神秘面纱。与以往不同，这一代产品不再“一芯多用”，而是采取了更为精细化的分工策略：TPU 8t专攻模型训练，而TPU 8i则聚焦于推理任务。所谓推理，即用户提交提示词后模型持续运行的过程，也是当下AI应用落地的核心环节。

从纸面参数来看，这两款新芯片的性能提升堪称激进。谷歌宣称，相比前代产品，TPU 8t能将AI模型训练速度提升最高3倍；而在性价比方面，整体每美元性能提升了80%。更令人瞩目的是集群扩展能力，单个集群可容纳超过100万颗TPU协同工作。这意味着，在提供海量算力的同时，能耗与客户成本将大幅降低。值得注意的是，尽管名为TPU而非GPU，但这源于其早期基于Tensor架构的低功耗设计传统，并非对图形处理单元的简单模仿。

然而，若据此断言谷歌正在向英伟达发起全面进攻，恐怕还为时过早。事实上，包括微软、亚马逊在内的其他云巨头，自研芯片更多是作为英伟达体系的补充，而非替代。谷歌甚至明确承诺，今年晚些时候将在其云平台上线英伟达最新的Vera Rubin芯片。这种“左右互搏”的策略背后，折射出当前AI基础设施市场的复杂生态：虽然超大规模云服务商（Hyperscalers）纷纷下场造芯，试图减少对单一供应商的依赖，但在现阶段，押注英伟达衰落仍是一笔不划算的买卖。

知名芯片市场分析师帕特里克·摩尔黑德曾在X平台上调侃道，早在2016年谷歌发布首款TPU时，他就曾预测这将对英伟达（及英特尔）构成利空。然而现实给了这一预言一记响亮的耳光——如今英伟达市值已逼近5万亿美元大关。从某种角度看，只要谷歌等云厂商的AI业务持续增长，即便部分负载运行在自研芯片上，最终也会带动整个数据中心基础设施的需求，从而间接利好英伟达。毕竟，蛋糕做大了，切蛋糕的人自然也能分到更多。

更具深意的是，谷歌与英伟达的关系并非简单的零和博弈。双方已达成协议，共同优化计算机网络技术，以提升英伟达系统在谷歌云中的运行效率。具体而言，两大科技巨头正联手强化名为“Falcon”的软件定义网络技术。该技术由谷歌于2023年在开放计算项目（OCP）下开源，旨在解决大规模数据中心内的通信瓶颈。这种“既竞争又合作”的微妙平衡，或许才是当下AI芯片战场的真实写照。