
【科技24时区】周三,谷歌云正式揭开了其第八代定制AI芯片——张量处理单元(TPU)的神秘面纱。与以往不同,这一代产品不再“一芯多用”,而是采取了更为精细化的分工策略:TPU 8t专攻模型训练,而TPU 8i则聚焦于推理任务。所谓推理,即用户提交提示词后模型持续运行的过程,也是当下AI应用落地的核心环节。
从纸面参数来看,这两款新芯片的性能提升堪称激进。谷歌宣称,相比前代产品,TPU 8t能将AI模型训练速度提升最高3倍;而在性价比方面,整体每美元性能提升了80%。更令人瞩目的是集群扩展能力,单个集群可容纳超过100万颗TPU协同工作。这意味着,在提供海量算力的同时,能耗与客户成本将大幅降低。值得注意的是,尽管名为TPU而非GPU,但这源于其早期基于Tensor架构的低功耗设计传统,并非对图形处理单元的简单模仿。
然而,若据此断言谷歌正在向英伟达发起全面进攻,恐怕还为时过早。事实上,包括微软、亚马逊在内的其他云巨头,自研芯片更多是作为英伟达体系的补充,而非替代。谷歌甚至明确承诺,今年晚些时候将在其云平台上线英伟达最新的Vera Rubin芯片。这种“左右互搏”的策略背后,折射出当前AI基础设施市场的复杂生态:虽然超大规模云服务商(Hyperscalers)纷纷下场造芯,试图减少对单一供应商的依赖,但在现阶段,押注英伟达衰落仍是一笔不划算的买卖。
知名芯片市场分析师帕特里克·摩尔黑德曾在X平台上调侃道,早在2016年谷歌发布首款TPU时,他就曾预测这将对英伟达(及英特尔)构成利空。然而现实给了这一预言一记响亮的耳光——如今英伟达市值已逼近5万亿美元大关。从某种角度看,只要谷歌等云厂商的AI业务持续增长,即便部分负载运行在自研芯片上,最终也会带动整个数据中心基础设施的需求,从而间接利好英伟达。毕竟,蛋糕做大了,切蛋糕的人自然也能分到更多。
更具深意的是,谷歌与英伟达的关系并非简单的零和博弈。双方已达成协议,共同优化计算机网络技术,以提升英伟达系统在谷歌云中的运行效率。具体而言,两大科技巨头正联手强化名为“Falcon”的软件定义网络技术。该技术由谷歌于2023年在开放计算项目(OCP)下开源,旨在解决大规模数据中心内的通信瓶颈。这种“既竞争又合作”的微妙平衡,或许才是当下AI芯片战场的真实写照。