服务器芯片:AMD即将超越Intel,Arm自信满满

半导体行业观察 2025-07-16 08:53

公众号记得加星标⭐️,第一时间看推送不会错过。


来源:内容编译自semiengineering


过去十年,数据中心处理器市场经历了两次重大转变。


过去,所有数据中心的计算都是 x86 架构,其中超过 90% 都来自英特尔。GPU 于 2016 年首次出现在数据中心(Pascal GPU)。


现在,大多数计算都在 GPU 上完成。AMD 正努力在 x86 市场超越英特尔,而基于 Arm 的 CPU 则在 NVIDIA 和超大规模厂商的推动下快速增长。


AMD 正在数据中心 CPU 领域取代英特尔


AMD 正在迅速抢占英特尔在 x86 数据中心处理器领域的份额。



如上图所示,AMD 的份额目前为 40%,而 2018 年几乎为零。这是因为:


1. AMD 总裁兼首席执行官苏姿丰;

2. 苏姿丰决定转投台积电;

3. 其团队的出色执行力;

4. 英特尔失去半导体制程技术主导地位。


这些潜在因素不太可能很快改变,因此 AMD 很可能在 2026 年成为数据中心最大的 x86 CPU 供应商。(英特尔的 18A 在纸面上看起来可行,但该公司似乎在扩展节点和相关的财务限制方面遇到困难)。


AMD 2025 年第一季度数据中心部门的收入为 37 亿美元,包括 CPU 和 GPU。最佳估计是,其中大部分是服务器 CPU,2025 年第一季度的收入约为 25 亿至 30 亿美元。


就单位数量而言,2024 年第三季度,AMD 和英特尔的服务器 CPU 总出货量为 550 万台。这意味着年均出货量约为 2200 万台。排名前四的超大规模厂商约占其中的一半,即每家每年约 250 万台。(注:不同 CPU 的平均售价可能差异很大。例如,AMD 服务器 CPU 的售价几乎是英特尔的两倍。美元收入是更好的指标,但为了与 Arm 进行比较,我们只有单位数量信息。)


超大规模企业购买了大约一半的 x86 数据中心处理器,并且它们全部都使用基于 Arm 的 CPU


Arm 高级副总裁兼数据中心基础设施总经理 Mohamed Awad 在 3 月份表示,到 2024 年底,基于 Arm 的 CPU 在数据中心的份额约为 15%。但他预计,到 2025 年底,Arm 的 CPU 份额将增长到接近 50%——这大概是出货量份额。(下文将介绍 Arm 的份额可能达到 50%,但要到 2020 年后期)。


这是因为另外两个重大转变。首先,超大规模计算厂商正在为通用应用设计自己的 CPU。其次,NVIDIA 正在设计自己的 CPU 用于 GPU 协同处理。


大约一半的数据中心 CPU/GPU 购买是由顶级超大规模企业进行的。


Arm 的 Mohamed 表示,超大规模计算厂商构建自己的 CPU 的主要动机是为了针对特定工作负载进行优化,从而获得更好的功耗/性能。削减英特尔/AMD 的利润率是一个考虑因素,但仅凭这一点可能不足以证明这种转变的合理性。


当然,超大规模企业运行的大部分工作负载是其客户的软件,这些软件目前主要针对 x86 进行了优化。Arm 处理器将首先用于超大规模企业控制的工作负载——搜索、照片、购物、Facebook、法学硕士 (LLM) 等。但看看超大规模企业的网站,他们正在大力推广他们的 Arm 处理器,所以这种情况将会改变。


亚马逊是数据中心中首款采用Arm架构的CPU。Graviton自2018年起已进入第四代。截至2024年中期,亚马逊已生产了超过200万颗Graviton。假设2024年生产了50万颗Graviton,这将约占x86 CPU总采购量的20%。Graviton在其云中用作独立计算实例,并与GPU配合使用。亚马逊首席执行官安迪·贾西(Andy Jassy)于6月30日在CNBC上表示,Graviton的性价比比x86高出30%至40%,而且功耗更低。


谷歌于 2024 年 4 月发布了 Axion 处理器。谷歌云网站声称“Axion 提供业界领先的性能和能源效率”,具体来说“与同类当前一代基于 x86 的实例相比,性能提高了 50%,能源效率提高了 60%”。


微软于 2023 年发布了 Azure Cobalt CPU(以及 Azure Maia AI 加速器)。微软声称与 x86 相比,其性能可节省约 30%。


节省成本固然重要,但电力最终将成为最重要的因素。在为 Frontier LLM 模型构建日益庞大的 AI 数据中心时,电力是最大的挑战。


所有这些 Arm-CPU 都可供云端客户使用,如果性价比优于 x86,那么随着时间的推移,客户会将他们的工作负载从 x86 转移到 Arm。


今年早些时候,Meta和 Arm 宣布他们正在研发 Arm 数据中心 CPU。


NVIDIA 已转向使用 Arm-CPU 控制其 GPU


2022 年,NVIDIA 开发了 Grace,这是其首款基于 Arm 的数据中心 CPU。它最初与 Hopper GPU 一起部署,今年将与 Blackwell GPU 一起部署。NVIDIA 在 NVLink72 配置下不支持 Blackwell 的 x86 架构。由于 NVLink72 性能最佳,因此大多数企业都会选择 NVLink72 进行部署。


将 Grace CPU 与英特尔至强铂金 8480+ 和 AMD EPYC 9654 进行比较,NVIDIA 声称 Grace 在大多数非 AI 基准测试中的相对性能提高了 1.2 倍到 2.4 倍,并且能效提高了 1.5 倍到 3.0 倍。


摩根大通预计 2025 年 Blackwell GPU 的出货量为 500 万个(2026 年为 750 万个 Blackwell/Rubin 单元)。两个 Blackwell GPU 由 1 个 Grace CPU 控制,这意味着 2025 年 Grace CPU 的出货量将达到 ~250 万个。一位数据中心基础设施行业的专家表示,对于 AI 工作负载,x86 服务器仅用于运行控制平面操作,因此每 100,000 个 GPU 将需要 5 到 10 个 x86 CPU 机架。一个 CPU 机架可容纳 42 个 1U 服务器,每个 1U 服务器可以配备 1 或 2 个 x86。计算一下,这意味着每 100,000 个 GPU 需要 210 到 840 个 x86 CPU,而每 100,000 个 GPU 有 50,000 个 Grace CPU。因此,对于 AI 工作负载,Grace CPU 的数量是 x86 的 50 倍到 100 倍。


此前,我们看到 x86 数据中心的出货量约为 2200 万台。考虑到超大规模厂商生产的 250 万台 Grace CPU 和大约 100 万台基于 Arm 的 CPU,Arm 2025 年的市场份额约为 15%,而不是 Arm 预测的近 50%。


到 2030 年,Arm 的份额将会增加,但即便如此,x86 似乎仍将保持主导地位


NVIDIA 的路线图于 3 月份在 GTC 2025 大会上发布,展示了一款名为 Vera 的全新 Arm 处理器,它将与 Rubin GPU 以及 Feynman GPU 配对。因此,NVIDIA 仍将坚持 Arm+GPU 的路线。


连接到 GPU 的 CPU 的增长速度将远超其他数据中心 CPU。除非 AMD 的 GPU 份额快速增长(因为 AMD 会将其 GPU 连接到 x86 CPU),否则这些 CPU 将主要基于 Arm。


数据中心中其余未直接连接到 GPU 的 CPU 有一半被交付给超大规模计算厂商——这些厂商都采用 Arm CPU。这些厂商的性价比更高,很可能会以更低的价格将客户转移到 Arm。


麦肯锡今年 4 月发布了对 2030 年数据中心增长的预测。



到 2030 年,以瓦特为单位的人工智能工作负载将增长 3.5 倍。非人工智能工作负载将增长 1.7 倍。


如果2025年非AI工作负载由约2200万个x86 CPU和约100万个Arm CPU完成,并且计算单元数量增长速度与GW(千兆字节)一样快(粗略估计),那么2030年的计算单元数量将约为3700万个x86 CPU和约200万个Arm CPU。目前,我们假设超大规模计算企业不会将其CPU配置转向Arm。如果前四大超大规模计算企业(占比约一半)将50%的CPU转向Arm,那么到2030年,计算单元数量将约为2900万个x86 CPU和约1000万个Arm CPU。考虑到超大规模计算企业的投入以及他们在网站上的宣传力度,后一种情况似乎更有可能出现。


如果 2025 年非 AI 工作负载由约 500 万个 GPU 完成,那么到 2030 年,这一需求将扩展到约 1800 万个 GPU,届时将需要约 900 万个 Arm CPU。(根据 GPU 的计算方式,实际 Arm CPU 数量可能会更少)。


因此,到 2030 年,数据中心 CPU 总数将达到约 4800 万个,其中 Arm 的份额将高达 1900 万个。这些数字虽然粗略,但足以表明,未来十年内,Arm 必将挑战数据中心 CPU 的主导地位。推动这一趋势的两个主要因素是:1)超大规模企业将云端工作负载从 x86 转移到 Arm;2)基于 Nvidia 的 AI 数据中心使用的 Arm CPU 数量将是 x86 的 50 到 100 倍。


美元份额更重要,但我们没有Arm的平均售价数据。x86的美元份额很可能会高于其出货量份额,但趋势仍在朝着Arm份额随着时间的推移稳步增长的方向发展。AMD从Nvidia手中夺取AI领域的大量份额将减缓Arm的份额增长,因为AMD很可能会使用x86而不是Arm进行GPU协同处理。


参考链接

https://semiengineering.com/data-center-cpu-dominance-is-shifting-to-amd-and-arm/


*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


END


今天是《半导体行业观察》为您分享的第4096期内容,欢迎关注。


推荐阅读


一颗改变了世界的芯片

美国商务部长:华为的芯片没那么先进

“ASML新光刻机,太贵了!”

悄然崛起的英伟达新对手

芯片暴跌,全怪特朗普

替代EUV光刻,新方案公布!

半导体设备巨头,工资暴涨40%

外媒:美国将提议禁止中国制造的汽车软件和硬件


加星标⭐️第一时间看推送,小号防走丢



求点赞


求分享


求推荐


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AR 服务器 芯片
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号