公众号记得加星标⭐️,第一时间看推送不会错过。

特朗普总统最近宣布了一项雄心勃勃的计划,旨在使美国成为人工智能和机器学习领域的强大力量。他取消了对竞相开发未来技术以处理大型语言模型和未来人工智能形式的美国企业的种种限制。美国企业将摆脱繁琐的州级法规,也不再受到联邦层面的护栏和其他限制的束缚。这一消息虽然对美国电子行业来说令人振奋,但也给下一代处理器的开发带来了更大的挑战。
过去几年,包括市场领导者 Nvidia、英特尔和 AMD 在内的主要芯片制造商都在积极开发新的处理器。然而,多项行业研究表明,对 AI 性能的要求可能会更高,这反过来又迫使供应商开发更多新产品,并对系统设计提出更高的要求。
虽然对创新处理器的需求表明人工智能芯片市场前景广阔,但考虑到市场将会成熟和整合,新参与者的窗口可能不会永远敞开。
增长正在放缓吗?
Omdia 最近发布了一份名为《云计算和数据中心 AI 处理器预测》的报告,预测尽管 AI 数据中心芯片市场将继续快速增长,但增长速度已开始放缓。Omdia 表示, 2022 年至 2024 年间, AI 基础设施的年增长率超过 250%;然而,预计 2024 年至 2025 年的增长率约为 67%。该公司预计,AI 基础设施支出在数据中心支出中的占比将在 2026 年达到峰值,届时基本上所有增量支出都将由 AI 驱动,然后到 2030 年逐渐减少。
Omdia 还指出,GPU 的替代品正在日益流行。这些替代品既包括定制 ASIC 芯片(例如谷歌的 TPU),也包括商用 ASSP(例如华为的 Ascend 系列、Groq 或 Cerebras)。Omdia 还指出,得益于 2024 年的重大软件投资,AMD 的 Instinct GPU 系列取得了进展。
Precedence Research 的另一项市场研究预测,人工智能芯片组市场规模将从 2025 年的 943.1 亿美元增长到 2034 年的 9312.6 亿美元,复合年增长率为 28%。Precedence 表示,图形处理单元(GPU) 占据人工智能 (AI) 芯片组市场的主导地位,这主要归功于其并行处理能力。GPU 被认为是数据中心和云环境中执行大量训练和推理任务的理想选择,可用于运行生成模型、计算机视觉和自然语言处理。
与 Omdia 一样,Precedence 预计未来增长将由 ASIC(专用集成电路)领域推动,因为其在特定 AI 功能(尤其是在推理密集型环境中)中具有卓越的效率和性能。与通用硬件相比,这些芯片组具有更高的能效和更小的尺寸,使其成为边缘设备和企业 AI 应用的理想选择。

GPU 仍是王者
GPU 继续占据各大芯片制造商的开发重心。AMD 发布了 Instinct MI350 系列 GPU,包括 Instinct MI350X 和 MI355X GPU 及平台,为各行各业的变革性 AI 解决方案提供了 4 倍的、逐代升级的方案。据 AMD 称,MI355X 显著提升了性价比,与竞品解决方案相比,每美元可产生高达 40% 的代币收益。Instinct MI350 系列在风冷机架中最多支持 64 个 GPU,在直接液冷机架中最多支持 128 个 GPU,可提供高达 2.6 exaFLOPS 的 FP4/FP6 性能。
英特尔发布了英特尔至强 6 系列中央处理器 (CPU) 的三款新产品,旨在管理最先进的图形处理器 (GPU) 驱动的人工智能系统。这些带有性能核心 (P 核) 的新处理器包括英特尔创新的优先核心睿频 (PCT) 技术和英特尔速度选择技术 - 睿频 (英特尔 SST-TF),可提供可定制的 CPU 核心频率,以提升 GPU 在高要求人工智能工作负载下的性能。
至强 6 处理器现已上市,其中一款目前作为 NVIDIA 最新一代 AI 加速系统 DGX B300 的主机 CPU。NVIDIA DGX B300 集成了英特尔至强 6776P 处理器,该处理器在管理、编排和支持 AI 加速系统方面发挥着至关重要的作用。凭借强大的内存容量和带宽,至强 6776P 能够满足日益增长的 AI 模型和数据集需求。
Nvidia 最近发布了 Rubin CPX,这是一款专为海量上下文处理而设计的新型 GPU。它使 AI 系统能够以突破性的速度和效率处理数百万个令牌的软件编码和生成视频。
Rubin CPX 与全新 NVIDIA Vera Rubin NVL144 CPX 平台中的 NVIDIA Vera CPU 和 Rubin GPU 协同工作。这款集成式 NVIDIA MGX 系统集成了每秒 8 百亿亿次浮点运算的 AI 计算能力,可提供比 NVIDIA GB300 NVL72 系统高出 7.5 倍的 AI 性能,并在单个机架中提供 100TB 的快速内存和每秒 1.7PB 的内存带宽。此外,还为希望重复使用现有 Vera Rubin NVL144 系统的客户提供了专用的 Rubin CPX 计算托盘。
云计算统治,边缘计算崛起
根据 Precedence Research 的数据,到 2024 年,云端 AI 处理领域将占据市场主导地位,占据 52% 的份额。云端高性能 AI 基础设施能够扩展自然语言处理和计算机视觉等应用的模型训练和部署。包括 AWS、谷歌云和微软 Azure 在内的超大规模云供应商一直在大力投资 AI 优化数据中心。
然而,尽管云端人工智能仍占主导地位,但边缘人工智能处理领域正在崛起。Precedence Research 的一份报告指出 ,对边缘计算技术的大量投资也可能增加对低功耗人工智能芯片组的需求。该报告预测,边缘人工智能处理领域将在未来几年以最快的速度增长,这得益于实时应用对低延迟、设备端智能的需求。自动驾驶汽车、工业机器人、可穿戴设备和监控系统中人工智能系统的边缘处理需要高能效和不依赖外部服务器。对智慧城市基础设施的投资迅速增加了交通监控和能源管理系统中的边缘部署,进一步提振了这一市场。
行业整合
Jon Peddle Research 表示,随着 AI 处理器市场的成熟,行业整合也有望实现。Jon Peddle Research 最近的一份报告预测,到 2030 年,市场将整合至仅剩约 25 家。在 Jon Peddle 列出的五大细分市场(超大规模训练、云基础设施、汽车、边缘计算和物联网)中,最有可能存活下来的 AI 处理器供应商是物联网和边缘计算领域的供应商,因为这些市场的 PAM 较大,但利润率较低,对主要参与者缺乏吸引力。
为了发挥优势并帮助保持市场地位,供应商之间的合作日益增多。
OpenAI 和 NVIDIA 已达成战略合作伙伴关系,将为 OpenAI 的下一代 AI 基础架构部署至少 10 千兆瓦的 NVIDIA 系统,用于训练和运行其下一代模型,从而实现超级智能。为了支持包括数据中心和电力容量在内的部署,NVIDIA 计划在部署新的 NVIDIA 系统时向 OpenAI 投资高达 1000 亿美元。第一阶段预计将于 2026 年下半年使用 NVIDIA Vera Rubin 平台上线。
Nvidia 还与竞争对手英特尔合作,共同开发多代定制数据中心和 PC 产品,以加速超大规模、企业和消费市场的应用程序和工作负载。两家公司将专注于使用 NVIDIA NVLink 无缝连接 NVIDIA 和英特尔架构,从而将 NVIDIA 的 AI 和加速计算与英特尔领先的 CPU 技术和 x86 生态系统相结合,为客户提供解决方案。根据合作协议,NVIDIA 将以每股 23.28 美元的价格投资 50 亿美元收购英特尔普通股。
持续的技术挑战
人工智能处理器性能提升的趋势也对其他电子系统组件产生了连锁反应。Rambus 研究员 Steven Woo 表示:“现有的内存配置经常面临带宽和延迟限制的问题,难以保证这些处理器完全满足需求并以最佳性能运行。新兴的内存设计正在被重新构想,以支持人工智能对海量数据和速度的要求。堆叠内存、近内存计算、多路复用和多 PAM 信令等技术正在被采用,以克服传统瓶颈,并跟上人工智能的快速发展步伐。”
封装技术在帮助克服内存限制方面发挥着重要作用。d-Matrix 在其 3D 堆叠数字内存计算(称为 3DIMC)中采用了芯片组设计。该公司预计,3DIMC 芯片组架构将通过提高数据访问速度,将数据密集型 AI 推理工作负载的内存容量提升几个数量级。
毫不奇怪,热管理会受到数据机架中运行温度更高的处理器的影响。这些处理器无法使用传统的散热器和风扇进行充分冷却。液冷解决方案曾被建议作为一种解决方案,但液冷虽然有效,但却增加了成本和复杂性。
Flex 的数据中心液体冷却器是典型的液体冷却解决方案。Flex 最近推出了一款液体冷却解决方案,每个机架最多可处理 6 个冷却分配单元 (CDU),最高功率可达 1.8 MW。该解决方案的运行速度为 1-1.5 LPM/kW,可支持各种工作负载,并根据需求匹配冷却输出,以减少浪费并降低运营成本,并通过智能歧管支持 CDU、服务器和存储的混合配置。
更高效的电力输送可以部分解决热管理问题。英飞凌科技与英伟达合作,开发了新一代电力系统,该系统基于一种全新架构,采用 800 V 高压直流 (HVDC) 集中发电。新的系统架构显著提升了整个数据中心的节能配电,并允许直接在服务器主板内的 AI 芯片(图形处理单元,GPU)进行电力转换。该系统有望为加速计算数据中心的先进电力输送架构铺平道路。
参考链接
https://www.designnews.com/electronics/processor-market-faces-challenges-meeting-data-center-needs
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
END
今天是《半导体行业观察》为您分享的第4181期内容,欢迎关注。
推荐阅读
★
★
★
★
★
★
★
★

加星标⭐️第一时间看推送,小号防走丢