Agentic AI 时代,CPU比GPU更重要?

电子发烧友网 2026-06-08 07:00
电子发烧友网报道(文/梁浩斌)最近英特尔在Computex 2026上的发布会上表示,传统的AI推理过程相对简单,但具备自主决策能力的代理式AI(Agentic AI)的运作方式则完全不同。Agentic AI 需要使用各种工具来处理数据、读取和写入文件、验证规则,这些任务通常是x86架构的CPU来承担的。

在传统的AI推理应用中,GPU和CPU的使用比例大概是7比1;但在基于智能体的Agentic AI中,由于设计代码编译和测试的任务更多,GPU和CPU的比例将转变成1比1.3。换言之,CPU在Agentic AI中将会起到更加重要的作用。 

值得一提的是,英伟达也正在加大投入到数据中心CPU领域,推出Vera CPU。CEO黄仁勋表示,在Agentic AI时代,CPU已经成为限制GPU发展的瓶颈,CPU未来将成为公司新的主要增长动力。

进入Agentic AI时代,长期受到忽视的CPU,似乎正在重新获得一个新的定位,算力的结构也将迎来新变化。对于国产CPU厂商而言,新的市场窗口期出现了?

Agentic AI为什么需要更多CPU

本质上,Agentic AI相当于一个虚拟的项目经理。传统生成式AI是需要输入具体的指令,来完成具体的工作。而Agentic AI只需要你输入你想要完成的目标,它能够理解你的需求,并自己“组建团队、分配任务”,利用不同的AI能力来协同完成复杂工作并交付。

从计算的角度来看,传统的生成式AI输入后,GPU负责高强度的矩阵乘法计算推理,计算完成后输出结果即结束任务。

Agentic AI作为一个“项目经理”,需要自主规划、工具调用、反思迭代和多智能体协同,而这种运行模式,意味着系统可能会同时启动多个并发进程,比如多个智能体协同完成复杂任务。

这个时候,CPU的多任务处理能力就显得尤为重要,如果并发的智能体进程数远超CPU物理核心数时,CPU必须频繁进行上下文切换。频繁的切换会导致现有CPU资源被迅速耗尽,系统的吞吐量瓶颈往往卡在CPU的调度能力上,而不是GPU的算力上。

另外GPU擅长处理大规模、高密度的并行矩阵计算,但对条件分支(If-Else)、循环、树状搜索以及复杂的逻辑极不擅长。这些GPU不擅长的领域正是CPU的优势,Agentic AI依赖于CPU提供的低延迟逻辑计算、分支预测、缓存一致性能力。

尤其是当未来物理AI在现实世界执行动作时,低延迟会变得更加重要。GPU 虽然吞吐高,但上下文切换和指令分支延迟大,不适合处理低延迟控制逻辑。

所以,未来随着Agentic AI的进一步普及,将会大幅提高CPU的需求。英特尔2026年一季度财报中,CFO David Zinsner明确表示:随着工作负载向推理和Agentic AI迁移,CPU和GPU比例可能收敛至1:1,甚至CPU需求超过GPU。这一转变已导致服务器CPU价格上涨10%—20%,交货周期延长至约6个月,未满足需求将“以十亿美元计”。

针对高并发Agent负载,CPU架构发生转变

从多家厂商的动作来看,英伟达在今年3月的GTC上发布了Vera CPU,专为代理式AI和AI工厂的CPU密集型工作而设计,配备88个定制Olympus ARM核心,支持多线程技术至176线程,通过NVLink-C2C总线实现1.8TB/s带宽连接,拥有1.2 TB/s的内存带宽。同时Vera CPU还将作为独立产品进行销售,而不是强制捆绑rubin GPU等产品,这也进一步显示出CPU的战略地位得到提升。

同样在今年3月,Arm发布了公司历史以来第一款对外销售的自研芯片——AGI CPU,单芯片集成136个Neoverse V3核心,全核3.2GHz,最高加速3.7GHz;内存支持12通道DDR5-8800,每核独享 6GB/s 带宽,延迟 <100ns;提供96通道 PCIe Gen6,支持CXL 3.0。

该芯片在高密度部署上也有不小亮点,Arm AGI CPU在标准36kW风冷机架中可部署约8160 核;在液冷环境下单架可扩展至336颗芯片、超45000 核,计算密度相比x86平台提升2倍以上。

另外顾名思义,Arm AGI CPU就是为了Agentic AI而打造的,Arm将其定位为异构架构中的“主控层”——GPU负责模型执行,AGI CPU负责系统编排。从产品名称到架构定义,都能够看出Arm押注“Agentic AI将重构数据中心CPU需求”的决心。 

AMD在今年5月官宣 Venice 系列服务器CPU进入量产爬坡阶段,根据之前透露的消息,AMD专为Agentic AI 时代的高并发轻线程负载推出了Venice Dense,这是第六代 EPYC 服务器 CPU 的高密度核心版本。

Venice Dense采用Zen 6c高密度核心架构,基于台积电N2工艺,提供256核心、512线程。其中单芯片集成8个CCD,每个CCD 32核,还配备高达1GB的L3缓存(每 CCD 128MB,每核 4MB)。未来作为Helios机架级AI平台的核心,Venice Dense 与 MI400 GPU 形成CPU 编排和GPU推理的异构闭环。

总体来看,Agentic 负载的 CPU 利用率特征不是持续满载,而是高频突发以及大量空闲等待,因此Agentic AI对CPU的需求,从过去强调单核性能优先,转变为高并发调度优先,这样的变化或许将会给CPU市场带来新的格局。

从核心数量上可见,Arm AGI CPU采用了136个Neoverse V3核心,最近AMD的Venice Dense 更是达到256核Zen6c,Chiplet和多芯粒设计正在成为主流,通过模块化扩展核心数。

近年来,基于Arm的服务器处理器市场份额不断提高,2025年全年渗透率已经超过20%。中国移动近期宣布启动2026年至2027年PC服务器产品集中采购项目,其中Arm架构服务器的占比高达65%。

对于国内大多使用Arm架构的服务器CPU厂商而言,Agentic AI的趋势,可能会是一次全新的市场窗口期。相比传统的x86架构,Arm在核心设计、延迟、功耗等方面有更大的灵活性,能够更好针对不同应用进行优化设计。

国内外云服务巨头自研芯片,几乎都采用Arm架构,部分也会选择更加开放的RISC-V架构。国内的服务器CPU厂商,包括华为鲲鹏、飞腾、阿里平头哥、鸿钧微等目前都已经推出了基于Arm架构的服务器CPU,并已广泛应用。

此前瑞银在报告中预测,随着Agentic AI的落地,Arm在服务器CPU市场的份额有望在2030年提升至40%到45%。

但x86阵营的英特尔和AMD也没有闲着,比如AMD在针对Agentic AI应用设计的Venice Dense上,采用了针对高密度计算优化的Zen 6c内核,相比Zen6的单核面积缩小30%;CCD 内部采用 4×8 网格拓扑,提供更低的延迟;适当缩减了浮点和向量单元,换取更多核心面积。这也证明X86 CPU通过架构优化同样能够适配Agentic AI应用。

小结

Agentic AI没有让CPU变得像GPU,而是让CPU重新找到了自己的不可替代性,CPU和GPU的需求比例也将会发生巨大变化,或最终接近1比1。随着英伟达、Arm的亲自下场,以及国内Arm CPU厂商的崛起,服务器CPU市场将又迎来大变局。

Agentic AI 时代,CPU比GPU更重要?图1

声明:本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱wuzipeng@elecfans.com


更多热点文章阅读



点击关注 星标我们



将我们设为星标,不错过每一次更新!

Agentic AI 时代,CPU比GPU更重要?图2喜欢就奖励一个“在看”吧!


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI GPU IC
more
曝英特尔拿下超300万张AI芯片大单
OpenAI:Chat已死
孙正义,想治日本人不爱用AI的病
量子位招小红书AI冲浪选手
高中辍学天才,从OpenAI走了!
万亿美元AI公司,面试时禁止使用AI
英飞凌扩展CoolSiC™ JFET产品组合,推出面向AI数据中心和工业级应用的常关型器件
英伟达与LG集团携手打造AI工厂
AI狂欢,要散场了?
vivo X Fold6 官宣定档6月!重构折叠屏AI生产力新体验
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号