18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...

电子工程专辑 2025-10-26 09:25


虽然电子工程专辑过去大半年都没写过任何Panther Lake的技术展望与解析,但这代PC处理器产品对Intel公司未来发展至关重要的属性,想必是绝大部分关注Intel的读者都十分清楚的。

尤其Panther Lake将首度搭载Intel 18A工艺——包含RibbonFET晶体管结构(GAAFET)和PowerVia背面供电技术的应用。18A工艺能否按期量产,都相关于市场对这家公司的发展信心,也相关于企业竞争力与营收数字。

可以说这一代酷睿Ultra处理器和同代的至强处理器,对Intel而言都关乎命运未来。我们此前就撰文提过Intel 18A工艺能否准时交付对现如今Intel的意义已经不单是展示技术先进性这么简单了。最近的媒体会上,高嵩(英特尔公司客户端计算事业部副总裁兼中国区总经理)再度谈到预计明年年初,OEM厂商就会有搭载Panther Lake处理器的笔记本与PC产品上市

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图2

虽然现阶段还没有这一代酷睿Ultra处理器的具体产品信息公开,但对Panther Lake的架构与工艺有个基本了解,也有利于我们对明年的PC产品做前瞻,同时也能更明晰Intel在PC处理器这一基本盘内,是否还有足够的竞争力。

本文篇幅较长,可按照需要做选择性阅读(若不关心实现细节,可仅阅读每个章节的开头部分):

Part 1 制造(Intel 18A)与封装(Foveros)工艺

Part 2 架构与定位综述

Part 3 CPU升级

Part 4 iGPU升级

Part 5 NPU与总结

先谈谈制造与封装工艺

因为这大半年来,个人行程安排实在太满,很难腾出空余时间来关注Panther Lake的各路传言信息;加上Intel在最近一次媒体会上公开有关Panther Lake的信息,在我们看来也远远称不上“干货”,所以本文只能从面上简单谈谈此系处理器新品。

首先来看看Panther Lake芯片的制造工艺与2.5D/3D先进封装技术。Panther Lake沿用了酷睿Ultra一代(Meteor Lake)以来基于chiplet的设计,整颗芯片包括有计算模块(compute tile)、图形模块(GPU tile)、平台控制模块(platform controller tile)、基础模块(base tile),以及用于结构填充和支撑的填充模块。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图3

可能是吸取Arrow Lake(酷睿Ultra 200S/H系列)和Meteor Lake(酷睿Ultra一代)的经验,这代芯片的分片方式显然保守了不少。CPU、NPU、媒体与显示引擎、IPU、内存控制器等关键组成部分都位于计算模块之上;图形模块也就是iGPU;平台控制模块有IO与连接相关的IP(如Wi-Fi, 蓝牙, PCIe等)。

所有die/chiplet,都藉由2.5D Foveros-S先进封装“缝合”到一起。不过Intel仍旧表示,这代产品有着不错的规模化(scaling)能力,借助模组与内存组合可覆盖不同价格区间的终端产品,而且藉由缩放就能面向PC以外的应用。这似乎也一定程度相关于Intel的scalable fabric以及die-to-die互连方式。

前道制造工艺方面,Intel的官方资料提到,Panther Lake的计算模块(compute tile)采用Intel 18A工艺,图形模块(GPU tile)基于Intel 3;平台控制模块(Platform contoller tile)则无意外地仍然采用外部foundry厂的方案——这片die的具体工艺是台积电N6

不过还有一则信息提到:最高配规格16个CPU核心版本的Panther Lake——后文的参数列表会提到——其中的图形模块(12个Xe3核心)会采用台积电N3E工艺。这可能一方面表明了Intel 3工艺产能并不理想;另一方面也表明Intel 3可能是个与台积电N3E,在器件物理尺寸上很相近的工艺——不要认为这是废话,不同foundry厂的工艺节点即便名字里头的数字一样,也不能代表它们的器件物理尺寸一致甚至相近。

同时,我们也看到Intel Products业务现在似乎更多地开始对同一种设计采用multi-foundry的方案(iGPU一边用自家工艺,一边用台积电工艺;此前Arrow Lake也有相似策略),体现的的确是设计方法标准化及相比从前的转向——不知道是否如此前Intel Foundry所说,在尝试多foundry设计规则的某种抽象。

这里稍微谈一谈Intel 18A工艺:虽然网上有关18A工艺的热议不少,但我们目前尚不掌握任何18A工艺的CD关键物理尺寸信息,也就更不可能知道晶体管密度之类的数字,尤其大部分读者可能会关心Intel 18A与竞争对手的2nm或其他节点对比——待Panther Lake上市,或许会有相关发现。

本次媒体会上,Intel针对18A工艺实则只说了两点(1)RibbonFET,也就是GAA(Gate-All-Around)栅极四面环抱的器件结构;(2)PowerVia背面供电技术的采用。

其实电子工程专辑对于这两个技术已经写过不少技术文章。毕竟在<2nm工艺节点的时代,GAAFET器件结构、BSPDN背面供电网络这两个技术点本来就是三家尖端制造工艺foundry厂争夺的焦点。不止是Panther Lake,面向数据中心的至强处理器(Clearwater Forest)也会采用这些技术。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图4

RibbonFET是Intel的GAAFET器件名称:相较于此前的FinFET,nanosheet电流通道横置——被栅极从四面环绕,实现更好的沟道控制。

RibbonFET似乎总共有4片nanosheets,一直以来的宣传图都展示了这一点——不过这次Intel提到GAA结构的价值还在于nanosheet的宽度、层数“都是可以调节的”,“搭配工作电压不同阈值,同一个工艺平台可以衍生出不同优化方向的晶体管规格,给客户提供良好的设计自由度,包括高性能、低功耗的选择”——这是从foundry厂的角度谈GAAFET的价值。

另外据说18A节点的RibbonFET“重新定义了晶体管控制的逻辑,为下一步尺寸缩减预留了空间”,为“后续节点延展”做好了准备。

PowerVia作为Intel的BSPDN解决方案应用于18A,也就让18A节点成为市面上最早商用背面供电的产品——我们此前报道过,台积电和三星代工很快也会跟进。将供电轨移到晶圆背面之后,Intel提供的数据是,密度和单元利用率提升10%,同时因为供电给晶体管的路径更短,所以从封装到晶体管的压降减少了30%,“尤其为高频电路提供干净的电流”。

Intel表示“栅极环绕技术释放晶体管的潜能,背部供电技术扫清了供电上的障碍,结合RibbonFET与PowerVia两项技术,共同支撑起了Intel 18A工艺在密度和能效上的同步提升”。因为电子工程专辑对这两技术的撰文已经不少,本文不再深入探讨。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图5

相对数据方面,Intel 18A相较Intel 3每瓦性能提升>15%,单位性能功耗降低>25%;另外芯片密度实现了30%的提升。掌握Intel 3工艺相关数字的读者,或许有机会大致判断,Intel 18A具体达成了怎样的晶体管密度提升——感觉在chiplet时代,具体在封装层面的收益还是很难做出简单判断的。

另外Intel还给出了工艺的HVM预期,虽然PPT中的缺陷率也只是个相对值、没有标尺,但Intel明确了“相比同时期,18A的良率大于或等于此前的每一代节点;预计今年第四季度就能达成大规模生产的良率目标,全面进入高产能生产阶段”;包括实现18A工艺量产的“美国亚利桑那Fab 52晶圆厂本月已经全面投入运营”。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图6

最后也稍微谈一谈Panther Lake后道封装的Foveros-S工艺。长期关注电子工程专辑的读者对于Foveros一定也是不陌生的,这是Intel的2.5D/3D先进封装技术名称,可类比台积电的CoWoS技术方向。

Foveros-S/R/B都属于2.5D封装方案,不同变体的差异在于Panther Lake所用的Foveros-S采用了硅中介(silicon interposer);而Foveros-R的R代表了RDL重排布层;Foveros-B可将硅桥(silicon bridge)与RDL结合。

这张图提供了Foveros 2.5D的关键数据,包括bump pitch(凸点间距)<25μm,C2C能耗效率0.5pJ/bit等。Foveros-S是早在2019年就开始量产的技术。值得一提的是,Clearwater Forest已经开始应用Foveros Direct封装方案,也就是Intel的混合键合3D垂直堆叠方案——还是比我们预想得更快的。

Panther Lake芯片:接棒轻薄本、全能本

Intel对于Panther Lake的定位是:兼具Lunar Lake(酷睿Ultra 200V)的能效Arrow Lake(酷睿Ultra 200H)的性能的处理器产品。

Panther Lake的确应当属于Lunar Lake与Arrow Lake-H这两条产品线的继任者——也就是说明年的轻薄本、全能本处理器会由Panther Lake担纲主力;更高性能定位的Arrow Lake-HX/S——游戏本与台式机处理器,应该会由Arrow Lake Refresh接替(不过明年台式机的CPU产品线预计会更复杂,不在本文探讨范围内,不再深入)。

虽然Panther Lake的产品信息尚未公开,但Intel已经给出了基于核心数量、IO与内存支持的基本配置信息,如下图所示:

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图7

理论上接替Lunar Lake或者说面向超轻薄本的处理器应该是最左边的Panther Lake 8核CPU版,iGPU总共4个Xe核心,内存支持为LPDDR5X-6800和DDR5-6400,12个PCIe通道;

而接替Arrow Lake-H、将主要应用在全能本上的Panther Lake则为16核CPU版——也切分了不同的iGPU核显规格,分有4个Xe核心版与16个Xe核心版;最高内存规格支持也有差异,分别为LPDDR5X-8533/DDR5-7200与LPDDR5X-9600...PCIe通道数也分成了20与12条。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图8

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图9

有两点值得单说:(1)8核版的Panther Lake虽然看起来是接替Lunar Lake的,即负责高能效、长续航的轻薄本。但实际上其CPU之外的规格堆料是不及Lunar Lake的,尤其iGPU和内存支持上。我们认为这对轻薄本受众而言反而是更合理的,因为轻薄本用户通常不会特别在意游戏及专业图形类需求。

但需要指出的是,Panther Lake全系都没有再沿用Lunar Lake那种将DDR内存纳入处理器封装的方案,而且应该也没有延续PMIC这种中心化的供电与管理解决方案——可能也是基于成本的考量。

虽然Intel在宣传中也提到Panther Lake的能效表现出色,或者说“延续Lunar Lake能效表现”,但暂未提及Panther Lake在系统闲置状态下的功耗情况。而取消片上内存、PMIC设计,就让我们比较在意Panther Lake轻薄本的续航是否还能达到Lunar Lake的程度。

有关低功耗设计,前两代的Low Power Island(低功耗岛)设计思路得以延续——这是个单独电源域、芯片之上的一部分,低功耗能效核LP E-core就位于该岛——也没有接入L3 cache。后文会提到,Panther Lake的LP E-core架构换代Darkmont。

不知道在新工艺节点(尤其PowerVia技术也能节约功耗)和核心IP升级带来效率提升,但抛弃片上内存、PMIC设计的情况下,Panther Lake能否为笔记本的续航带来提升或至少持平——这是轻薄本用户都很关心的问题。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图10

(2)16核Panther Lake两个版本,以iGPU核显规格区分。其中4个Xe核心的版本,猜测更多应该是准备搭配独显的——尤其给到的PCIe通道也相对充沛;而12个Xe核心的版本显然强调了核显性能——应当是目前所有PC处理器之中最强核显之一(抛开隔壁Strix Halo这种标志性意义大于实际意义的产品不谈)。

两个不同版本的16核Panther Lake不是通过制造过程中的binning process得来,因为Intel渲染的宣传图出现了3种不同的die(如上图),对应8核版、16核4Xe版、16核12Xe版(还是多foundry方案,这真的不会大幅增加成本吗?)。

(3)有关CPU异构核心,Panther Lake的CPU部分仍旧延续了性能核P-core + 能效核E-core + 低功耗能效核LP E-core的方案。P-core代号Cougar Cove,E-core和LP E-core代号Darkmont,用于取代上一代的Lion Cove和Skymont。后文会更详细地谈到这两种核心。

8核版Panther Lake为4 P-core + 4 LP E-core的方案,而16核版则为4 P-core + 8 E-core + 4 LP E-core。16核版的P-core相较上代少了2个,而LP E-core多了2个——从Intel提供的多线程性能数据来看,这也没有影响到Panther Lake的多线程吞吐能力。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图11

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图12

仔细观察不难发现,Panther Lake的LP E-core也是Darkmont,相较Arrow Lake的LP E-core(Crestmont)更新了两代,则多线程性能、整体能效提升应该是可预期的...

我们针对其中的关键信息,做了两张相比上代芯片的对比表格,如上图所示。除CPU、GPU之外的其他信息还包括NPU架构换代,算力应该是保持了全系一致(50TOPS);

另外还有此处没有列出的集成的IPU换代(IPU 7.5)——用于摄像头视觉信息处理的ISP;无线连接MAC控制和配套软件,加入Wi-Fi 7 R2功能支持,支持蓝牙LE Audio低功耗音频、蓝牙6信道探测、双蓝牙,以及引入新版无线连接套件ICPS 5.0...这部分内容本文不做展开。

消它们带来的影响吗?这也是个很值得观察的问题。

CPU:核心IP改良、调度机制换新

如前所述,Panther Lake的CPU部分换用了两种新的核心IP:Cougar Lake和Darkmont,用去替换上代的Lion Cove和Skymont。从介绍来看,Cougar Lake和Darkmont应当都属于基于前代核心的改良款。

直接来看两种核心IP改良带来的性能与能效提升成果,如下图所示:

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图13

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图14

单线程性能方面,Intel的数据是相较Lunar Lake和Arrow Lake-H,在相似性能之下功耗降低>40%,同功耗下则可提升>10%的性能——这代表的就是Cougar Lake的能力了。多线程性能方面,对比Lunar Lake,相似功耗下Panther Lake性能至多提升>50%,而同性能功耗降低至多>30%——表明这代E-core的表现也是很亮眼。(基于SPECrate2017_int_base)

看这两份数字都还算理想的。不过Intel没有给出峰值性能提升数字。实际上关乎峰值性能的,在于Panther Lake处理器的核心频率高低。这也直接关乎到Intel 18A工艺的实际水平;就只有等酷睿Ultra新品问世时才有机会知晓了。

更具体地,针对性能核Cougar Cove,Intel列出的关键提升有:18个执行端口;共享的L3 cache增大到18MB(Lunar Lake为12MB);“基于AI的电源管理”——“基于用户使用对CPU负载的动态变化,更好地调配资源,及时响应负载变化”;

TLB size增大;分支预测增强;内存消歧(memory disambiguation)达成对存储敏感型负载的效率提升;16.67MHz更精准的时间间隔;PPA优化;还有微架构的其他调整,包括拆分乱序引擎、更广泛的调度等...

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图15

Intel在宣传中着重强调了Cougar Cove的三项改进:内存消歧、TLB、分支预测提升。内存消歧旨在提升存储敏感型负载的性能核效率:在当代CPU的乱序执行过程中,load和store也就是读和写指令可能存在前后相关性;内存消歧就是用来预测和决策load是否依赖于上一个store操作的机制,也就提升了效率。

Intel对于Cougar Cove之中的内存消歧是这么说的:“它能精准预测哪些操作可以并行执行,哪些存在真实依赖。一旦预测错误或检测到实际冲突,它能以极快的速度进行恢复(recovery),确保程序的正确性。”最终起到提升CPU与内存之间带宽利用率的目的。“相比Lion Cove做了更好的提升,消歧技术性能更可靠,细节更准,恢复更快。”

TLB本身无需多做解释了,Cougar Cove令TLB容量达成1.5倍提升,主要是因为Intel 18A工艺提升了器件密度,也就有机会塞下更多的资源;更大的TLB有利于降低TLB未命中率、实现更大的内存区域覆盖,对于存储敏感型应用也产生正面价值。只是不清楚Cougar Cove的TLB层级结构是怎么设计的。

分支预测的提升,主要是“继承Lunar Lake中新颖BPU方案”,基于该方案“进一步提高准确性”,并“增加结构容量以降低延迟”。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图16

能效核Darkmont在Panther Lake之上肩负了更大的多线程性能使命,毕竟这次的P-core数量不及上代多了。不过Intel也提到Darkmont在低功率释放区间,能够以更低的功耗达成相较Raptor Cove(酷睿13、14代CPU的核心)的更高性能(SPECrate2017_int_base,固定频率,且不考虑存储子系统影响)。

强调有关Darkmont核心微架构的亮点涵盖:保留26个调度端口;同样引入内存消歧;4MB L2 cache,维持128B/cycle带宽;提升nanocode性能;以及分支预测、动态预取器控制、深度队列提升等。

其中,内存消歧与Cougar Cove的改进相似;分支预测则通过“提升容量预测更稳”,“提高准确性降低延迟”;“引入动态的pre-fetcher控制,根据负载变化来动态响应”,甚至节约功耗;

而nanocode作为相比microcode更低一个层级的指令,实则是在Skymont核心中就引入的——它实现了更靠近硬件、更高效的资源分配——Darkmont的优化在于nanocode覆盖了更多的指令,“以前只能针对某几种类型的负载,而Panther Lake在更多场景中实现了覆盖,能够更充分发挥能效核的性能和能效。”

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图17

拔高视角、从SoC层级来看,Intel还提到了三点:(1)Panther Lake的E-core接入了L3 cache——虽然听起来是废话,这一条主要是比对 Lunar Lake的LP E-core没有接入L3 cache,强调Panther Lake的E-core有着更强的性能;不过话说回来,Panther Lake的LP E-core作为低功耗岛的一部分,其实也没有接入L3 cache。

(2)只不过相比Meteor Lake和Arrow Lake,Panther Lake的LP E-core的L2 cache容量翻倍——LP E-core也因此能承载更多工作,不致如Meteor Lake时期那般不堪用。

(3)和Lunar Lake一致,保留了8MB memory-side cache(类似于system level cache,上图左下角)——不同处理器都可以访问,不过据说Intel针对这部分的充分利用还在做更进一步的调优;内存控制器也保留在了计算模块上——Arrow Lake饱受诟病的一点也在于内存控制器与CPU核心位于不同的两片die。

还有一些数据一致性机制的调整都旨在减少多核心或多die访问相同数据时的同步问题,也让系统层面未来有机会扩展到更高的核心数目。另外,国内媒体会上,Intel没有再谈封装层面的一致性机制:从外媒的报道来看,若上升到封装层级,据说某些需要跨die的共享工作负载(如视频编码、GPU加速的计算负载)也能够直接以共同数据结构的方式,连接不同处理单元,也不需要维护单独的内存拷贝。

具体情形未知,未来有机会我们可就系统级的更多优化机制再做深入探讨。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图18

对应的,基于CPU核心与微架构调整,

Intel Thread Director(硬件线程调度器)也做了优化和改进。Thread Director的基本机制是通过ACPI CPPC2定义的Hardware Feedback Interface(HFI)完成工作;对应的调度参考信息由SoC控制器形成HFI表格,向上提供给操作系统,实时指导scheduler做跨不同核心的调度工作。

不同PC OEM厂商为笔记本设定的不同性能或电源模式,就是通过Intel的平台软件层(Dynamic Tuning Technology,构建于微软的Processor Power Management框架之上),去通知SoC电源管理逻辑——SoC电源管理再与Thread Director配合,并面向操作系统scheduler提供hint,最终执行调度。

受限于篇幅,本文不对更新后的Thread Director做展开:Intel的宣传点大致包括不同核心间的高度并行实现;优化负载分类模型——可以给到操作系统更准确的参考;基于OEM预设电源模式和更多信息来调整给到操作系统的反馈表;

“扩大‘繁忙’用例的覆盖范围”——也就是Thread Director会在更多场景下给出调度参考;以及“操作系统隔离区”(OS containment zones)——操作系统可以限定特定负载跑在特定核心组——比如据说“混合”zone之下,游戏场景负载集中分配在E-core与P-core,甚至相较“不分区”有助于实现更低功耗下的更高性能。

值得一提的是,据说这次Intel在平台软件层面给出了“智能自动切换”特性,在Windows的平衡性能模式下,可以“自动根据工作负载切换到定义好的性能模式”,令设备处在闲置状态时更省电、需要性能时达成更强的性能释放。Intel给出的数据是,平衡模式下,采用智能自动切换,能实现UL Procyon Office和Cinebench 2024单线程性能测试19%的成绩提升。

这应该也是很多Windows用户期望看到的:具体实践估计还要看OEM厂商的决策。

iGPU:Intel有史以来最大核显,多帧生成也来了

iGPU核显是我们看来Panther Lake升级的最大亮点:尤其12 Xe3核心版的Panther Lake,达成了Windows PC处理器之中,除Strix Halo这种相对难买、价格还贼高的产品之外的最强核显:相比Lunar Lake提升超过50%的图形性能;能效方面,相比Arrow Lake-H的“每瓦图形性能”提升超过40%

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图19

虽然>50%的性能提升在后半程也需要靠功耗来换——达成极致游戏性能大约会成为考验OEM厂商做散热与供电的一部分,但这部分提升在Windows PC核显领域也绝对堪称惊艳。

去年我们体验过Lunar Lake笔记本,Lunar Lake所用的8个Xe2核心达成大约4200分的3DMark Time Spy图形分——我们说要玩当代3A游戏中画质完全可行,玩多年前3A游戏画质全开也没压力……

若Intel所说Panther Lake核显性能提升50%为真,则其图形渲染性能应该就已经追上笔记本GeForce RTX 3050独显了——真正的核显玩3A不是梦。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图20

实际游戏测试中,同样限定17W TDP,12 Xe3(Panther Lake)相较8 Xe2(酷睿Ultra 7 258V)在部分3A及网游中的帧数提升如上图——注意所有游戏皆为1080p中画质。

前一阵有传言说Intel砍掉了Arc显卡业务部门,从Panther Lake的iGPU堆料,以及Intel在媒体会上顺带提了句下一代Arc独显会采用Xe3P架构来看,Intel做显卡的决心还是在的。

就是不知道未来12 Xe3核心版Panther Lake的笔记本售价几何,考虑到iGPU这么大的占地面积,Intel也说是自己“有史以来性能最强、die size最大的iGPU”……这两年PC平台卷核显的竞争态势还真是一点没放松。老黄表示很受伤…

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图21

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图22

这一代Xe3在架构设计上更多考虑了可扩展性,所以才在设计层面推出了4核与12核两种规格,不知道未来会不会有其他Xe核心数目的SKU(也可能通过binning来达成核心屏蔽)。4核版与12核版的高抽象层级框图如上图所示。

从这两张框图可见,Xe render slice渲染切片单元的构成是比较灵活的——4核版的Xe3核显每个render slice有2个Xe3核心,2个RTU光线追踪单元,以及其他固定共享图形单元。所以核显总共4个Xe3核心,配套总体4MB L2 cache。

而12 Xe3 iGPU的每个render slice扩展到了6个Xe3核心——上代Xe2的单个render slice可容纳最多4个Xe核心。实现了iGPU核显共12个Xe3核心;配套更多的RTU光追单元,更多的像素后端、几何管线、采样器,以及总体共享的16MB L2 cache。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图23

看单个Xe3核心内部,每个Xe3核心内有8个512位的矢量引擎,8个2048位的XMX矩阵扩展引擎——专用于AI加速的部分;L1 cache/SLM容量增加了1/3。

这次的矢量引擎也变宽了,线程数最多增加25%,增加“可变寄存器分配”,整体提升矢量引擎的使用效率和并行数量,同时支持了FP8反量化。

XMX矩阵扩展方面,每个XMX支持的单周期操作数分别为TF32 1024、FP16/BF16 2048、INT8 4096、INT4/INT2 8192——对峰值算力数字感兴趣的读者可以去查一查Xe2的对应数据,相比上代的理论性能提升幅度应该是不小的。

顶配12个Xe3核心之中XMX所能达成的最高INT8算力为120 TOPS,也就是很多人关心AI PC的算力组成部分所在。

Intel还强调了RTU光线追踪单元的加强,“支持异步光线追踪的动态光线管理”,“通过更好的调度机制,在拥塞即将到来时降低光线分发频率,提升光线追踪负载性能。”以及在固定功能管线部分,采用新的URB(Unified Return Buffer,用于线程或固定功能单元的数据传输)管理器——支持仅部分URB传输同步,“帮助最高支持2倍异向性过滤”以及“模板测试速率最高提升2倍”。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图24

以上是相较于上代Xe2,本代Xe3在部分micro-benchmark中的性能提升。“后端部分由于Xe3保持同样的硬件资源,定点速率、颜色混合这类性能基本保持不变”;“在主要相关运算单元的GEMM、FP32/INT32速率测试中,性能提升约1.5倍,源于更大的render slice设计”;

“微架构层面的新特性引入,则帮助我们实现了在如射线三角形焦点、滤波、网格体渲染、分散读取方面的2倍性能提升;对一些关键单元的特殊优化,则让高寄存器压力着色器和深度写入测试拿到了更大幅度的提升。”

图形特性支持上,现在不得不谈的一定少不了AI:尤其基于AI的超分、帧生成,乃至多帧生成。无论你是否喜欢DLSS/XeSS这类技术,是否认可AI生成而非渲染的像素与帧,它们都实打实地提升了游戏静态清晰度与动态流畅度,而且正成为图形学事实上的标准。

关注XeSS技术的读者应该知道,XeSS2在超分(XeSS-SR)之外,也新增了帧生成(XeSS-FG)核低延迟(XeLL)配套技术,虽然游戏生态建设进度还不及绿厂,但作为一种开放技术,实则我们已经能在很多游戏里看到XeSS选项,至少超分特性已经有了。

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图25

这次随Panther Lake及Xe3新核显的发布,Intel也开推了XeSS-MFG多帧生成——也算是意料之中:即在渲染的帧之间生成、插入不止1帧,倍增游戏帧率,简单流程如上图所示。媒体会上Intel并未谈到有关XeSS-MFG的实现细节及生态构建情况(如预期加入支持的游戏),或许未来的Arc独显发布会上有机会听到更多相关XeSS-MFG的信息。

Xe媒体和显示引擎部分在此也多提一句:新增10bit AV1、AVC和索尼XAVC格式的支持,显示引擎开始支持eDP 1.5标准;据说在效率上,两者也做了升级——虽然实际上媒体和显示引擎并不在图形模块(GPU Tile)上。

AI PC还在延续:NPU瘦身,将来走向Agentic AI

最后不得不提的当然就是AI PC的话题了。Intel这些年推AI PC始终在坚持XPU驱动的AI能力,即CPU、GPU、NPU都出力,借助Intel的OpenVINO实现多处理器的AI推理协同。

从XPU的角度来看,除了前文已经提到Xe3 iGPU的XMX引擎能带来120TOPS的INT8算力,CPU部分提供10TOPS算力,还有专用加速单元NPU的AI算力保持与Lunar Lake的基本一致为50TOPS——所以最高配Panther Lake所能提供的AI算力为180TOPS

18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...图26

相关Panther Lake换新的NPU 5这里做个简单介绍:新版NPU的核心设计理念应该是die size的缩减或面积效益的提升。不仅在Intel 18A工艺带来的器件微缩,还在于NPU 5整体增大了神经计算引擎(Neural Compute Engine)及其中的MAC乘加矩阵——单个引擎算力翻倍;

但单个切片中的神经计算引擎数量缩减到了3个(12K MAC, 4.5MB Scratchpad RAM, 6 SHAVE DSP, 256KB L2 cache),“有效提升运算效率、提升die size利用率”,总体实现了单位面积内TOPS性能>40%的提升。所以在与Lunar Lake保持相似INT8算力(50TOPS vs 48TOPS)的前提下,NPU的占地面积应该是有了大幅缩减的——估计也考虑对冲因iGPU增大带来的成本增加。

另外还有一些更具针对性的优化,比如最新激活函数的支持、原生FP8/INT8运算支持等,在“部分主流AI负载,尤其LLM中带来更好的用户体验”。

这部分最后值得一提的是,Intel在媒体会上也特别说到未来期望“通过软件创新,赋能不同级别的AI智能体应用”——大致意思应该是对现在流行的、结合不同agent及具备深度思考能力的Agentic AI的本地推理支持。大约这也能在AI模型进化的加持下,带来更好的、更有实际价值的AI PC体验。

最后的最后,如果让我们给Panther Lake划个重点,那么首先必然是Intel 18A工艺的应用:GAAFET晶体管及背面供电技术的真正大规模商用,若能如预期般达成在明年初的交付,无疑很快,我们每个人都能借助PC享受到最新的半导体尖端制造工艺;另外对18A工艺器件关键物理参数感兴趣的读者,也应当关注一下传说进入了埃米时代的这个新节点,及其与竞品2nm节点的对比。

其次是Panther Lake在iGPU核显规格上的堆料,最高配12个Xe3核心,令Panther Lake成为真正意义上的“大核显”。它对Intel持续推广自家的GPU生态有价值,同时也让轻薄本和全能本有机会具备更出色的图形与AI性能。这也是相当一颗赛艇的。

最后,单纯就已掌握的信息来看,CPU部分大概率是一次架构改良,或许不会带来飞跃式的性能与能效进步。不过有关CPU,我们更好奇的还是在于Panther Lake 4c版能否延续Lunar Lake的续航佳绩,毕竟它去掉了片上DRAM设计与PMIC电源管理方案:而更先进的制造工艺、微架构改良足够抵






声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
处理器
more
【AI治理周报·10月第三期】OpenAI与Broadcom签约开发首款定制AI处理器;中国生成式人工智能用户规模超 5 亿
铭凡发布 M1-1295 迷你主机:搭酷睿 i9-12950HX 处理器,正面采用无接口设计
国产AI芯片和处理器上市公司2025上半年市场表现分析
18A工艺的Panther Lake处理器技术解析:明年的笔记本性能前瞻...
处理器简史——摩托罗拉 68000:16 位总线里的 32 位硬核传奇
聊一款处理器升级的“电竞游戏本”
【装机帮扶站】第1265期:聊一款不适合“冲首发”的CPU以及现阶段英特尔处理器竞争流力分析
游戏党必看!官方帮你极限“压榨”酷睿处理器性能
聊一款处理器升级的大屏商务本
AMD 重新推出速龙 3000G 双核处理器:改换新包装和散热器,约合 278.5 元
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号