
图片来源:三星
2026年英伟达GTC大会的高光时刻,并非出现在SAP中心的主舞台,而是藏于1207号展位的玻璃展柜中。
三星半导体在领英发布的一张照片,勾勒出AI硬件产业格局的深层变革:英伟达首席执行官黄仁勋与三星晶圆代工部门总裁韩镇万、内存业务高管黄相俊并肩而立,用永久性记号笔在两片硅晶圆上签下名字。在第六代HBM4晶圆上,他写下“惊艳的HBM4”,而在为Groq第三代语言处理单元(LPU)打造的4纳米专属晶圆上,落款则是“Groq超高速”。
这一画面的象征意义不言而喻:2025年英伟达收购Groq,将这家初创企业的工程团队与LPU知识产权纳入麾下,此番举动标志着Groq正式实现与英伟达平台的运营整合。更深远的是,这意味着三星晶圆代工业务已从单纯的内存供应商,转型为英伟达下一代AI系统先进逻辑芯片的核心制造合作伙伴。
这场变革的核心,是黄仁勋在主题演讲中提及的**“推理危机”**。英伟达Vera Rubin GPU在高吞吐量工作负载中表现优异,可高效支撑模型训练与大规模推理,但在超低延迟需求场景下却存在短板。新兴的智能体AI系统要求每秒实时处理数千个令牌,这一需求催生了新的性能瓶颈。
黄仁勋指出,NVLink72架构在该类场景中存在性能上限,在极致的令牌生成速率下会出现算力枯竭。英伟达的解决方案,是将自有GPU与Groq的LPU搭配,让后者成为专用的“令牌加速器”。与GPU不同,Groq的架构是确定性数据流系统,全程由软件完成编译与调度,依托大容量片上静态随机存取存储器(SRAM)最大限度降低延迟,消除动态随机存取存储器(DRAM)带来的性能波动。
基于英伟达“Dynamo”软件栈,工作负载可在这套异构系统中实现拆分处理:Vera Rubin GPU负责计算密集型操作及键值缓存存储等内存密集型任务,而由三星代工的Groq芯片则聚焦高速令牌生成。英伟达表示,这一组合能让高要求推理工作负载的吞吐量效率实现质的提升。
对三星电子而言,为Groq代工LPU是其发展的战略拐点。这款基于三星4纳米工艺打造的芯片,印证了该制程节点已攻克此前的良率难题。英伟达在GTC大会的此次官宣,意味着三星4纳米制程的良率已达到商业量产的稳定水平,足以支撑先进逻辑芯片制造与HBM4基片生产双重需求。
英伟达将Groq芯片的制造合作仍交由三星,即便该技术已融入自身产品路线图,这一决策实则是对三星制造能力的默许认可。双方的合作也早已超越单纯的代工范畴:三星内部设计团队与Groq深度协作,优化芯片的落地实现方案,推动其加速完成量产准备,预计2026年下半年开始逐步提升出货量。
此次合作让英伟达在台积电之外,拥有了第二大先进制造合作伙伴,在AI基础设施需求激增的背景下,有效降低了供应链集中风险。而三星的定位也不再是英伟达的“备用选项”:英伟达下一代“费曼”架构已进入研发阶段,三星正与Groq联合设计新一代LPU,这意味着三星将在英伟达的推理芯片路线图中占据长期核心地位。
Groq的发展历程,恰能解释英伟达为何果断出手收购。该公司由前谷歌张量处理单元(TPU)工程师乔纳森·罗斯创立,多年来始终主张单一GPU并不适配实时推理场景。2025年,Groq的架构开始获得市场认可,这让英伟达不得不做出选择:要么正面竞争,要么将该技术收入囊中。最终的收购案,让英伟达得以规避通用GPU适配串行令牌生成的效率短板,同时牢牢掌控自身整体平台战略。

事实上,三星与Groq的合作早于英伟达的介入。2023年,Groq成为三星美国得克萨斯州泰勒工厂的早期客户,既为自身搭建了美国本土制造基地,也受益于三星对未经验证架构的支持。这一早期投资如今已融入更庞大的产业体系,将初创企业的设计理念与全球领先的AI计算平台紧密联结。
随着Groq的LPU即将在数据中心大规模部署,这两片签名字晶圆成为AI硬件架构变革的缩影:AI工厂的核心不再是单一芯片,而是由计算、内存、推理引擎等专用组件构成的协同系统,各组件各司其职、联动运行。而在这套全新系统中,三星已牢牢占据核心位置。
韩国业界对此反应迅速,本土媒体与分析师将英伟达GTC大会的这一动态,视作三星晶圆代工业务的发展拐点,部分观点认为,英伟达的认可相当于为三星4纳米制程颁发了“官方认证”。3月18日,三星在水原召开年度股东大会,管理层表示公司已走出发展停滞期,进一步强化了晶圆代工业务复苏的市场预期。
据韩国媒体报道,三星晶圆代工部门总裁韩镇万在股东大会上透露,Groq的LPU目前正在三星平泽工厂进行样品生产,初期需求超出预期,计划2026年下半年启动量产。他还表示,三星预计2027年下半年在得克萨斯州工厂为特斯拉量产下一代AI芯片,持续拓展AI基础设施领域的客户版图。
三星管理层着重强调,公司已成为整合型供应商,可同时提供HBM4内存、先进封装及逻辑芯片制造服务。首尔的分析师们愈发认为,英伟达-三星-Groq的三方合作,绝非简单的供应协议,更是三星重新切入由台积电长期主导的高性能逻辑芯片市场的结构性布局。
随着人工智能产业从模型训练向大规模推理阶段转型,行业正围绕异构架构进行重构。在这场重构中,英伟达的生态不再以GPU为绝对核心,而三星也不再满足于在AI产业链中扮演配角。
三方合作背后的半导体行业趋势与核心意义
1.AI推理成产业竞争新核心,异构架构成主流:AI产业从训练向推理的转型,让超低延迟、高吞吐量的推理算力成为竞争焦点,单一GPU已无法满足需求,“GPU+专用推理芯片”的异构架构成为AI算力系统的标配,此次三方合作正是这一趋势的典型落地。
2.三星晶圆代工业务实现关键突破,打破台积电垄断:三星4纳米制程通过Groq LPU的量产验证,标志着其在先进逻辑芯片代工领域攻克良率难题,借助英伟达的合作实现高端市场突破,逐步打破台积电在高性能AI芯片代工领域的绝对垄断格局。
3.英伟达供应链多元化,降低核心制造依赖:英伟达在台积电之外绑定三星作为先进制造合作伙伴,既保障了AI芯片的产能供应,也有效降低了供应链集中风险,成为头部芯片企业应对产业不确定性的核心布局思路。
4.内存厂商向整合型半导体供应商转型:三星从传统内存供应商,升级为可提供“内存+先进封装+逻辑芯片制造”的整合型供应商,依托全产业链能力切入AI核心生态,这一转型为存储芯片企业突破业务边界提供了参考范式。
5.初创企业技术成巨头生态补位核心:Groq的LPU技术弥补了英伟达在实时推理场景的短板,成为其异构生态的关键组成,反映出头部科技企业正通过收购初创企业的核心技术,快速完善自身产品矩阵,应对产业快速变革。
原文标题:The signature on the wafer: Samsung, Nvidia, and Groq close loop on AI inference
原文媒体:digitimes asia
