全栈芯基建:Marvell重构AI芯片高速公路(二)光互连与封装革新,驱动2025 AI芯基建爆发

半导体产业研究 2025-08-01 12:00
资讯配图

【编者按】

本篇选自Semi Version的长文深度解析Marvell如何以全栈定制战略重塑AI芯片基础设施。面对云巨头3270亿美金AI投资浪潮,传统GPU架构遭遇成本与能效瓶颈。Marvell凭借XPU+Attach双轨架构(18款定制芯片落地)、6.4Tbps硅光引擎及2nm级封装集成,构建从SRAM缓存优化到光互连的完整技术闭环。文章揭示其颠覆性创新:定制SRAM面积减半功耗降66%,448G SerDes突破带宽极限,更以XPU Attach组件90%增速卡位模块化AI生态——这不仅关乎单点技术突破,更是算力基础设施的范式革命。欢迎感兴趣的读者转发与关注!

2025年:愿景成真
到2025年,Marvell不仅兑现了这份路线图——它已在多个前沿领域取得进展,展现出卓越的战略远见和执行力:
1.定制化云芯片的商业化
Marvell推出了多款专为超大规模云工作负载(包括推理、数据移动和安全处理)量身定制的定制CPU、ML和DPU解决方案。这些芯片采用基于芯粒(chiplet)的模块化封装,并集成了高速SerDes、共封装光学(Co-Packaged Optics)和芯粒间(Die-to-Die, D2D)互连技术——从而实现了高效、可扩展且功耗优化的异构平台。
2.共封装光学与光学I/O成为核心技术
Marvell的硅光引擎进入量产阶段,成为客户AI加速器和服务器架构不可或缺的一部分。在1.6Tbps和6.4Tbps光模块等高带宽场景中,Marvell展示了卓越的能效和封装集成度,解决了传统电互连的局限性。
3.多芯粒封装与2nm制程实现
Marvell成功采用2nm工艺节点,并实现了支持双向D2D通信的3D封装,为异构计算单元提供了无缝连接。这些先进技术不仅为Marvell自身的ASIC提供动力,还通过其标准化、平台导向的设计生态系统为客户提供支持。
4.以平台为中心的设计与深入的云服务提供商(CSP)协作
与传统IP供应商不同,Marvell作为平台合作伙伴运作,在芯片设计、封装和验证方面提供端到端支持。这种方式促成了与前四大CSP——谷歌(Google)、亚马逊(Amazon)、微软(Microsoft)和Meta——的紧密合作,使Marvell能够以敏捷和精准的方式渗透到AI加速器、LPO模块和数据中心交换机等关键领域。
四年验证的远见
Marvell在2021年所预见的——数据中心架构与芯片设计的融合——在2025年已成为现实。通过在硅光子学、封装平台和XPU Attach战略上的早期投入,Marvell已将自身定位于AI数据基础设施浪潮的中心。
Marvell的历程是远见、执行力和平台驱动转型的案例研究。它为半导体行业提供了一条引人注目的替代路径:不仅仅是销售芯片,而是共同定义云基础设施的未来。
资讯配图
资讯配图
Marvell 2025:以全栈技术和定制芯片战略引领AI基础设施新时代
随着生成式AI和大语言模型持续推动数据中心计算需求呈指数级增长,Marvell的2025年投资者报告清晰阐述了其愿景和执行:通过整合SerDes、硅光子学、HBM、先进封装和完全定制的芯片平台,Marvell正在扩大其在AI基础设施市场的版图。作为高速互连和定制化计算解决方案的关键推动者,Marvell旨在塑造直至2030年及以后的AI数据中心格局中扮演核心角色。
1.AI时代的资本支出扩张与TAM激增
资讯配图
资讯配图
2025年,AI数据中心背后的基础设施正经历前所未有的资本投资增长。美国四大超大规模服务商——亚马逊(Amazon)、微软(Microsoft)、谷歌(Google)和Meta——正在积极扩张其下一代AI计算平台。与此同时,一波新兴的超大规模服务商正在迅速崛起,涉足涵盖模型开发、垂直应用和主权AI(sovereign AI)平台的全栈计划,标志着AI基础设施平台驱动新时代的到来。
传统超大规模服务商的战略举措
根据Marvell的投资者报告,亚马逊、微软、谷歌和Meta的总资本支出(CAPEX)预计在2025年将达到3270亿美元,较2023年的1530亿美元翻倍——年复合增长率(CAGR)高达46%。这反映了资源正大规模重新配置到AI芯片开发、数据中心重构、网络升级和基础电力基础设施中。
• 亚马逊(AWS)持续开发其Trainium和Inferentia芯片,增强其AI训练集群和数据湖系统,专注于芯片自主权和云规模AI服务。
• 微软(Azure)在深化与OpenAI合作的同时,也在推进其内部开发的Maia AI加速器和Cobalt CPU。其基础设施也支持其Copilot AI工具生态系统的后端。
• 谷歌(GCP)基于其TPU和Pax架构构建大规模、多租户的AI云,同时支持专有的Gemini模型和开源部署选项。
• Meta专注于Llama及其他基础模型,部署其MTIA芯片并扩展下一代AI数据中心,为其AI驱动的社交平台和AR/VR整合提供动力。
这些参与者正在从“堆叠GPU以提升性能”向AI原生硬件和光电集成转型。硅光子学、共封装光学(CPO)和3D IC等关键技术正被部署,以降低功耗并优化延迟。
新兴超大规模服务商的崛起
除了现有巨头,Marvell识别出三类快速崛起的新兴超大规模服务商类别:
• 模型驱动型参与者(例如xAI, OpenAI):专注于内部LLM开发,这些公司正日益掌控其AI训练和推理基础设施。
• 应用驱动型领导者(例如特斯拉Tesla, 苹果Apple):这些公司将AI嵌入汽车、移动和边缘系统,推动具有低延迟、本地部署和边云协同数据中心架构的混合部署。
• 主权AI创新者(例如Humain, Stargate):构建专有数据、模型和定制芯片以满足政府、国防和国家数据主权需求。这些参与者以其闭环AI堆栈挑战着主流的开源和共享基础设施范式。
这些新进入者正超越模型创新,深入垂直整合——涵盖芯片、封装、网络和热管理——使其成为Marvell、台积电(TSMC)和英伟达(NVIDIA)等上游供应商的关键合作伙伴和竞争力量。
在2023年至2025年间,四大超大规模服务商的资本支出正以46%的复合年增长率增长,达到3270亿美元。数据中心总体投资预计将从2023年的2600亿美元增至2025年的5930亿美元,并在2028年突破1万亿美元。Marvell估计数据中心半导体的总可寻址市场(TAM)将从2023年的210亿美元增长至2028年的940亿美元。其中,加速定制计算(Accelerated Custom Compute)细分市场预计将以53%的复合年增长率扩张,达到554亿美元。
资讯配图
资讯配图

相关阅读

全栈芯基建:Marvell重构AI芯片高速公路(一)从XPU定制到光互连的深度布局
*原文媒体:Semi Version
*原文链接
https://tspasemiconductor.substack.com/p/from-custom-sram-to-optical-serdes
资讯配图

芯启未来,智创生态

湾芯展2025与您相约!

资讯配图

资讯配图

资讯配图

资讯配图
资讯配图
资讯配图

资讯配图


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI AR 驱动 芯片
more
智元携手德马,完成全球首次数据驱动的具身智能物流作业直播
ACL 2025|驱动LLM强大的过程级奖励模型(PRMs)正遭遇「信任危机」?
重磅来袭 | 美新半导体发布高性能eOIS影像稳定驱动系列新品MSD4100WA!
论坛直击 | 可信人工智能驱动财务数智化转型 ,2025世界人工智能大会“智能财务”论坛成功举行
中控技术王宽心:打造工业AI智能体,驱动“智”造全面升级|甲子光年
政务+商业双轮驱动,普宙科技打造全球最大共享无人机网络
数说IT|区域间数字经济发展水平仍不均衡,数字经济实力和创新能力为竞争力提升的关键驱动力(2025年第15期(总第54期))
吴恩达给PM的灵魂拷问:数据说了算,还是你说了算?别再迷信数据驱动,顶尖PM靠的是「心智模型」
垂直单晶工艺在高边驱动芯片过流和过温保护中的作用
真实数据驱动!全球首例端到端具身智能机器人物流作业直播即将开启
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号