
作者丨刘伊伦
“超节点互联协议生态的碎片化,正成为制约其规模化部署的核心瓶颈。”奇异摩尔CEO田陌晨说。
从当前产业实践来看,全球已形成多条技术路线并行竞争的格局:英伟达NVLink凭借成熟生态与全栈封闭体系占据高端训练主导地位;华为灵衢依托超节点架构在国内智算中心实现规模化部署;UALink联盟以开放标准为基础,打造多厂商兼容的开放互联协议,形成“反英伟达”联盟;ETH‑X、SUE等以太网开放协议,以及OISA标准,在通用物理层之上构建原生超节点互联协议,兼顾开放生态与部署成本。
路线的差异客观上构成了彼此割裂的生态孤岛,设备互操作性受限,客户一旦选定某条路线便深陷迁移成本高昂的“单选题”困境。
“英伟达新一代DGX SuperPOD统一内存域的规模上限为576个Rubin GPU,核心原因正是其多层异构的互联架构:GPU与CPU之间采用NVLink或PCIe、GPU与GPU之间采用NVLink,而跨服务器互联则采用InfiniBand或以太网。”资深产业专家刘雨嫣表示,“不同层次的计算资源采用不同协议互联,会直接推高集群维护成本,同时削弱网络弹性。”
不过这一困境并未动摇国内厂商自研的路径,不少厂商相继推出采用自研互联协议的超节点方案。
“但这类企业普遍缺乏chip-to-chip片间互联技术的积累,而算力体系向scale-up深度演进的过程中,对网络能力与系统架构的要求却会持续抬升。网络研发的技术难度并不亚于高端芯片设计,且至少需要500人的团队规模才能支撑。”芯片厂商高管张翔评价道。关于国产芯片厂商在超节点领域的竞争态势,欢迎添加微信 YONGGANLL6662 交流更多信息。
各家单打独斗,本质是出于抢占生态话语权、构建技术壁垒等考量,但这一做法无疑加剧了协议生态的碎片化。行业更主流的共识,指向了另一条更关键的路径:协议标准化。
历史规律反复验证:协议标准化是技术规模化爆发的先决条件。TCP/IP奠定了万维网,4G LTE收敛催生了移动互联网。超节点互联亦然,只有通过开放统一的互联协议,实现算力硬件的全域互通与高效协同,才能真正支撑起下一代AI算力基础设施。
那么,既然开放是大势所趋,为何头部厂商仍坚持以封闭协议构筑壁垒?在标准割据与生态垄断的夹缝中,中小芯片厂商是否还有破局空间?这场关乎未来算力格局的技术博弈,最终是否真的会像互联网一样,走向协议统一与全域互通?
封闭协议催生生态「排他性」,
谷歌与英伟达会就此「赢家通吃」吗?
“互联标准不统一、生态割裂,是当前的必然结果。谷歌和英伟达在设计超节点互联架构之初,就没有以开放兼容为目标。它们不会等待行业形成共识,而是持续迭代新标准,以此保持技术领先身位。” 通信芯片专家李南指出。
多位行业人士也认为,超节点整体仍处于极早期阶段。它的出现,本质源于云计算架构从通算向智算转型,这一变化要求云计算体系必须围绕AI范式进行全面重构。
“在当下全面重构的阶段,互联协议是突破超节点‘通信墙’这一核心瓶颈的关键所在,因此各大巨头正通过封闭化的技术路线,快速构筑属于自己的底层壁垒,所以这个阶段追求协议统一并不现实。”刘雨嫣说。
谷歌为TPU集群量身打造了封闭式芯片间高速互联协议 ICI(Inter-Chip Interconnect),并将其与OCS光电路交换、以太网交换机、专用光模块以及TPU深度协同,实现了极高的产品解决方案一致性,依据需求构建了“苹果式生态”。“这种情况下他们一定是实现效果最佳的,Gemini 3的成功便是最有力的说明。”李南评价道。
英伟达则从底层硬件出发,自下而上构建超节点解决方案。其以NVLink为核心的私有互联技术,提供了远超传统以太网的带宽与通信效率,让多芯片以极低时延实现高效协同调度,并且靠着在单芯片设计能力上的垄断地位,其在市场上同样极具声量。
“但英伟达需要兼顾原有技术体系的兼容性与继承性,短期内其超节点规模仅能支持到576颗芯片。而云厂商身处激烈的MaaS竞争,提供Token服务必须原生支持超大规模集群调度,面向的是百万卡级别的组网能力,这种路线差异最终带来了双方产品形态的分化。”芯片专家子皓表示。
不过,业内普遍认为,二者只是技术优先级与演进路径不同,本质差异并不大。英伟达后续同样具备支撑百万卡级规模的能力,这就意味着英伟达和谷歌一样,都将具备强大的规模化部署能力。
所以,为了充分利用封闭自研协议的优势,英伟达及谷歌都定义统一、标准化的原子节点。通过让每一个最小算力单元形态、接口、性能保持一致,实现大规模的高效组网。
规模化部署能够带来极强的“排他性”,进一步强化了英伟达及谷歌的垄断地位。
子皓表示:“AI云是赢家通吃的市场,一旦错失先机,很可能彻底被边缘化。而封闭的互联协议,正是当前英伟达和谷歌重要的竞争手段,甚至可以说是最优选择。”
那么,面对英伟达和谷歌强大的竞争壁垒,超节点这场游戏是否还有新玩家的席位?
国产超节点陷阱:
500人团队死磕自研协议,不如接入开放生态
“对绝大多数芯片厂商而言,超节点赛道已明显超出其能力边界。这类企业普遍缺乏chip-to-chip互联技术的积累,而算力体系向scale-up深度演进的过程中,对网络能力与系统架构的要求却会持续抬升。”张翔表示,“网络研发的技术难度并不亚于高端芯片设计,且至少需要500人的团队规模才能支撑。”
与此同时,对于单纯聚焦超节点系统解决方案的厂商而言,同样面临难以破解的行业困境:超节点的技术话语权与生态落地,高度依赖行业巨头带头并定义标准,独立方案商很难凭借自身力量建立事实标准,但被动跟随、适配巨头标准,又会在产业链中失去不可替代性。
在标准话语权缺失、自研投入性价比较低的多重约束下,对不少厂商而言,过度追求互联协议自主权,反而容易变成不切实际的“内耗”,并进一步加剧互联协议生态的割裂。而放弃协议自研,是否就等于放弃生态话语权?欢迎添加微信 YONGGANLL6662 交流这一行业矛盾。
芯片公司和OEM的合作是一个破局的思路,寒武纪与中兴通讯的合作提供了一个“分工解耦”的例子,前者专注MLU-Link芯片级互联,后者发挥系统级工程化优势,双方通过协议适配完成超节点落地。华为开放灵衢2.0协议,为第三方芯片厂商提供高速互联能力,支持超节点集群的多卡扩展。中国移动OISA等开放联盟同样破解标准割裂,走“国芯国连、协议共用”的开放路线。
此外,在超节点的产品形态下,采用统一开放的互联协议正为中小芯片厂商对抗谷歌、英伟达的封闭生态提供了历史性契机。
趋境科技架构师谢威宇表示:“国产算力硬件厂商当下不应走封闭路线,在英伟达和谷歌的体系中,异构会带来效率损耗,但对中小厂商而言,超节点则提供了异构的契机,其通信与计算并非强耦合,所以统一的通信层为产业协同创造了条件。英伟达之外芯片厂商间的合作,能在全球竞争中占据更大的市场份额。”
不少业内人士也表示:统一协议带来高效互联的情境下,异构集群效率会更高。大模型推理等任务结构复杂,不同模块天然适配不同芯片,强行同构反而会抹销场景化适配带来的性能收益。
“当前,PD分离已是成熟且易于落地的拆分方案。未来还可向更细粒度延伸,例如在模型内部实现Attention与MoE、稠密计算与稀疏计算的分离,让更匹配的计算硬件承接更细分的任务,会有更高效率。”谢威宇表示。
行业共识也并非只有“兼容开放”一条路径:拥抱开放协议是务实选择,而为适配自身优势场景,走向适度的协议自主化,同样是国产算力厂商值得探索的可行方向。
这种场景化自主,建立在对超节点最优规模的判断之上。对部分芯片厂商而言,其真正的优势区间也较为明确:面向中小型模型推理集中在16–64 卡,万亿参数大模型则在128–256卡。
“过度追求超节点规模,一旦超出阈值,通信延迟增长会抵消算力提升,导致GPU闲置率上升、故障率急剧攀升,MFU也会大幅下降。聚焦优势场景与成本优化,通过低精度算力与互联协议深度优化,才能有效降低单Token成本,远比盲目扩集群规模更具竞争力。”曦望Sunrise联席CEO王勇表示。
NVLink终将「安卓化」?
CSP对封闭协议没有“容忍度”
超节点互联协议生态的“开放”与“封闭”之争,是AI基础设施产业极具张力的叙事主线。这场博弈不仅关乎技术路线的胜负,更将决定下一代算力基础设施的权力分配格局。
“当超节点演进为全行业的技术焦点,其规模效应与性能需求将自下而上驱动当前碎片化的网络互联协议生态向收敛态演进。这一过程有望推动资源与研发力量向统一的开放协议体系汇聚,最终构建出支撑下一代数字基础设施发展的、具有广泛互操作性的标准协议框架与生态系统。”田陌晨表示。
SUE、OISA、ETH-X、UALink等协议的涌现,正逐步推动开放互连生态的构建。
然而,这一收敛进程注定不会一蹴而就。
超节点互联协议碎片化是一个复杂命题,仅凭单一企业的力量难以进行统筹,这是一场关乎“生态构建”与“产业协同”的系统性工程,其成功高度依赖于产业链上下游的紧密协作。
因此,市场力量也将成为打破封闭格局的关键推力。
“CSP(云服务提供商)企业与大客户对封闭协议的容忍度会逐渐逼近临界点,其推动协议开放的诉求日益强烈。英伟达虽然通过NVLink和InfiniBand能构建起技术壁垒,但面对这种行业压力,开放协议是迟早的事情。”刘雨嫣表示。
事实上,英伟达已于2025年5月推出NVLink Fusion,将封闭的NVLink高速互联技术开放为可集成第三方芯片的半定制架构,但主要面向云厂商等客户及合作伙伴,且有严格准入与合规门槛。
总体看来,封闭与开放的博弈本质上是产业发展阶段的映射。
谷歌ICI、英伟达NVLink等垂直整合方案,皆是特定历史阶段的产物:先以封闭体系快速满足市场需求、初步确立工业标准,再通过行业协会渐进式推动协议统一,最终交由UEC等产业组织落地实现,这一路径在IT产业发展史上屡见不鲜。
互联网的发展历程为此提供了最有力的参照。
无论是WLAN、以太网、5G等不同底层接入方式,还是手机、电脑等各类终端,彼此之间的通信都统一基于IP协议承载。正是凭借这套全球通用的协议体系,互联网才打破了早期各类私有通信协议的壁垒,实现全域互通。
这一逻辑同样适用于当前的AI算力基础设施。
采用开放统一的超节点互联协议,能够让算力硬件全域互通、高效协同,以此支撑起爆发式增长的算力需求。
循此逻辑,面向国产超节点互联的未来发展,更可行的路径已然清晰:由国内大型云服务商与头部厂商协同,在工信部指导下,共同制定统一的中国国家标准。回顾过去几十年的技术演进,PON接入、TD-LTE等重大技术体系均走过类似道路,以顶层引导与产业协同的方式,形成自主可控、规模化落地的技术标准体系。
注:文中张翔、李南、子皓皆为化名。