AI超节点集群的分布式未来:从铜退光进到全解构

智猩猩 2026-06-26 21:10
各类万亿参数MOE(混合专家)大模型疯狂涌现的今天,算力需求已经不能单靠优化单个GPU来解决,而是需要将成百上千张GPU拧成一股绳。这股绳怎么拧?这就是AI超节点服务器要解决的核心问题。

从Scale-up(垂直扩展)的视角来看,超节点正在经历一场从“物理大一统”向“光网络解构”的深刻变革。

01

铜缆的物理极限与光的“降维打击”


在过去,超节点内部GPU之间的高速互联,最可靠、最经济的方式无疑是Copper Tray(铜缆互联)。通过密集的铜背板或铜缆,GPU之间可以实现极低延迟的Scale-up吞吐。

然而,物理定律是残酷的。随着大模型参数突破万亿,MOE模型中的专家数量呈指数级增加,单一机柜已经塞不下所需的GPU数量(例如需求达到 128卡、256卡甚至更多)。更致命的是,GPU侧的SerDes速率正在从112G向224G飙升,未来甚至会演进到448G。
AI超节点集群的分布式未来:从铜退光进到全解构图1

我们可以用高铁与飞机来做个形象的对比:

铜缆就像高铁:高铁贴地飞行,受限于轨道、空气阻力和地面摩擦,时速到350-400 km/h 几乎就逼近了物理和经济成本的极限。SerDes速率越高,铜缆的信号衰减就越恐怖,传输距离被压缩到极致,连走出机柜都做不到。

光网络就像飞机:飞机可以直接飞向万米高空,摆脱了地面的束缚,可以轻松达到 900  km/h甚至更快的速度。光子在光纤中的损耗极低,天然具备超大带宽和超长传输距离。

因此,当超节点需求跨越机柜限制时,“铜退光进”成为必然,只能通过光互联来实现跨机柜的超级节点集群。

02

历史的重演:从集中式走向“分布式解构”


回顾计算机的发展史,我们会发现历史总是惊人的相似: 在大规模计算时代的早期,大型机(Mainframe)和小型机(Minicomputer)凭借高可靠性和强大的单机性能统治市场。但由于它们架构封闭、扩展昂贵,最终被高性价比、标准化的X86服务器分布式集群所取代。

AI超节点集群的分布式未来:从铜退光进到全解构图2
今天的AI超节点也正处于这个十字路口。传统的单机柜“大怪兽”由于散热、供电和空间限制,必然走向分布式解构架构

未来的超节点集群,将采用一种“对称型”的拓扑结构:

中间:网络节点。放置高性能的光网络交换机(速率达400G、800G,甚至1.6T)。

两边:计算节点。GPU/CPU服务器直接出以太网光接口(400G/800G/1.6T),不再通过复杂的中间层,直连中央的光交换机。

通过这种解构,集群可以轻松突破物理机柜限制,实现256卡、512卡、甚至1024卡的超大规模高速低延迟互联。
AI超节点集群的分布式未来:从铜退光进到全解构图3

03

光模块的无DSP革命:

CPO、NPO、LPO与XPO


在光网络互联中,如何降低功耗和成本是重中之重。过去的光模块里都有一个号称“功耗大户”的芯片——DSP(数字信号处理器)

当前大热的几项前沿光技术:CPO、NPO、LPO以及XPO(液冷可插拔),它们最大的共同点就是:干掉(或极大地弱化)DSP!从而实现功耗和成本的双重暴降。
AI超节点集群的分布式未来:从铜退光进到全解构图4

但它们各显神通,技术原理和应用场景各有侧重:

技术方案技术原理核心特点典型适用场景

CPO

将光发动机(Optical Engine)和交换芯片(ASIC)直接共同封装在同一个基板上。信号传输距离最短,损耗和功耗极低。但制造工艺极难,维护成本高。适用于超高密度、对功耗极端敏感的超大型数据中心核心交换中心

NPO

光发动机不跟芯片挤在一起,而是放在芯片附近的PCB母板上介于CPO和传统模块之间,兼顾了性能与制造良率,折中的过渡方案。适用于中短期内向高性能网络过渡的大带宽交换机节点

LPO

保持传统可插拔外形,去掉DSP,只使用高线性的驱动器(Driver)和放大器(TIAs)进行线性信号放大100%兼容现有插拔接口,成本低,时延极低(省去了DSP转换时间),但对系统协同测试要求高。适用于AI集群中短距离(机柜间)的高速GPU直连通道,能极大降低整体算力延迟。

XPO

液冷可插拔光模块。专门针对高密度液冷服务器设计,将光模块直接暴露或适配液冷环境。解决去DSP后依然存在的高热密度问题,保障光器件在极高功率下的波长稳定性。适用于未来全液冷AI超节点服务器内部及机柜边缘的高密互联


04

终极愿景:ALL in 高速以太网


超节点的分布式演进并不会止步于GPU的互联。未来的终极趋势是ALL in 高速以太网(全解构光网络)

传统的服务器是一个“偏科的整体”(紧耦合),而未来,GPU节点、CPU节点、内存节点、SSD存储节点、以及网络节点将全部被“大卸八块”(全解构)。它们各自独立存在,互不绑定,中间通过统一的、超高速的光网络以太网像搭积木一样串联起来。

需要多少算力,就动态调度多少GPU;需要多少缓存,就一键直连内存池。光网络将化有形为无形,真正实现“网络即计算机”的算力自由。

AI超节点集群的分布式未来:从铜退光进到全解构图5

END


2026中国AI智能体大会

智猩猩主办的2026中国AI智能体大会7月2-3日杭州举行,大会设有开幕式,企业级AI智能体、AI智能体产品创新2场论坛,以及Coding Agent、自进化智能体、深度研究智能体、Computer-Use Agent、多智能体协同、Agent Skills、Agent Harness7场技术研讨会。最终议程已公布。

AI超节点集群的分布式未来:从铜退光进到全解构图6
AI超节点集群的分布式未来:从铜退光进到全解构图7
AI超节点集群的分布式未来:从铜退光进到全解构图8
AI超节点集群的分布式未来:从铜退光进到全解构图9
AI超节点集群的分布式未来:从铜退光进到全解构图10
AI超节点集群的分布式未来:从铜退光进到全解构图11
AI超节点集群的分布式未来:从铜退光进到全解构图12
AI超节点集群的分布式未来:从铜退光进到全解构图13
AI超节点集群的分布式未来:从铜退光进到全解构图14
AI超节点集群的分布式未来:从铜退光进到全解构图15


AI超节点集群的分布式未来:从铜退光进到全解构图16



点击下方名片 即刻关注我们

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
谷歌为什么做不好「AI 编程」?
绕开管制,高通推中国特供 AI芯片!
高考志愿填报,正在变成 AI 的主场
重磅!新思科技EDA+IP 硬核助力,瑞芯微打造业界首颗器人端侧AI芯片!
全域AI决战前夜:谁在裸泳,谁是标杆?|奖项申报
AI 志愿“砸了”机构饭碗!1290 万考生没了信息差!
别再用只会聊天的 AI 了!DuMate 才是真・办公搭子
【晶圆制造要闻简报】先进节点涨价延续,AI存储扩产拉动晶圆产能重估
重构交互逻辑 全面赋能AI vivo X Fold6评测
Google开卖TPU,AI芯片大战进入“下半场”,云厂商机会来了
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号