零GPU,世界第一超算!深圳制造改写游戏规则了

量子位 2026-06-24 13:31
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

全球最强超算,易主了!

中山大学教授带队、深圳制造的灵晟超级计算机,刚刚登顶全球超算TOP500榜单,打破了西方近十年的垄断地位。

更让人惊诧的是,这个TOP1超算,含英伟达量为0,甚至一块GPU也没用

在超过2EFlops的超算系统中,独一无二,惊诧友邦。

零GPU,世界第一超算!深圳制造改写游戏规则了图1
来源:中山大学计算机学院官微

具体来说,灵晟采用了自主可控的纯CPU架构,CPU芯片、存储架构和高速互连网络全部自研。

图灵奖得主Jack Dongarra评价,灵晟是“AI4S新型架构的希望之光”,将重新划定全球算力竞争格局。

0GPU含量,全链路自主可控

灵晟没有使用一块GPU,这在今天的超算领域几乎是一个异类。

El Capitan、Frontier、Aurora……当前TOP500前列的E级超算,无一例外都依赖GPU提供主要算力。

GPU擅长大规模并行计算,是过去十年超算性能跃升的核心驱动力。

零GPU,世界第一超算!深圳制造改写游戏规则了图2

但灵晟选择了一条完全不同的路——Online Acceleration全CPU架构,而且芯片、互连、存储、操作系统到上层软件,全部自研。

灵晟的核心处理器是自研的LX2芯片

LX2基于Armv9指令集,每颗LX2集成304个核心,主频1.55GHz,整机共部署约1379万核。

LX2并不是一颗传统意义上的通用CPU,其内部集成了AI矩阵加速单元,原生支持FP64、FP32、BF16、FP16、INT8多种精度格式,将矩阵加速能力直接内嵌进了CPU。

官方表示,灵晟在混合精度与稀疏/稠密矩阵计算等关键指标上,已超越传统CPU+GPU异构架构。

LX2的内存架构同样是灵晟的亮点。

灵晟是首款集成国产HBM的超算系统,每颗LX2片上都搭载了32GB国产HBM,内存带宽达4TB/s,同时搭配最高256GB的外部DDR5内存,兼顾带宽与容量。

相比传统CPU,灵晟的内存带宽提升了10倍。

零GPU,世界第一超算!深圳制造改写游戏规则了图3
来源:国家超级计算深圳中心

网络层面,灵晟采用自主设计的灵启高速互连网络,支持200万个端口、10万节点的超大规模组网,节点间带宽达1.6Tb/s。

在软件层面,灵晟运行的是阿里巴巴基于RHEL开发的Anolis OS 8.9,并配套自研全栈软件,将灵晟的底层硬件能力以可编程、可优化的方式开放给上层应用。

散热方面,灵晟首创100%全液冷散热机柜,整机功耗42.2MW,能效比达52.07GFlops/W,在Green500能效榜上排名第50位。

灵晟能靠纯CPU架构在双精度浮点性能上登顶TOP500,并同步拿下HPCG榜单第一,证明了全CPU路线在传统科学计算场景下的可行性。

零GPU,世界第一超算!深圳制造改写游戏规则了图4
来源:国家超级计算深圳中心

而将AI矩阵加速单元直接内嵌进CPU的设计思路,也让灵晟天然具备承载HPC与AI融合计算的潜力。

在大规模并行环境下,灵晟的平均扩展效率达84.4%,全系统可调度核心数超过千万。

9年,中国超算重返世界之巅

灵晟的夺冠意味着,时隔九年,中国超算重回TOP500榜首;上一次登顶,还是2017年的神威·太湖之光。

而且灵晟此次以全国产自主架构直接夺冠,给外界带来的关注也不止于性能数字。

灵晟是全球首台纯CPU架构突破2EFlops的超算系统,打破了E级算力必须依赖GPU的行业惯例。

超算行业里,GPU的统治地位由来已久。

过去十年,随着并行计算需求的爆发式增长,GPU逐渐取代CPU成为超算系统的核心算力来源。

据英伟达官方披露,在本届ISC2026发布的TOP500榜单中,英伟达技术支撑的超算系统数量已超过400台,占TOP500总数的81%。

当前TOP500前列的E级超算——El Capitan、Frontier、Aurora——无一例外都以GPU作为核心算力引擎。

零GPU,世界第一超算!深圳制造改写游戏规则了图5

GPU在超算领域的渗透,也让英伟达成为全球算力基础设施中几乎不可绕过的一环。

AI时代的到来,也进一步强化了这一格局。

大模型训练对GPU的需求,让英伟达的超算地位与AI产业深度绑定,形成了更难被撼动的生态壁垒。

灵晟的出现,是这个格局中罕见的异数。

图灵奖得主Jack Dongarra在颁奖现场评价,灵晟让世界看到了超算通向AI4Science新型系统架构的希望之光。

在HPCG榜单上,灵晟同步登顶,绩达22 PFLOPS,进一步印证了灵晟在传统科学计算场景下的综合实力。

灵晟的总设计师、国家超算深圳中心主任、中山大学教授卢宇彤,与这个领域的渊源可以追溯到更早。

2013年至2015年,卢宇彤以天河二号副总设计师的身份,六次站上全球超算最高领奖台,见证了天河二号创下的六连冠纪录。

时隔十一年,卢宇彤再度登台领奖,灵晟接续了天河二号的历史。

零GPU,世界第一超算!深圳制造改写游戏规则了图6
来源:国家超级计算深圳中心

性能之外,灵晟的实际应用已在多个科学领域展开。

AI for Science(AI4S),正在成为超算领域最受关注的前沿方向。

从AlphaFold预测蛋白质结构,到大规模气候模型、药物分子筛选、材料性质预测,AI与传统科学计算的融合正在加速重塑各个基础学科的研究范式。

这对超算系统提出了新的要求,不仅要跑得快,还要能同时承载高精度科学模拟与大规模AI训练两类截然不同的计算任务。

现有的GPU加速架构在AI训练上表现出色,但在两种计算模式的深度融合上,仍存在架构层面的天然割裂。

灵晟的出现,很好地弥补了这个不足。

自灵晟系统部署以来,灵支撑大气海洋、工程仿真、材料科学、药物发现、脑科学、科学AI、大模型推理等方向的计算任务。

面向科学、工程、产业各领域的大规模应用需求,灵晟提供了多学科、全流程、多精度融合的科学智能应用平台,并已形成世界级应用成果。

参考链接:
[1]https://mp.weixin.qq.com/s/1wzSE-f3s47abkXGKbrbtw
[2]https://mp.weixin.qq.com/s/NzNYNqaoEizPmVhkKLI0Qw
[3]https://www.tomshardware.com/tech-industry/supercomputers/chinas-lineshine-supercomputer-dethrones-us-el-capitan-secures-first-place-in-top-500-list-f


一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

🌟 点亮星标 🌟

科技前沿进展每日见

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
GPU
more
腾讯“送钱送订单”!将收获一家国产GPU上市公司
Agentic AI 时代,CPU比GPU更重要?
智能体时代,GPU不再万能
用国产GPU训练AI给自己写内核,摩尔线程刷榜硬核基准
堆了一仓库GPU,却生产不出专业智能?九章云极用AI工厂给出解答
田渊栋创业公司首个成果:GPU内核优化,英伟达官方榜单SOTA
28亿!北京公司拿下GPU大单
【有奖活动】应对千瓦级GPU与兆瓦级机柜的供电挑战
刚刚,燧原科技过会!国产GPU四小龙终于集齐
纯CPU“踢开”GPU,中国超算九年后再登顶!
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号