没用一块GPU!国产超算靠自研CPU干翻美国,重返全球第一

极果网 2026-06-24 18:55
没用一块GPU!国产超算靠自研CPU干翻美国,重返全球第一图1

中国芯片“逆袭”,时隔九年重返全球第一!


近日,最新全球超算TOP500榜单揭晓,中国“灵晟”拿下第一,每秒跑到219.8亿亿次,是全球超算第一次冲破2EFlops的算力天花板。


没用一块GPU!国产超算靠自研CPU干翻美国,重返全球第一图2

先科普下,全球超级计算机500强榜单由国际组织“TOP500”编制,约每半年发布一次,算是全球超算界的“奥斯卡”。中国超算上一次登顶,还得追溯到2017年的“神威·太湖之光”。


时隔九年,中国超算重回世界巅峰。


从太湖之光的每秒9.3亿亿次,干到了灵晟的每秒219.8亿亿次,性能提升了超过23倍。


没用一块GPU!国产超算靠自研CPU干翻美国,重返全球第一图3

消息一出,国内网友直接沸腾。有人自豪地表示:咱不争第一,不代表没有第一。


更硬核的是,这次全是国产芯,谁也卡不住。


没用一块GPU!国产超算靠自研CPU干翻美国,重返全球第一图4

那么,在高端GPU被全面断供的今天,中国超算是怎么做到的?


带着这个疑问,咱来拆一拆灵晟背后的技术密码。

没用一块GPU!国产超算靠自研CPU干翻美国,重返全球第一图5

先看硬实力。灵晟由国家超级计算深圳中心研制部署,搭载国产LX2处理器,这颗芯片基于ARM架构,每颗集成304个核心。整个系统由20480个计算节点,加起来近245万个CPU核心,相当于把24万多台高性能电脑绑在一起干活。

那么,它跑起来有多快呢?“每秒2.198百亿亿次”这个数字听起来有点抽象。打个比方:全世界70亿人,每人拿个计算器不停按,要整整十年才能赶上它一秒的工作量。

这个速度,直接把长期霸榜的美国“酋长岩”挤了下去,性能领先超过20%。

没用一块GPU!国产超算靠自研CPU干翻美国,重返全球第一图6


更硬核的是,它没用一块GPU加速卡。

当前主流超算普遍走“CPU+GPU”异构路线,CPU负责调度,GPU负责算力。行业也早有共识:论并行计算,GPU天生比CPU强。

但灵晟没按这个剧本走。它是纯CPU同构架构,整机搭载约4.7万颗国产LX2处理器,完全不依赖任何国外GPU。

没用一块GPU!国产超算靠自研CPU干翻美国,重返全球第一图7

别人用显卡堆算力,我们自己造的CPU来干同样的事,而且干成了!

没用一块GPU!国产超算靠自研CPU干翻美国,重返全球第一图8

而真正让外界震撼的,是全栈国产。整个系统的心脏是国产LX2处理器,它基于ARMv9架构,每颗集成304个核心,全系统近4.7万颗处理器、加起来超过245万个CPU核心。每个核心支持ARM SVE和SME可伸缩扩展,能同时处理FP64科学计算和BF16、INT8等AI数据格式,这正是“超智融合”的硬件根基。

存储方面,LX2集成了首颗国产HBM高带宽内存,带宽达4TB/s,较传统CPU提升10倍,同时配合最大256GB的DDR5内存,由内置SDMA引擎智能调度数据。HBM此前几乎被三星、SK海力士垄断,国产化本身就是一枚重磅信号。

没用一块GPU!国产超算靠自研CPU干翻美国,重返全球第一图9

互联和系统层面,自研“灵启”高速互联网络撑起了这座超算的骨架,支持200万个端口、10万节点组网,每节点带宽1.6Tb/s。操作系统跑的是国产麒麟,散热采用100%全液冷方案,能效比达51-52GFlops/W,整机功耗约42.2MW。

说到底,高端GPU买不到,英伟达CUDA生态的路也走不通,那就不走了。灵晟从芯片到网络到系统,彻底甩开了对国外加速器的依赖。这是一个真正的、从硬件到软件的全栈式突破。

没用一块GPU!国产超算靠自研CPU干翻美国,重返全球第一图10

纵观中国超算史,曾多次登顶世界第一,却屡遭美国“拉黑”,超算中心、研发企业被列入实体清单,高端芯片和互联器件供应被切断。

过去,国内部分超算仍存海外技术依赖,一旦高调上榜就容易引来精准打压。灵晟登顶证明了一件事:封锁,堵不死中国的路。在高端GPU被禁运的情况下,中国超算硬是蹚出了一条自己的路。

这条路不一定是最优解,但它证明:没有英伟达,照样造出世界最快的计算机。与其说这是“超越”,不如说这是“不被卡死”。

而且灵晟不是摆设,已经在实实在在干活了,天气预报、飞机火箭设计、新药研发、AI大模型训练,这些关乎国家长远发展和科技前沿的大事,现在都有了更强大、更安全、完全自主可控的算力兜底。

灵晟只是一个节点,不是终点。封锁,挡不住创新。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
GPU
more
零GPU,世界第一超算!深圳制造改写游戏规则了
商汤国香资本合伙人李扬:GPU估值翻倍、RISC-V站上台前,资本如何锁定确定性?
AI占比首次过半!百度Q1交卷,GPU云同比暴涨184%
28亿!北京公司拿下GPU大单
马斯克解散xAI,22万张GPU全送给Claude,为了绞杀OpenAI他真拼了!
28亿GPU大单落地,算力产业加速驶入快车道
【有奖活动】应对千瓦级GPU与兆瓦级机柜的供电挑战
阿里达摩院发布GPU版敏迭求解器,破解亿级变量“不可解”困局
直播预约 | AI算力要“变天”了:RISC-V + vLLM,正在掀翻GPU规则?
摩尔线程宣布开源MusaCoder:首个国产GPU全栈训练代码大模型!
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号