美国总统唐纳德・特朗普表示,美国将允许英伟达 H200 处理器对华出口,但中方是否会批准中国企业采购该芯片,目前尚不明确。
为摆脱对外来技术的依赖,中国已培育出一批本土人工智能芯片企业。以下将从性能维度,对比中国本土竞品与英伟达 H200 的差异。
国产芯片能否媲美 H200 性能?
据进步研究所近期发布的报告,中国本土厂商的最先进产品为华为昇腾 910C,其算力与内存带宽均与 H200 存在差距。昇腾 910C 的总算力达 12032,而 H200 为 15840;前者内存带宽为 3.2TB/s,后者则高达 4.8TB/s。其他本土企业的产品竞争力更弱。寒武纪旗舰芯片思元 590 与海光信息 BW1000 的性能,均落后于华为昇腾 910C。
有无国产芯片可对标英伟达 H20?
可以。H20 是英伟达专为中国市场设计的降配版处理器,今年早些时候因美国出台禁令,该芯片已停止对华出货。据伯恩斯坦今年 7 月的报告,华为昇腾 910B 总算力达 5120,超过 H20 的 2368;寒武纪思元 590 算力为 4493,同样优于 H20。

中国企业为何难以撼动英伟达的市场地位?
英伟达的行业主导地位,源于其开发者长期依赖的 CUDA 软件平台 —— 该平台是人工智能模型开发的核心工具。若切换至国产芯片,开发者需重写代码并在新平台上完成适配训练,这一过程成本高昂且耗时长久。尽管国产芯片在算力指标上超越 H20,但由于缺乏能与 CUDA 比肩的成熟本土软件生态,使用方便性不如英伟达产品。
后续布局有哪些?
以华为为例,于今年 9 月对外公开发布了人工智能芯片发展路线图,宣布未来三年将推出三款新产品:昇腾 950PR 计划于 2026 年一季度上市;同年四季度,高内存版本昇腾 950DT 将面市;昇腾 960 与昇腾 970 则分别定于 2027 年四季度和 2028 年四季度发布。伯恩斯坦 9 月报告指出,昇腾 960 算力基本与 H200 持平,但其互联带宽达 2200GB/s,远超 H200 的 900GB/s。更高的互联带宽可提升多芯片系统中各芯片间的数据传输速度,这对大型人工智能模型的训练至关重要。这一技术选型表明,华为正将芯片间通信速度置于算力指标之上,作为核心研发优先级。
英伟达 H200 与新一代芯片对比如何?
H200 属于英伟达上一代人工智能芯片,基于 2022 年推出的Hopper 架构打造;而英伟达最新的架构为去年发布的Blackwell 架构。据英伟达本月初公布的数据,其最新人工智能服务器单台集成 72 颗Blackwell 芯片,相较搭载 H200 的服务器,部分人工智能模型的性能提升可达 10 倍。无党派智库进步研究所于上周日发布报告称,目前美国人工智能企业使用的Blackwell 芯片,在人工智能模型训练任务上的速度是 H200 的 1.5 倍,在模型推理(即人工智能模型的实际应用环节)任务上的速度更是达到 H200 的 5 倍。不过该报告同时指出,相较于目前合法对华出口的最高规格人工智能芯片 H20,H200 的性能几乎是其 6 倍。