中国AI芯片如何对标英伟达H200

美国总统唐纳德・特朗普表示，美国将允许英伟达 H200 处理器对华出口，但中方是否会批准中国企业采购该芯片，目前尚不明确。

为摆脱对外来技术的依赖，中国已培育出一批本土人工智能芯片企业。以下将从性能维度，对比中国本土竞品与英伟达 H200 的差异。

国产芯片能否媲美 H200 性能？

据进步研究所近期发布的报告，中国本土厂商的最先进产品为华为昇腾 910C，其算力与内存带宽均与 H200 存在差距。昇腾 910C 的总算力达 12032，而 H200 为 15840；前者内存带宽为 3.2TB/s，后者则高达 4.8TB/s。其他本土企业的产品竞争力更弱。寒武纪旗舰芯片思元 590 与海光信息 BW1000 的性能，均落后于华为昇腾 910C。

有无国产芯片可对标英伟达 H20？

可以。H20 是英伟达专为中国市场设计的降配版处理器，今年早些时候因美国出台禁令，该芯片已停止对华出货。据伯恩斯坦今年 7 月的报告，华为昇腾 910B 总算力达 5120，超过 H20 的 2368；寒武纪思元 590 算力为 4493，同样优于 H20。

中国企业为何难以撼动英伟达的市场地位？

英伟达的行业主导地位，源于其开发者长期依赖的 CUDA 软件平台 —— 该平台是人工智能模型开发的核心工具。若切换至国产芯片，开发者需重写代码并在新平台上完成适配训练，这一过程成本高昂且耗时长久。尽管国产芯片在算力指标上超越 H20，但由于缺乏能与 CUDA 比肩的成熟本土软件生态，使用方便性不如英伟达产品。

后续布局有哪些？

以华为为例，于今年 9 月对外公开发布了人工智能芯片发展路线图，宣布未来三年将推出三款新产品：昇腾 950PR 计划于 2026 年一季度上市；同年四季度，高内存版本昇腾 950DT 将面市；昇腾 960 与昇腾 970 则分别定于 2027 年四季度和 2028 年四季度发布。伯恩斯坦 9 月报告指出，昇腾 960 算力基本与 H200 持平，但其互联带宽达 2200GB/s，远超 H200 的 900GB/s。更高的互联带宽可提升多芯片系统中各芯片间的数据传输速度，这对大型人工智能模型的训练至关重要。这一技术选型表明，华为正将芯片间通信速度置于算力指标之上，作为核心研发优先级。

英伟达 H200 与新一代芯片对比如何？

H200 属于英伟达上一代人工智能芯片，基于 2022 年推出的Hopper 架构打造；而英伟达最新的架构为去年发布的Blackwell 架构。据英伟达本月初公布的数据，其最新人工智能服务器单台集成 72 颗Blackwell 芯片，相较搭载 H200 的服务器，部分人工智能模型的性能提升可达 10 倍。无党派智库进步研究所于上周日发布报告称，目前美国人工智能企业使用的Blackwell 芯片，在人工智能模型训练任务上的速度是 H200 的 1.5 倍，在模型推理（即人工智能模型的实际应用环节）任务上的速度更是达到 H200 的 5 倍。不过该报告同时指出，相较于目前合法对华出口的最高规格人工智能芯片 H20，H200 的性能几乎是其 6 倍。