顶流合力，DeepSeek已决定采用华为昇腾训练部分模型

8月30日科技区角报道，根据多方消息，DeepSeek已决定采用华为昇腾AI芯片训练部分AI模型，以减少对英伟达芯片的依赖。

虽然英伟达芯片短期内仍将是DeepSeek大模型训练的主力，华为昇腾目前将只负责小部分模型的训练，但这一决策标志着国内AI厂商正逐步减小对于英伟达的依赖，转而尽可能使用国产算力芯片。

这一转变发生在美国持续数年扩大对华先进芯片出口限制的背景下，同时也响应了国家推动科技产业自主化发展的长期战略。

根据目前国内产业局势，英伟达后续在华业务将产生长期且重大影响，英伟达首席执行官黄仁勋周三晚间估计，今年中国AI芯片市场规模达500亿美元，年增长率可能达50%，但受制于美国对华限制政策及H20在华的受挫局面，使其业绩增长上呈现疲软态势。

DeepSeek今年1月下旬因发布R1深度推理模型引发全球关注，该模型性能与OpenAI同期产品相当但训练成本却远低于对手。DeepSeek被视为国内科技自主创新典范，展现了国内产业应对美国政府出口管制等技术封锁的韧性与实力。

据悉，在最近几个月，DeepSeek分别对华为、百度及寒武纪科技的AI芯片进行测试，而DeepSeek最终选择华为，正与其工程师合作利用昇腾芯片训练下一代尚未发布的R2模型的小型版本。

根据消息，DeepSeek仍会在最新的R2模型训练中主要使用英伟达芯片，对于英伟达的国产替代仍需时间。除了算力性能上的因素，由于英伟达长期主导全球AI芯片市场，大多数中国AI开发者已习惯使用英伟达芯片及其配套的CUDA软件进行模型训练和运营，在这方面，国产厂商任需时间培育。

DeepSeek早期模型如R1，针对英伟达软硬件进行了深度优化，导致其在使用国产芯片训练时，存在管理困难和效率低下的问题，据某云服务提供商工程师透露，客户在运行DeepSeek模型时若改用国产芯片，性能表现会显著下降。这意味着DeepSeek以及国内算力芯片厂商，应加大技术协同步伐，才能确保其AI模型与国产硬件及软件生态兼容。

尽管面临挑战，DeepSeek的算力成本仍以远低于行业平均水平，与华为的合作可能帮助后者优化昇腾芯片的软件生态，吸引更多用户。两大国内科技领域顶流将对英伟达AI芯片在华市场实现挑战。

当被问及与华为合作时，英伟达发言人回应："竞争已真正到来。全球将选择最适合运行热门应用和开源模型的技术栈。美国产业必须赢得包括中国在内的全球开发者支持，才能赢得AI竞赛。"

DeepSeek尚未公布R2模型的确切发布日期。据悉，DeepSeek CEO梁文锋对R2性能仍不满意是延迟主因。他要求模型在推理、编码和数学能力上达到顶尖水平，同时保持高效率和低算力成本。为优化模型，研究人员正通过移除部分组件来测试各模块对整体性能的贡献。

在推进R2开发的同时，DeepSeek本月通过V3基础模型升级推出了名为UE8M0 FP8的新型数据处理格式。该格式专为适配国产芯片设计，虽不被英伟达芯片原生支持，但能显著提升国产芯片的推理效率，标志着DeepSeek在降低对英伟达依赖方面已取得实质性突破，深化其在国内产业领域的战略地位。