8月30日科技区角报道,根据多方消息,DeepSeek已决定采用华为昇腾AI芯片训练部分AI模型,以减少对英伟达芯片的依赖。虽然英伟达芯片短期内仍将是DeepSeek大模型训练的主力,华为昇腾目前将只负责小部分模型的训练,但这一决策标志着国内AI厂商正逐步减小对于英伟达的依赖,转而尽可能使用国产算力芯片。这一转变发生在美国持续数年扩大对华先进芯片出口限制的背景下,同时也响应了国家推动科技产业自主化发展的长期战略。根据目前国内产业局势,英伟达后续在华业务将产生长期且重大影响,英伟达首席执行官黄仁勋周三晚间估计,今年中国AI芯片市场规模达500亿美元,年增长率可能达50%,但受制于美国对华限制政策及H20在华的受挫局面,使其业绩增长上呈现疲软态势。DeepSeek今年1月下旬因发布R1深度推理模型引发全球关注,该模型性能与OpenAI同期产品相当但训练成本却远低于对手。DeepSeek被视为国内科技自主创新典范,展现了国内产业应对美国政府出口管制等技术封锁的韧性与实力。据悉,在最近几个月,DeepSeek分别对华为、百度及寒武纪科技的AI芯片进行测试,而DeepSeek最终选择华为,正与其工程师合作利用昇腾芯片训练下一代尚未发布的R2模型的小型版本。根据消息,DeepSeek仍会在最新的R2模型训练中主要使用英伟达芯片,对于英伟达的国产替代仍需时间。除了算力性能上的因素,由于英伟达长期主导全球AI芯片市场,大多数中国AI开发者已习惯使用英伟达芯片及其配套的CUDA软件进行模型训练和运营,在这方面,国产厂商任需时间培育。DeepSeek早期模型如R1,针对英伟达软硬件进行了深度优化,导致其在使用国产芯片训练时,存在管理困难和效率低下的问题,据某云服务提供商工程师透露,客户在运行DeepSeek模型时若改用国产芯片,性能表现会显著下降。这意味着DeepSeek以及国内算力芯片厂商,应加大技术协同步伐,才能确保其AI模型与国产硬件及软件生态兼容。尽管面临挑战,DeepSeek的算力成本仍以远低于行业平均水平,与华为的合作可能帮助后者优化昇腾芯片的软件生态,吸引更多用户。两大国内科技领域顶流将对英伟达AI芯片在华市场实现挑战。当被问及与华为合作时,英伟达发言人回应:"竞争已真正到来。全球将选择最适合运行热门应用和开源模型的技术栈。美国产业必须赢得包括中国在内的全球开发者支持,才能赢得AI竞赛。"DeepSeek尚未公布R2模型的确切发布日期。据悉,DeepSeek CEO梁文锋对R2性能仍不满意是延迟主因。他要求模型在推理、编码和数学能力上达到顶尖水平,同时保持高效率和低算力成本。为优化模型,研究人员正通过移除部分组件来测试各模块对整体性能的贡献。在推进R2开发的同时,DeepSeek本月通过V3基础模型升级推出了名为UE8M0 FP8的新型数据处理格式。该格式专为适配国产芯片设计,虽不被英伟达芯片原生支持,但能显著提升国产芯片的推理效率,标志着DeepSeek在降低对英伟达依赖方面已取得实质性突破,深化其在国内产业领域的战略地位。