顶流合力,DeepSeek已决定采用华为昇腾训练部分模型 | 区势·Big Tech

科技区角 2025-08-30 07:15
资讯配图
资讯配图
资讯配图
资讯配图
8月30日科技区角报道,根据多方消息,DeepSeek已决定采用华为昇腾AI芯片训练部分AI模型,以减少对英伟达芯片的依赖。
虽然英伟达芯片短期内仍将是DeepSeek大模型训练的主力,华为昇腾目前将只负责小部分模型的训练,但这一决策标志着国内AI厂商正逐步减小对于英伟达的依赖,转而尽可能使用国产算力芯片。
这一转变发生在美国持续数年扩大对华先进芯片出口限制的背景下,同时也响应了国家推动科技产业自主化发展的长期战略。
根据目前国内产业局势,英伟达后续在华业务将产生长期且重大影响,英伟达首席执行官黄仁勋周三晚间估计,今年中国AI芯片市场规模达500亿美元,年增长率可能达50%,但受制于美国对华限制政策及H20在华的受挫局面,使其业绩增长上呈现疲软态势。
DeepSeek今年1月下旬因发布R1深度推理模型引发全球关注,该模型性能与OpenAI同期产品相当但训练成本却远低于对手。DeepSeek被视为国内科技自主创新典范,展现了国内产业应对美国政府出口管制等技术封锁的韧性与实力。
据悉,在最近几个月,DeepSeek分别对华为、百度及寒武纪科技的AI芯片进行测试,而DeepSeek最终选择华为,正与其工程师合作利用昇腾芯片训练下一代尚未发布的R2模型的小型版本。
根据消息,DeepSeek仍会在最新的R2模型训练中主要使用英伟达芯片,对于英伟达的国产替代仍需时间。除了算力性能上的因素,由于英伟达长期主导全球AI芯片市场,大多数中国AI开发者已习惯使用英伟达芯片及其配套的CUDA软件进行模型训练和运营,在这方面,国产厂商任需时间培育。
DeepSeek早期模型如R1,针对英伟达软硬件进行了深度优化,导致其在使用国产芯片训练时,存在管理困难和效率低下的问题,据某云服务提供商工程师透露,客户在运行DeepSeek模型时若改用国产芯片,性能表现会显著下降。这意味着DeepSeek以及国内算力芯片厂商,应加大技术协同步伐,才能确保其AI模型与国产硬件及软件生态兼容。
尽管面临挑战,DeepSeek的算力成本仍以远低于行业平均水平,与华为的合作可能帮助后者优化昇腾芯片的软件生态,吸引更多用户。两大国内科技领域顶流将对英伟达AI芯片在华市场实现挑战。
当被问及与华为合作时,英伟达发言人回应:"竞争已真正到来。全球将选择最适合运行热门应用和开源模型的技术栈。美国产业必须赢得包括中国在内的全球开发者支持,才能赢得AI竞赛。"
DeepSeek尚未公布R2模型的确切发布日期。据悉,DeepSeek CEO梁文锋对R2性能仍不满意是延迟主因。他要求模型在推理、编码和数学能力上达到顶尖水平,同时保持高效率和低算力成本。为优化模型,研究人员正通过移除部分组件来测试各模块对整体性能的贡献。
在推进R2开发的同时,DeepSeek本月通过V3基础模型升级推出了名为UE8M0 FP8的新型数据处理格式。该格式专为适配国产芯片设计,虽不被英伟达芯片原生支持,但能显著提升国产芯片的推理效率,标志着DeepSeek在降低对英伟达依赖方面已取得实质性突破,深化其在国内产业领域的战略地位。

资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
华为
more
华为Mate XTs三折叠开启预约,新配色亮相
8.8英寸!华为 mini新机官宣:9月4日,正式发布!
小米澎湃OS 3今日发布/美团:外卖大战导致利润率暴跌/华为新款三折叠官宣定档
8.8英寸小屏幕!华为新机即将开挂
华为徐直军:鸿蒙生态根基已立,互联网头部应用已适配
华为499元新机官宣:9月4日,正式开售!
小米营销遭苹果三星联合起诉/华为官宣MatePad Mini/特斯拉推出高性能版Model Y
和华为、小米联手打造的丰田新车,终于来啦
华为上半年营收4270亿元;小米澎湃OS 3首批Beta版推送;苹果“跨肩背带”首曝...
华为MatePad Mini旗舰小平板官宣!“超强超Mini”
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号