

中国人工智能公司深度求索(DeepSeek)因未能使用华为芯片对其新模型进行训练,已推迟该模型的发布。这一情况凸显出中国在推动技术替代美国方面存在的局限性。
据三位知情人士透露,在今年1月发布R1模型后,深度求索受到有关部门的鼓励,要求其采用华为的昇腾处理器,而非使用英伟达的系统。
但这些人士表示,这家中国初创公司在使用昇腾芯片进行R2模型训练的过程中,遭遇了持续的技术问题,这促使其在训练阶段使用英伟达芯片,而在推理阶段使用华为芯片。
一位了解情况的人士称,这些问题是该模型从5月起推迟发布的主要原因,导致其落后于竞争对手。(行业有报道)

训练指的是模型从大型数据集中学习的过程,而推理则是指利用经过训练的模型进行预测或生成响应(例如聊天机器人回复查询)的步骤。
深度求索遇到的困难表明,中国芯片在关键任务上仍落后于美国竞争对手,凸显出中国在实现技术自主方面面临的挑战。
北京鼓励使用广华为和寒武纪等
英国《金融时报》本周报道,北京已要求中国科技公司说明其订购英伟达H20芯片的理由,此举旨在鼓励它们推广华为和寒武纪等企业生产的替代产品。
业内人士表示,与英伟达的产品相比,中国芯片存在稳定性问题、芯片间连接速度较慢以及软件性能较差等问题。
两位知情人士称,华为已派遣一组工程师前往深度求索的办公室,协助该公司使用其AI芯片开发R2模型。但他们表示,尽管有工程师驻场,深度求索仍无法在昇腾芯片上成功完成训练运行。
这些人士还表示,深度求索仍在与华为合作,以使该模型在推理阶段能与昇腾芯片兼容。
他们称,深度求索创始人梁文峰在内部表示,他对R2模型的进展不满,并一直在推动投入更多时间来打造一款先进模型,以维持公司在人工智能领域的领先地位。
另一位人士补充道,R2模型的发布推迟,也是因为其更新模型的数据标注工作比预期耗时更长。中国媒体报道称,该模型可能最快在未来几周内发布。
业内看法:研究员称模型易替代,开发者转用阿里等
加州大学伯克利分校的人工智能研究员里特维克·古普塔表示:“模型就像商品一样,很容易被替换。很多开发者都在使用阿里巴巴的通义千问3(Qwen3),它功能强大且具有灵活性。”
古普塔指出,通义千问3借鉴了深度求索的核心理念,例如其能让模型具备推理能力的训练算法,但通义千问3在使用上更高效。
一直在关注华为人工智能生态系统的古普塔表示,华为在将昇腾芯片用于训练方面正面临“成长的烦恼”,不过他预计这家中国领军企业最终会适应。
他说:“仅仅因为我们现在没有看到基于华为芯片训练出的领先模型,并不意味着未来不会出现。这只是时间问题。”
处于中美地缘政治博弈中心的芯片制造商英伟达,最近同意将其在华收入的一部分上交美国政府,以恢复向中国销售H20芯片。
关于中国企业使用其芯片一事,英伟达表示:“开发者将在打造成功的人工智能生态系统中发挥关键作用。放弃整个市场和开发者,只会损害美国的经济和国家安全。”
深度求索和华为均未回应置评请求。
- End -