【区角快讯】据4月4日披露的消息,中国人工智能企业DeepSeek即将推出的第四代大语言模型V4,已完成对以华为昇腾系列为代表的国产AI芯片的深度适配优化。

为保障该模型在本土硬件平台上的高效运行,DeepSeek在过去数月内与华为、寒武纪等国内芯片厂商展开紧密协作,不仅对模型底层代码进行了结构性重写,还同步推进了多轮联合测试与验证工作。
此举显著区别于行业过往惯例——以往多数大模型优先针对英伟达等美国厂商的GPU进行调优。而此次DeepSeek明确未向美方AI芯片供应商开放预发布测试权限,转而将国产芯片厂商置于适配序列的首位。
除基础版V4外,该公司还同步研发了两款面向差异化应用场景的衍生版本,二者同样基于中国自主设计的AI芯片架构开发,进一步强化了软硬协同的定制能力。
面对即将上线的V4云服务所带来的算力需求激增,包括阿里巴巴、字节跳动及腾讯在内的头部互联网企业已提前锁定华为最新AI芯片产能,累计下单量已达数十万颗级别。
值得注意的是,华为已于3月21日在中国合作伙伴大会上正式推出搭载昇腾950PR处理器的Atlas 350加速卡。该芯片采用SIMD架构,在FP8精度下提供1PFLOPS算力,FP4模式下更可达2PFLOPS,并全面支持FP32、FP16、BF16、FP8、MXFP8及FP4等多种数据格式。其互联带宽高达2TB/s,配备128GB高带宽内存,内存带宽为1.6TB/s。
这一系列动作标志着中国大模型产业正从“依赖进口算力”向“国产算力优先”加速转型,国产AI芯片生态迎来实质性突破拐点。