DeepSeek V4参数量或达1.6万亿,算子库更新引发发布猜想

科技区角 2026-04-17 20:01

【区角快讯】据4月17日披露的消息,随着4月下旬临近,国产大模型DeepSeek V4的发布进程持续引发业界高度关注。日前,DeepSeek研发团队悄然对其核心组件DeepGEMM算子库进行了重要更新,此举被广泛解读为V4即将上线的关键信号。



尽管团队在更新后迅速补充说明,强调此次改动仅服务于DeepGEMM自身的开发迭代,与内部大模型发布无直接关联,并呼吁外界“勿作过度联想”,但这一澄清反而进一步激起了社区对V4的猜测热情。分析指出,本次算子库升级包含多项关键技术突破,很难与下一代模型完全脱钩。

具体来看,新版本DeepGEMM不仅新增对FP8_FP4混合精度算子的支持,还针对NVIDIA最新Blackwell架构进行了深度优化。更关键的是,其底层架构引入了Mega MoE与HyperConnection两项创新设计。其中,Mega MoE有望推动混合专家(MoE)架构实现重大跃迁。

有技术解析援引Gemini相关资料推测,DeepSeek V4激活的专家数量或将从V3的256个跃升至数千级别。这一改进可在显著增强模型推理能力的同时,有效控制对算力与显存的消耗,维持系统灵活性。

此外,社区根据算子库透露的结构参数推算,若单层MoE规模约为253.7亿参数,且模型维持60层设计,则V4总参数量极可能达到1.6万亿;即便采用48层结构,参数量也预计达1.25万亿。相较此前流传的1万亿预期,1.6万亿意味着提升幅度高达60%。

即便最终落地版本为1.25万亿参数,也已较当前V3的6700亿参数实现近一倍增长。结合数千专家激活机制,此次升级或将成为MoE架构演进史上的里程碑事件,标志着国产大模型在性能与效率平衡上迈出关键一步。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
在硅谷和两个 AI 工程师聊完,我觉得下一代汽车可能不是车了
国产AI激光灭蚊设备Photonmatrix海外众筹火爆,今夏将量产交付
阿里“快乐马”登顶AI视频生成榜单,4月30日开放API引行业震动
小米上线电池升级服务,深圳预付式消费新规拟设7天冷静期,Claude要求用户上传身份证件,特斯拉AI5芯片流片,这就是今天的其他大新闻!
OpenAI豪掷200亿美元押注Cerebras,加速构建去英伟达化算力生态
谷歌悄悄加了个按钮,Gemini长出手脚变打工人!三巨头抢着教AI干活
第一篇AI署名的正式报道出现了,讨论“词元经济”的崛起
2025年数字消费者洞察分析:生成式AI服务
1300亿!曝OpenAI花大价钱给英伟达找备胎
独家!《2026中国电子工程师AI应用现状白皮书》重磅发布
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号