NVIDIA Nemotron 3 Super登顶开源榜单,混合架构重塑推理效率边界

科技区角 2026-05-06 16:01

【区角快讯】在开源大模型的激烈角逐中,NVIDIA再次交出了一份亮眼的成绩单。据5月6日披露的消息,其旗下开源模型Nemotron 3 Super成功问鼎EnterpriseOps-Gym排行榜开源类别榜首,以27.3分的平均成绩力压群雄。紧随其后的是Kimi-K2.5(26.2分)、DeepSeek v3.2(23.8分)以及MiniMax m2.7(23.0分),而GPT-OSS-120B则以17.1分位列第五。这一排名不仅反映了当前开源生态的竞争格局,更凸显了特定架构在复杂任务中的优势。



回顾今年3月的GTC大会,Nemotron 3 Super作为混合专家(MoE)模型正式亮相。该模型总参数量高达1200亿,但在实际推理过程中,仅激活其中的120亿参数。这种设计巧妙地在维持高知识密度的同时,大幅削减了计算开销。值得注意的是,其采用的潜在混合专家架构通过压缩输入数据,使得在同等推理成本下,能够调用的“专家子网络”数量激增至四倍,从而显著提升了处理复杂任务的灵活性。

长上下文支持是该模型的另一大亮点。原生支持的100万token窗口,让模型在执行长时间任务时能保持连贯的长期记忆,有效规避了目标偏移的风险。数据显示,其吞吐量较上一代Nemotron Super提升了五倍以上。硬件层面的适配同样激进,基于Blackwell架构的原生NVFP4预训练,使其在B200上的推理速度达到H100使用FP8格式时的四倍,且精度未受折损。

此外,借助NeMo Gym与NeMo RL框架,该模型在21种不同环境配置下完成了多环境强化学习后训练,累计部署超过120万次训练环境。目前,Nemotron 3系列已覆盖Nano、Super和Ultra三条产品线,而同步推出的Nemotron 3 Nano Omni更是宣称能将AI吞吐量提升九倍,显示出NVIDIA在细分场景下的全面布局野心。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源
more
最小仅2B!谷歌最强开源模型登场,免费商用,手机就能跑
LeCun点赞:国产开源模型占领硅谷,性价比超10倍
阿里新模型刚屠榜,就被套壳网站“开源”收美元了。。。
龙虾冲浪终于不迷路了!网页智能体新框架Avenir-Web开源即SOTA
国产大模型强势崛起:豆包登顶国内榜首,小米双模上榜,开源赛道领跑全球
华为盘古大模型负责人离职/ChatGPT成人模式无限期搁置/飞书CLI开源,可让Agent接管 |Hunt Good周报
没想到!DeepSeek V4里,竟还藏着一个中国万亿开源模型
浙大开源ClawGUI,打通GUI智能体训练、评估与部署全链路
AI“复活”张雪峰引法律与伦理争议,开源项目“张雪峰.skill”登上GitHub热搜
炸场!英伟达发布全球首个开源量子AI模型
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号