NVIDIA Nemotron 3 Super登顶开源榜单,混合架构重塑推理效率边界

科技区角 2026-05-06 16:01

【区角快讯】在开源大模型的激烈角逐中,NVIDIA再次交出了一份亮眼的成绩单。据5月6日披露的消息,其旗下开源模型Nemotron 3 Super成功问鼎EnterpriseOps-Gym排行榜开源类别榜首,以27.3分的平均成绩力压群雄。紧随其后的是Kimi-K2.5(26.2分)、DeepSeek v3.2(23.8分)以及MiniMax m2.7(23.0分),而GPT-OSS-120B则以17.1分位列第五。这一排名不仅反映了当前开源生态的竞争格局,更凸显了特定架构在复杂任务中的优势。



回顾今年3月的GTC大会,Nemotron 3 Super作为混合专家(MoE)模型正式亮相。该模型总参数量高达1200亿,但在实际推理过程中,仅激活其中的120亿参数。这种设计巧妙地在维持高知识密度的同时,大幅削减了计算开销。值得注意的是,其采用的潜在混合专家架构通过压缩输入数据,使得在同等推理成本下,能够调用的“专家子网络”数量激增至四倍,从而显著提升了处理复杂任务的灵活性。

长上下文支持是该模型的另一大亮点。原生支持的100万token窗口,让模型在执行长时间任务时能保持连贯的长期记忆,有效规避了目标偏移的风险。数据显示,其吞吐量较上一代Nemotron Super提升了五倍以上。硬件层面的适配同样激进,基于Blackwell架构的原生NVFP4预训练,使其在B200上的推理速度达到H100使用FP8格式时的四倍,且精度未受折损。

此外,借助NeMo Gym与NeMo RL框架,该模型在21种不同环境配置下完成了多环境强化学习后训练,累计部署超过120万次训练环境。目前,Nemotron 3系列已覆盖Nano、Super和Ultra三条产品线,而同步推出的Nemotron 3 Nano Omni更是宣称能将AI吞吐量提升九倍,显示出NVIDIA在细分场景下的全面布局野心。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源
more
李飞飞世界模型“杀手锏”开源!网页3D大场景秒开,手机畅跑1亿点云
开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测
全球OCR新王来自中国开源!GitHub狂揽73300+Star
月之暗面估值飙至200亿美元,中国开源模型何以在“性价比”赛道突围?
刚刚,Claude Code开源了!51万行代码,全网狂欢
大厂数据护城河打破!上交全开源Search Agent OpenSeeker登场
国产双开源:让Mac成为你的私人AI工作站
AI“复活”张雪峰引法律与伦理争议,开源项目“张雪峰.skill”登上GitHub热搜
开源模型首超Opus4.6!智谱GLM-5.1登场,14小时后CUDA专家被冲了
2B开源模型手机养虾!谷歌Gemini 3技术下放:支持语音视频多模态,全免费可商用
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号