
NVIDIA 发布了 Nemotron 3 Ultra,这是一个专为长时间运行的智能体构建的开放模型,并由 Nemotron Coalition 协同开发。
为长时间运行的智能体提供支持的模型,其作用远不止是生成文本。它们需要解释信息、规划后续步骤、调用工具、评估结果并进行反复迭代,以完成复杂的编码、研究和企业级任务。这就需要高效模型能够在更短的时间内探索更广的搜索空间,从而更快地提供更高准确度的结果。
Nemotron 3 Ultra 专为这种新工作负载而打造。这是一款前沿智能模型,推理速度可提升高达 5 倍,并可将复杂智能体任务的成本降低高达 30%。这使智能体能够在更短的时间内完成相同的工作,或在相同时间内完成更多工作。

Nemotron 3 Ultra 是一个具有 5,500 亿参数的混合专家模型,能够处理自主工作流中的编排和高难度的推理调用:在长时间运行的编码会话中做出架构决策、跨数百个研究来源进行合成,以及对数千个相互依赖的约束进行验证。
这些模型目前已在 Hugging Face、魔搭社区、OpenRouter 以及 NVIDIA 官网以 NVIDIA NIM 的形式提供,并通过 NVIDIA 云合作伙伴、推理平台和云服务提供商构成的广泛的生态系统供用户使用。
以上为摘要内容,请点击“阅读原文”或扫描下方二维码阅读完整内容:

扫描下方海报二维码,观看 NVIDIA CEO 黄仁勋在 GTC 台北大会现场发表的主题演讲回放,深入了解推动新一代 AI 的突破性成果。
