NVIDIA Nemotron 3 Ultra 正式上线！Perplexity、Palantir 和 ServiceNow 作为早期采用者，正以此驱动长时间运行的 AI 智能体

NVIDIA 发布了 Nemotron 3 Ultra，这是一个专为长时间运行的智能体构建的开放模型，并由 Nemotron Coalition 协同开发。

为长时间运行的智能体提供支持的模型，其作用远不止是生成文本。它们需要解释信息、规划后续步骤、调用工具、评估结果并进行反复迭代，以完成复杂的编码、研究和企业级任务。这就需要高效模型能够在更短的时间内探索更广的搜索空间，从而更快地提供更高准确度的结果。

Nemotron 3 Ultra 专为这种新工作负载而打造。这是一款前沿智能模型，推理速度可提升高达 5 倍，并可将复杂智能体任务的成本降低高达 30%。这使智能体能够在更短的时间内完成相同的工作，或在相同时间内完成更多工作。

Nemotron 3 Ultra 是一个具有 5,500 亿参数的混合专家模型，能够处理自主工作流中的编排和高难度的推理调用：在长时间运行的编码会话中做出架构决策、跨数百个研究来源进行合成，以及对数千个相互依赖的约束进行验证。

这些模型目前已在 Hugging Face、魔搭社区、OpenRouter 以及 NVIDIA 官网以 NVIDIA NIM 的形式提供，并通过 NVIDIA 云合作伙伴、推理平台和云服务提供商构成的广泛的生态系统供用户使用。

以上为摘要内容，请点击“阅读原文”或扫描下方二维码阅读完整内容：

扫描下方海报二维码，观看 NVIDIA CEO 黄仁勋在 GTC 台北大会现场发表的主题演讲回放，深入了解推动新一代 AI 的突破性成果。