NVIDIA BlueField DPU：助力 AI 云兼顾效率与可信

随着大模型和高性能 AI 业务全面上云，用户的核心诉求正在从“有没有算力”转向“算力是否可控、是否隔离可信、能否高效调度”。在云端做 AI 训练与推理，一方面需要极致的 I/O 性能和多 GPU 扩展能力，另一方面又必须满足硬件级安全和全链路数据保护诉求。传统以 CPU 为中心的云基础设施，无法提供优化的性能、弹性和安全性，这会增加 Token 的成本。

NVIDIA BlueField-3 DPU 正是在这样的背景下成为下一代 AI 云的重要基础设施底座。通过硬件卸载、内生安全能力以及开放的虚拟化架构，NVIDIA BlueField-3 为实现在性能、弹性和安全性之间提供了一个“无需妥协”的途径。

破解虚拟化的长期矛盾

NVIDIA BlueField 通过将数据面的处理从主机 CPU 转移到数据处理器 DPU 解决了虚拟化网络和存储领域性能与弹性长期存在矛盾。它基于硬件级 vDPA 架构，将数据卸载至 BlueField，由专用硬件完成转发和加速，而控制面仍然保留在软件端侧，用于可观测、可管控和虚拟化管理。

全栈硬件卸载：

把 CPU 从 I/O 中释放

在资源交付层面，NVIDIA BlueField 提供全栈硬件卸载：尽可能多地把 I/O 相关开销迁移到 DPU 上，由 BlueField 全权负责。在 AI 场景下，这往往意味着更多的 CPU 核心资源可以用于数据预处理、训练任务调度和推理前后处理。

内置安全：

构建 CPU–DPU–GPU 的可信链路

NVIDIA BlueField 不仅是一个性能加速器，也是云上“可信数据通路”的关键支点。虽然 BlueField DPU 通过将网络和 I/O 路径纳入严格控制的安全边界，强化了机密计算部署。与机密虚拟机和机密容器技术协同工作，有助于将保护范围从计算层扩展出去，以支持更全面的端到端安全架构。

基于这种架构，百度云已经在新一代机密虚拟机中实现规模化落地。BlueField-3 成为了“全链路可信”体系中的重要一环：上有机密虚机、机密容器，侧有 DPU 保障的可信 I/O 通路，最终构建从计算到存储、从主机到网络的统一安全边界。

面向下一代 AI 云基础设施的意义

站在云平台的视角，采用 NVIDIA BlueField 并不仅仅是“换一块更强的网卡”，而是重构 I/O、虚拟化和安全栈的一次机会。

对于希望在 AI 云市场中建立长期优势的厂商来说，NVIDIA BlueField 不再是“性能优化选配项”，而越来越接近下一代 AI 基础设施的“必选项”。

以上为摘要内容，点击“阅读原文”或扫描下方二维码阅读完整内容：