
随着大模型和高性能 AI 业务全面上云,用户的核心诉求正在从“有没有算力”转向“算力是否可控、是否隔离可信、能否高效调度”。在云端做 AI 训练与推理,一方面需要极致的 I/O 性能和多 GPU 扩展能力,另一方面又必须满足硬件级安全和全链路数据保护诉求。传统以 CPU 为中心的云基础设施,无法提供优化的性能、弹性和安全性,这会增加 Token 的成本。
NVIDIA BlueField-3 DPU 正是在这样的背景下成为下一代 AI 云的重要基础设施底座。通过硬件卸载、内生安全能力以及开放的虚拟化架构,NVIDIA BlueField-3 为实现在性能、弹性和安全性之间提供了一个“无需妥协”的途径。
破解虚拟化的长期矛盾
NVIDIA BlueField 通过将数据面的处理从主机 CPU 转移到数据处理器 DPU 解决了虚拟化网络和存储领域性能与弹性长期存在矛盾。它基于硬件级 vDPA 架构,将数据卸载至 BlueField,由专用硬件完成转发和加速,而控制面仍然保留在软件端侧,用于可观测、可管控和虚拟化管理。
全栈硬件卸载:
把 CPU 从 I/O 中释放
在资源交付层面,NVIDIA BlueField 提供全栈硬件卸载:尽可能多地把 I/O 相关开销迁移到 DPU 上,由 BlueField 全权负责。在 AI 场景下,这往往意味着更多的 CPU 核心资源可以用于数据预处理、训练任务调度和推理前后处理。
内置安全:
构建 CPU–DPU–GPU 的可信链路
NVIDIA BlueField 不仅是一个性能加速器,也是云上“可信数据通路”的关键支点。虽然 BlueField DPU 通过将网络和 I/O 路径纳入严格控制的安全边界,强化了机密计算部署。与机密虚拟机和机密容器技术协同工作,有助于将保护范围从计算层扩展出去,以支持更全面的端到端安全架构。
基于这种架构,百度云已经在新一代机密虚拟机中实现规模化落地。BlueField-3 成为了“全链路可信”体系中的重要一环:上有机密虚机、机密容器,侧有 DPU 保障的可信 I/O 通路,最终构建从计算到存储、从主机到网络的统一安全边界。
面向下一代 AI 云基础设施的意义
站在云平台的视角,采用 NVIDIA BlueField 并不仅仅是“换一块更强的网卡”,而是重构 I/O、虚拟化和安全栈的一次机会。
对于希望在 AI 云市场中建立长期优势的厂商来说,NVIDIA BlueField 不再是“性能优化选配项”,而越来越接近下一代 AI 基础设施的“必选项”。
以上为摘要内容,点击“阅读原文”或扫描下方二维码阅读完整内容:
