CXL 3.1+PCIe 6.2：AI计算效率的新纪元

我们每一代人都会在成长过程中探索科技的未来。每个时代也都会描绘着对未来的愿景：从60年代的《杰森一家》、70年代的《星球大战》、21世纪初的《拜见罗宾逊一家》，到如今数百部未来主义电影中的任何一部。人类的好奇心始终有一个共同点：人工智能(AI)。

在这些电影中，基于人工智能的角色以机器人管家或贴心朋友的身份登场。然而，曾经美好的愿景如今已成为现实。这股热潮背后，凝聚着无数杰出人才和先进设备。尽管如此，推动这一转变的最伟大创新之一是基于CXL的内存池及其协同技术PCIe。这两项技术改变了开发人员实现工作负载分配和速度的方式，使我们更接近那些未来主义的伙伴。在我们都能实现电影级的AI之前，当今的AI必须突破计算需求、海量数据传输、实时处理和内存利用率的界限。传统的计算架构仅依赖于PCle互连，难以跟上AI工作负载的快速发展，而这正是CXL 3.1(最新一代CXL标准)能够发挥作用的地方，它为内存和资源分配提供了一种全新的方法。

基于CXL的内存池：AI的新范式

半导体行业协会(SIA)的一项研究表明，内存瓶颈在当今AI工作负载中可能导致高达40%的性能损失。如今的CXL旨在通过启用可由多个处理单元访问的共享内存池来缓解这一问题。

CXL 3.1不仅增加了带宽，还重新定义了内存的访问和共享方式。通过在CPU、GPU和加速器之间实现动态内存池共享，CXL使AI系统能够更高效地优化其资源。这种方法的主要优势包括：

消除内存瓶颈：AI模型通常需要大量的内存资源，这可能导致传统架构的效率低下。CXL 3.1支持共享内存模型，从而降低延迟并最大限度地提高利用率。
降低功耗：CXL通过允许AI工作负载专注于分配所需的内存，最大限度地减少不必要的功耗，从而实现更节能的AI训练和推理。
无缝扩展AI应用：灵活的内存共享架构允许AI开发人员构建更复杂的模型，而不受CPU、GPU和DPU中传统内存层次结构的限制。

AI加速的混合方法

虽然CXL彻底改变了内存管理，但PCIe对于高速数据传输仍不可或缺。PCIe 5.0提供高达128GB/s的双向带宽，确保AI应用的高速数据交换。随着PCIe 6.2的创新，这一传输速率预计还会进一步提升，而混合方法正是PCIe 6.2的真正亮点。

在同时使用PCIe 6.2和CXL 3.1的统一解决方案中，可以灵活利用两种标准的优势。这种混合方法尤其适用于复杂的AI系统，因为它具有高速数据传输、高效的内存共享和面向未来的基础架构。

PCIe 6.2提供极高的数据传输速率，可确保AI加速器无延迟地接收所需数据。CXL 3.1支持多个处理单元对共享内存池的动态访问，从而提高内存利用率。单一SoC上集成支持PCIe 6.2与CXL 3.1的混合交换机，可为下一代AI工作负载提供无缝升级与可扩展性。

资讯配图

CXL助力AI的未来

未来几代基于CXL的芯片将通过促进AI加速器和内存池之间的直接通信，彻底革新AI驱动的计算，从而显著提升效率。这些互连可减少数据传输瓶颈，并实现智能内存分配，使AI模型能够处理信息并适应不断变化的工作负载。超越传统架构，下一代CXL 3.1和PCIe 6.2技术将开启全新可能，支持需要极高效率和实时决策的应用。