公众号记得加星标⭐️,第一时间看推送不会错过。

由 AMD 和 Intel 共同定义的即将推出的 x86 扩展集 ACE 发布了最新规范,重点关注 AI 加速。
AMD和英特尔专注于通过符合ACE标准的下一代x86架构加速AI。

去年,英特尔和AMD合作成立了“x86生态系统咨询小组”,旨在加强x86生态系统。该计划的目标是提供一套跨架构的标准化功能,使x86架构更易于访问、可扩展,并能兼容未来的需求。其中一项关键功能是FRED、AVX10、ChkTag和ACE。
现在,AMD 和 Intel 发布了最新的ACE“AI 计算扩展”规范,让我们得以了解这项针对 x86 芯片的新功能能够提供什么。
面向 x86 架构的 AI Computex Extensions (ACE) 旨在显著提升矩阵乘法性能,同时兼顾可扩展性和能效。众所周知,矩阵乘法是人工智能工作负载中神经网络和逻辑线性模型 (LLM) 的核心组成部分。
当前的 SIMD(单指令多数据流)扩展,例如 AVX10,可以进行矩阵乘法运算,但其可扩展性和计算密度有限。加速矩阵乘法等技术可以提高性能,但这并非一种高效的方法。EAG 旨在通过 ACE 解决这个问题,ACE 既能加速矩阵乘法,又能提供更高的灵活性和可扩展性。

ACE 扩展定义了矩阵乘法原语,为 AVX 和标量代码添加了新功能,具体包括:
ACE寄存器状态,包括图块和块缩放寄存器
消耗 AVX 寄存器输入并对图块寄存器状态进行操作的数据处理操作
数据移动操作,用于在ACE寄存器状态和AVX寄存器之间移动数据。
系统管理的状态和操作
ACE 实现了 AVX 向量和 ACE 瓦片寄存器之间的紧密集成,将高计算密度的瓦片处理操作与 AVX 的全面数据处理功能相结合。
除了矩阵加速之外,AVX10 框架还提供了一系列专用的格式转换操作。
这些最新规范定义了用于加速计算任务的 x86 扩展,最初侧重于矩阵乘法内核和对机器学习工作负载重要的降低精度数据格式。
数据格式
本文档中描述的扩展功能包括对多种数据格式的支持。这可能包括对矩阵乘法等运算的原生格式支持、对 OCP MX 风格运算的缩放支持、累加格式以及不同格式之间的格式转换支持。未来可能会引入对其他数据格式的支持。

ACE只是x86架构发展道路上的一步。我们还讨论过APX(高级性能扩展),它将在下一代x86架构芯片的开发中发挥至关重要的作用。这些进步有望在未来的产品线中得到应用。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
END
今天是《半导体行业观察》为您分享的第4443内容,欢迎关注。
推荐阅读
★
★
★
★
★
★
★
★

加星标⭐️第一时间看推送


