更多精彩,请点击上方蓝字关注RVEI


三位一体:RISC-V构建覆盖全场景的矩阵计算图谱
随着大规模预训练模型(LLM)从云端训练加速向边缘端推理渗透,计算负载的特征正经历深刻变革。会议开场,阿里巴巴达摩院玄铁处理器架构师项晓燕全面勾勒了RISC-V矩阵计算标准的宏观蓝图。
项晓燕指出,为满足从嵌入式设备到高性能服务器的多元化算力需求,RISC-V指令集工作部正协同推进三项核心矩阵扩展标准的制定,形成“三位一体”的战略布局:
IME(集成矩阵扩展):以最少的架构状态增加扩展出了矩阵计算,旨在为低功耗及资源受限场景提供高效的矩阵处理能力。
VME(向量-矩阵扩展):依托于RISC-V Vector扩展,扩展独立累加寄存器和矩阵计算,实现向量运算与矩阵运算的高效融合与平滑过渡。
AME(附属矩阵扩展):面向高性能计算场景,通过挂载专用矩阵运算单元,追求极致的计算吞吐量与面积能效比。
这一布局标志着RISC-V正从通用处理器架构,向面向AI原生、适应异构计算需求的全栈架构加速演进。
规范深度解析:Polymorphic ISA 与 Mtype CSR 创新设计
随后,芯昇科技高级芯片架构师李高山与阿里巴巴达摩院技术专家仇径对当前制定中的三种扩展规范中的讨论热点--矩阵数据类型,进行了深度技术拆解。
IME/VME扩展的创新亮点在于其Mtype CSR(矩阵类型控制与状态寄存器)设计。该方案将数据类型信息与具体运算指令解耦,允许同一条运算指令依据CSR的配置动态执行不同精度的计算,并为未来支持更多数据格式预留了灵活接口。
AME扩展则引入了独特的“Sidecar”(侧车) 元数据架构作为其核心设计哲学之一,与其 “Polymorphic ISA”(多态指令集架构) 理念相辅相成。通过分离的元数据通道管理数据形状、类型等上下文信息,AME实现了运算指令与数据特征的解耦,大幅提升了指令集的表达效率与执行灵活性。
在传统设计中,操作数类型与维度常被硬编码,而AME通过这一创新机制,允许单条指令动态适配不同数据类型的矩阵运算,为高性能计算提供了更优的架构支持。通过定义不同应用场景的Profile,允许芯片厂商根据目标市场(如高精度科学计算或低比特AI推理)灵活选择类型支持子集。
这种“通用基础集合+场景化方案”的思路,有效平衡了指令集架构的统一性与商业实现的灵活性,有助于避免生态碎片化,同时为厂商保留了充足的差异化创新空间。
展望:RISC-V在AI时代的使命与征程
会议总结阶段,与会专家达成重要共识:矩阵扩展标准的制定,不仅是RISC-V指令集能力的重要拓展,更是整个生态面向AI时代算力需求的一次系统性升级。
本次技术分享会系统揭示了IME/VME/AME三大扩展的技术内涵与协同价值,向产业界传递了明确信号:RISC-V已构建起从嵌入式设备到服务器的全场景矩阵计算能力图谱。通过开放、协同的标准化路径,RISC-V正在成为驱动全球AI算力创新与普惠的关键基础设施。
值得关注的是,由阿里巴巴达摩院牵头推进的RISC-V国际协会(RVI)AME标准制定工作,展现了我国在处理器开放架构前沿领域的深度参与和技术引领能力。这种开放协同的创新模式,将为中国乃至全球的AI算力发展注入新的动能,加速大模型时代计算基础设施的演进与革新。
来源:RVEI秘书处
