更多精彩,请点击上方蓝字关注RVEI

SPEC CPU2017是权威的CPU性能基准测试套件,用于评估处理器综合能力。但在芯片验证阶段,仿真平台速度慢、资源有限,很难直接跑全量测试。
行业数据也反映了这个问题的严重性:根据西门子EDA与Wilson Research Group联合发布的2024年功能验证趋势报告,ASIC/SoC项目首次投片成功率已降至14%,超过75%的项目出现延期。
因此,在芯片投片前高效、准确地预估性能,是保障芯片制造后性能达标、具备商用竞争力的关键环节。
面向RISC-V架构的
轻量化切片评估方案
业界目前有两种主流的切片评估方案:一是基准子集测试,选代表性子集用例(如INTRATE的505、523、531);二是聚类+ROI识别,用兴趣区域代表程序整体行为,典型实现是x86的Pinball工具。
砺睿微的方案基于第二类,但RISC-V生态下Pinball等工具无法直接使用,因此选用NEMU解释器提取指令流。
相比全量测试,该方案的准确率高于95%(多核配置下最高可达99.63%),测试耗时缩短至原来的1/321,实现了准确率与提效比的双重突破,且具有良好的可拓展性。
三步快速部署
多环境可适配
该切片方案流程简洁清晰,仅需三步即可完成高效制作,最终生成的 ELF 文件通用性强,可作为工作负载灵活接入虚拟机、模拟器等各类验证环境。
先采集关键信息,智能筛选代表性片段并分配权重;再回放指令流,提取核心指令与数据;最终生成标准 ELF 文件,轻松适配各类验证平台。
基于该切片文件即可快速获取 CPI 数据,结合权重信息准确算出 SPEC CPU2017 分数,为微架构性能调优提供持续、可靠的数据支撑。详细流程如下图所示。

实测验证:
高准高效双重突破
该方案的回归测试基于业内RISC-V服务器平台进行,针对单核、多核配置下的SPEC CPU2017切片准确率进行了回归测试,使用交叉编译工具链为gcc14.2,选取的测试集为SPEC CPU2017 INTRATE。

从上述测试结果中可以看出,该方案的单核及多核切片跑分与对应的bin文件对比,总分误差率在5%以内,且误差率随着核数增加显著降低,在64核的测试环境下误差率小于1%。
对比整体的测试时间,bin文件单核运行时间为11893秒,切片单核运行时间为37秒,测试耗时缩短为原来的 1/321。
相比Pinball、DynamoRIO等通用方案,砺睿微的切片方案:
-
支持RISC-V架构,覆盖单核到多核性能评估;
-
生成的ELF文件不依赖特定模拟器,灵活可拓展;
-
实测验证结果具有高准确率(>95%)和高提效比(1/321耗时)。
未来,砺睿微将继续拓展切片方案至更多SPEC测试集(如FPRATE),并探索在AI加速器等异构场景下的应用,持续为RISC-V生态提供高效的性能验证工具。
北京砺睿微电子科技有限公司(简称“砺睿微”)由深圳市中兴微电子技术有限公司为投资主体,于2023年在北京经济技术开发区注册成立,是北京市高精尖产业发展布局在算力基础设施建设领域重点引进的一家高科技创新企业。公司致力于提高国产算力芯片的核心竞争力和相关产业链的快速发展。
来源:中兴微