加解密运算:进迭时空 RISC-V Vector Crypto 量产实践

进迭时空SpacemiT 2026-04-10 19:44
加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图1
加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图2

近年来,RISC-V 不断在各个应用场景落地,在各种真实应用场景中,安全一直是离不开的一个话题。加密、认证、哈希、校验正逐步成为系统中的常驻负载。进迭时空在 K3 芯片上推进 RISC-V Vector Crypto,在真实硬件与应用中形成稳定、可感知、可复用的密码学能力,为 RISC-V 生态的真正落地提供答案。

加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图3


加密与认证广泛应用于网页访问、数据传输、文件同步、VPN连接等场景。随着云边协同、零信任接入、存储加密等需求持续增长,密码学计算正从“可选能力”转为“常驻负载”。针对这一趋势,进迭时空选择在 RISC-V 处理器中支持 RISC-V Vector Crypto 扩展。不同于依赖通用 CPU 标量指令计算或外挂独立密码加速 IP 的方法,Vector Crypto 在原有 RISC-V Vector 扩展的基础上,直接增强了加密、认证和哈希等计算,进而提升这些场景下的应用表现。


从进迭时空的实践来看,Vector Crypto 有以下3个特点:


  1. 同时覆盖国际标准算法与中国商用密码算法

  2. 以结构化的 Element Group 提升软硬件协同效率

  3. 在设计上注意执行时延与加密内容无关,降低时序侧信道风险


对进迭时空而言,Vector Crypto 的意义不只是“更快”,更在于把“高性能、标准化、可控安全实现”统一到同一条执行路径上。SpacemiT K3 的价值,也正在于将这一能力从规范推进到量产实践。



算法级测试结果


算法级及应用级实验均基于 K3 芯片的 X100 实测。以下为 OpenSSL benchmark 中,不同数据规模下开启 Vector Crypto 后相对标量基线的加速倍数。


加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图4


结果中可观察到几个明确趋势:


  1. 数据块越大,收益通常越明显。如 aes-128-cbc 从 16 bytes 的 4.7x 提升到 16384 bytes 的 13.9x,GHASH 更是从 2.5x 提升到 46.6x。

  2. 块加密与认证路径表现最为突出。AES-CBC 和 GHASH 的提升符合其天然适合并行处理的特性。

  3. 不同算法对向量化的敏感度存在差异。sha512、SM3 的提升相对平稳,说明算法结构、数据组织方式及实现路径均影响最终收益。



应用级测试结果


算法级 benchmark 固然重要,但用户感知更多取决于真实应用场景。



01.  HTTPS / TLS 场景


网络安全测试使用 Nginx + TLS 1.3 服务端,客户端通过 openssl s_time 压测,对比 AES-GCM 和 ChaCha20-Poly1305 两组 cipher suite,分别在 1KB 和 1MB 文件场景下测试 with/without Vector Crypto 的差异。两种连接方式含义如下:


  • 新建连接:每次请求重新建立 TLS 连接

  • 复用连接:复用已有 session 进行请求


加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图5


在 1KB 小包场景下,两种算法均有提升,但幅度相对有限;进入 1MB 大包传输后,AES-GCM 收益明显拉开,新建连接模式提升约 72.9%,复用连接模式提升约 49.7%。这与前述算法级实验中 AES + GHASH 受益更明显的结论一致。


而 ChaCha20-Poly1305 的表现更平稳。其原因在于,ChaCha20 本身并没有直接对应的 Vector Crypto 专用加速指令,因此能够获得的收益相对有限。这一点在 HTTPS / TLS 场景中也体现得比较明显:整体有提升,但无论是小包还是大包,增益都明显低于 AES-GCM 路径。



02.  存储安全场景


存储安全测试使用 fio,在 verify=sha256 场景下观察开启 Vector Crypto 后,带校验的写路径和校验读路径是否发生变化。测试覆盖 4k、64k、1m 三种块大小。


加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图6
加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图7


Vector Crypto 对“写入 + SHA256 校验”路径提升显著,而且块越大,收益越高。1m 下,写路径达到 6.58x,校验读达到 6.46x。对照组表明,纯顺序读几乎没有变化,说明提升主要来自 sha256 verify 处理过程,而非普通 I/O 。



03.  数据完整性校验场景


数据完整性测试使用 openssl dgst -sha256,分别测试 1GB 大文件和 4096 x 16KB 批量小文件两类场景。


加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图8

实验结果符合工程直觉:大文件完整性校验提升显著(约 7.34x),而批量小文件的耗时主要由文件切换和调度开销主导,收益很小(约 1.78%)。说明优化更适合大块数据的连续处理,而非存在频繁文件切换和调度开销主导的场景。



04.  WireGuard 隧道场景


在 WireGuard 测试中,额外做了纯 ChaCha20-Poly1305 benchmark 和实际隧道吞吐两组对比。

  • 纯 ChaCha20-Poly1305 benchmark 下,1KB 负载提升约 19.9%

  • 纯 ChaCha20-Poly1305 benchmark 下,1MB 负载提升约 39.2%

  • 但实际 WireGuard 隧道吞吐几乎没有变化,稳定在约 0.89 Gbit/s

这一结果说明,当前 WireGuard 负载的主要瓶颈不在加解密运算本身,因此即便 ChaCha20-Poly1305 的纯算法 benchmark 已经明显提升,实际隧道吞吐也不会出现同等幅度的增长。



05.  国密合规场景


国密合规测试主要围绕 Tongsuo 展开,对比使用 Vector Crypto 与未使用 Vector Crypto 两种配置下的表现,分成两个层面:


  • 算法级性能对比:观察 SM3 和 SM4-CBC 在应用实现中的实际收益;

  • TLCP 应用场景对比:观察这些收益能否反映到连接层性能上。


先看算法级结果:


SM3 的对比覆盖了从 16B 到 16384B 的多个数据规模。使用 Vector Crypto 和未使用 Vector Crypto 的速度之比如下图所示:


加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图9


可以看到,SM3 在不同负载下都能获得稳定收益,并且数据块越大,提升越明显,大块数据时已经接近 2.4x。


SM4-CBC 的提升更直接,使用 Vector Crypto 和未使用 Vector Crypto 的速度之比如下图所示:



加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图10


这说明在 Tongsuo 的国密应用实现中,SM4-CBC 是一条非常典型的高收益路径,其提升范围已经达到 3.6x ~ 7x。


再看 TLCP 应用层表现。测试场景使用本机 TLCP 服务端,协议为 NTLSv1.1,cipher suite 为 ECC-SM2-SM4-CBC-SM3,对 /1k.bin 进行 60 秒短连接压测。结果如下:


加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图11


也就是说,在 TLCP 国密短连接场景中,使用 Vector Crypto 已经能够体现出稳定可见的连接层收益。综合来看,在国密场景下,Vector Crypto 不仅能显著提升 SM3、SM4-CBC 等算法路径的性能,而且能将收益进一步传导到 TLCP 等真实应用场景中。



结语


RISC-V Vector Crypto 的价值,不在于“多了一组新指令”,而在于它让处理器第一次能更系统地承担起高频密码学工作负载。


对进迭时空而言,K3 的意义不只是“支持了标准”,而是将这一能力真正落地到量产硬件,并在算法级和应用级两个层面都给出了可验证的优化结果。下一步,进迭时空将继续围绕真实业务负载推进软硬件协同优化,让 Vector Crypto 在更多场景中释放稳定的性能收益。



加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图12



加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图13

点击下方图标,关注进迭时空 SpacemiT 资讯平台

加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图14
加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图15
加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图16
加解密运算:进迭时空 RISC-V Vector Crypto 量产实践图17


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
RISC-V 进迭时空
more
加解密运算:进迭时空 RISC-V Vector Crypto 量产实践
[生态进展] VSCode RISC-V 插件正式支持进迭时空(SpacemiT)AI 拓展指令集
2026 全国大学生嵌入式大赛开放报名中!参加“进迭时空赛道”赢取实习机遇及现金奖励
Canonical 与进迭时空携手:Ubuntu 全面支持 K3/K1 RISC-V AI CPU 计算平台
进迭时空 K3 芯片完成国家级人形机器人创新中心技术验证
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号