openEuler 24.03 LTS SP4版本正式上线发布，深化AI与全场景创新

2026年7月1日，OpenAtom openEuler（简称"openEuler"或“开源欧拉”） 24.03 LTS SP4 版本正式上线发布，该版本为基于6.6内核的24.03-LTS版本增强扩展版本，面向服务器、云、AI场景，持续提供更多新特性和功能扩展，包括内核优化、灵衢超节点可靠性&易用性、NPU算力切分、推理服务快恢、沙箱、智能诊断&调优&运维、编译器、机密虚机等，给开发者和用户带来全新的体验，服务更多的领域和更多的用户。感谢来自社区39家成员单位的2006名开发者的贡献和支持，让我们携手同行，共建更好的openEuler。

openEuler 24.03 LTS SP4下载链接：

https://www.openeuler.org/zh/download/

以下为版本优势

openEuler 24.03 LTS SP4版本正式上线发布，深化AI与全场景创新图2

01 AI场景创新

智能诊断：在openEuler 24.03 LTS SP4版本中提供容器干扰检测、干扰源分析及干扰恢复建议生成功能，通过智能诊断Agent+已知问题分析Agent组合即可自动完成全链路诊断，替代传统数小时人工调试，快速支撑应急止损。

智能调优：提供OS层性能分析调优skills和TopDown性能瓶颈自动化识别，快速获取系统重要性能指标数据及分析系统性能并提供优化建议。

AI软件包适配（新增30+）：覆盖搜推广场景，兼容Qwen，使能昇腾CANN。24.03 LTS SP4版本主动规划AI生态软件兼容性，解决头部搜推软件在openEuler 的安装及使用问题。支持千问235B模型部署、910B CANN及驱动与OS兼容适配（含软件包/容器发布与兼容性清单）和搜推软件适配。

XPU Turbo大语言模型推理优化方案：当前支持DeepSeek、Qwen等transformer架构的模型。通过上述技术，利用CPU填充推理任务，充分利用CPU资源，增加大模型并发量与吞吐量。

NPU算力切分：xSched是面向中小模型的通用NPU调度框架，提供任务抢占、时间片切分、组调度、算力带宽及显存容量管控等基础调度机制，并支持公平调度、实时调度等多种策略，满足多推理任务混部场景下单卡算力按需分配、解决资源过分配问题，以及多训推混部或在离线混部场景下推理任务快速抢占低优先级任务、保障高优任务性能的同时提升NPU资源利用率等不同AI场景的调度诉求。

故障快恢：为AI推理容器提供秒级故障快速恢复能力，将恢复时间从分钟级降低到秒级，并实现与k8s生态的对接，实现推理容器的秒级恢复。

02 超节点场景创新

IPoURMA：提供了一种基于UB协议和硬件传输IP数据包的标准化方法。融合UB高性能特性与以太网的广泛兼容性，在UB网络能够取代以太网卡提供标准TCP协议栈的socket API，提升UB易用性。

RH2D多级缓存直通加速：RH2D提供将远端Host上的KvCache通过异步流水传输到本端Device的能力。适用于AI推理、训练、分布式缓存和异构计算等需要频繁从远端节点获取大块数据并写入GPU的场景，适合大value、多并发、多线程读取场景，可降低数据获取过程中串行等待时间。

Qemu支持NPU卡D2H：UB Memory 部署于 GuestOS 业务驱动与 Host UMMU 之间，向上为 SVM 模块提供调用接口；向下基于 QEMU 模拟的 VUMMU 硬件，通过 Mapping Driver 实现 Guest 与 Host 内存 map/unmap 的透传。

灵衢系统高阶服务：面向灵衢超节点，为了应用快速使能超节点能力，灵衢系统构建了UB Service Core，封装UB底层能力、集群拓扑等，简化并兼容现有生态，让应用用本地资源一样使用超节点资源，简化应用开发，构筑6大集群级系统服务，释放超节点平等互联架构优势，全面使能应用加速30~50%，促进灵衢系统软件生态构筑。

灵衢可靠性：①灵衢可靠性插件：紧急事件发生时阻塞并上报至 UBPRM，防止数据丢失与业务中断，同时统一管理 UB event 事件，支持节点故障检测与恢复。②内存池化故障劫持&通知：补齐共享内存场景下内存故障的业务通知能力，业务感知故障后可自行进行处理。③内存借用文件缓存故障防扩散：针对远端和本地存在文件共享的场景，通过约束pagecache的分配位置，能够有效避免远端pagecache出现故障时，故障扩散到本地的情况。

超节点故障定界工具：面向超节点KVCache和URMA通信场景，提供时延和通断故障定界能力，问题定界时长<5min，该功能支持作为独立工具使用和接入外部运维系统两种应用模式。

03 云原生场景创新

Agent 沙箱：面对企业落地 Agent落地困难的痛点，24.03 LTS SP4版本中，openEuler打造轻量 Agent 沙箱运行时，构筑低Token消耗、全链路安全的 Agent 技术底座。通过软硬协同优化镜像快照，结合远端懒加载、分层按需加载，大幅缩短冷启动耗时；依托鲲鹏超节点实现镜像快照共享分发，规避重复拉取。双重优化叠加，显著提升多沙箱启动效率，兼顾极速响应与安全保障。该沙箱运行时支持AI Agent安全执行代码与调用工具、自动化工作流处理及轻量级可扩展云端IDE等场景。

04 内核创新

openEuler 24.03 LTS SP4基于 Linux Kernel 6.6内核构建，在此基础上，同时吸收了社区高版本的有益特性及社区创新特性。openEuler发布64K内核，arm镜像支持4K/64K可选内核安装，在保证arm默认安装4K内核行为不变的前提下，增加安装64K内核的可选行为；默认持平upstream社区特性兼容性，基于64K特性提升OS基础场景性能。

文件系统支持可编程页缓存：针对大模型推理场景中模型加载I/O效率低下问题，实现一种页缓存可编程框架，使应用可以根据负载特性在用户态对文件系统的缓存策略进行定制，从而对不同模型的加载进行I/O效率的显著优化。

跨进程零拷贝传输：支持将源进程虚拟内存页面直接映射至目的进程地址空间，兼容大页/小页，保持访问权限一致。

FUSE文件系统支持io_uring通信接口：通过使用io_uring通信接口，提升用户态守护进程与内核态驱动模块通过字符设备/dev/fuse通信性能。

动态SMT：保证LS任务的运行，BE任务自动被节流并让出微架构资源，同时BE任务在主SMT核和空闲从核上插空运行来提高CPU利用率。

网络多路径RPS增强特性：实现多核CPU负载均衡的同时，兼顾NUMA和Cluster亲和性，有效降低内存访问延迟，提升网络吞吐性能。

sockmap加速同主机tcp流：将两个socket发送和接收队列连接起来，直接将数据包redirect到对端，以此来bypass协议栈，减少报文转发流程，降低时延。

HiSock功能增强：针对互联网场景进行功能增强，包括本地加速、包解析逻辑增强、抓包逻辑、地址转换、邻居处理等能力，提升在承载高并发、低时延网络负载时的性能表现和吞吐能力。

NetKit支持：原生支持 eBPF 内核级流量治理，支持自定义多 eBPF 程序的链式动态调度。

sched_ext可编程调度框架：基于eBPF技术实现系统运行时动态加卸载自定义调度算法的能力，无需重新编译内核，降低了调度器开发周期和门槛，实现对特定工作负载极致优化，内置安全保护机制，BPF程序异常时自动切回系统默认调度器，避免系统卡死异常。

cgroup v2特性增强：支持开源cgroupv2功能，解决由于cgroup级别的同步内存回收带来的性能损耗，在缓解内存短高峰带来的性能抖动的同时，按照场景需要，提升业务性能。

05 编译器优化

LLVM for openEuler编译器在openEuler 24.03 LTS SP4版本引入以下编译特性，提升了编译构建效率，削减Debuginfo信息膨胀以及使能Triton-CPU全量支持FlagGems算子。

多流并行编译优化：改进ThinLTO流程，基于CallGraph拆分大文件，增强并行度更充分使用鲲鹏CPU的多核能力，缩减编译时长，提升应用开发效率。

Dwarfutils功能增强，削减Debuginfo信息膨胀：优化编译时长能够有效提升LLVM优化特性验证效率，如在字节因编译时长限制，仅能验证有限的优化手段，同时能够助力客户降低版本构建时长，提升开发效率。

Triton-CPU全量支持FlagGems算子：本次更新全量支持了FlagGems算子，并亲和了AArch64 SVE/SME等指令能力，提高了在AArch64架构下的实用性。

Go for openEuler编译器：Go for openEuler 是基于开源 Golang 开发的Go基础软件，主要面向云原生、微服务应用等容器云场景，解决实际业务中由原生 Golang 能力不足导致的性能问题。

毕昇JDK：实现鲲鹏亲和指令增强、优化VM启动速度，提升大数据场景性能。

AI编译器ANNC：聚焦计算图优化、高性能融合算子与高效代码生成，并支持主流开源推理框架和多硬件后端接入，提升CPU推荐小模型推理性能。

06 虚拟化创新

GIC超分优化：优化GICv4.1开启场景，虚拟机同亲和组内频繁核间迁移场景性能。

vTimer直通：vTimer直通通过避免timer中断注入过程中的陷入/陷出操作，从而降低中断注入时延，提升场景性能。

07 安全特性增强

CCA特性增强：CCA引入了全新的Realm域作为可信执行环境，来保护正在使用中的数据和代码的机密性和完整性。在机密计算场景下，支持使能PCIPC保护的PCIe、设备直通Realm域，数据免中转免拷贝，以此保证设备数据链路的机密性。

鲲鹏virtCCA特性增强：virtCCA架构支持UEFI启动，通过并行硬件初始化加速实例启动与弹性伸缩，依托GPT分区表突破2TB磁盘限制以支撑百TB级云盘满足大数据与AI场景，并借助标准化镜像简化自动化运维与批量部署流程，扩展了机密虚机的应用场景。

海光架构安全特性增强：为服务器本地盘与云盘提供SM4-XTS硬件加速加密以满足数据静态安全需求，利用SM4-GCM的AEAD能力为交易数据、日志及消息队列提供机密性与完整性双重保护，并为Kubernetes持久化卷与容器镜像层加密提供国密算法支持，全面覆盖数据库、金融核心业务及云原生环境。

GTA远程证明及资源分发服务安全特性增强：Global Trust Authority远程证明新增对华为鲲鹏机密计算CCA的支持及基于BMC DICE的远程证明能力。新增对应的GTA Resource Broker Service资源分发服务，先通过远程证明验证运行环境的安全，再将预置的资源（如密钥）安全导入至可信执行环境中。密钥可用于落盘加密，传输加密，互联认证等。二者联用，可支持绝大部分机密计算的上层应用场景，如机密AI推理等。