在北京大学于本届KADC 2025大会上发布的前沿成果中,Align-Anything框架无疑是焦点之一。作为全球首个开源的全模态对齐微调框架,Align-Anything解决了现有框架仅支持单一或少数模态对齐的问题,在一个模型内实现了图像、语音、视频、动作等模态的对齐。其科研价值体现在多个方面:它支持任意到任意模态的对齐,开源了包含12种模态的200k对齐数据集,以及涵盖多个主流对齐微调算法(如SFT、RLHF、DPO、GRPO)的训练代码。此外,Align-Anything通过采用信息更丰富的多模态偏好数据(例如文本、图文音频等反馈,而非二元偏好),实现更准确、更细粒度的对齐,有效减少多模态融合带来的幻觉问题,在具身智能等场景下具有显著意义。这种前沿的全模态大模型对齐研究,对底层高性能算力基础设施提出了极高的要求。那么,北京大学是如何构建并支撑这些创新研究的算力底座呢?北京大学基于鲲鹏昇腾硬件,构建了北大卓越中心集群,为Align-Anything等前沿AI研究提供了坚实的算力支撑。从底层硬件到上层应用,该集群的技术栈均实现了自主创新。其中,鹤思算力调度系统和SCOW(Super Computing On Web)算力平台系统是核心组成部分。鹤思是北大自研的开源调度系统,起初为解决海量小任务和超大规模集群性能问题。随着国产化进程加速,鹤思强大的兼容性使其能适配包括鲲鹏、昇腾在内的国产计算设备及相关生态,实现高性能计算和智能计算场景下的资源、作业管理等功能。SCOW平台则为用户提供便捷的可视化界面,大大降低了用户使用高性能计算资源的门槛。2024年,SCOW发展出SCOW for AI版本,专门面向AI计算中心,提供AI全流程的开发与部署辅助系统。以Align-Anything为例,鹤思能够为其训练与推理提供高效的资源调度和管理,确保模型在昇腾NPU上的稳定运行,而SCOW则能够辅助其从数据集管理、算法管理、模型管理、训练管理等在内的AI训练完整流程。鲲鹏昇腾科教创新卓越中心为北京大学的上述算力平台提供了从国产化算力底座到完备软件生态的全领域支撑。在智东西与北京大学计算中心系统管理室主任樊春的交流中,我们了解到,根据北京大学用户一手体验后的评价,目前鲲鹏CPU的性能已经与国外传统CPU厂商基本拉齐,同时昇腾NPU在硬件性能、软件生态方面也正在迅速发展。昇腾生态方面的变化给樊春留下了极为深刻的印象。在过去5年中,他明显感受到昇腾生态不断完善,逐渐能够适配大量的主流开发工具,程序、模型的移植只需几行代码就能完成。目前,昇腾异构计算架构CANN已经迭代至8.0版本,创新开发100多个融合算子,覆盖MoE、多模态等主要场景,显著提升大模型性能。此外,CANN还支持安装PyTorch拓展前端,这意味着用户可以直接在昇腾设备上选择PyTorch作为前端推理框架,极大地便利了开发工作。MindSpeed支持多种主流训练框架,方便科研人员灵活切换,其支持的Megatron训练框架,从并行策略、内存优化、亲和计算、通信优化等四大场景支持大语言模型、多模态模型等训练场景优化。MindIE、vLLM昇腾插件等工具帮助实现运行加速、调试调优和快速迁移部署。在本届KADC大会上发布的Align-Anything框架就是昇腾生态的受益者之一。通过CANN的算子自动融合和vLLM昇腾插件等优化,Align-Anything节省了14.9%的训练时间,并提高了近200%的Tokens吞吐量。樊春透露,北京大学 鲲鹏昇腾科教创新卓越中心的算力使用率维持70%左右,在高峰期常常能达到90%甚至是100%。用户对鲲鹏、昇腾产品的直观感受是“程序跑得通”、“性能还不错”,用户满意度较高。这些用户的直观感受和真实数据,充分体现了鲲鹏昇腾科教创新卓越中心在构建高性能、易用性强的算力底座方面的全面支撑,有效推动了前沿AI研究的创新与发展。 02.上交✖华为:“交我算”鲲鹏算力助力科研自研分子模拟算法实现突破