AI Agent时代「顶格配置」：华为云，重塑算力格局

资讯配图

华为云给出了它的答案。

资讯配图

Lovart Beta版本上线5天内注册用户超过10万人；Genspark只用了9天就突破1000万美元ARR；“初代顶流”Manus更是一再刷新全球关注度纪录……

2025年，全球AI Agent（智能体）市场再度迎来爆发，AI算力市场随之迎来了一轮新“狂飙”。

一方面，随着全球模型复杂度与大规模实时互动需求齐头并进，中外“AI算力”概念股狂飙。全球AI算力需求不仅没有因为“百模大战”的逐渐熄火而消退，反而需求日盛。

另一方面，面对全球AI Agent热潮，AI算力的严重不足首当其冲，成本控制与弹性扩容成为企业面临的巨大难题，伴随而来还有配置和管理庞大的AI工具链极为繁琐，全链条技术底座缺失。

如果说“百模大战”是这场比赛的Level 1，那么在通关以后，一个更难的Level 2摆在了所有人面前。

——在“Agent为王”时代，如何在高并发、高吞吐的推理与训练场景中，实现算力效率的极致突破？

在华为全联接大会2025上，华为重磅宣布其“明星产品”CloudMatrix的云上超节点规格将从384卡升级到未来的8192卡；同时，会上还宣布CloudMatrix384 AI Token推理服务全面上线，并发布了企业级Agent平台Versatile，帮助行业客户快速开发出各种AI Agent。

换句话说，当前，面对日益爆发的AI Agent规模化落地浪潮，华为云已经构建好了一套覆盖硬件、算力、大模型、应用开放平台的全链条技术底座。

在“Agent为王”的时代，华为云给出的答案是“CloudMatrix384 x MaaS平台 x AI Token服务 x Versatile”，而这可能也是当前的顶格配置。

澎湃算力，全球超强

在华为全联接大会2025上，华为全新发布了最新的超节点产品Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点，其分别支持8192及15488张昇腾卡，在卡规模、总算力、内存容量、互联带宽等关键指标上全面领先业内，在未来多年内都将是全球头部算力的超节点。

为什么我们需要这么强的算力？

先来看一组新闻。去年，两则AI新闻意外地在生物科研界与AI界同时“刷屏”——谷歌DeepMind最新AI模型AlphaFold 3登陆顶级期刊《Nature》，诺贝尔化学奖更是破天荒地授予了DeepMind创始人Demis Hassabis。

根据论文数据披露，AlphaFold3使用了256个A100 GPU进行了约20天的训练，训练计算量约为4E22FLOP——是AlphaFold 2的10倍。

毫无疑问，现代前沿科研对于AI高性能计算的依赖已经越来越强烈，从蛋白质的折叠方案与相互作用方式，到模拟人脑的神经元连接通道，小到量子级、大到天文级，前沿科技的计算量已经远超一般的人类认知。

此前，国内科研领域高度依赖国外高性能AI算力平台，自主创新性往往长期受制于人。自多年以前开始，我国就一直在进行高性能计算的攻关活动，诞生了如“神威·太湖之光”超级计算机等的优秀成果。

今年7月，中国科学院联合团队更是正式发布了Cloudmatrix384昇腾AI云服务支撑的“磐石·科学基础大模型”。

磐石·科学基础大模型

磐石大模型将覆盖中国科学院多个院所的科研场景，采用专业科学知识和数据进行训练、服务于科学任务的智能底座，实现了对波、谱、场等多种科学模态数据的深入理解；模型接入1.7亿篇科技文献与实时开源科技信息，以往需要3至5天才能完成的文献调研工作可缩短至20分钟，一些药物靶点发现研究科研效率甚至可以加速超过10倍。

科学无国界，但很可惜，科研有国界。只有在自主创新的超强算力底座上跑通了自己的大模型，科学研发的自主创新才会不再受制于人。

除了科研外，另一个对算力要求更大的应用场景是智能汽车。

众所周知，当前，随着智能驾驶平台对模型算力需求的爆炸式增长，传统计算架构已难以支撑AI技术的代际跃迁。汽车智能化程度呈现爆炸式增长，越来越成为“长着四个轮子的超算中心”，智能驾驶算法与模型的训练复杂度飙升，对于算力利用效率的需求同样激增。

而在不久前的智能汽车大会2025上，长安成为央企首个应用华为云CloudMatrix384超节点，以自主创新算力开展智能辅助驾驶研发的车企。

针对目前车端算力所面临的共性问题，华为云CloudVeo接入了CloudMatrix384超节点为智能辅助驾驶模型训练提供超强动力。实际测试结果显示，在E2E、VLA模型上，CloudMatrix384超节点性能超过H100，绝对是非常适合智能辅助驾驶模型训练的算力平台。而根据IDC数据显示，华为云已连续多年位居中国汽车云市场份额第一。

对于任何一个云服务厂商、任何一个AI算力平台底座来说，客户对于足够强大的澎湃算力，永远是第一需求。

Token消耗量爆发增长

从新闻到汽车、从科研到搜索、从自动驾驶到陪伴机器人……过去18个月，中国AI Agent应用呈现指数级增长。

Token就是大模型世界里用来衡量和处理文本的“基本单元”，就跟今天的水电一样，Token就是智能世界的水电，甚至空气。

根据国家数据局数据显示，2024年初，中国日均Token的消耗量为1000亿；而截至今年6月底，我国日均Token消耗量已突破30万亿，1年半的时间增长了300多倍，人工智能应用规模快速增长。

与此同时，MaaS（Model as a Service，模型即服务）的需求也在快速增长。

通过云端平台将AI模型封装为标准化服务，华为云MaaS服务能够让用户通过简单的API接口随时调用强大的AI能力，而无需进行复杂、昂贵的模型训练与运维。例如，今年上半年，一位17岁的高中女生就靠华为云MaaS平台搭建出一个专门帮唇腭裂小朋友做语言康复训练的AI应用，真正做到了“AI普惠，科技向善”。

当前，华为云MaaS服务已支持DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型。

同时，为了进一步降低AI Agent开发门槛，同时提高AI Agent的性能、模型适配与效果调优效果，本次全联接大会2025上，华为云CloudMatrix384 AI Token推理服务也全面上线。

对于大量拥有AI Agent开发需求的企业来说，AI Token服务可以有效屏蔽复杂的底层技术实现，让企业能够更加简单、高效地进行Agent开发。而基于CloudMatrix384的xDeepServe分布式推理框架，以极致分离架构 Transfomerless让超节点释放出更高效算力。

把传统“Transformer”直接拆散！Attention 计算、FFN 计算，各自解耦，切成更细的“工作岛”，打造Token的“超高速流水线。单卡吞吐达到了H20的2.5-4倍，最高可以做到2400 TPS。

例如，360纳米AI依托CloudMatrix384的AI Token推理服务，成功处理每天上千万的内容生成请求。

虽然纳米AI以AI搜索能力知名，但其不仅仅是一个AI搜索引擎，更是一个具备自主思考与任务规划能力的AI Agent，能够自动调用各类工具完成复杂任务。

背靠CloudMatrix384的AI Token推理服务，纳米AI的多个专家智能体可以灵活拉群、多层嵌套、组队协作完成复杂任务，还能异步并行运行，大幅缩短超级任务执行时长。

360集团创始人周鸿祎表示：“衡量智能体的能力，就是衡量它使用的算力，我们做了L4级智能体——蜂群智能体，就是有十几个智能体像一个团队一样为你协作，做超级复杂的任务，但5~10分钟的视频能消耗千万级Token，对算力的消耗非常巨大，华为云的算力架构能够完美地支持多个基座大模型的共同工作。”

降低Agent开发门槛：

更快、更好、更高效

除了算力、应用方面的挑战外，一直以来，AI Agent规模化落地仍然面临了一个巨大障碍——开发门槛高。

企业Agent开发流程节点多，业务复杂，往往导致Agent在规模化落地的过程中面临“最后一公里”难题——懂业务的未必懂Agent开发，而有开发能力的技术方却未必能精准解决需求。

为此，在华为全联接大会2025上，华为常务董事、华为云计算CEO张平安正式发布企业级智能体平台Versatile，该平台通过极简流程实现企业级Agent生成，用户仅需输入业务逻辑描述与流程图，两步即可完成开发，使原本需30人天的工作缩至3人天，效率提升10倍。

华为常务董事、华为云计算CEO张平安

例如，慧通差旅依托华为云企业级智能体平台Versatile打造了一款专属Agent“通宝”。

在员工使用过程中，“通宝”能够通过整合差旅行业数据、企业管理知识与员工历史出行记录，实时提醒员工出发、中转、航变场景等情景及应对方案，差旅结束后还会自动核查报销合规性，让流程又快又省心。

在Versatile的能力加持下，“通宝”结合了业界领先的差旅垂域大模型和多种专业小模型，满足深度意图理解、实时数据获取、复杂计算求解、拟人总结等多种任务要求；同时还能打通三层数据飞轮，将员工和企业产生的实时业务数据及时沉淀，变得“越来越聪明”。

当前，AI Agent正成为AI时代全新的应用形态。

根据国信证券数据，当前30%的年收入5亿元以上大型企业已经建立了专门的AI Agent团队，63%的B端企业已把AI Agent列为未来12个月的关键布局。市场研究机构CB Insights预测，到了2032年，AI Agent市场规模将超千亿。

如今，华为云AI云服务的全球客户数量从去年的321家增长到今年的1805家；落地千行百业，成绩亮眼。

今天，人工智能的应用场景和价值正在从量变走向质变，“百模大战”逐渐熄火，全球AI竞赛迈向“Agent规模化落地”。我们所面对的，是大模型的“Level 2”世界——AI Agent时代。

AI Agent时代，我们需要怎样的算力配置？

华为云给出了它的答案。

CloudMatrix384 x MaaS平台 x AI Token服务 x Versatile = Agent时代顶格配置。

资讯配图