AI Agent时代「顶格配置」:华为云,重塑算力格局

36氪 2025-09-21 19:02
资讯配图

资讯配图

华为云给出了它的答案。
资讯配图

资讯配图

Lovart Beta版本上线5天内注册用户超过10万人;Genspark只用了9天就突破1000万美元ARR;“初代顶流”Manus更是一再刷新全球关注度纪录……

2025年,全球AI Agent(智能体)市场再度迎来爆发,AI算力市场随之迎来了一轮新“狂飙”。

一方面,随着全球模型复杂度与大规模实时互动需求齐头并进,中外“AI算力”概念股狂飙。全球AI算力需求不仅没有因为“百模大战”的逐渐熄火而消退,反而需求日盛。

另一方面,面对全球AI Agent热潮,AI算力的严重不足首当其冲,成本控制与弹性扩容成为企业面临的巨大难题,伴随而来还有配置和管理庞大的AI工具链极为繁琐,全链条技术底座缺失。

如果说“百模大战”是这场比赛的Level 1,那么在通关以后,一个更难的Level 2摆在了所有人面前。

——在“Agent为王”时代,如何在高并发、高吞吐的推理与训练场景中,实现算力效率的极致突破?

在华为全联接大会2025上,华为重磅宣布其“明星产品”CloudMatrix的云上超节点规格将从384卡升级到未来的8192卡;同时,会上还宣布CloudMatrix384 AI Token推理服务全面上线,并发布了企业级Agent平台Versatile,帮助行业客户快速开发出各种AI Agent。

换句话说,当前,面对日益爆发的AI Agent规模化落地浪潮,华为云已经构建好了一套覆盖硬件、算力、大模型、应用开放平台的全链条技术底座。

在“Agent为王”的时代,华为云给出的答案是“CloudMatrix384 x MaaS平台 x AI Token服务 x Versatile”,而这可能也是当前的顶格配置。

资讯配图

澎湃算力,全球超强

在华为全联接大会2025上,华为全新发布了最新的超节点产品Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点,其分别支持8192及15488张昇腾卡,在卡规模、总算力、内存容量、互联带宽等关键指标上全面领先业内,在未来多年内都将是全球头部算力的超节点。

为什么我们需要这么强的算力?

先来看一组新闻。去年,两则AI新闻意外地在生物科研界与AI界同时“刷屏”——谷歌DeepMind最新AI模型AlphaFold 3登陆顶级期刊《Nature》,诺贝尔化学奖更是破天荒地授予了DeepMind创始人Demis Hassabis。

根据论文数据披露,AlphaFold3使用了256个A100 GPU进行了约20天的训练,训练计算量约为4E22FLOP——是AlphaFold 2的10倍。

毫无疑问,现代前沿科研对于AI高性能计算的依赖已经越来越强烈,从蛋白质的折叠方案与相互作用方式,到模拟人脑的神经元连接通道,小到量子级、大到天文级,前沿科技的计算量已经远超一般的人类认知。

此前,国内科研领域高度依赖国外高性能AI算力平台,自主创新性往往长期受制于人。自多年以前开始,我国就一直在进行高性能计算的攻关活动,诞生了如“神威·太湖之光”超级计算机等的优秀成果。

今年7月,中国科学院联合团队更是正式发布了Cloudmatrix384昇腾AI云服务支撑的“磐石·科学基础大模型”。

资讯配图

磐石·科学基础大模型

磐石大模型将覆盖中国科学院多个院所的科研场景,采用专业科学知识和数据进行训练、服务于科学任务的智能底座,实现了对波、谱、场等多种科学模态数据的深入理解;模型接入1.7亿篇科技文献与实时开源科技信息,以往需要3至5天才能完成的文献调研工作可缩短至20分钟,一些药物靶点发现研究科研效率甚至可以加速超过10倍。

科学无国界,但很可惜,科研有国界。只有在自主创新的超强算力底座上跑通了自己的大模型,科学研发的自主创新才会不再受制于人。

除了科研外,另一个对算力要求更大的应用场景是智能汽车。

众所周知,当前,随着智能驾驶平台对模型算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。汽车智能化程度呈现爆炸式增长,越来越成为“长着四个轮子的超算中心”,智能驾驶算法与模型的训练复杂度飙升,对于算力利用效率的需求同样激增。

资讯配图

而在不久前的智能汽车大会2025上,长安成为央企首个应用华为云CloudMatrix384超节点,以自主创新算力开展智能辅助驾驶研发的车企。

针对目前车端算力所面临的共性问题,华为云CloudVeo接入了CloudMatrix384超节点为智能辅助驾驶模型训练提供超强动力。实际测试结果显示,在E2E、VLA模型上,CloudMatrix384超节点性能超过H100,绝对是非常适合智能辅助驾驶模型训练的算力平台。而根据IDC数据显示,华为云已连续多年位居中国汽车云市场份额第一。

对于任何一个云服务厂商、任何一个AI算力平台底座来说,客户对于足够强大的澎湃算力,永远是第一需求。

资讯配图

Token消耗量爆发增长

从新闻到汽车、从科研到搜索、从自动驾驶到陪伴机器人……过去18个月,中国AI Agent应用呈现指数级增长。

Token就是大模型世界里用来衡量和处理文本的“基本单元”,就跟今天的水电一样,Token就是智能世界的水电,甚至空气。

根据国家数据局数据显示,2024年初,中国日均Token的消耗量为1000亿;而截至今年6月底,我国日均Token消耗量已突破30万亿,1年半的时间增长了300多倍,人工智能应用规模快速增长。

与此同时,MaaS(Model as a Service,模型即服务)的需求也在快速增长。

通过云端平台将AI模型封装为标准化服务,华为云MaaS服务能够让用户通过简单的API接口随时调用强大的AI能力,而无需进行复杂、昂贵的模型训练与运维。例如,今年上半年,一位17岁的高中女生就靠华为云MaaS平台搭建出一个专门帮唇腭裂小朋友做语言康复训练的AI应用,真正做到了“AI普惠,科技向善”。

当前,华为云MaaS服务已支持DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型。

同时,为了进一步降低AI Agent开发门槛,同时提高AI Agent的性能、模型适配与效果调优效果,本次全联接大会2025上,华为云CloudMatrix384 AI Token推理服务也全面上线。

对于大量拥有AI Agent开发需求的企业来说,AI Token服务可以有效屏蔽复杂的底层技术实现,让企业能够更加简单、高效地进行Agent开发。而基于CloudMatrix384的xDeepServe分布式推理框架,以极致分离架构 Transfomerless让超节点释放出更高效算力。

把传统“Transformer”直接拆散!Attention 计算、FFN 计算,各自解耦,切成更细的“工作岛”, 打造Token的“超高速流水线。单卡吞吐达到了H20的2.5-4倍,最高可以做到2400 TPS。

例如,360纳米AI依托CloudMatrix384的AI Token推理服务,成功处理每天上千万的内容生成请求。

虽然纳米AI以AI搜索能力知名,但其不仅仅是一个AI搜索引擎,更是一个具备自主思考与任务规划能力的AI Agent,能够自动调用各类工具完成复杂任务。

背靠CloudMatrix384的AI Token推理服务,纳米AI的多个专家智能体可以灵活拉群、多层嵌套、组队协作完成复杂任务,还能异步并行运行,大幅缩短超级任务执行时长。

360集团创始人周鸿祎表示:“衡量智能体的能力,就是衡量它使用的算力,我们做了L4级智能体——蜂群智能体,就是有十几个智能体像一个团队一样为你协作,做超级复杂的任务,但5~10分钟的视频能消耗千万级Token,对算力的消耗非常巨大,华为云的算力架构能够完美地支持多个基座大模型的共同工作。”

资讯配图

降低Agent开发门槛:

更快、更好、更高效

除了算力、应用方面的挑战外,一直以来,AI Agent规模化落地仍然面临了一个巨大障碍——开发门槛高。

企业Agent开发流程节点多,业务复杂,往往导致Agent在规模化落地的过程中面临“最后一公里”难题——懂业务的未必懂Agent开发,而有开发能力的技术方却未必能精准解决需求。

为此,在华为全联接大会2025上,华为常务董事、华为云计算CEO张平安正式发布企业级智能体平台Versatile,该平台通过极简流程实现企业级Agent生成,用户仅需输入业务逻辑描述与流程图,两步即可完成开发,使原本需30人天的工作缩至3人天,效率提升10倍。

资讯配图

华为常务董事、华为云计算CEO张平安

例如,慧通差旅依托华为云企业级智能体平台Versatile打造了一款专属Agent“通宝”。

在员工使用过程中,“通宝”能够通过整合差旅行业数据、企业管理知识与员工历史出行记录,实时提醒员工出发、中转、航变场景等情景及应对方案,差旅结束后还会自动核查报销合规性,让流程又快又省心。

在Versatile的能力加持下,“通宝”结合了业界领先的差旅垂域大模型和多种专业小模型,满足深度意图理解、实时数据获取、复杂计算求解、拟人总结等多种任务要求;同时还能打通三层数据飞轮,将员工和企业产生的实时业务数据及时沉淀,变得“越来越聪明”。

当前,AI Agent正成为AI时代全新的应用形态。

根据国信证券数据,当前30%的年收入5亿元以上大型企业已经建立了专门的AI Agent团队,63%的B端企业已把AI Agent列为未来12个月的关键布局。市场研究机构CB Insights预测,到了2032年,AI Agent市场规模将超千亿。

如今,华为云AI云服务的全球客户数量从去年的321家增长到今年的1805家;落地千行百业,成绩亮眼。

今天,人工智能的应用场景和价值正在从量变走向质变,“百模大战”逐渐熄火,全球AI竞赛迈向“Agent规模化落地”。我们所面对的,是大模型的“Level 2”世界——AI Agent时代。

AI Agent时代,我们需要怎样的算力配置?

华为云给出了它的答案。

CloudMatrix384 x MaaS平台 x AI Token服务 x Versatile = Agent时代顶格配置。

资讯配图

资讯配图

资讯配图

资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 华为
more
OpenAI最新硬件2026年底亮相!狂挖苹果20+老将
【AI】15年大佬深夜痛哭半小时!氛围编程巨坑曝光,95%程序员沦为「AI保姆」
苹果iPhone Air国行只有合约机?无全网通版本?真相快揭开了...
AI Agent时代「顶格配置」:华为云,重塑算力格局
醒醒,LLM根本没有性格!加州理工华人揭开AI人格幻觉真相
靠10万+粉丝,北漂插画师秒贷款!华为全栈AI加速,让银行及时看见
趋势丨高功率需求倒逼,AI电源芯片赛道沸腾
AI播客的未来是成为每个人的音频助手,事实性、完整性和活人感都很重要|对话ListenHub
全网都在玩 nano banana 生成手办,但这个 AI 真能给你做出来
老黄9亿美元再投AI Infra,这次直接打包带走CEO和核心技术
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号