
这一年多来,Agent「外挂」几乎快把打工人「爽」上天。
只需一句话,它就能秒级吐出数万字深度报告,甚至直接交付一款软件。把孩子照片剪成 Vlog 发给老公,或者替你操控浏览器订机票、填表单,也不在话下。
如今,这种「起飞」的丝滑体感正在反向挤压底层云服务,掀起一场「土地」风暴。
「 4 年前做 AI 要买算力卡,3 年前要卷大模型,而今天,做 AI 就是开发和用好智能体。」在 6 月 5 日的 INSPIRE 创想者大会上,华为公司董事、华为云 CEO 周跃峰用一句话点破了行业拐点,并将一个新概念推向台前——硅基黑土地。

华为公司董事、华为云CEO周跃峰
过去,云服务被称为「算力黑土地」。企业要种 AI,先得有地、有水、有电,也就是算力、存储、网络和数据库。但 Agent 时代,它必须变成适合「种植」智能体的「硅基黑土地。」
也是在这一天,华为云一口气砸下四大层面、十余款 Agentic AI 新品。
从「算力」到「硅基」,两字之变,背后是大厂解题思路的重要转向:不再倒卖散装算力,而是重新定义 Agent 时代智能体生长和进化的底层土壤。
先把 Agentic Infra 这层土壤变厚
当一批数字「劳动力」进入企业流程,一次看似简单的任务,背后可能是几十次模型调用、多个工具链切换、一串沙箱环境启动、长时间上下文保存,以及 CPU、NPU、存储、网络之间连续不断的资源调度。
这时候,仅仅死磕模型参数、 GPU 数量,远远不够。谁能把 Token 效率、记忆、调度、安全这些底层能力做得扎实,才有可能让上面的 Agent 真正长出来。
这正是华为云提出「硅基黑土地」的原因。
在这次 INSPIRE 创想者大会上,华为云正式提出 Agentic Infra 新范式:高效 Token 工厂、持续学习、通智一体化调度、安全自治。

四个关键词,正好对应 Agent 大规模落地的四个基础难题。
第一个难题,是 Agent 不能慢。
人和聊天机器人对话,等几秒还能接受。但 Agent 要连续思考、连续调用工具、连续执行任务。每一步慢一点,整条任务链路就会被拖成「龟速」。
一旦进入客服、研发、金融风控、工业调度这些真实生产系统,慢和不稳定都会变成业务风险。
所以,华为云推出 AICS 灵衢智算集群——凭借创新性的灵衢 UnifiedBus(UB)统一总线协议+基于 SuperPoD 超节点架构,AICS 打破传统服务器的物理边界,让大规模智算集群更像一台逻辑上的「巨型计算机」,也把云底座变成了一个高效 Token 工厂。

在集群规模与算力上,最大可落地 10 万卡超大型智算集群,整体总算力达 200EFLOPS。
在 Token 生产能力上,千卡硬件每秒 Token 吞吐量达 500 万,推理单 Token 生成时延压缩至 10ms 以内,满足 Agent 实时交互、高并发在线推理需求。
在服务稳定性上,灵衢智算集群基于全链路可观测与多级快恢能力,支持在线推理服务达到 99.95% 的可用性。
第二个难题,是 Agent 不能只有「鱼的记忆」。
AMS Agentic 记忆存储解决方案,通过 PB 级记忆空间、KV Cache 分层池化、长上下文和多轮记忆管理,让 Agent 可以保存更长时间的任务状态和经验。换句话说,就是给智能体配一个更大的「工作记忆」和「长期记忆」。
这对企业级 Agent 很关键。真正的企业任务很少一次问答就结束。一个研发任务可能跑几个小时,一个数据分析任务可能跨多个系统,一个行业智能体甚至要在多轮反馈里不断修正策略。
Agent 要从「能回答」走向「能长期干活」,记忆能力必须成为基础设施的一部分。
第三个难题,是算力资源要调得动。
Agent 的工作流很杂。有时要跑大模型推理,有时要启动沙箱执行代码,有时要读写存储,有时要调用传统业务系统。训练、推理、Agent 负载、通用微服务,都会混在一起抢资源。
如果底层调度还停留在传统云原生时代,就很容易出现尴尬局面:算力拼不起来、调不动也用不满,任务一多还打架。
通智一体化调度引擎 CCE VolcanoNext ,利用精密的「软件调度技术」、通过两个关键动作,立马让整体硬件利用率提升了 30% 以上。
一个是「训推共池」。
把原本割裂的训练和推理算力揉成一张网,让训练、推理、Agent 等多种负载可以在同一资源池里动态复用。
另一个是「碎片整合」,变废为宝。
训练任务里常常会有很多细碎的资源空隙。 CCE VolcanoNext 能将极其零碎的算力「偷」出来,瞬间打包塞给正在等待响应的在线推理任务(比如去生成一个 Token ),让算力流失率趋近于零。
第四个难题,是 Agent 必须管得住。
企业不是不想用 Agent,而是不敢随便让 Agent 进生产系统。毕竟能力越强,风险越大,企业越容易紧张。
这也是 AgentSphere 的定位——它提供的是生产级智能体运行环境,把沙箱隔离、身份权限、意图防护、双向网络防护、行为审计放进同一个底座里。
同时,它还足够快。
AgentSphere 通过羽量级沙箱技术,实现 100ms 级启动和每分钟十万级批创能力,既能支撑 Agent Serving 里的工具调用,也能支撑 Agentic RL 里大规模沙箱高频创建。
ModelArts+AgentArts:
再让企业级智能体触手可及
话又说回来,企业真正需要的,是上面这些裸算力吗?其实不是。
与其说人们需要的是电,不如说是那些真正进入生活、解决问题的电器。传统企业也一样,他们更需要可自由支配的模型和智能体能力。
所以,在 Agentic Infra 之上,华为云继续铺了两层能力:ModelArtsNext 和 AgentArts。前者解决「模型怎么用得更好」,后者解决「 Agent 怎么跑进企业」。

先看 ModelArtsNext 。
过去很多 MaaS 平台像一个模型货架:这里有 DeepSeek,那里有 Qwen,还有自家的模型,用户自己选、自己调、自己试。
但 Agent 时代,这种方式会很快遇到问题。一个企业任务可能并不只适合一个模型。写代码、做客服、查知识库、跑推理、处理多模态内容,不同环节对成本、速度、效果的要求都不一样。
这时候,关键不只是「有多少模型」,而是能不能把合适的请求,分给合适的模型。
ModelArtsNext 的模型路由能力,应运而生。它可以根据请求特征、实时负载和使用体验,动态选择更合适的模型。用户可以选择成本优先、效果优先,或者均衡模式,让系统在不同任务之间自动做取舍。
这听上去像一个后台调度功能,但对企业来说很重要。
因为企业不是在玩模型评测榜,而是在算真实成本:同样一个任务,能不能少花一点 Token?同样一套应用,能不能既保证效果,又把推理成本压下来?
除了模型路由,ModelArtsNext 还把 RLaaS、机密推理和模型矩阵打包进来。
RLaaS (强化学习服务)让企业可以用强化学习继续优化自己的智能体,让模型在真实业务反馈中越用越聪明。
机密推理面向金融风控、AI 编码等高敏感场景,解决数据可信和安全调用问题。
此外,华为云提供丰富的模型矩阵能力,实现了主流 SOTA 模型(如 DeepSeek、Kimi、智谱GLM等)Day0 上线,能力覆盖编程、多模态等丰富场景。企业可通过 Tokens API、工具链、Agent 开发平台、智能体应用 4 种形态轻松调用。

再往上,就是 AgentArts,负责把模型能力封装成靠谱、合格的「数字员工」。
企业级 Agent 一旦进入生产环境,就如同可能影响业务结果的数字员工,怎么样才能让这位「员工」稳定、可控、可持续地进入工作流?
AgentArts 对应的,正是这套生产级要求。
其中,长程任务,解决的是 Agent 能不能连续干活的问题。企业任务往往不是一问一答,而是持续数小时甚至数天的流程。AgentArts 要保障任务不中断、异常能恢复、上下文能延续。
企业级安全,解决的是 Agent 能不能放心用的问题。它需要会话隔离、权限管控、隐私数据保护和安全沙箱,不能让一个能调用工具的智能体随便越权。
行业知识深度,解决的是 Agent 能不能懂业务的问题。不同企业、不同岗位、不同流程,都有自己的知识、规则和经验。Agent 要真正干活,就必须把这些行业资产吃进去。
全链路可观测,解决的是 Agent 出问题后能不能查清楚的问题。它做了什么、调用了什么工具、哪一步失败、为什么失败,都要能被追踪和复现。
基于华为云 AgentArts 平台,企业可以从 300 多个行业资产中灵活选取,组合出适合自己的智能体能力。从实际落地来看,这套能力已经开始跑进真实业务场景。
例如,温氏集团通过华为云 AgentArts,基因组分析效率提升 50%,AI 解读成功率高达 95 %以上。此外,遗传评估准确率同步提升 15%。
比起数Token,华为云更关心它们去了哪里
过去一年,AI 云厂商被 Token 卷上了天。
模型调用量、Tokens 产出、推理成本、API 价格,几乎成了衡量 AI 云热度的新尺子。
谁能承接更多模型调用,谁能生产更多 Token,谁就更像握住了 AI 云时代的新增长入口。
华为云没有回避 Token 经济,也在建设高效 Token 工厂、MaaS 模型即服务和 Agentic Infra,但它又不想陷入互联网的这套排行榜里。
在媒体见面会上,周跃峰说得很直白:华为云「不太在乎 Token 总量是多少」,也「不太在乎收入的总量是多少」,更在乎国产化算力系统生产出来的 Tokens 背后,能不能带来健康提升、节电和生产力提升,而不只是情绪价值。

这句话听起来有点反增长叙事,其实点出了华为云和互联网云厂商的关键差异。
来看一个医疗案例。针对中国病理医生缺口高达14 万的结构性挑战,上海瑞金医院联合华为,历时一年半打造了 RuiPath 病理大模型。
这是国内首个进入医院生产流程的临床级病理大模型,可覆盖 90% 的常见癌种和 90% 的下游诊断任务。

研发过程中,瑞金医院提供了百万张高质量数字病理切片和宝贵临床数据。华为云提供的是数据工程、模型工程、应用工程以及全流程工具链支持。
现在,RuiPath 正在按照「顶级医院研发验证—地市三甲医院扩展—县域医院复制应用」的路径向外扩散。短短几个月,朋友圈已扩展到全国 20 多家医院。
比如,邯郸市中心医院,通过每轮几十张切片的小样本微调,让本地乳腺癌有无肿瘤判别准确率提升到接近 100%。
涉县医院、武安市第一人民医院这样的区域医院,也可以在数据不出域、安全可控的前提下,通过端云协同享受到顶尖专家的诊断能力。
这才是华为云口中「有价值的 Token」。
它对应的不是一次聊天、一段生成文本、一个 API 调用,而是一次更准确的病理判断,一次基层医院诊断能力的提升,一次优质医疗资源的下沉。
这一核心差异化,可以追溯到华为最初进入云市场时的底色。
早在多年以前,华为云就曾明确提出,未来 AI 的主场在行业,并把公有云作为面向未来的重要战略。那时,很多政府和企业客户才刚刚开始上云,而政企、运营商、金融、制造、能源等 2B 场景,恰恰是华为长期深耕的领域。
所以从一开始,华为云的云业务就带着很强的行业属性,关心的是怎样把云、AI、数据和行业系统结合起来,变成真实生产力。
相比之下,互联网大厂的基因造就了另一套打法。
他们天然拥有高频流量场景、C 端应用、内容平台和开发者生态。这些会带来海量模型调用,也会反过来推动模型能力、推理平台和工具链快速迭代。
他们的 2B 能力,很多时候也是从高频互联网场景、开发者生态和大规模模型调用中外溢出来的。
如果 Token 要真正转化为生产力,就必须进入政企、传统企业的业务流程,一对经典矛盾也接踵而至:
传统企业组织机构复杂、业务系统复杂、手握高敏感数据、安全合规要求极高,对本地化部署、数据不出域、业务连续性都有明确诉求。但模型和算力迭代又非常快。如果企业完全自建,很容易「部署完就落后」。
这就引出了华为云另一个关键差异化:坚持公有云和面向国计民生的混合云「两条腿走路」。
RuiPath 就是一个很典型的样本,将原本对立的「数据安全」与「先进模型便利」统一起来。
在医院端,先通过轻量化工具对原始病理切片进行预处理,提取少量疑似肿瘤区域特征,再经过加密后上传云端。这样一来,原始数据和核心诊疗流程仍然留在医院可控范围内。
在云端,华为云通过全密态、「可用不可见」等机制,支撑诊断推理、模型增训和持续迭代。云端提供的,是瑞金与华为共建的基础模型能力、算力能力和工具链能力。
基层医院只需要利用相当于传统训练约 10% 的本院小样本数据,就可以在基础模型之上做本地化适配,快速得到更贴合本院病例特点的专属模型。

值得一提的是,虽然云厂商都在讲「全栈」,但与华为云「全栈」的「含硅量」和国产化率,存在天差地别。
华为是做通信设备和硬件出身,它的全栈逻辑也向下扎到了最底层的物理世界,如昇腾 NPU、鲲鹏 CPU、CloudMatrix 超节点等硬核实体。
而且,从最底层的「一粒沙子」(芯片算力),到中间层的底层使能(如CANN 架构),再到最上层的智能体平台,全部都是自研。用周跃峰的话说,华为云要打造不同于「万国牌」的「另一个算力平面」。
对中国企业而言,这不只是「多了一家云厂商」,而是在主流 GPU 路线之外又多了一种算力选择、多了一套生态选择,也多了一条基础设施路线。
开放才能致远
除了把硅基黑土地做厚,真正让 AI 长进千行万业,还需要把已经验证过的技术、工具链和行业经验开放出去,这也是 INSPIRE 创想者大会发布「行业 AI 梦工厂」的意义。
首批「梦工厂」包括医疗、具身智能、科学计算、智能制造等垂直领域,开放华为长期积累的技术能力、工具链和实践经验,让行业 AI 不再停留在少数标杆项目里,而是进入可复制、可共建、可持续迭代的新阶段。

开放,也贯穿在华为云的底层生态里。
从鲲鹏、昇腾,到欧拉操作系统、CANN 系统,再到 CCE Volcano、ModelArts 工具链,以及与AgentArts 企业版内核同源度超过 90% 的openJiuwen,华为云正在把更多能力以开源开放的方式交给产业。
周跃峰说,希望华为云在智能体时代成为一朵最开放的云。最终,让智能体开发这件事变得更普惠。

任正非曾说,在方向大致正确的情况下,要先开一枪,不能等,大胆往前走。过去多年,华为云押注行业、押注国产化、押注全栈能力,这条路并不轻松,也不会立刻见效,但也从未动摇。
有人说,一旦认定一件事,便全力以赴。在业内,华为的执行力令许多竞争对手忌惮。
确实。没有一件事情可以随随便便成功,但是认真干起来,也不可能不成功。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin.com