华为云，换一种打法

编辑｜吴昕

这一年多来，Agent「外挂」几乎快把打工人「爽」上天。

只需一句话，它就能秒级吐出数万字深度报告，甚至直接交付一款软件。把孩子照片剪成 Vlog 发给老公，或者替你操控浏览器订机票、填表单，也不在话下。

如今，这种「起飞」的丝滑体感正在反向挤压底层云服务，掀起一场「土地」风暴。

「 4 年前做 AI 要买算力卡，3 年前要卷大模型，而今天，做 AI 就是开发和用好智能体。」在 6 月 5 日的 INSPIRE 创想者大会上，华为公司董事、华为云 CEO 周跃峰用一句话点破了行业拐点，并将一个新概念推向台前——硅基黑土地。

华为云，换一种打法图2

华为公司董事、华为云CEO周跃峰

过去，云服务被称为「算力黑土地」。企业要种 AI，先得有地、有水、有电，也就是算力、存储、网络和数据库。但 Agent 时代，它必须变成适合「种植」智能体的「硅基黑土地。」

也是在这一天，华为云一口气砸下四大层面、十余款 Agentic AI 新品。

从「算力」到「硅基」，两字之变，背后是大厂解题思路的重要转向：不再倒卖散装算力，而是重新定义 Agent 时代智能体生长和进化的底层土壤。

先把 Agentic Infra 这层土壤变厚

当一批数字「劳动力」进入企业流程，一次看似简单的任务，背后可能是几十次模型调用、多个工具链切换、一串沙箱环境启动、长时间上下文保存，以及 CPU、NPU、存储、网络之间连续不断的资源调度。

这时候，仅仅死磕模型参数、 GPU 数量，远远不够。谁能把 Token 效率、记忆、调度、安全这些底层能力做得扎实，才有可能让上面的 Agent 真正长出来。

这正是华为云提出「硅基黑土地」的原因。

在这次 INSPIRE 创想者大会上，华为云正式提出 Agentic Infra 新范式：高效 Token 工厂、持续学习、通智一体化调度、安全自治。

四个关键词，正好对应 Agent 大规模落地的四个基础难题。

第一个难题，是 Agent 不能慢。

人和聊天机器人对话，等几秒还能接受。但 Agent 要连续思考、连续调用工具、连续执行任务。每一步慢一点，整条任务链路就会被拖成「龟速」。

一旦进入客服、研发、金融风控、工业调度这些真实生产系统，慢和不稳定都会变成业务风险。

所以，华为云推出 AICS 灵衢智算集群——凭借创新性的灵衢 UnifiedBus（UB）统一总线协议+基于 SuperPoD 超节点架构，AICS 打破传统服务器的物理边界，让大规模智算集群更像一台逻辑上的「巨型计算机」，也把云底座变成了一个高效 Token 工厂。

在集群规模与算力上，最大可落地 10 万卡超大型智算集群，整体总算力达 200EFLOPS。

在 Token 生产能力上，千卡硬件每秒 Token 吞吐量达 500 万，推理单 Token 生成时延压缩至 10ms 以内，满足 Agent 实时交互、高并发在线推理需求。

在服务稳定性上，灵衢智算集群基于全链路可观测与多级快恢能力，支持在线推理服务达到 99.95% 的可用性。

第二个难题，是 Agent 不能只有「鱼的记忆」。

AMS Agentic 记忆存储解决方案，通过 PB 级记忆空间、KV Cache 分层池化、长上下文和多轮记忆管理，让 Agent 可以保存更长时间的任务状态和经验。换句话说，就是给智能体配一个更大的「工作记忆」和「长期记忆」。

这对企业级 Agent 很关键。真正的企业任务很少一次问答就结束。一个研发任务可能跑几个小时，一个数据分析任务可能跨多个系统，一个行业智能体甚至要在多轮反馈里不断修正策略。

Agent 要从「能回答」走向「能长期干活」，记忆能力必须成为基础设施的一部分。

第三个难题，是算力资源要调得动。

Agent 的工作流很杂。有时要跑大模型推理，有时要启动沙箱执行代码，有时要读写存储，有时要调用传统业务系统。训练、推理、Agent 负载、通用微服务，都会混在一起抢资源。

如果底层调度还停留在传统云原生时代，就很容易出现尴尬局面：算力拼不起来、调不动也用不满，任务一多还打架。

通智一体化调度引擎 CCE Volcano^Next ，利用精密的「软件调度技术」、通过两个关键动作，立马让整体硬件利用率提升了 30% 以上。

一个是「训推共池」。

把原本割裂的训练和推理算力揉成一张网，让训练、推理、Agent 等多种负载可以在同一资源池里动态复用。

另一个是「碎片整合」，变废为宝。

训练任务里常常会有很多细碎的资源空隙。 CCE Volcano^Next 能将极其零碎的算力「偷」出来，瞬间打包塞给正在等待响应的在线推理任务（比如去生成一个 Token ），让算力流失率趋近于零。

第四个难题，是 Agent 必须管得住。

企业不是不想用 Agent，而是不敢随便让 Agent 进生产系统。毕竟能力越强，风险越大，企业越容易紧张。

这也是 AgentSphere 的定位——它提供的是生产级智能体运行环境，把沙箱隔离、身份权限、意图防护、双向网络防护、行为审计放进同一个底座里。

同时，它还足够快。

AgentSphere 通过羽量级沙箱技术，实现 100ms 级启动和每分钟十万级批创能力，既能支撑 Agent Serving 里的工具调用，也能支撑 Agentic RL 里大规模沙箱高频创建。

ModelArts+AgentArts：

再让企业级智能体触手可及

话又说回来，企业真正需要的，是上面这些裸算力吗？其实不是。

与其说人们需要的是电，不如说是那些真正进入生活、解决问题的电器。传统企业也一样，他们更需要可自由支配的模型和智能体能力。

所以，在 Agentic Infra 之上，华为云继续铺了两层能力：ModelArts^Next 和 AgentArts。前者解决「模型怎么用得更好」，后者解决「 Agent 怎么跑进企业」。

先看 ModelArts^Next 。

过去很多 MaaS 平台像一个模型货架：这里有 DeepSeek，那里有 Qwen，还有自家的模型，用户自己选、自己调、自己试。

但 Agent 时代，这种方式会很快遇到问题。一个企业任务可能并不只适合一个模型。写代码、做客服、查知识库、跑推理、处理多模态内容，不同环节对成本、速度、效果的要求都不一样。

这时候，关键不只是「有多少模型」，而是能不能把合适的请求，分给合适的模型。

ModelArts^Next 的模型路由能力，应运而生。它可以根据请求特征、实时负载和使用体验，动态选择更合适的模型。用户可以选择成本优先、效果优先，或者均衡模式，让系统在不同任务之间自动做取舍。

这听上去像一个后台调度功能，但对企业来说很重要。

因为企业不是在玩模型评测榜，而是在算真实成本：同样一个任务，能不能少花一点 Token？同样一套应用，能不能既保证效果，又把推理成本压下来？

除了模型路由，ModelArts^Nex^t 还把 RLaaS、机密推理和模型矩阵打包进来。

RLaaS （强化学习服务）让企业可以用强化学习继续优化自己的智能体，让模型在真实业务反馈中越用越聪明。

机密推理面向金融风控、AI 编码等高敏感场景，解决数据可信和安全调用问题。

此外，华为云提供丰富的模型矩阵能力，实现了主流 SOTA 模型（如 DeepSeek、Kimi、智谱GLM等）Day0 上线，能力覆盖编程、多模态等丰富场景。企业可通过 Tokens API、工具链、Agent 开发平台、智能体应用 4 种形态轻松调用。

再往上，就是 AgentArts，负责把模型能力封装成靠谱、合格的「数字员工」。

企业级 Agent 一旦进入生产环境，就如同可能影响业务结果的数字员工，怎么样才能让这位「员工」稳定、可控、可持续地进入工作流？

AgentArts 对应的，正是这套生产级要求。

其中，长程任务，解决的是 Agent 能不能连续干活的问题。企业任务往往不是一问一答，而是持续数小时甚至数天的流程。AgentArts 要保障任务不中断、异常能恢复、上下文能延续。

企业级安全，解决的是 Agent 能不能放心用的问题。它需要会话隔离、权限管控、隐私数据保护和安全沙箱，不能让一个能调用工具的智能体随便越权。

行业知识深度，解决的是 Agent 能不能懂业务的问题。不同企业、不同岗位、不同流程，都有自己的知识、规则和经验。Agent 要真正干活，就必须把这些行业资产吃进去。

全链路可观测，解决的是 Agent 出问题后能不能查清楚的问题。它做了什么、调用了什么工具、哪一步失败、为什么失败，都要能被追踪和复现。

基于华为云 AgentArts 平台，企业可以从 300 多个行业资产中灵活选取，组合出适合自己的智能体能力。从实际落地来看，这套能力已经开始跑进真实业务场景。

例如，温氏集团通过华为云 AgentArts，基因组分析效率提升 50%，AI 解读成功率高达 95 %以上。此外，遗传评估准确率同步提升 15%。

比起数Token，华为云更关心它们去了哪里

过去一年，AI 云厂商被 Token 卷上了天。

模型调用量、Tokens 产出、推理成本、API 价格，几乎成了衡量 AI 云热度的新尺子。

谁能承接更多模型调用，谁能生产更多 Token，谁就更像握住了 AI 云时代的新增长入口。

华为云没有回避 Token 经济，也在建设高效 Token 工厂、MaaS 模型即服务和 Agentic Infra，但它又不想陷入互联网的这套排行榜里。

在媒体见面会上，周跃峰说得很直白：华为云「不太在乎 Token 总量是多少」，也「不太在乎收入的总量是多少」，更在乎国产化算力系统生产出来的 Tokens 背后，能不能带来健康提升、节电和生产力提升，而不只是情绪价值。

这句话听起来有点反增长叙事，其实点出了华为云和互联网云厂商的关键差异。

来看一个医疗案例。针对中国病理医生缺口高达14 万的结构性挑战，上海瑞金医院联合华为，历时一年半打造了 RuiPath 病理大模型。

这是国内首个进入医院生产流程的临床级病理大模型，可覆盖 90% 的常见癌种和 90% 的下游诊断任务。

研发过程中，瑞金医院提供了百万张高质量数字病理切片和宝贵临床数据。华为云提供的是数据工程、模型工程、应用工程以及全流程工具链支持。

现在，RuiPath 正在按照「顶级医院研发验证—地市三甲医院扩展—县域医院复制应用」的路径向外扩散。短短几个月，朋友圈已扩展到全国 20 多家医院。

比如，邯郸市中心医院，通过每轮几十张切片的小样本微调，让本地乳腺癌有无肿瘤判别准确率提升到接近 100%。

涉县医院、武安市第一人民医院这样的区域医院，也可以在数据不出域、安全可控的前提下，通过端云协同享受到顶尖专家的诊断能力。

这才是华为云口中「有价值的 Token」。

它对应的不是一次聊天、一段生成文本、一个 API 调用，而是一次更准确的病理判断，一次基层医院诊断能力的提升，一次优质医疗资源的下沉。

这一核心差异化，可以追溯到华为最初进入云市场时的底色。

早在多年以前，华为云就曾明确提出，未来 AI 的主场在行业，并把公有云作为面向未来的重要战略。那时，很多政府和企业客户才刚刚开始上云，而政企、运营商、金融、制造、能源等 2B 场景，恰恰是华为长期深耕的领域。

所以从一开始，华为云的云业务就带着很强的行业属性，关心的是怎样把云、AI、数据和行业系统结合起来，变成真实生产力。

相比之下，互联网大厂的基因造就了另一套打法。

他们天然拥有高频流量场景、C 端应用、内容平台和开发者生态。这些会带来海量模型调用，也会反过来推动模型能力、推理平台和工具链快速迭代。

他们的 2B 能力，很多时候也是从高频互联网场景、开发者生态和大规模模型调用中外溢出来的。

如果 Token 要真正转化为生产力，就必须进入政企、传统企业的业务流程，一对经典矛盾也接踵而至：

传统企业组织机构复杂、业务系统复杂、手握高敏感数据、安全合规要求极高，对本地化部署、数据不出域、业务连续性都有明确诉求。但模型和算力迭代又非常快。如果企业完全自建，很容易「部署完就落后」。

这就引出了华为云另一个关键差异化：坚持公有云和面向国计民生的混合云「两条腿走路」。

RuiPath 就是一个很典型的样本，将原本对立的「数据安全」与「先进模型便利」统一起来。

在医院端，先通过轻量化工具对原始病理切片进行预处理，提取少量疑似肿瘤区域特征，再经过加密后上传云端。这样一来，原始数据和核心诊疗流程仍然留在医院可控范围内。

在云端，华为云通过全密态、「可用不可见」等机制，支撑诊断推理、模型增训和持续迭代。云端提供的，是瑞金与华为共建的基础模型能力、算力能力和工具链能力。

基层医院只需要利用相当于传统训练约 10% 的本院小样本数据，就可以在基础模型之上做本地化适配，快速得到更贴合本院病例特点的专属模型。

值得一提的是，虽然云厂商都在讲「全栈」，但与华为云「全栈」的「含硅量」和国产化率，存在天差地别。

华为是做通信设备和硬件出身，它的全栈逻辑也向下扎到了最底层的物理世界，如昇腾 NPU、鲲鹏 CPU、CloudMatrix 超节点等硬核实体。

而且，从最底层的「一粒沙子」（芯片算力），到中间层的底层使能（如CANN 架构），再到最上层的智能体平台，全部都是自研。用周跃峰的话说，华为云要打造不同于「万国牌」的「另一个算力平面」。

对中国企业而言，这不只是「多了一家云厂商」，而是在主流 GPU 路线之外又多了一种算力选择、多了一套生态选择，也多了一条基础设施路线。

开放才能致远

除了把硅基黑土地做厚，真正让 AI 长进千行万业，还需要把已经验证过的技术、工具链和行业经验开放出去，这也是 INSPIRE 创想者大会发布「行业 AI 梦工厂」的意义。

首批「梦工厂」包括医疗、具身智能、科学计算、智能制造等垂直领域，开放华为长期积累的技术能力、工具链和实践经验，让行业 AI 不再停留在少数标杆项目里，而是进入可复制、可共建、可持续迭代的新阶段。

开放，也贯穿在华为云的底层生态里。

从鲲鹏、昇腾，到欧拉操作系统、CANN 系统，再到 CCE Volcano、ModelArts 工具链，以及与AgentArts 企业版内核同源度超过 90% 的openJiuwen，华为云正在把更多能力以开源开放的方式交给产业。

周跃峰说，希望华为云在智能体时代成为一朵最开放的云。最终，让智能体开发这件事变得更普惠。

任正非曾说，在方向大致正确的情况下，要先开一枪，不能等，大胆往前走。过去多年，华为云押注行业、押注国产化、押注全栈能力，这条路并不轻松，也不会立刻见效，但也从未动摇。

有人说，一旦认定一件事，便全力以赴。在业内，华为的执行力令许多竞争对手忌惮。

确实。没有一件事情可以随随便便成功，但是认真干起来，也不可能不成功。

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com