Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri

硅星人Pro 2026-04-23 09:50
Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri图1
作者吴瑞琪
邮箱rachelwu@pingwest.com

"试验阶段结束了。" Google Cloud CEO Thomas Kurian 在开场不到三分钟就抛出这句话。

Google Cloud Next 大会于当地时间4月22日上午在拉斯维加斯召开。这是近年来科技圈最受关注的云计算大会之一,今年的主角只有一个:Agent

从 Keynote 的章节命名就能看出 Google 的野心:Agentic Enterprise Blueprint、Agentic Data Cloud、Agentic Defense、Agentic Taskforce......每一个模块都冠上了"Agentic"的前缀,Google Cloud 向世界介绍的是一套从算力底座到应用前端的完整agent架构。

但如果你把这场 Keynote 从头看到尾,会发现一件非常有意思的事:

Google是真的瞧不上Harness,在整场大会里对这个火热名词一字未提。

在热火朝天的agent浪潮里,Harness是最近一段时间最火热的概念。它被用来描述建设agent的过程里所需要的一切基础设施。

而在疯狂的讨论里,。它完全缺席了。

这次Google Cloud的大会上,缺席的原因终于明白:

Google根本不认同什么Harness,或者说它拒绝被其他人提出的模棱两可概念牵着鼻子走,它提出的是从AI Hypercomputer(包括新发布的训练和推理分家的更强TPU),Agentic Data Cloud、Agentic Defense、Agentic Task Force,到最重要的Gemini Enterprise Agent Platform的Agent五层架构体系。

Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri图2

它要用这个全家桶抢走所有企业agent的生意。在这次大会上,甚至出现了活久见的一幕:苹果的logo出现在Google的发布会大屏幕上,恍惚以为误入乔布斯剧院。Google就这样以客户案例展示的形式“发布”了新的Siri的关键信息。

Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri图3

这一切都是Google在秀肌肉。

以下是这场长达两小时 Keynote 的核心内容解析。

Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri图4

1

Sundar Pichai :资本投入创历史

Google CEO Sundar Pichai 公布了一个让人瞠目的数字:Google 在2022年的资本支出为310亿美元,而2026年的预算区间是1750亿至1850亿美元,四年内实现了近6倍的增长。其中超过一半的机器学习算力将专门分配给云业务。

他随即用 Google 自己的案例说明 Agent 的实际价值:

Google 内部目前75%的新代码由 AI 生成,并由工程师审核通过(去年秋天这一比例还是50%)。在一次复杂的代码迁移任务中,工程师组建了由"规划者、协调者、编码者"三类角色构成的 Agent 系统,最终将迁移速度提升了6倍。

在营销层面,团队借助 Gemini 生成大量创意素材变体,实现精细化个性投放,带来70%的制作周期缩短和20%的转化率提升。

在安全层面,Google 安全运营中心的 Agent 每月自动处理数以万计的非结构化威胁报告,将威胁缓解时间压缩了超过90%

Pichai 随后宣布了大会最重磅的产品:Gemini Enterprise Agent Platform,并将其定义为"Agent 时代的任务控制中枢"。

1

Gemini Enterprise Agent Platform:企业 Agent 的操作系统

这是整场 Keynote 着墨最多的部分,也是 Google 今年最核心的产品策略落点。

新模型阵容

Google 发布了一批新模型,均处于 Preview 阶段:

Gemini 3.1 Pro,最新的旗舰推理模型,专为复杂工作流编排设计,可与企业 API 和系统直接交互,减少调优需求。Databricks、JetBrains、Replit 均已选择接入。

Gemini 3.1 Flash Image(内部代号 Nano Banana 2),面向高保真视觉资产生成。Veo 3.1 Lite,Google 最具成本效益的视频模型,定位高并发视频应用场景。Lyria 3 Pro,企业级音频和音乐生成模型。

值得关注的是,Google 同时支持 Anthropic 全线模型,并在大会上宣布新增对 Claude Opus 4.7 的支持。

此外,Google还宣布成为苹果的首选云合作伙伴,双方正在基于 Gemini 技术共同开发下一代 Apple Foundation Models,这些模型将驱动包括"更个性化的 Siri"在内的苹果未来 AI 功能。

Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri图5

Agent 的完整生命周期管理

平台的核心价值在于覆盖 Agent 从构建到治理的全生命周期:

Low-Code Agent Studio 允许非技术员工用自然语言创建和部署 Agent,将业务规则融入 LLM 推理,实现可预期的自主执行。

Agent Registry 是 Agent 的"总台账",为组织内每一个内部 Agent 和工具建立索引,确保可发现性与治理合规。Skills & Tools Registry 则提供可复用的模块化指令包,让 Agent 能快速习得特定领域的专项能力。

Agent Marketplace 支持从生态合作伙伴直接搜索和部署专业 Agent,接入方包括 Atlassian、Box、Oracle、ServiceNow、Workday 等主流企业软件厂商。

平台原生支持 Model Context Protocol(MCP),并将全部 GCP 服务暴露为 MCP 接口,使任意 Agent 均可无缝调用任意 GCP 服务。

安全与治理:Agent 身份识别

在安全侧,平台引入了 Agent Identity 机制——每个 Agent 被分配唯一的加密 ID 和明确的授权策略,所有行为均可追踪和审计。Agent Gateway 充当统一管控台,跨组织执行策略,配合 Model Armor 防止敏感数据泄露。

Agent Observability 提供粒度化的执行路径可视化,支持 OTel 标准遥测,开发者可追踪 trace、监控工具调用,诊断推理死循环。

真实客户案例

客户采用数据颇为亮眼:

德国保险公司 Signal Iduna 上线数周后即达到80%的使用率,11,000名员工开始自主构建专属 Agent,其健康险 Agent 将用户答复速度提升了37%,周活用户增长400%。KPMG 首月达到90%的采用率,上线超过100个 Agent。Walmart 向门店管理人员推出 Gemini Enterprise,让管理者能花更多时间在卖场与员工、顾客互动,而非坐在办公室盯屏幕。NASA 使用 Gemini Enterprise Agent 为 Artemis II 载人航天任务提供飞行就绪性支持,确保宇航员安全。

此外,Citi Wealth 与 Google Cloud 及 DeepMind 合作,推出了名为"Citi Sky"的 AI 财富团队成员,可全天候多语言为客户提供金融服务。Virgin Voyages 部署了面向船员的 AI 助理"Project Ruby",将生产时间线缩短约60%,并拉动单月销售额增长28%,实现了一个销售纪录季度。

大会还邀请了单板滑雪传奇、三届奥运金牌得主 Shaun White 上台,现场演示 Google Cloud 如何用 AI 分析他在2017年的比赛影像——将一个不到三秒的腾空动作逐帧拆解,追踪三维姿态、旋转速度、腾空时长,为新生代运动员的技术训练提供数据支持。

Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri图6

1

AI Hypercomputer:算力基础设施的两条腿

负责基础设施的高级副总裁 Amin Vadhat 说:"在 Agent 时代,算力不再由一块芯片定义,算力就是整个数据中心。"

第八代 TPU:训练与推理分家

Google 本次发布了 TPU 第八代,并首次拆分为两个独立平台:

TPU 8t(训练专用):将块缩放乘法运算直接内置于 MXU(矩阵运算单元),消除 VPU 计算开销,单 pod 计算性能是上一代的近3倍。芯片间互联带宽是 Ironwood 的两倍,最多可连接96,000颗 TPU,形成3D 环形拓扑,整个 Superpod 提供121 exaflops FP4算力。单 Superpod 共享带宽内存达2 petabytes。Google 将其类比为"可存放美国国会图书馆全部数字馆藏100次"的容量。

TPU 8i(推理及强化学习专用):集成专用集合加速引擎,额外降低5倍延迟;全部内存缓存直接驻留在硅基上,从根本上打破了制约长上下文解码的"内存墙"。采用全新 Boardfly 拓扑,单 pod 部署1,152颗 TPU,可同时运行数百万个并发 Agent,接近零延迟,算力达11.6 FP8 exaflops,较256芯片 Ironwood pod 提升9.8倍

Virgo 网络与 NVIDIA Vera Rubin

在网络层,Virgo Network 将134,000颗芯片以47 petabits/s 的无阻塞带宽互联,提供170万 exaflops 的总算力,支持在单一集群中组织超过百万颗 TPU,可将数月的训练时间压缩到数周。

与此同时,Google 宣布将成为全球首批提供 NVIDIA Vera Rubin NVL72 的云厂商,并在其上开放 Virgo 网络支持,最多可连接96万颗 GPU。

在处理器侧,基于 Arm 架构的自研 Google Axion N4A 实例上线,与同类 x86 实例相比,价格性能比提升最高2倍,能耗性能比提升80%。

金融巨头 Citadel Securities 现场分享了实测数据:在 TPU 上运行工作负载的速度是此前的2至4倍,成本降低30%;原本需要数周甚至数天的研究任务,现在可以在数小时乃至数分钟内完成。

Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri图7

1

Agentic Data Cloud:让 Agent 读懂企业数据

"没有上下文的推理只是猜测。" 负责数据业务的 Karthik Narain 给出了这场演讲里最直白的一句话。

Agentic Data Cloud 由四项核心创新构成:

Knowledge Catalog(知识目录),定位为企业的"通用上下文引擎"。它深度整合 BigQuery,将表结构和元数据映射为统一的业务语义,并通过 Smart Storage 将非结构化数据(PDF、图片等)一落入 Google Cloud Storage 便立即完成标记、富化和 Agent 就绪处理,无需任何人工数据工程。Gemini 会自动提取实体、映射关系、理解业务语义:当 Agent 听到"净收入"或"风险"时,它能理解企业特定的语义含义。

Data Agent Kit,一套内嵌于开发者日常工作流(VS Code、Claude Code、Gemini CLI)的数据科学工具库。开发者只需表达意图,例如"预测客户流失",系统便自动构建数据管道、部署模型,直接在 Agentic Data Cloud 上执行,全程无需手动编排。

Lightning Engine for Apache Spark,Google 重构了 Spark 执行引擎,在 Agent 时代的大规模数据处理场景下,性能是此前市场领导者的2倍,价格性能比也高出2倍。Flipkart、Lowe's、Meesho 等已开始使用。

Cross-Cloud Lakehouse(跨云数据湖仓),这是 Karthik 最着重阐述的一项能力。基于开放的 Apache Iceberg 标准,分析引擎可以直接跨 AWS、Azure 查询数据,数据不移动、零复制、无须承担昂贵的出站流量费,直接实现低延迟访问,彻底打破"数据必须在同一朵云"的历史枷锁。

Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri图8

1

Agentic Defense:安全也要以机器速度运转

"漏洞从发现到被利用的时间已经变成负数。"安全负责人 Francis deSouza 用这句话揭示了当前网络安全的严峻现实:当前漏洞的平均被利用时间是负7天,也就是说,攻击往往发生在补丁尚未开发出来之前。更令人担忧的是,攻击者从初始入侵到移交给下一个威胁团伙的交接时间,已从过去的8小时压缩到22秒

应对这一现实,Google 推出了 Gemini 原生的 Agentic 安全运营中心(SOC):triage Agent 将原本30分钟的安全调查压缩至60秒完成;威胁狩猎与检测 Agent 以人类团队无法企及的速度和规模主动扫描风险;结合 Mandiant、VirusTotal 和 Chrome 的全球遥测数据,暗网威胁识别准确率达98%

大会上,Wiz 正式并入 Google Cloud(此前已宣布收购意向)。Wiz 联合创始人 Yinon Costica 上台介绍了 Wiz 的 AI Application Protection Platform(AI-APP)

Wiz 通过无代理方式自动构建云和代码环境的动态资产清单,并生成安全图谱,直观呈现 AI 应用架构(包括哪个 Agent 运行哪个模型、能访问哪些数据库和工具)。

Wiz Red Agent(红队 Agent)持续自动验证每个暴露风险,像一个友好的白帽黑客不间断扫描攻击面——它能发现认证绕过漏洞,并证明该漏洞确实可被用来渗透后台敏感数据库。Wiz Green Agent(绿队 Agent)则负责自动化完整的修复流程:识别责任人、定位漏洞代码行、生成修复建议,并可直接提交 PR 或触发编码 Agent 自动修复。

Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri图9

1

Agentic Taskforce:让 Agent 直接服务客户和员工

面向客户:从购物到服务的全渠道 Agent

Google 推出了预建的购物 Agent 和餐饮点单 Agent,支持从发现到结账的全流程自然语言交互。Omnichannel Gateway 确保 Agent 在网页、移动端、语音多个渠道之间无缝衔接,且完整保留对话上下文。

Papa John's 正在用 Food Ordering Agent 构建记忆用户偏好、加速送达的超个性化点餐系统。Best Buy 用 Agent Assist 引导购物者了解复杂产品规格、解决问题、预约服务。Home Depot 的"Magic Apron"助理则覆盖从选购灵感、产品知识到购后支持的全旅程。

演示环节中,YouTube TV 的客服语音 Agent 已在生产环境中服务100%的用户,现场接到来电后,Agent 流畅地推荐了体育订阅方案,并在请求下实时切换为西班牙语为来访者父亲讲解,整个体验自然到与真人客服无异。更重要的是,YouTube TV 团队从零到生产上线,只用了六周

面向员工:Workspace Intelligence

Google Workspace 产品 VP Yulie Kwon Kim 发布了 Workspace Intelligence,定义为"消除上下文碎片的统一智能层"。

她用一个场景说明问题:一个普通的工作日里,你为了回答一个问题打开了15个标签页,在过期邮件、被人实时编辑的 PPT 和多个表格之间来回跳转。Workspace Intelligence 的目标是让这一切不再发生。

演示中,系统在 Google Chat 的 Ask Gemini 界面里,直接汇总了来自多个来源的最紧急任务,精确定位了"上季度那个带区域销售折线图的 doc",并通过调用"区域营销技能",自动跨邮件、聊天记录、外部 CRM 和企业品牌素材,生成了一份格式精美、符合个人历史风格的 Google Slides 报告。

大会还宣布,从 Microsoft 365 迁移到 Google Workspace 现在可以快5倍,包括法律和财务等对格式要求严苛的复杂团队迁移也在支持范围内。

Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri图10

1

一场系统架构层面的宣战

纵观整场 Keynote,如果只提炼一个核心判断,那就是:Google 正在将 Agent 从一个功能,升级为一套完整的企业操作系统。

Thomas Kurian 在最后总结时特别强调了"开放",并以此与竞争对手的"围墙花园"策略形成对比:客户可以自由选择最好的芯片和模型、自由在任何地方运行 AI、自由控制自己的数据和 Agent。

但自由不是无序。Google 给出的答案,是用五层架构把这种自由兜住。

AI Hypercomputer,为 Agent 时代重新设计的算力底座,训练与推理首次分开专项优化。Agentic Data Cloud,解决的是 Agent 的"原料"问题:企业数据如何变成 Agent 可信赖的上下文。Agentic Defense,让安全本身也成为自主运行的 Agent,以机器速度对抗机器速度的威胁。Gemini Enterprise Agent Platform,Agent 的构建、部署、治理、优化一体化平台。Agentic Taskforce,面向客户和员工的现成 Agent 部队,以及将 AI 能力深度融入 Workspace 的智能层。

"试验阶段结束了",这句话听起来像一个简单的宣告,但背后是一个清晰的商业逻辑:当75%的 Google Cloud 企业客户已经在使用 AI 产品,当 Walmart 和 Unilever 这样的传统巨头也已将 Agent 部署到门店和采购流程,Google Cloud 需要的不再是说服企业为什么要用 AI,而是向企业提供管理数千个 Agent 的能力。

这正是 Gemini Enterprise Agent Platform 的存在意义。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AR 苹果
more
法律AI明星初创Harvey完成2亿美元融资,估值飙升至110亿美元
Meta全新AI模型Muse Spark来了!
Meta发布Muse Spark:华人天团废墟重建,最恨Llama的果然是小扎自己
亚马逊斥资115.7亿美元收购Globalstar,加速布局卫星直连设备市场
印度AI新锐Sarvam冲刺独角兽轮融资,英伟达亚马逊拟参投
Andrej Karpathy最新播客:Token没用完让人焦虑,就像患上「AI精神病」
BotLearn创始人李可佳:不要问龙虾能为你做什么,要问你能为龙虾做什么|甲子光年
英伟达给机器人装上龙虾大脑!具身智能的Harness来了
美国金融科技公司Marquis遭勒索软件攻击,超67万人敏感金融信息被盗
斯坦福博士创立太空光伏新锐 Arinna,获400万美元种子轮融资
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号