“编者按:面对OpenAI的强势崛起,谷歌如何反击?Mariner项目就是谷歌给出的答案——一步险棋,也是一步非下不可的棋。
这副牌,打好并不便宜

谷歌的目标不止是与 OpenAI 竞争。它真正的野心,是凭借其全新的自主 AI 智能体——Mariner项目,彻底改写 AI 应用领域的游戏规则。
谷歌的构想,是打造一个能直接替你办事的超级助理,而不只是一个问答机器人。无论在哪个网站或APP,它都能代你操作。
但这个构想最大的难题在于,运行它所需耗费的资源极为庞大,高昂的成本注定这在短期内无法成为大众工具。
什么是 Mariner,它为何如此重要?
Mariner 的核心是一个行动模型,远超传统聊天机器人的范畴。
当其他 AI 还在教你如何订机票时,Mariner 已经帮你搞定了一切:它会自动打开浏览器、寻找最佳航班、填写乘客信息、选择日期、完成支付,最后把电子机票发到你的邮箱。
它的背后,是四项关键技术的融合:
计算机视觉,让它能像人一样读懂屏幕上的图形界面。 Gemini大模型,赋予它强大的推理和规划能力。 强化学习,让它学会与网页上的按钮、菜单和各种控件互动。 多模态能力,使其可以同时理解文字、图片并执行具体动作。
这带来的颠覆性结果是,Mariner 能将任何网站或应用的图形界面直接转化为可供自己调用的接口,整个过程甚至不需要对方网站的任何授权。

它究竟能做什么?
在多次演示中,Mariner 已证明了它的强大能力:
一站式旅行规划:从搜索航班酒店,到对比餐厅和博物馆门票价格,再到最终下单预订,它能帮你规划和执行一趟完整的里斯本之旅。
智能购物:它能读取你在 Google Drive 里的一个食谱,自动识别出你缺少的食材,然后在 Instacart 上帮你加满购物车并下单。
跨应用任务处理:它能根据你邮件里的需求,自动去 TaskRabbit 平台为你雇佣一个临时工来完成特定任务。
智能日程协调:在帮你预订 Expedia 酒店前,它会先检查你的个人日程,确保不会与其他安排发生冲突。

谷歌的组合拳:如何反击OpenAI和微软
Mariner 并非孤军奋战,它是谷歌为赢得下一代人机交互入口——自主 AI 智能体——这场战争的核心武器,用以对抗 OpenAI 和微软的步步紧逼。
谷歌的战略布局清晰可见:
在 Chrome 浏览器中,Mariner 将把这个信息入口,升级为一个无所不能的“网络操作系统”。
在 Workspace 全家桶里,它能打通 Gmail、文档和日历,实现跨应用的复杂工作流自动化。
在 Android 系统上,它有潜力在后台为你协调不同 App 间的操作,全程无需你动手。
在谷歌云平台,一个「企业版Mariner」将为商业客户提供前所未有的大规模自动化解决方案。
尽管 OpenAI 的智能体也在做类似的事,但 Mariner 的最大优势在于其原生性。它与谷歌的生态系统血脉相连,在 Chrome、Workspace 和 Android 上的作战能力,是任何外部对手都难以比拟的。
两大核心挑战:可靠性与成本
技术上的脆弱点
任何网站的微小改动,甚至是弹出的一个广告或验证码,都可能让 Mariner 的自动化流程瞬间崩溃。在正式上线前,谷歌必须解决这个难题。
高昂的成本与有限的开放范围
Mariner 的每次操作都需要消耗巨量的算力。目前,它仅对每月支付约 200 美元订阅 Google Ultra 服务的用户开放。
这道高墙将绝大多数人挡在门外。除非谷歌愿意烧钱补贴,否则 Mariner 的强大功能,对普通人来说依旧是镜花水月。
可能的定价模式
面向开发者:在谷歌云平台上提供按次或按量付费的 API 调用。 面向高端用户:与目前约 200 美元/月的 Google Ultra 套餐绑定。
这清晰地表明,Mariner 当前的定位,是一个不折不扣的顶级高端产品。
AI 代理的终极战场
战局上的玩家远不止谷歌:
OpenAI:手握 ChatGPT、GPTs、Actions 和尚在测试中的自主导航工具。 微软 Copilot:深度集成于 Windows 和 Office,在企业市场根基深厚。 Adept AI 等创业公司和开源项目:虽然集成度不高,但胜在灵活。
这场战争的终局,无关谁的 AI 模型更聪明,而在于谁能成为用户手机里、电脑上那个默认的、无处不在的AI代理。
下一步是什么?
如果谷歌能解决可靠性的硬伤,并找到一个更亲民的定价模式,Mariner 或将进化为每个人的数字第二大脑。
它能预测你的需求,管理你的生活,过滤繁杂的信息,成为你密不可分的一部分。
在那之前,这场决定未来数字世界由谁主宰的战争,才刚刚拉开序幕。
网站: https://labs.google.com/mariner/landing
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!