
腾讯不能接受 GUI agent,只能接受 A2A。 |
文|王毓婵 梁键强
编辑|张雨忻
6 月 4 日,腾讯客服回应称,微信正在与华为、小米、荣耀、OPPO、vivo 等手机厂商合作推出 A2A 助手能力,目前已有多家厂商完成接入。
“您可以通过对应手机系统的 AI 助手发起微信音视频通话或向指定好友发送消息。该功能基于 A2A(Agent-to-Agent) 协作机制,数据安全与隐私通过双重授权机制保障。合作旨在将微信高频沟通功能融入手机系统助手,为您提供更便捷的使用体验。”腾讯客服表示。
与之前字节跳动推出的豆包手机相比,腾讯的微信 AI 采取了完全不同的技术路径。
以豆包手机为代表的很多 OS 端 AI 助手,走的是 GUI agent(图形界面智能体) 路线——它们像人一样通过“读屏”来识别界面,再通过“模拟点击”去操作微信。
而腾讯此次与手机厂商的合作,采用了 A2A(Agent-to-Agent) 机制——微信打开一道门,让手机厂商的系统智能体(如华为小艺、小米小爱、荣耀 YOYO、vivo V、魅族 Aicy)等直接对话微信内部的 agent。
系统智能体解析出用户的“意图”后,通过加密且受控的协议把指令发给微信,由微信在后台“自己执行”并返回结果。
这本质上是一种“双授权”,即用户授权+应用授权。
两种技术路径,一个伦理问题
在 5 月的腾讯 Q1 财报电话会上,有分析师问腾讯总裁刘炽平,“如何看待来自操作系统层面智能体的长期潜力或潜在颠覆,包括来自 iOS、Android 或手机厂商的智能体”。
刘炽平回答说:
从操作系统的角度来看,这里面混了几种不同的东西。有真正的操作系统,如 iOS 和 Android,然后还有那些试图假装自己是操作系统的应用程序。
我认为,如果你是 iOS 或 Android 这样的操作系统,你希望确保生态系统得到良好保护和精心策划,并给予应用程序合理的权限,你可以拥有一个试图为用户提供服务的智能体,但你需要获得不同应用程序的许可。
否则,作为操作系统,你本质上是在掠夺不同的应用程序,这不是管理操作系统的最佳方式。操作系统已经存在很长时间了,它的原则是中立的,为所有应用程序提供公平的竞争环境。
未来,所有智能体都可以与操作系统合作。但如果有一个应用程序试图成为类似操作系统的服务,并试图侵入其他应用程序,那才是真正的竞争,任何应用程序都不会允许这样做。我认为操作系统本身也应该阻止这种情况发生。
现在看来,刘炽平的意思已经表达得很清楚——用操作系统的 agent 来操控应用是可以的,但不能不获得应用程序的授权,否则就是对应用的掠夺。
换句话来说,腾讯不能接受 GUI agent,只能接受 A2A。
手机厂商不是没有尝试用 GUI 硬闯过。
2023 - 2024 年,大模型爆发初期,手机厂商一度热衷于“全自动驾驶”尝试,荣耀 YOYO 宣传过“一句话发微信红包/点外卖”,小米智能家居产品的卖点是“小爱自动打通微信电话”。
厂商当时的做法是运用系统级宏命令(Macro)或 GUI 自动化工具。当你对手机说“给 XX 发个 10 块钱红包”时,AI 助手在后台执行的是:“解锁 -> 点击微信图标 -> 搜索 XX -> 点击加号 -> 点击红包 -> 输入10 -> 调起支付”。
这一行为很快被微信全面封杀。
2025 年 4 月,微信安全中心发布公告称:“近期,我们发现有第三方工具以‘AI 管理用户微信聊天记录’等名义,绕过微信安全技术措施,违法违规获取或利用微信终端用户数据。在此提醒用户,切勿安装或使用任何可访问本地聊天记录的第三方工具。”
随后,这类系统级 AI agent 均无法再直接调用微信功能,退回到了测试流畅、调屏幕亮度、连接 Wi-Fi 的小打小闹之中。
手机厂商虽然一直尝试通过“系统无障碍辅助”来曲线救国,但一旦微信更新了界面 UI,或者修改了控件的 ID,厂商的 AI 助手就会出现点错人、点错按钮的尴尬情况,体验非常不稳定。
真正再次触及各家互联网公司底线的是豆包手机。

△豆包手机助手介绍页截图
2025 年 12 月 1 日,字节与中兴联合发布豆包手机助手技术预览版。搭载努比亚 M153 工程样机,系统级 AI agent 核心卖点是“AI 直接跨应用操作”。
该产品同样被应用提供方堵截。12 月,大量用户反馈,微信账号被强制下线,系统提示登录环境异常。与此同时,淘宝、支付宝、农业银行、建设银行等应用也开始限制相关能力。
腾讯方面表示,此系豆包手机助手通过系统级权限(如 INJECT_EVENTS)模拟用户操作,触发了微信既有的安全风控策略,被判定为违反《腾讯微信软件许可及服务协议》中禁止第三方外挂、自动化操作的规定。
如今,微信 AI 已经箭在弦上,“野蛮人”也到了变身“合作方”的时候。A2A 机制让微信官方给出安全协议,两边的 AI 正式“握手谈判”。开关门的权力依然掌握在腾讯手中。
微信 AI 携百万小程序,面对阿里“全家桶”和字节火山引擎
6 月 2 日,英国《金融时报》引用两位知情人士的发言称,腾讯目前已完成该 AI 智能体的原型测试,最快将于本月启动公开上线前所需的合规审批流程。
该报道发布后,腾讯股票当日收盘上涨 10.5%,创下自 2021 年 1 月 25 日以来单日最高涨幅纪录。
《金融时报》称,一位看过早期演示的人士透露,用户可以通过在微信主屏幕上向右滑动来访问人工智能代理的聊天框。用户可以输入指令,让代理自动访问微信数百万个小程序,并完成诸如根据特定口味和价格要求查找咖啡馆和订购饮料等任务。
AI 时代,各家大厂的打法风格大不相同,但基本都是集中在自己最具优势的一个点上放大。
阿里千问 APP 已接入地图、打车、购物、闪购等数十个阿里生态 agent,以及向第三方 agent、Skill 开放,让企业在平台上运营自己的 Agent,成为了名副其实的“全家桶”。
字节除了有一个比元宝更强势的豆包 agent,和比混元更强势的豆包大模型之外,还有先一步与手机厂商达成的合作关系——目前全球 Top 10 的手机厂商中,有 9 家(除了苹果)已经通过火山引擎接入了豆包大模型,火山几乎完成了对国产手机生态的垄断。
腾讯最大的优势,目前来看,显然还是掌握中国唯一一个真正意义上的“超级应用”,微信。
一位腾讯内部人士评价此次与手机厂商的合作时称:“任何手机 agent,如果不能调用微信,就不算一个真正的系统级 agent。腾讯这个口子一定会开,只是时间问题。”
在与硬核联盟的关系上,虽然手机厂商在底层要向火山引擎等服务平台支付算力费用,但它们也非常清楚,在应用层,用户可以换手机,但绝不能不用微信。
谁的手机能“一句话盲操发微信通话”,谁就能在高端市场上拿到绝对的体验优势。与腾讯的合作是“可以等,但不能不做的”。
腾讯与手机厂商的 A2A 合作,算是在如今硬核联盟与应用提供方的“柏林墙”上开了一个洞,平衡了双方的利益。未来,我们应该也可以看到更多阿里系和字节系的应用通过这条路径真正接入系统 agent。
封面来源|AI生成

