领养了阿里猴子,两天后,我发现它比“牛马”厉害

智东西 2026-03-23 22:41

领养了阿里猴子,两天后,我发现它比“牛马”厉害图1领养了阿里猴子,两天后,我发现它比“牛马”厉害图2

对话即执行,这次离现实更近了。
作者 |  李水青
编辑 |  云鹏
智东西3月23日报道,3月17日,阿里推出全球首个AI原生企业级Agent平台——悟空,引起产业人士的广泛关注。
这不仅是阿里成立CEO吴泳铭亲自挂帅的ATH事业群后的首秀,也是其继千问之后打造的又一AI Agent重要入口,或将影响全国2000万钉钉企业客户及近8亿用户,实际体验如何?
智东西第一时间获得了悟空内测码并对此进行了体验。进入悟空,我们能看到这是一个类似于OpenClaw对话框的界面,算力消耗按“算粒”来计算,每日更新100个免费算粒,大概可以执行4-8个中等复杂任务
领养了阿里猴子,两天后,我发现它比“牛马”厉害图3

▲悟空体验界面

实测下来,悟空在三方面的表现可圈可点,但也有明显边界:
在基础认知与任务拆解方面,给它“新开咖啡馆要引流”,两分钟后,它既给出了完整的活动方案,也搭好了可直接预约的落地页。模糊指令到可准确执行输出,衔接流畅。
在企业级系统与工具调用方面,让它去1688筛选符合条件的三家货源,它能自主登录、检索、纠错,最后生成一张包含商品信息、店铺评分、沟通记录的钉钉表格。复杂多步骤任务完成度不错。但涉及通讯录权限时其也显出局限,让它定时给好友发消息,它启动了任务,消息却发给了我自己。
在创意内容生成与精准控制方面,让它做24节气视频,诗句和节气能一一对应,飘落花瓣粒子效果也能呈现;让它用“动画大师”做GDP排行榜,数据准确,还能根据“左边有点空”的反馈迭代修改。但在动态插画、地图轮廓这类细节上,生成精度还有差距。
总体来看,悟空在处理开放性任务、打通多平台操作上已经展现出实用价值,但权限边界细节控制在当前版本仍有进步空间。

01.
基础认知、任务拆解和执行:
脑子好用手速快


按惯例,我们首先看看悟空的基础认知与任务拆解能力如何,这是完成更复杂任务的基础。
提示词:悟空,我是一家未来科技城新开的咖啡馆,下周开业,帮我策划一个线上引流活动,目标是让附近3公里的白领都知道我们。
这一题是为了测试悟空是否能准确理解模糊指令,并将其拆解为可执行的、逻辑连贯的子任务。
可以看到,当悟空接到任务,一边为我创建一个活动营销页面,用于推广开业活动,给出了应用创建过程链接;一边为我完善整个线上引流活动的策划方案,直接在对话框里呈现内容。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图4

▲悟空将需求拆解为两个任务进行执行

大概2分钟之后,线上引流活动的策划方案首先输出,给出了开业首周优惠、 社交裂变传播、会员锁定策略等核心活动设计,以及精准地域投放、写字楼渗透、社群运营等推广渠道策略。整体消耗4.6个算粒。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图5

▲悟空生成的线上引流活动的策划方案

下图是悟空随后给出的营销落地页面,包括客户端和手机端两个版本,预约入口点进去可操作,页面风格与咖啡店调性契合,落地页内容覆盖了前面提及的各种营销措施和基本的时间地点信息,几乎不需要修改,就能直接应用。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图6

▲悟空生成的营销落地页面

可以看到,尽管我的需求比较模糊,悟空能够理解“线上引流”的内涵和玩法,给出了比较具体的方案,还给出了明确可执行的活动时间节点,以及比较符合咖啡店行情的预算建议和效果预期。
接下来,我通过一个域名查询的题目,来考察悟空的信息检索与执行。
提示词:悟空,帮我查一下example.com域名是否被占用,如果可用,多少钱能买?
仅仅花了30秒,消耗0.7个算粒,悟空就自动查询了域名注册信息,反馈这个域名是已经被占用的状态,展示出比较敏捷的信息检索能力。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图7

▲悟空回复内容截图


02.
企业级系统与工具调用升级:
复杂的活也能干,一些权限管得严


接下来,我们将体验升级,把悟空放到更复杂的企业工作环境中进行测试。
提示词:悟空,1688上找一下“露营折叠椅”的高性价比货源,要求供应商必须有牛头标(诚信通),且最近一周评价量大于100。筛选出3家,把沟通记录和样品申请状态同步更新到一个铺货表格里。
这一题是为了测试悟空打通企业权限、操作第三方软件、读写数据的能力,这是企业级Agent的核心。悟空大概耗时5分钟,消耗了34.7算粒,最终给出了一份准确的表格统计。
在输入提示词的同时,我勾选了“1688选品”这个Skill,紧接着悟空就开始执行我的命令。它首先打开了1688官网,首次访问需要我手动登录账号。在我登录之后,悟空就开始自动检索搜集。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图8

▲悟空自动在1688进行检索

在这个过程中,悟空出现了2次搜索出0个结果的情况,但它立刻找到了是“类别选错”等问题,于是自行进行了纠正并搜索出正确结果。
紧接着悟空就开始进行统计信息,不同于人类用户需要依次点开页面的动作,悟空的1688界面停在了搜索结果总览,聊天界面上直接输出了我需要的统计结果,大概2-3分钟后,其给出了一个可点击的表格链接。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图9

▲悟空输出的答案

点开链接可见钉钉文档的界面,这是悟空内置的表格功能支持,可见三家店铺对应商品ID、商品标题、商品链接、主图URL、价格、近期成交件数、店铺名称、店铺链接、诚信通年限、回头率、综合评分、服务标签、沟通记录和样品申请状态等维度都详细出现在表格中。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图10
领养了阿里猴子,两天后,我发现它比“牛马”厉害图11

▲悟空生成的表格页面截图

点击某家的商品链接,可见与商品对应准确,悟空交付了最终的正确结果。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图12

▲点开链接可以看到正确的商品页

悟空的一大特征是,其也内置在钉钉App中,用户可以在手机钉钉App通过与悟空对话,完成与客户端一样的操控。于是我尝试用手机钉钉发送了一个小任务。
提示词:每到整点给小白发消息,提醒他喝水,站起来走走。
悟空在接到任务后,没有发现专门用于定时发送消息的技能,但它使用use_cron 来创建定时任务,结合钉钉工作空间技能来发送消息,并告诉我任务已启用。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图13

▲用手机钉钉App对话可以操控悟空

但当我以为设置成功的时候,我的朋友小白并没有在整点收到消息,而是我和悟空的对话框中,我自己收到了这条消息。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图14

▲悟空的任务执行页面截图

智东西猜想,背后是钉钉并没有给悟空单独给通讯录好友发消息的权限,这也可以理解,如果这个口子放开,可能我们的对话框里会充斥各种AI定时发送的广告轰炸,也可能我们的悟空会被别人通过对话操控,对钉钉用户的体验带来损伤。
不过,悟空在这一任务中的问题是,应该明确说明问题,而不是启动一个不太准确呈现提示词需求的类似任务。
提示词:帮我发邮件给xxx,邀请他来参加我们4月21-22日举办的2026中国生成式AI大会(北京站),在北京富力万丽酒店举行。
可以看到,悟空不到一分钟就为我准备好了邮件草稿,但由于我的钉钉邮箱无法直接发送到这个外部邮箱,它仅为我创建了一封HTML格式邀请邮件,没有替我操作邮件。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图15

▲悟空生成的邮件内容参考

总的来说,阿里悟空目前在通讯录等方面仍设置了权限边界,一方面限制了悟空的管理权限,让悟空看起来不如龙虾那么全能,另一方面其也带来了更多安全感,避免造成企业级的信息泄露、业务中断等问题。

03.
创意内容生成与精准控制:
文化理解和数据提取准确
动态效果仍待提升


最后,我比较关注多模态与创作能力的结合,体验了悟空的创意执行与确定性输出能力。
提示词:帮我做一个动画视频,以24节气为主题,每个节气搭配一句古诗和动态插画,运用“水墨溶解转场”与“飘落花瓣粒子”效果。
这个题目围绕“节气诗会”主题,主要考验悟空能否理解中国24节气文化,以及对特定动态效果的生成情况。
大概花了10分钟,悟空生成了以下1分36秒的视频,可见其完整准确地依次按顺序生成了二十四节气,并且配上了与该节气契合的诗句;在动效上,飘落花瓣粒子呈现比较准确和水墨溶解转场基本呈现,动态插画则没有加入。整体画风比较简洁。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图16

▲悟空生成的视频部分截图

于是我进一步加大难度,想要考察悟空的数据检索,以及精确控制动画每一帧,区别于普通AI视频的随意性的能力。
提示词:悟空,通过动画大师帮我做一个中国城市GDP排行榜动画视频,榜单展示前十名,用Lightmo风格。
如下图所示,悟空自动调用了“动画大师”这一Skill,为我制作了一个关于中国2025年GDP十大城市的动效视频,符合 Lightmo风格(轻盈现代风格)。
从数据上来看,悟空思考过程显示,其一开始找到了官方的纯GPD总量排名以及华顿经济研究院综合排行榜,最后选用了更符合需求的第一个版本数据。可以看到,视频载入数据与官方实际公布数据吻合,没有出现错误。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图17

▲悟空生成的视频部分截图

从动画效果来看,虽然呈现了需求,但我认为视频左边画面比较空,于是再次输入提示词要求悟空进一步修改完善视频。
提示词:视频的左边有点空,可以以中国地图为背景,地图上依次出现前十名城市所在位置的标记点。
可以看到,视频变化不大,悟空确实生成了一些相对位置的标记点,但是中国地图的轮廓却看不出来。整体花费了近15分钟,近60个算粒。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图18

▲悟空生成的视频部分截图

最后,我还让悟空帮我做了电商主图优化,主要考察悟空分析主图问题、自动调整设计能力。
提示词:悟空,这个商品主图点击率低,帮我优化一下,目标人群是4岁女童。
如下图所示,上图是优化前的图片,右图是优化后的图片,下图相比左图在背景颜色、图案上进行了调整,变得更具备可爱风的特点。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图19
领养了阿里猴子,两天后,我发现它比“牛马”厉害图20
时间有限,智东西本次只是针对对一小部分场景对悟空进行了体验。在悟空“技能中心”,我们还能看到近百种推荐Skill可供直接添加使用,从开源平台获取的Skill也可以在悟空中进行应用。悟空更全面的实测效果如何,还有待更深入的体验。

04.
结语:AI Agent时代
企业软件交互方式正被重构


作为阿里布局AI Agent的重要落子,悟空展现了企业级智能体从“对话”走向“执行”的跨越。其在任务拆解、跨系统操作与多模态生成上表现出的连贯性,已初步验证了“AI即服务”的产品范式。尤其在钉钉生态内,悟空具备成为千万级企业智能入口的潜力,但其权限边界与执行透明度仍需进一步厘清。
从产业视角看,悟空的亮相标志着AI Agent正式进入“可交付、可控制、可迭代”的新阶段。未来,随着token经济、技能市场与权限体系的完善,企业软件的交互方式将被重构。谁能在开放能力与安全边界之间找到最优解,谁就能在这场AI代理革命中占据先机。
领养了阿里猴子,两天后,我发现它比“牛马”厉害图21
(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)

2026中国生成式AI大会预告


领养了阿里猴子,两天后,我发现它比“牛马”厉害图22


领养了阿里猴子,两天后,我发现它比“牛马”厉害图23

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
阿里
more
今日看点:阿里千问大模型负责人林俊旸卸任;华为发布新一代基带方案
中国龙虾第一芯!全球首款OpenClaw专属CPU,Arm、阿里云都来了
千问3.5-Max-Preview亮相LM Arena,阿里登顶中国大模型榜首
阿里“悟空”上线!钉钉给企业送来龙虾大军
阿里批准林俊旸离职,CTO周靖人接管千问!Gemini周浩确定加盟
龙虾之后,阿里巴巴的猴子来了
阿里、抖音、京东彻底疯狂,新的大战一触即发
早报 | 道指跌近800点,美油涨超6%;阿里辟谣千问模型团队集体离职;美拟将AI芯片出口管制扩展至全球;比亚迪发布第二代刀片电池
阿里通义千问核心负责人林俊旸突然离职,正值Qwen 3.5小模型发布次日
老黄呼吁所有企业「养虾」当天,阿里正规军入场,「悟空」把路铺平了
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号