啥?Fable 5一出,Skill和Prompt都白学了?

量子位 2026-06-14 19:00
henry 发自 凹非寺
量子位 | 公众号 QbitAI

Workflow、Skill、SOP,可能真的要过时了。

在Fable 5发布24小时后,Reddit 9年老兵Bohdanowicz连肝一天一夜,最后写下这样一句评价:

“工作流的变化,比模型的变化更大。而模型的进步,是真的。”

啥?Fable 5一出,Skill和Prompt都白学了?图1

过去几个月,为了让模型更好用,他亲手搭了一整套工作流,把任务拆得明明白白,甚至连Harness都是自己手搓的。

结果Fable 5发布后,一切突然变得有些多余。

用他的话来说,是时候重写剧本了!人类自己精心设计的Agent工作流,已经过时了

以前需要拆成4到6步、全程盯着推进的任务,现在一句话交代下去,Fable 5自己就跑完了。

可以说,几个月攒下来的经验和技巧,一夜之间成了历史。

(所以说嘛就不用学,反正最后都会自动化!)

而有这种感受的人,不止他一个。

Fable发布72小时后,全网已经攒出一批深度体验报告,大家反复讨论的是同一个问题:人和模型之间,该重新怎么分工

除了Bohdanowicz,其中流传最广的几份,画风是这样的:

两行CSS,逼它发明了一套自动化

咱先说Django联创Simon Willison用Fable 5的心得。

两天用下来,Simon最大的感受是“relentless proactive”(坚持不懈的主动),说人话就是,Fable 5特别爱主动干活

啥?Fable 5一出,Skill和Prompt都白学了?图2

事情是这样的。

6月11日,他在自己的项目里发现一个小bug,输入框下面多了一条不该出现的横向滚动条。

他截了张图丢给Claude Code里的Fable 5,只留下一句提示:去依赖库里查查原因。然后起身做家务去了。

啥?Fable 5一出,Skill和Prompt都白学了?图3

几分钟后回来,他愣住了。Firefox自己开了,正在自动跳转到出Bug的页面。

接着Safari也开了,而Simon压根没装过任何浏览器自动化工具。

啥?Fable 5一出,Skill和Prompt都白学了?图4

事后复盘日志时,他发现Fable干了一件非常离谱的事:为了修这个Bug,它给自己现造了一套自动化工具链

具体来说,Fable 5先是自己启动本地服务,在不同浏览器里复现问题。

发现复现不了之后,又直接打开Simon真实机器上的浏览器。

接着为了看清页面,它绕过常规方案,用Python调用macOS底层接口给窗口截图。

啥?Fable 5一出,Skill和Prompt都白学了?图5

遇到弹窗打不开的问题时,它直接修改网页模板,自动模拟按键。

啥?Fable 5一出,Skill和Prompt都白学了?图6

当页面尺寸拿不到时,它就直接顺手手搓了个本地服务器,把浏览器里的数据回传回来。

啥?Fable 5一出,Skill和Prompt都白学了?图7

整个过程里,没有人告诉它该怎么做。它只是一步步发现缺什么,就补什么。

最后折腾半天,修复方案落地:

两行CSS

这中间还有个插曲。把这些招全部摸索出来之后,Fable触发了某个看不见的护栏,被自动降级成了Opus 4.8。

但好在Opus拿着完整的对话记录,沿用Fable发明的全部技巧,把修复跑完了。相当于一个模型给另一个模型留好了施工图纸。

Simon给这种行为起了个名字,relentlessly proactive,不依不饶地主动。

它会的招数极多,而且为了达成目标,几乎什么招都肯用,完全不需要人来介入,教他。

一个prompt,它自己干了九个半小时

接下来是拿到早期访问权限的沃顿商学院教授Ethan Mollick

先说结论。

在他看来,Fable 5相比此前所有模型都是一次巨大的跃迁。而真正变化的,不只是能力,而是人与AI的关系

啥?Fable 5一出,Skill和Prompt都白学了?图8

拿到模型后,Mollick先搬出了一个老题目——等时线地图

这是一类诞生于19世纪的地图:从某座城市出发,经过多少天能够抵达世界哪些地方。

虽然看起来只是生成一张地图,但背后却需要整合海量交通数据,还要做无数细小判断。

过去他拿这个题目考过不少模型,没有一个真正过关。

而这一次,他只给了Fable 5一个超长Prompt:

我想让你构建一张经过完整研究且美丽的等时线地图,让我能选择不同的城市,并基于真实数据看到真实的等时线。我希望设计独特。你应该考虑机场(以及往返机场的交通时间)、火车、步行和开车。数据不必是实时的,但应基于你的研究和数据是真实的。你可以从几个城市开始,但越通用越好,这应该是一个全新的项目。

(大家可以试试)

并接受了Fable 5按照原始地图的风格来实现的建议,然后奇迹发生了:

Fable 5接到prompt后,先自己启动子Agent(可能是sonnet这样的便宜模型)做研究,检索了超过2200条航班数据,从法国TGV到日本新干线的时刻表,再到不同国家的公路通行速度。

啥?Fable 5一出,Skill和Prompt都白学了?图9

与此同时,它自己写代码、自己验证结果、自己记录进度。

Mollick后来提了一条意见:偏远地区不要估算,要真实数据。

于是模型又启动了一套互相挑错的Agent流程,一组查资料,一组负责找漏洞。

啥?Fable 5一出,Skill和Prompt都白学了?图10

从太平洋上的皮特凯恩岛补给船班次,到加拿大北极圈内小镇Grise Fiord的交通路线,全被翻了出来。

最终结果是一个可以互动的地图,你手拖到哪里,就会显示到达那里需要多久。

(注:地图链接:https://isochronic-passage-chart.netlify.app/#nyc)

而真正让Mollick震惊的,还不只是这张地图。后来他又把一个研究界的老难题丢给了Fable 5:

如何校准人类评分员与AI评判之间的差异,这是个很多研究者都头疼的问题。

模型接到任务后,先写出一份19页设计文档,然后开始干活。

九个半小时后,它交出了一套完整的软件工具:Concord

啥?Fable 5一出,Skill和Prompt都白学了?图11

Mollick后来把它开源到了GitHub。

作为领域专家,他当然还是挑出了不少问题,让模型继续修改。但整个过程中,他最强烈的感受却是:自己越来越没什么事可做。

数百个技术决策,模型直接替他做了,过程长到甚至不值得跟读。

于是Mollick写下了一句很有意思的话:

“欢喜,因为我只是提了个要求,事情就成了。

“不安,也因为我只是提了个要求,事情就成了。”

去年,他还把使用AI形容成当巫师。念出咒语,然后等待奇迹发生。

但这一次,他改口了。“我已经不确定自己还是不是那个巫师。我更像一个甲方。描述需求,付钱,验收。至于炼金术发生在哪里,我已经看不见了。”

Fable 5最先淘汰的,是提示词工程师?

如果说前面两位讲的还是个人体验,那么开发者大佬Matt Van Horn干脆替大家做了一次社区普查。

他从Reddit、X、YouTube一路爬到TikTok,读完865条关于Fable 5的讨论,最后整理出一份《第一天生存指南》。

啥?Fable 5一出,Skill和Prompt都白学了?图12

当然,865条里不少人还是在整活。

有人刚拿到号称”Mythos级”的新模型,转头就让它写待办清单和贪吃蛇。

常年仰望AGI的r/singularity版面上,一个高赞帖子则直接宣布:

“兄弟们,我觉得我们摸到AGI了。”

但把这些段子滤掉之后,社区其实很快形成了一些共识。

比如,Fable只做计划,让同门便宜的Sonnet写实现,更便宜的Haiku跑测试,一半agent干活,一半agent验收,验收通过才许提交代码。

与此同时,网上也出现了邪修版本,直接用Fable 5,努力程度设置为Max,然后让它作为协调者,管理Opus这样的模型。

啥?Fable 5一出,Skill和Prompt都白学了?图13

还有开发者发现,Fable开中等思考强度,效果甚至好过Opus 4.8火力全开,Token反而更省。

但整份指南排在第一条的结论,却绕了一整圈互联网,又回到了文章开头那位Bohdanowicz身上。

给目标,别给步骤。

啥意思呢?过去大家写提示词,喜欢把任务拆得明明白白,生怕模型理解错,Skill、SOP,都是这套方法的衍生品。

但,现在越来越多开发者发现,这套方法开始失效了。

连Anthropic自己都在调整工作方式。Claude Code团队成员Thariq形容,这是从微观管理任务转向高层目标对齐,

啥?Fable 5一出,Skill和Prompt都白学了?图14

翻译一下就是:旧时代的Prompt Skill是在教AI怎么做事,新时代的Prompt Skill是在告诉AI什么叫做好这件事。

而Bohdanowicz正是对此感受最深的人。

他原来的工作流极其严格:调研、规划、实现、测试,每一步都单独下指令。

但换成Fable 5之后,他发现这套脚手架不仅没帮助,反而成了负担。

因为模型本身就在规划,额外塞进去的人类流程,反而会限制它判断任务边界。

于是他总结出一句被广泛转发的话:

“别再规定How(如何),只规定什么What(什么),以及什么算完成。”

这里有个容易误解的地方。这不意味着提示词不重要了。恰恰相反,机器能够验证的验收标准,依然是人类最有价值的输入。

真正过时的,是那些手把手教模型做事的过程说明书

帖子里他还提到一个此前很少被讨论的能力:

爆炸半径分析(Blast Radius Analysis)。

Fable修改一段代码之前,会先把上下游依赖关系摸一遍,再派出对抗Agent专门挑战那些隐藏假设,而类似机制,Bohdanowicz过去是自己手工搭的。

“看到它原生长出来的那一刻,我彻底服了。”

几个月搭出来的工作流,一夜之间成了负资产。

One More Thing

Matt Van Horn那份生存指南的文末,有一行小字。

啥?Fable 5一出,Skill和Prompt都白学了?图15

这篇关于Fable 5的文章,由Fable 5协助完成。它没有触发自己的安全分类器。

第一天,一切正常。

我们不知道未来的SOTA模型会不会彻底吞掉那些由人类总结出来的Workflow、Skill和SOP。

但至少这一周,很多开发者已经发现:

自己研究了几个月的提示词技巧,可能还没有模型一晚上悟出来的新方法好用。

AI时代最残酷的事,或许不是学不会。

而是刚学会,就自动化了。

参考链接

[1]https://simonwillison.net/2026/Jun/11/fable-is-relentlessly-proactive/

[2]https://digg.com/tech/zrppa6ui

[3]https://www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos

— 欢迎AI产品从业者共建 


📚「AI产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为AI行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。

啥?Fable 5一出,Skill和Prompt都白学了?图16


一键关注 👇 点亮星标

科技前沿进展每日见

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
突破极低温瓶颈 我国团队实现锂硫电池宽温域新跨越
比亚迪王传福:今年销量取决于二代刀片电池 大产量在明年
小米官方通报:小米SU7 Ultra南昌大桥起火,非电池自燃导致
问界再回应浙江台州M9事故,华为巨鲸电池好稳
GGII:2025年中国锂电池黑粉处理量破60万吨,原材料周期释放特征明显
曝REDMI K100系列测试万级大电池,多档位产品升级
电池寿命预测新SOTA!港科广联合团队开源新方法,用多层次学习精准预测电池全生命衰老
滔滔TOPTALK|谢戎彬对话王明旺 欣旺达的初心是“用心做好每一块电池”
iQOO万级大电池新机曝光,正在测试中
Archer eVTOL电池包性能提升与梯次利用详解
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号