被叫停的Fable 5,和刹不住车的AI

虎嗅app 2026-06-15 21:44
被叫停的Fable 5,和刹不住车的AI图1

本文来自微信公众号: 动察Beating ,作者:Sleepy,头图来自:AI生成

现在这些AI公司,它们嘴上最警惕的那个东西,往往就是它们手上正在拼命造的那个东西。

开会谈风险,他们谈得比谁都恳切,说这技术跑得太快,总得有人管管。会一散,模型照常发布,一个比一个强,时间表一个比一个紧。

同一拨人,同一张嘴,上午警告,下午加速。你要说他们是装的,又不像,可那台滚滚向前的机器也是真的,一天都没停下来过,而且越跑越快。

Anthropic最新发布的模型Fable 5就活了三天。

6月9日上线,6月12日被叫停。那天下午Anthropic接到美国政府电话,给了90分钟。傍晚五点二十一分,正式指令到达,一切外国国民不论身在何处都不能继续使用这个模型了,连Anthropic自己的外籍员工都不行。理由是国家安全。

被叫停的Fable 5,和刹不住车的AI图2

国家安全这四个字,落到一个模型身上,听着有点重。可它落得下来,是因为Fable不简单。这模型是Anthropic一直没放出来的Mythos的「安全版本」,通过一层安全护栏确保人们无法用它来进行网络攻击、科学研究等可能造成严重后果的事情。但Amazon却向美国政府提交了一份报告,说有人能够越狱,直接通过Fable调用Mythos模型,美国政府担心的就是这一点,于是果断重拳出击。

Anthropic大概是全世界最认真对待AI风险的公司。但无奈这两年模型能力成长得太快了,整条赛道只认一个方向,往前。

Anthropic比同行更早开始提醒大家如果这样下去可能会有技术失控的风险,甚至主动说过,政府应该有权拦住危险的模型。

没想到美国政府真动手那天,第一个被拦住的是它自家的模型。

Amazon提示了风险,美国政府要护住国家,Anthropic在做它认定该做的安全防护工作。每个人都尽了责,合起来却没迎来一个圆满的结果。

这看着像终于有人给行业踩了脚刹车,其实不是。一个模型上线三天就被一道命令叫停,恰恰说明没人肯自己慢下来,才轮到外头动手。要是公司、安全研究者、客户和美国政府之间真有一套坐下来一起减速的办法,事情走不到国家安全一刀切这一步。何况这一刀切下去,停的只有Anthropic一家,别人都还在跑。

Fable这三天不是行业开始减速的证据,是没人能让它好好减速的证据。

 一、刹车也能成为竞争力 

Fable 5从一开始就是个折中的产物。

Anthropic手里真正锋利的模型是Mythos。它没有公开就是因为能力太强了。2026年4月,公司通过Project Glasswing把Mythos的预览版交给一批安全机构,让他们拿去找漏洞。

找漏洞这件事,本来就难分善恶。同一个能力,找出来是为了把洞补上,还是为了顺着洞钻进去,取决于拥有这个能力的是谁。

可Anthropic终究也在这个每天都加速一点的赛道上。到了6月,它还是把这类能力推向了公众。Fable是Mythos的安全版本,高风险的请求会退回到更受限的Opus 4.8,上线前做过红队测试,流量留存三十天,方便发现有人越狱。它同时还是一件商品,有定价,有客户评测,有试用期,要卖钱,要在投资人眼里好看。

安全做成竞争力,这本身就是个拧巴的事。竞争力的意思是跑得比别人快,安全的意思是别跑太快。Anthropic想让这两件事同时成立,可怎么同时成立,它自己到今天大概也没太想明白。

创始人Dario Amodei做过OpenAI的研究副总裁,Anthropic的一批创始成员也是从OpenAI出来的。他们见过模型一代代变强时人有多兴奋,也知道那股兴奋底下压着什么。

OpenAI后来的事可以拿来做参照。Altman被解雇,五天后又回来,反过来把董事会重组了。Superalignment团队成立时说四年解决安全问题,可不到一年就解散了。

Anthropic是那场风波之后长出来的另一个答案。它说,强大的模型我们也要造,但要把刹车写进制度里。负责任扩展政策到2026年已经更新到3.0,按安全等级给模型分级。他们说,技术在指数式地飞速发展,定规矩的世界还没追上来,所以政府应该有权拦住危险的部署。

一边自己造模型,一边主动说政府该有权拦模型。这背后得有一种信念,你得相信那只大手会谨慎地用权,会走程序。这种立场,我原先是有几分敬重的。可Fable的三天,说明了这份信念有多不靠谱。

今年年初,Anthropic就和五角大楼为Claude的军事用途吵过一架。它做了Claude Gov给美国政府客户用,但拒绝大规模的国内监控,也拒绝没人盯着的致命自主武器。

在它看来,这是责任的边界。在国家安全那套体系看来,边界本身就是麻烦,因为边界意味着你不肯完全服从。

Anthropic说的安全,是不要失控。国家安全体系说的安全,是一切都能掌控。

连刹车是什么都谈不拢,谁还谈得上证明自己担得起责任。Anthropic很快发现自己证明不了,因为光靠自己不行。

 二、不能停,也不敢停 

6月初,Anthropic提了一个想法,前沿实验室也许得协调着一起放慢,甚至一起暂停,给社会和政策留出追上来的时间。

协调。

为什么非得协调。因为一家公司自己慢下来,世界不会因此更安全。Anthropic停了,OpenAI不一定停,Google不一定停,资本市场绝不会停。

所以一个人单方面克制,在这种局面里算不上什么美德。先停下来的那个,不会被记住,只会被顶替。

Anthropic的问题,从来不是要不要负责。它很清楚自己要负责。真正的问题是,在别人未必负责的时候,一个人到底能负到哪一步。

过去的工业事故再复杂,总归能找到一个相对清楚的源头。可前沿AI不是这样。一个模型的能力,来自算力,来自论文,来自开源社区,来自投资人催着增长,也来自国家想要技术上的优势。每一块都能撇清自己,说做决定的不是我。可这些块拼到一起,就把世界推到了今天这一步。

责任拆散了,加速度还能保持住。

Anthropic一边在政策文件里写AI跑得太快、治理跟不上,一边发布新模型。

我并不是想说Anthropic是虚伪的。Anthropic早就不是那个靠理想主义就能活下去的小实验室了。它得跟OpenAI、Google、xAI抢,得应付融资和IPO的预期。硅谷嘴上都很敬重安全,可真到掏钱下注的时候,看的还是谁的模型更强。

所以它只能把事情拆成两半。自己能做的,先做起来。需要整个行业一起做的,另外列出来,等别人。

务实,也无奈。

Fable就生在这条夹缝里。车停不下来,那就给车装一套更复杂的刹车片。夹缝里逼出来的东西,注定两头都不讨好。

 三、站在中间 

Fable上线之后,最先不满意的不是美国政府,是做安全的那批人。

IBM X-Force的研究者Chompie说,Fable会拒掉一大堆只是沾点边的安全请求,有时候让它读一篇博客都能触发。

被叫停的Fable 5,和刹不住车的AI图3

安全护栏想分辨的是意图,可模型眼前只有语言和上下文。它分不清你掏出工具是要修门还是撬锁,索性把两种人一起拦下。

两天之后,一份报告递进了美国政府的房间,从那一刻起,这件事就不再是Anthropic自己评判自己的安全设计了。

Anthropic反复强调一个时间差。发布之前,它几次知会过美国政府,美国政府没反对,甚至参与过发布前的测试,公司是拿到了部署许可的。三天之后,同一套系统忽然告诉它必须下架。

Anthropic说,美国政府始终没给出具体的细节。它自己看过演示,觉得那不过是几个已知的、不算严重的漏洞,换别的公开模型一样做得到。一直到声明发出,美国政府拿出来的也只是口头上的说法。

这个模型,开发者不满意,美国政府也觉得不满意。Anthropic站在中间,里外不是人。

Fable这件事的背后是一整条不信任链的运行使然。一圈转下来,每一环都在防着上一环。到最后,社会也很难再相信,这里头还有谁真能把责任担起来。

 四、e/acc是一种气候 

这个问题难就难在,每一方都觉得自己在负责,而且都说得通。每个人手里,都攥着一份局部的正当。

可怕的就在这儿。每个人都只为自己那一小块负责,加起来,却没有谁为整件事负责。责任被切成了碎片。公司内控,模型评测,出口管制,客户需求,国家竞争,投资回报,每一片都映出一点真的东西,没有哪一片映得出全部。

当连定义都统一不了,所有人唯一不会争的方向,就只剩一个「快」。

Effective accelerationism,缩写e/acc,这几年成了一套挺鲜明的技术乐观主义。把技术往快里推,不用管监管、社会结构和伦理,相信进步能解决掉那些大问题。

不是每家公司都自称e/acc,Anthropic就更不会。可一种主张,从来不需要所有人认可就改变大环境。

能力上的竞赛,烧不完的算力,融资的时间表,国家之间的较劲,军方的需求,开发者对更强工具的饥渴。这些东西合在一起,就成了一种气候。有人不喜欢这种气候,可也得在里面过日子,跟所有人一样。

强如Anthropic,是这个加速时代里少数几个反复念叨刹车的人,到头来还是得先证明自己跑得够快。

技术加速不需要一个坏人,它只需要每一个好人都觉得自己不能第一个停下来。

 五、刹车一直都在 

Fable这件事就是把刹车交出去的代价。你盼着公权力介入,是因为行业的自律不够。可公权力不一定按你期待的方式运转。国家安全这台机器最熟练的动作不是协商,是封锁、许可和例外。

AI早就不是一件能画清边界的技术了。当一个前沿模型同时嵌进商业、科研、国防和基础设施,还有谁有能力决定它不该被怎样用。

所有人都知道速度太快。可速度本身,已经成了活下去的条件。

一百多年前,也有过一次没人敢叫停的加速。

1914年8月1日傍晚五点,德皇威廉二世下令全军总动员。命令刚发出去几分钟,伦敦来了一封电报,说只要德国不打法国,英国就能让法国置身事外。德皇大喜,他本来最怕两线作战,这下好了,全部兵力都能调去东边对付俄国。他转头对总参谋长小毛奇说,那我们就只往东打。

小毛奇说,办不到。

他给的理由是,一支上百万人的军队,怎么开拔、走哪条铁路、几点几分到哪个站台,全按计划排死了。这套时刻表是用整整一年磨出来的,磨好之后,一个字都改不了。

后来很多历史学家都讲过这个故事。讲的人多半把它当成一个关于机器的寓言,说现代战争的机器精密到了这个地步,连开机器的人都按不住。

可再后来,人们又翻出一件事。那套时刻表,其实是改得动的。铁路部门每年都演练怎么临时改线、改时间,东线的方案也一直备着。火车真要掉头,掉得过来。

也就是说,刹车一直都在。

那一夜真正发生的,不是没有刹车,是站在闸边上的那个人,一口咬定刹车碰不得。他没去问能不能改,他太确定不能改了。

于是火车继续一列列往西边开,把一场本来能关在三个国家之间的冲突,拖成了一场把整个欧洲都埋进去的大战。没有人想要这个结果。每个人当时都觉得,自己只是在做那件最该做、也最没法不做的事。

我之所以想起这列火车,是因为AI的加速也是这样一列已经发动的车。它不是哪个人造出来的,是算力、资本和国家的野心,一节一节挂上去,自己往前开。车上坐着所有人,每个人都在做手边最该做的事,火车还是一直往前开。

这是AI时代让我感不安的地方。危险不是没人看见,刹车也不是真的不存在。喊刹车的人就坐在车里,知道危险的人脚还踩在油门上。

这个行业最警惕的东西,往往就是它自己正在拼命造的那个东西。Fable本该是个让所有人停下来看一眼的例子。可等我写完这些,新模型又发布了几个,都说自己最强。

愿意先踩刹车的人,一个都没有。


参考资料

[1]Anthropic:Claude Fable 5 and Claude Mythos 5

[2]Anthropic:Statement on the US government directive to suspend access to Fable 5 and Mythos 5

[3]Anthropic:Responsible Scaling Policy Version 3.0

[4]Anthropic:Policy on the AI Exponential

[5]Anthropic:Claude Gov models for U.S.national security customers

[6]Axios:Anthropic had 90 minutes to take down Fable after Trump admin demand

[7]Axios:How Amazon and the White House ended Anthropic's Fable

[8]TechCrunch:Cybersecurity researchers aren't happy about the guardrails on Anthropic's Fable

[9]Washington Examiner:Amazon researchers use Anthropic AI to find cybersecurity weaknesses

[10]AP:A former OpenAI leader says safety has taken a backseat to shiny produc

[11]WIRED:OpenAI's Long-Term AI Risk Team Has Disbanded

[12]Business Insider:OpenAI and Anthropic keep warning about a future they're building at breakneck speed

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。

 End

想涨知识 关注虎嗅视频号!

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
早报|美伊达成和平协议,19日正式签署;阿里巴巴辟谣周靖人离职;歌手黄大炜去世,代表作《你把我灌醉》;蚂蚁集团正秘密测试AI版支付宝
部署4万块GB300 GPU,英伟达AI算力“朋友圈”再扩大
很多人想简单了,未来可能经历多次AI泡沫
夹缝中的AI独角兽:思必驰再战科创板,端侧AI成破局关键
美团通用Agent负责人领衔!Agent Skills技术研讨会议程出炉,拆解AI智能体能力扩展的主流范式
明天召开:AI+芯片测试研讨会(成都)
用国产GPU训练AI给自己写内核,摩尔线程刷榜硬核基准
解密 AI 版支付宝,20 年来最大改版即将发布
终于通了!腾讯元宝接入ima知识库,专业的AI搜索来了
Fable 5四天暴毙!AI史上最短命旗舰
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号