刚刚,Anthropic向全人类发出警告:停止研究AI!

新智元 2026-06-05 08:42

刚刚,Anthropic向全人类发出警告:停止研究AI!图1

  新智元报道  

刚刚,Anthropic向全人类发出警告:停止研究AI!图2

【新智元导读】AI造AI,已经发生了!Anthropic重磅长文揭秘,超80%代码由Claude编写,工程师人均产出暴增8倍,Mythos研究提速52倍。看着如此恐怖的进化速度,Anthropic却发出呼吁:必要时,请暂停AI研发。


AI造AI的时代,已然降临!

刚刚,Anthropic向全人类发出警告:停止研究AI!图3

就在刚刚,Anthropic扔出了一篇重磅长文:When AI builds itself(当AI开始造AI)。

打开这篇博客,满屏只透出一个词:加速!

刚刚,Anthropic向全人类发出警告:停止研究AI!图4

这一次,他们用最硬核的真实数据,把AI「递归自我改进」(RSI)彻底砸到了台面上——

在Anthropic内部,超80%的代码,全由Claude编写;

工程师人均代码产出较2024年暴涨8倍,许多研究员已经5个月,没有手写过一行代码;

最开放的工程难题上,Claude成功率半年从26%飙到76%;

优化训练代码,人类4-8小时做到4倍加速,Claude Mythos Preview直接干到52倍。

刚刚,Anthropic向全人类发出警告:停止研究AI!图5
刚刚,Anthropic向全人类发出警告:停止研究AI!图6


「递归自我改进」的奇点尚未彻底降临,但它逼近的速度,恐怕已超出全球所有顶尖实验室的准备。

然而,最具戏剧性的一幕出现了:

就在Anthropic不断铺陈RSI,将以何等惊人的速度到来时,却突然发出严肃呼吁——

必要时,一起按下前沿AI的「暂停键」。


刚刚,Anthropic向全人类发出警告:停止研究AI!图7

一时间,这篇博文全网刷屏,许多人疯狂安利:墙裂建议每个人都读一读!

刚刚,Anthropic向全人类发出警告:停止研究AI!图8
刚刚,Anthropic向全人类发出警告:停止研究AI!图9


刚刚,Anthropic向全人类发出警告:停止研究AI!图10
80%的代码,出自Claude之手


整篇文章,Anthropic都在向外界证实一个令人胆寒的现实——

Claude正在疯狂按下AI进化的「加速键」。

他们正在蹚出一条通向「递归自我改进」的现实路径:让AI亲手打造出比自己更强大的下一代系统。

刚刚,Anthropic向全人类发出警告:停止研究AI!图11

而这一切,比所有人预想的还要快。

截至2026年5月,Anthropic合入代码库的代码中,超80%由Claude撰写。

而在2025年2月Claude Code发布之前,这个数字还停留在「个位数」。

一年多时间,从「打打下手」到「包揽八成」。

刚刚,Anthropic向全人类发出警告:停止研究AI!图12

Claude进化时间线

产能端的变化更直观。2021到2024年,Anthropic工程师人均每天合入的代码量基本是一条水平线。

2025年,Claude开始自己运行代码,曲线第一次上扬;

2026年,模型开始在更长时间跨度上自主工作,曲线第二次陡升。

到2026年第二季度,典型工程师的日代码合入量,已经是2024年的8倍。

刚刚,Anthropic向全人类发出警告:停止研究AI!图13

一位Anthropic员工的自述更扎心:

大约一年前我开始全力「Claude化」。这是一场疯狂的冒险——到现在,我已经有约5个月没自己写过任何代码了。


刚刚,Anthropic向全人类发出警告:停止研究AI!图14

不过,Anthropic也很诚实地补了一刀:

代码行数衡量数量多过质量,8倍肯定高估了真实生产力。

但2026年3月,对130名研究人员的内部调查显示,中位数受访者估计,自己的产出是没有AI时的4倍左右。

刚刚,Anthropic向全人类发出警告:停止研究AI!图15

刚刚,Anthropic向全人类发出警告:停止研究AI!图16

不光写得多,写得还比人好


量大管饱,那Claude输出的质量如何?

Anthropic给出了两个判断标准:代码能不能跑,以及别的工程师能不能看懂、能不能在上面继续盖楼。

第一条,证据已经非常硬核。

过去一年,研究员纠正、打断、中途接管Claude任务的比率持续下降——

哪怕是在最复杂、最开放的任务上。

在最开放的任务难度档位上,Claude的成功率在2026年5月达到了76%,6个月暴涨50个百分点。

刚刚,Anthropic向全人类发出警告:停止研究AI!图17

举个真实案例:一次例行升级,突然让数万个训练任务集体崩溃。

工程师只丢给Claude一段文字描述和集群权限,Claude在运行中的任务里逐一排查环境变量,揪出了那个极其隐蔽的调试标志,复现、验证、修复

两小时,Claude干完了正常需要两三天的活。

刚刚,Anthropic向全人类发出警告:停止研究AI!图18

更夸张的是2026年4月的一次「大扫除」,Claude一口气提交了800多个修复,把一类API错误压低了1000倍。

负责监督的工程师估算:这些活儿如果让人来干,得花4年。

第二条标准,差距还在,但正在以肉眼可见的速度消失。Anthropic内部的共识是:

我们预计Claude编写的代码,将在今年内全面超越人类。


刚刚,Anthropic向全人类发出警告:停止研究AI!图19

Claude写代码,Claude审代码,这个闭环已经转起来了。


刚刚,Anthropic向全人类发出警告:停止研究AI!图20
一年提速52倍,Claude暴击人类


如果说写代码只是工程层面,那真正让人脊背发凉的,是研究层面的进展。

Anthropic每次发新模型,都会做同一个测试:

给Claude一段训练小型AI模型的代码,要求它在保证正确性的前提下,跑得越快越好。

这本质上,就是一个微缩版的AI研究实验循环——改代码、跑、计时、再改。

看看这份极具压迫感的「成绩单」:

而一位熟练的人类研究员,需要4到8小时,才能做到4倍。

一年时间,Claude从「超级有用」到「超人水平」。在这种目标明确的实验优化环节,人类已经被甩出了一个数量级。

刚刚,Anthropic向全人类发出警告:停止研究AI!图21

更重磅的是,Claude开始展现「研究判断力」的苗头。

Anthropic做了一个极其刁钻的实验:他们翻出真实研究session里人类研究员「走弯路」的129个时刻,把弯路之前的全部上下文喂给Claude,问它:下一步该怎么走?

再让另一个能看到完整结局的Claude当裁判。

结果,2025年11月的Opus 4.5,有51%的概率给出比人类更优的下一步;

2026年4月的Mythos Preview,这个数字涨到了64%。

还有那个著名的「端到端」实验:Claude智能体被丢进一个开放的AI安全难题,自己提假设、自己设计实验、自己和并行智能体交换发现。

两位人类研究员花一周,只追回了23%的性能差距;

Claude智能体军团用800个累计小时、约1.8万美元算力,追回了97%。

刚刚,Anthropic向全人类发出警告:停止研究AI!图22

人类唯一的实质性贡献,只剩下:选了这个题。


刚刚,Anthropic向全人类发出警告:停止研究AI!图23
AI留给人类「1%灵感」
所剩时间不多了


把以上所有证据拼在一起,一幅图景浮现出来:

在AI开发的每一个环节,人类的角色都在收窄。

写代码?Claude包了。跑实验?Claude比你快一个数量级。判断下一步?Claude正在追上来。

刚刚,Anthropic向全人类发出警告:停止研究AI!图24

Anthropic的判断是:一旦人类和AI的代码质量达到平价,人类将彻底停止写代码,只负责审查。

但问题来了,如果人类审查的速度跟不上Claude生成的速度,人类自己就会变成AI发展的瓶颈。

这正是计算机科学里经典的「阿姆达尔定律」(Amdahl’s law)——

整体速度,永远被那个没提速的环节卡住。


刚刚,Anthropic向全人类发出警告:停止研究AI!图25

Anthropic已经撞上了第一堵墙:代码审查排队。

第二堵墙也来了:员工和强大模型合作之后,新想法、新工具、新模拟的产出量爆炸,多到公司根本没有能力全部消化。

目前,人类仅存的比较优势,叫做「研究品味」——

判断哪些问题值得做、哪些结果可信、哪条路是死胡同。

但Anthropic毫不留情地补了一刀,爱迪生说天才是1%的灵感加99%的汗水,而我们看到,汗水正在被全面自动化。

文章里有一段非常清醒的论述:AI的进步很少靠「灵光一现」。

Transformer这种范式级灵感,几年才出一次;

之间的绝大多数进步,靠的都是「放大、看哪坏了、修好、再试」。这恰恰是Claude最擅长的工作流。

至于「研究品味」?

Anthropic的原话是,它可能只是又一个AI暂时不会、然后突然就会了的能力。解释笑话、心智理论、语言谜题——哪一个不是这么被攻克的?

刚刚,Anthropic向全人类发出警告:停止研究AI!图26


刚刚,Anthropic向全人类发出警告:停止研究AI!图27
三种未来
Anthropic押注最后两个


那接下来会发生什么?Anthropic给出了三种剧本。

剧本一:趋势停滞,S曲线见顶。

也许「研究品味」就是堆算力堆不出来的;也许瓶颈在芯片、电网和供应链。

但即便模型能力今天就冻结,世界也回不去了——

Project Glasswing的Mythos Preview,仅在最初几周就在全球关键系统中,找出了超过10000个高危和严重级漏洞,多到网络防御的瓶颈从「找漏洞」变成了「来不及打补丁」。

不过Anthropic自己都说:这是三种剧本里他们最不相信的一种。

因为到目前为止,每一条能测量的能力曲线,都没有弯。

刚刚,Anthropic向全人类发出警告:停止研究AI!图28

剧本二:复合加速持续,人类掌舵,

AI研发大幅自动化,人类继续掌舵方向。100人的公司干出10万人组织的活儿。

这是Anthropic认为最可能的走向——

但效率的另一面,是整套能力同样可以服务于全民监控和千人千面的操纵机器。

剧本三:完全的递归自我改进。

AI自己设计、训练、迭代自己的继任者。AI进步的速度只取决于算力供给,人类退居验证和监督。

Anthropic罕见地承认:对这个世界,「我们没有好的直觉」——

今天模型里那些罕见的失准行为,可能在一代代自我构建中复合放大,越来越频繁,越来越难以理解,直到失控。

上个月在伦敦的演讲,联创Jack Clark给出过一个更具体的数字:

2028年底前,出现递归自我改进的概率为60% 。


刚刚,Anthropic向全人类发出警告:停止研究AI!图29

警告全球:必要时,暂停AI


于是,就有了这篇博客,最戏剧性的部分。Anthropic公开写道:

我们相信,让世界拥有「减速或暂停前沿AI开发」的选项,是一件好事—— 这能让社会结构和对齐研究跟上技术的脚步。


刚刚,Anthropic向全人类发出警告:停止研究AI!图30

注意,他们没有天真地喊「都停下」。

Anthropic说得很清楚:如果只有谨慎者放慢脚步,等于把领先优势拱手送给最不谨慎的人。

所以真正需要的,是多国、多个前沿实验室、在同样条件下同时停,且彼此可验证。

刚刚,Anthropic向全人类发出警告:停止研究AI!图31


刚刚,Anthropic向全人类发出警告:停止研究AI!图32
当AI开始造AI,正叩开ASI的大门


人类通往超级智能(ASI)的路径上,一直横着一道理论上的「最后关卡」:智能爆炸的临界点。

当AI改进AI的速度,超过人类改进AI的速度,飞轮就会脱离人类的手,开始自转,且越转越快。

今天,全球估值最高的AI公司之一,拿着自家代码库的提交记录告诉你:

跨越临界的倒计时,已经悄然开启。

刚刚,Anthropic向全人类发出警告:停止研究AI!图33

80%的代码、8倍的产能、52倍的实验加速、64%的判断胜率——每一个数字,都是飞轮加速的一声咔哒。

剩下的,只有最后一格:研究品味。

一旦这格被点亮,AI研发的速度将只由算力决定。从AGI到ASI的距离,可能短到以「模型代际」来计量。

到那时,受益的将远超AI本身——

药物研发、材料科学、能源、机器人,每一个领域,都会被这台自我加速的智能引擎重新发动。

参考资料:

https://x.com/AnthropicAI/status/2062568862479208923 

https://www.anthropic.com/institute/recursive-self-improvement 

  https://www.wsj.com/tech/ai/anthropic-urges-global-pause-in-ai-development-flags-self-improvement-risk-99cefb73?mod=tech_lead_story


编辑:

桃子 David


秒追ASI
点赞、转发、在看一键三连
点亮星标,锁定新智元极速推送!

刚刚,Anthropic向全人类发出警告:停止研究AI!图34

刚刚,Anthropic向全人类发出警告:停止研究AI!图35

刚刚,Anthropic向全人类发出警告:停止研究AI!图36

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI IC
more
SOPIC出席RVEI通用高性能应用组2026年度线下会议
「这可能是人类写的最后一篇论文」Stanford、Michigan、CMU 等 37 位学者联手:把论文从 PDF 改写成 AI 能直接执行的研究包
1500美元订单、三场合约、一次跨界:Micro LED光互连不再是“AR专用”
【转载】Agentic4Systems暑期学校|京沪深三地集结,打造智算系统实战派
AI开始自我进化!Anthropic紧急呼吁,全球暂停AI研究
超睿科技x上海交通大学:业界首项RISC-V虚拟化性能研究被IEEE Micro Special Issue接收!
获近2亿元融资,这家公司用无损Micro-LED加速AI眼镜全彩化进程丨早起看早期
“中国版Anthropic”、6000亿市值?还有两道坎
NVIDIA Nemotron 3 Ultra 正式上线!Perplexity、Palantir 和 ServiceNow 作为早期采用者,正以此驱动长时间运行的 AI 智能体
从芯片到场景:BOS半导体以Physical AI定义车载AI Box新范式
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号