6月5日,AI行业传来一则震动整个科技圈的消息:当下的人工智能,已经实实在在展现出自我进化、自主迭代的能力苗头。
这个大胆且关键的判断,来自AI巨头Anthropic最新发布的核心论文《WhenAIBuildsItself》。论文中提到,倘若现有发展节奏保持不变,再叠加充足的算力支撑,未来AI有望实现完全自主迭代,能够独立设计、开发新一代AI系统,业内将这种终极形态称作“递归自我提升”。


针对这一趋势,Anthropic团队保持着审慎态度。他们表示,目前行业还没达到AI自我迭代的终极阶段,而且这一未来也并非板上钉钉。但有一点可以肯定:这场技术变革的到来速度,大概率会远超全球各行各业的筹备进度。
也正因如此,Anthropic主动对外发声,呼吁全球适当放缓、甚至阶段性暂停前沿AI研发工作。目的是给社会体系、AI安全对齐研究留出充足时间,跟上技术狂奔的脚步,从容应对新技术带来的各类变革与风险。
与此同时,Anthropic官宣新的研究规划。旗下研究所将联动各界外部机构,深耕超强可迭代AI系统带来的各类影响,摸索可行的管控与发展方案,让人类能够真正主导AI技术的未来走向,而非被动接受技术变化。

为了避免市场过度解读,Anthropic官方X账号专门补充澄清。团队坦言,递归自我提升不会立刻到来,现阶段的Claude模型,依旧欠缺顶尖科研必备的判断力,无法精准筛选、攻克核心研究难题。不过不可否认的是,按照当前发展趋势,AI自主迭代更新自身版本,是完全具备可行性的。
这项技术一旦成熟,既能在医疗、科技、经济领域带来颠覆性突破,也会加剧AI安全对齐难题,存在失控风险。
和以往各类偏向预测的行业报告不同,这篇论文的核心内容并非对远期未来的畅想。文中所有结论,都基于真实实测数据和落地现象,描述的是当下正在持续发生、快速推进的AI进化现状,这也是其能震撼整个科技行业的核心原因。
值得关注的是,在发布这篇重磅论文之前,Anthropic刚完成一轮顶级融资。当地时间5月28日,其H轮融资落地,融资总额650亿美元,投后估值达到9650亿美元。凭借这一数值,Anthropic成功超越OpenAI8520亿美元的估值,登顶全球估值最高的AI初创企业。
作为全球AI赛道的头部玩家,Anthropic在企业级大模型、代码AI领域占据重要市场份额,同时深度参与全球通用AI技术、AI安全规则的制定工作。长期以来,这家企业的技术研究成果和行业表态,都深刻影响着全球AI的研发方向与迭代节奏。

超八成代码由Claude自主编写,AI已成研发主力
根据Anthropic公开的最新数据,截至2026年5月,公司内部代码库中,超过80%的有效合并代码,全都由Claude模型独立完成编写。
仅仅一年多前,也就是2025年2月,ClaudeCode还只是一款仅供测试的预览工具,AI自主编写的代码占比仅有个位数。短短15个月时间,Claude完成了跨越式蜕变,从只能辅助给出代码建议的工具,变成了企业代码生产的核心主力。
这场技术变化,直接带动了研发团队生产力的大幅提升。回顾2021至2024年,也就是Anthropic成立的前四年,公司工程师的日均有效代码产出始终保持稳定,没有明显涨幅。
一切转折点出现在2025年。随着Claude实现代码直接生成、自主运行,彻底省去了工程师手动复制修改的步骤,团队研发生产力迎来爆发式增长。到2026年第二季度,增长速度进一步加快,普通工程师的日均代码合并量,已经是2024年的8倍。

Anthropic也客观承认,代码行数无法全面衡量真实生产力。这个指标只统计产出数量,不考量代码质量,8倍的增长数据,大概率高估了实际的生产力提升效果。
2026年3月,公司对130名核心研发员工开展调研,结果显示,使用MythosPreview工具后,员工的工作产出中位数,是纯人工工作状态的4倍。即便剔除数据误差,这样的提升幅度依旧具备革命性。如今的工程师,工作模式已经彻底改变,不再手动编写大量代码,核心工作转变为指导、审核AI产出的代码。
更值得警惕的是,Claude的代码质量还在持续精进。不少内部研发人员表示,2025年底Claude编写的代码,整体质量还比不上人类工程师,但到2026年6月,二者水平已经基本持平。按照团队预判,一年内,Claude的代码编写质量将全面超越人类专业工程师。
这并非空泛的预判,而是已经落地的现实。有Anthropic内部员工分享了自己的工作变化:“我从一年前开始全面用Claude开展工作,体验颠覆以往,过去整整五个月,我完全没有手动写过一行代码。”
除了编写新代码,Claude还能高效修复人类遗留的技术漏洞。2026年4月,Claude一次性完成800多项代码漏洞修复,将一类长期困扰团队的API报错问题频次降低了1000倍。负责跟进该项目的工程师估算,同等工作量,如果由人工完成,需要耗费整整四年时间。不仅如此,在代码审核环节,Claude的能力已经超越人类,能够排查出人类工程师遗漏的、约三分之一极易引发生产事故的高危漏洞。
面对无固定规范、场景复杂的开放式工程任务,Claude的进步同样迅猛。2026年5月,它的复杂任务完成成功率达到76%,相比半年前提升了50个百分点。
业内一个典型案例显示,一次常规系统升级导致数万条训练任务崩溃,工程师仅向Claude描述了问题,并开放集群访问权限,模型就自主排查出一处极为隐蔽的调试故障,独立完成问题复现与漏洞修复,全程仅耗时2小时。而换作人类工程师,处理同类复杂问题,通常需要两到三天。

突破人类科研边界,AI开始独立开展高端研究
如果说代码编写属于重复性的工程工作,那独立开展科研探索,就意味着AI真正触碰并突破了人类长期垄断的高端智力领域。
AI的迭代速度本身也在不断提速。论文数据显示,AI可稳定完成的连续工作时长,翻倍周期从最初的7个月,缩短到如今的4个月。2024年3月,ClaudeOpus3仅能完成人类4分钟的工作量;一年后,ClaudeSonnet3.7可独立完成1.5小时的连续工作;到2026年,ClaudeOpus4.6已经具备12小时不间断独立作业的能力。
按照这个迭代速度推算,2026年内,AI就能独立完成人类数天的工作量;到2027年,足以攻克需要人类耗费数周才能完成的复杂科研任务。
这种能力跃迁,在AI自研领域体现得最为明显。论文披露了一组极具冲击力的实验数据:研究人员给Claude提供了小型AI模型的训练代码,要求其在保证精度的前提下,优化运行速度。2025年5月,ClaudeOpus4能实现3倍的速度优化;短短11个月后,ClaudeMythosPreview的优化能力飙升至52倍。反观资深人类研究员,花费4到8小时深耕优化,平均仅能实现4倍的速度提升。
在执行标准化科研实验的场景中,Claude只用了不到一年时间,就从高效辅助工具,成长为能力超越人类的科研助手。
更让人警惕的是,AI已经具备独立设计科研实验的能力。2026年4月,Anthropic公开演示了Claude的端到端科研能力。研究团队仅抛出一个AI安全领域的开放性难题——“弱势模型能否有效监督强势模型”,后续所有研究工作,全部交由Claude自主推进。
整个过程中,Claude自主提出研究假设、设计全套实验方案、和多组AI代理共享研究数据,持续迭代优化结论。最终统计数据显示,两名人类研究员耗时一周,仅弥补了23%的实验性能差距;而Claude集群通过800小时累计运算、消耗1.8万美元算力资源,弥补了97%的核心差距。
在这场实验里,人类只负责敲定研究方向和评价标准,所有核心的实验落地、数据测算、方案迭代工作,都由Claude独立完成。
即便在被视作人类科研最后优势的研究判断力上,AI也在快速追赶。Anthropic官方公布过一组对比数据:科研工作本质,就是无数次“下一步如何推进”的决策叠加。

团队复盘了人类研究员决策失误的科研案例,将完整过程同步给Claude后,让其判断最优研究方向。结果显示,MythosPreview的决策正确率达到64%,优于人类研究员,而2024年这一数值仅为22%。
三种未来推演:平稳迭代、可控发展、递归失控
结合当下所有实测数据和技术迭代趋势,Anthropic为AI行业推演了三种未来发展可能性。
第一种是技术迭代逐步停滞。所有指数级增长的技术,最终都会进入平稳的S型增长曲线,AI的高速发展也可能迎来拐点。像是科研天赋、研究审美这类顶尖研究员的核心能力,或许无法靠算力和数据堆叠实现复刻。同时,算力供给、能源储备、芯片制造等供应链短板,也可能成为AI进化的硬性瓶颈。
不过Anthropic判断,这种可能性相对较小。目前所有可量化的AI能力指标,依旧保持稳定的指数级增长,没有任何放缓迹象。即便AI技术停留在当前水平,也足以引发大规模社会变革。典型例子就是ProjectGlasswing项目,MythosPreview短短数周,就筛查出全球核心系统上万条高危漏洞,直接让网络安全的核心难题,从“找不到漏洞”变成“来不及修补漏洞”。
第二种是人类主导的可控加速发展。未来AI研发会高度自动化,但核心主动权依旧掌握在人类手中,由人类把控研究方向、评判技术成果。届时各行各业的知识工作生产力将迎来爆发,百人规模的科创团队,或许能完成过去万人、甚至十万人的工作量。这种变革会彻底重塑职场形态,但也暗藏风险,相关技术可能被用于大规模监控、舆论操纵等不良场景。
第三种也是风险最高的一种,即AI实现完全递归自我提升。如果现有技术趋势不变,AI终将具备自主设计、自我优化、迭代新版本的完整能力。届时AI的进化速度,将完全由算力资源决定,人类在AI研发中的作用会大幅弱化,仅需监督、核验AI搭建的虚拟实验体系。
Anthropic坦言,目前没人能精准预判这个场景的最终影响。当下全球的经济体系、社会运行逻辑,全都依托人类劳动和人类工具构建。一旦人类劳动失去竞争优势,整个社会的产业结构、运行规则都将迎来根本性重构。
呼吁全球协同管控,搭建可信AI研发约束机制
正是基于对AI失控风险的深度考量,Anthropic在论文中发出了行业罕见的呼吁:主动放缓前沿AI研发节奏,为社会适配、安全研究争取更多时间,是当下极具现实意义的必要举措。
同时,团队也清醒认识到,单一企业、单一国家的单方面暂停毫无意义。反而会让忽视安全、激进研发的主体抢占技术先机,加剧全球AI安全风险。真正有效的研发管控,需要全球所有前沿AI实验室达成统一共识、遵守同等规则,同时搭建可交叉核验的监管体系,确保所有主体严格落实管控要求。

这套全球协同方案的落地难度极高。不同于可监测、可管控的核武器设施,AI训练过程隐蔽性极强,容易规避监管,而且各方的技术竞争动机极强——谁能在行业管控窗口期实现技术突破,就有可能掌控未来AI产业的主导权。
对此,Anthropic表示,将联合全球科研机构、行业组织,专项研发可落地、可核验的AI监管体系。如果这套可信约束机制成功搭建,且全球前沿研发主体共同遵守,就能有效规避AI无序迭代的未知风险,让人工智能在安全可控的前提下,持续为社会发展赋能。
本文由作者原创,52RD转载是为分享该信息或观点,不能代表对观点的支持,如果有任何异议,欢迎联系我们