突发！AI开启自我进化模式，行业巨头紧急发声要求暂停研发

　　6月5日，AI行业传来一则震动整个科技圈的消息：当下的人工智能，已经实实在在展现出自我进化、自主迭代的能力苗头。

　　这个大胆且关键的判断，来自AI巨头Anthropic最新发布的核心论文《WhenAIBuildsItself》。论文中提到，倘若现有发展节奏保持不变，再叠加充足的算力支撑，未来AI有望实现完全自主迭代，能够独立设计、开发新一代AI系统，业内将这种终极形态称作“递归自我提升”。

　　针对这一趋势，Anthropic团队保持着审慎态度。他们表示，目前行业还没达到AI自我迭代的终极阶段，而且这一未来也并非板上钉钉。但有一点可以肯定：这场技术变革的到来速度，大概率会远超全球各行各业的筹备进度。

　　也正因如此，Anthropic主动对外发声，呼吁全球适当放缓、甚至阶段性暂停前沿AI研发工作。目的是给社会体系、AI安全对齐研究留出充足时间，跟上技术狂奔的脚步，从容应对新技术带来的各类变革与风险。

　　与此同时，Anthropic官宣新的研究规划。旗下研究所将联动各界外部机构，深耕超强可迭代AI系统带来的各类影响，摸索可行的管控与发展方案，让人类能够真正主导AI技术的未来走向，而非被动接受技术变化。

　　为了避免市场过度解读，Anthropic官方X账号专门补充澄清。团队坦言，递归自我提升不会立刻到来，现阶段的Claude模型，依旧欠缺顶尖科研必备的判断力，无法精准筛选、攻克核心研究难题。不过不可否认的是，按照当前发展趋势，AI自主迭代更新自身版本，是完全具备可行性的。

这项技术一旦成熟，既能在医疗、科技、经济领域带来颠覆性突破，也会加剧AI安全对齐难题，存在失控风险。

　　和以往各类偏向预测的行业报告不同，这篇论文的核心内容并非对远期未来的畅想。文中所有结论，都基于真实实测数据和落地现象，描述的是当下正在持续发生、快速推进的AI进化现状，这也是其能震撼整个科技行业的核心原因。

　　值得关注的是，在发布这篇重磅论文之前，Anthropic刚完成一轮顶级融资。当地时间5月28日，其H轮融资落地，融资总额650亿美元，投后估值达到9650亿美元。凭借这一数值，Anthropic成功超越OpenAI8520亿美元的估值，登顶全球估值最高的AI初创企业。

　　作为全球AI赛道的头部玩家，Anthropic在企业级大模型、代码AI领域占据重要市场份额，同时深度参与全球通用AI技术、AI安全规则的制定工作。长期以来，这家企业的技术研究成果和行业表态，都深刻影响着全球AI的研发方向与迭代节奏。

超八成代码由Claude自主编写，AI已成研发主力

　　根据Anthropic公开的最新数据，截至2026年5月，公司内部代码库中，超过80%的有效合并代码，全都由Claude模型独立完成编写。

　　仅仅一年多前，也就是2025年2月，ClaudeCode还只是一款仅供测试的预览工具，AI自主编写的代码占比仅有个位数。短短15个月时间，Claude完成了跨越式蜕变，从只能辅助给出代码建议的工具，变成了企业代码生产的核心主力。

　　这场技术变化，直接带动了研发团队生产力的大幅提升。回顾2021至2024年，也就是Anthropic成立的前四年，公司工程师的日均有效代码产出始终保持稳定，没有明显涨幅。

　　一切转折点出现在2025年。随着Claude实现代码直接生成、自主运行，彻底省去了工程师手动复制修改的步骤，团队研发生产力迎来爆发式增长。到2026年第二季度，增长速度进一步加快，普通工程师的日均代码合并量，已经是2024年的8倍。

　　Anthropic也客观承认，代码行数无法全面衡量真实生产力。这个指标只统计产出数量，不考量代码质量，8倍的增长数据，大概率高估了实际的生产力提升效果。

　　2026年3月，公司对130名核心研发员工开展调研，结果显示，使用MythosPreview工具后，员工的工作产出中位数，是纯人工工作状态的4倍。即便剔除数据误差，这样的提升幅度依旧具备革命性。如今的工程师，工作模式已经彻底改变，不再手动编写大量代码，核心工作转变为指导、审核AI产出的代码。

　　更值得警惕的是，Claude的代码质量还在持续精进。不少内部研发人员表示，2025年底Claude编写的代码，整体质量还比不上人类工程师，但到2026年6月，二者水平已经基本持平。按照团队预判，一年内，Claude的代码编写质量将全面超越人类专业工程师。

　　这并非空泛的预判，而是已经落地的现实。有Anthropic内部员工分享了自己的工作变化：“我从一年前开始全面用Claude开展工作，体验颠覆以往，过去整整五个月，我完全没有手动写过一行代码。”

　　除了编写新代码，Claude还能高效修复人类遗留的技术漏洞。2026年4月，Claude一次性完成800多项代码漏洞修复，将一类长期困扰团队的API报错问题频次降低了1000倍。负责跟进该项目的工程师估算，同等工作量，如果由人工完成，需要耗费整整四年时间。不仅如此，在代码审核环节，Claude的能力已经超越人类，能够排查出人类工程师遗漏的、约三分之一极易引发生产事故的高危漏洞。

　　面对无固定规范、场景复杂的开放式工程任务，Claude的进步同样迅猛。2026年5月，它的复杂任务完成成功率达到76%，相比半年前提升了50个百分点。

业内一个典型案例显示，一次常规系统升级导致数万条训练任务崩溃，工程师仅向Claude描述了问题，并开放集群访问权限，模型就自主排查出一处极为隐蔽的调试故障，独立完成问题复现与漏洞修复，全程仅耗时2小时。而换作人类工程师，处理同类复杂问题，通常需要两到三天。

突破人类科研边界，AI开始独立开展高端研究

　　如果说代码编写属于重复性的工程工作，那独立开展科研探索，就意味着AI真正触碰并突破了人类长期垄断的高端智力领域。

　　AI的迭代速度本身也在不断提速。论文数据显示，AI可稳定完成的连续工作时长，翻倍周期从最初的7个月，缩短到如今的4个月。2024年3月，ClaudeOpus3仅能完成人类4分钟的工作量；一年后，ClaudeSonnet3.7可独立完成1.5小时的连续工作；到2026年，ClaudeOpus4.6已经具备12小时不间断独立作业的能力。

　　按照这个迭代速度推算，2026年内，AI就能独立完成人类数天的工作量；到2027年，足以攻克需要人类耗费数周才能完成的复杂科研任务。

　　这种能力跃迁，在AI自研领域体现得最为明显。论文披露了一组极具冲击力的实验数据：研究人员给Claude提供了小型AI模型的训练代码，要求其在保证精度的前提下，优化运行速度。2025年5月，ClaudeOpus4能实现3倍的速度优化；短短11个月后，ClaudeMythosPreview的优化能力飙升至52倍。反观资深人类研究员，花费4到8小时深耕优化，平均仅能实现4倍的速度提升。

　　在执行标准化科研实验的场景中，Claude只用了不到一年时间，就从高效辅助工具，成长为能力超越人类的科研助手。

　　更让人警惕的是，AI已经具备独立设计科研实验的能力。2026年4月，Anthropic公开演示了Claude的端到端科研能力。研究团队仅抛出一个AI安全领域的开放性难题——“弱势模型能否有效监督强势模型”，后续所有研究工作，全部交由Claude自主推进。

　　整个过程中，Claude自主提出研究假设、设计全套实验方案、和多组AI代理共享研究数据，持续迭代优化结论。最终统计数据显示，两名人类研究员耗时一周，仅弥补了23%的实验性能差距；而Claude集群通过800小时累计运算、消耗1.8万美元算力资源，弥补了97%的核心差距。

　　在这场实验里，人类只负责敲定研究方向和评价标准，所有核心的实验落地、数据测算、方案迭代工作，都由Claude独立完成。

　　即便在被视作人类科研最后优势的研究判断力上，AI也在快速追赶。Anthropic官方公布过一组对比数据：科研工作本质，就是无数次“下一步如何推进”的决策叠加。

团队复盘了人类研究员决策失误的科研案例，将完整过程同步给Claude后，让其判断最优研究方向。结果显示，MythosPreview的决策正确率达到64%，优于人类研究员，而2024年这一数值仅为22%。

三种未来推演：平稳迭代、可控发展、递归失控

　　结合当下所有实测数据和技术迭代趋势，Anthropic为AI行业推演了三种未来发展可能性。

　　第一种是技术迭代逐步停滞。所有指数级增长的技术，最终都会进入平稳的S型增长曲线，AI的高速发展也可能迎来拐点。像是科研天赋、研究审美这类顶尖研究员的核心能力，或许无法靠算力和数据堆叠实现复刻。同时，算力供给、能源储备、芯片制造等供应链短板，也可能成为AI进化的硬性瓶颈。

　　不过Anthropic判断，这种可能性相对较小。目前所有可量化的AI能力指标，依旧保持稳定的指数级增长，没有任何放缓迹象。即便AI技术停留在当前水平，也足以引发大规模社会变革。典型例子就是ProjectGlasswing项目，MythosPreview短短数周，就筛查出全球核心系统上万条高危漏洞，直接让网络安全的核心难题，从“找不到漏洞”变成“来不及修补漏洞”。

　　第二种是人类主导的可控加速发展。未来AI研发会高度自动化，但核心主动权依旧掌握在人类手中，由人类把控研究方向、评判技术成果。届时各行各业的知识工作生产力将迎来爆发，百人规模的科创团队，或许能完成过去万人、甚至十万人的工作量。这种变革会彻底重塑职场形态，但也暗藏风险，相关技术可能被用于大规模监控、舆论操纵等不良场景。

　　第三种也是风险最高的一种，即AI实现完全递归自我提升。如果现有技术趋势不变，AI终将具备自主设计、自我优化、迭代新版本的完整能力。届时AI的进化速度，将完全由算力资源决定，人类在AI研发中的作用会大幅弱化，仅需监督、核验AI搭建的虚拟实验体系。

　　Anthropic坦言，目前没人能精准预判这个场景的最终影响。当下全球的经济体系、社会运行逻辑，全都依托人类劳动和人类工具构建。一旦人类劳动失去竞争优势，整个社会的产业结构、运行规则都将迎来根本性重构。

呼吁全球协同管控，搭建可信AI研发约束机制

　　正是基于对AI失控风险的深度考量，Anthropic在论文中发出了行业罕见的呼吁：主动放缓前沿AI研发节奏，为社会适配、安全研究争取更多时间，是当下极具现实意义的必要举措。

　　同时，团队也清醒认识到，单一企业、单一国家的单方面暂停毫无意义。反而会让忽视安全、激进研发的主体抢占技术先机，加剧全球AI安全风险。真正有效的研发管控，需要全球所有前沿AI实验室达成统一共识、遵守同等规则，同时搭建可交叉核验的监管体系，确保所有主体严格落实管控要求。

　　这套全球协同方案的落地难度极高。不同于可监测、可管控的核武器设施，AI训练过程隐蔽性极强，容易规避监管，而且各方的技术竞争动机极强——谁能在行业管控窗口期实现技术突破，就有可能掌控未来AI产业的主导权。

　　对此，Anthropic表示，将联合全球科研机构、行业组织，专项研发可落地、可核验的AI监管体系。如果这套可信约束机制成功搭建，且全球前沿研发主体共同遵守，就能有效规避AI无序迭代的未知风险，让人工智能在安全可控的前提下，持续为社会发展赋能。

本文由作者原创，52RD转载是为分享该信息或观点，不能代表对观点的支持，如果有任何异议，欢迎联系我们