靠AI撑起万亿估值，临上市却喊"AI将失控，请停手"，Anthropic想拦住谁？

出品｜搜狐科技

作者｜梁昌均

“如果能有效地减缓AI的发展速度，从而为我们争取更多时间来应对其巨大影响，我们认为这很可能是一件好事。”最近因上市而风头正劲的Anthropic公开发文呼吁暂缓AI研究。

今日早些时候，Anthropic发布万字长文《When AI builds itself》（《当AI开始自我构建》），提到AI正加速发展，将朝着递归自我改进（recursive self-improvement）的方向演进。

换句话说，AI可以自我进化构建，自己造自己了，而人类将成为按下开始键但却无法控制最终走向的旁观者。

该公司认为，AI自我构建将是技术史上的重大突破，有望在科学、医疗及其他领域为世界带来巨大福祉，但这也可能加剧人类失去对AI系统控制的风险。

“如果系统具备完全自主构建自身继任者的能力，那么我们如何确保它们的安全、监控它们的运行以及引导其行为，都将变得愈加重要。”该文由此呼吁放缓或暂停对AI的研究。

这家万亿美元估值、正在冲刺上市的顶尖AI公司大喊技术刹车，引发争议——这到底是一种吸引眼球的营销方式，还是出于对人类未来命运的深沉关切？

靠AI撑起万亿估值，临上市却喊"AI将失控，请停手"，Anthropic想拦住谁？图3

AI将走向自我进化构建

Anthropic在这篇长文中花了大量篇幅证明AI正在加速发展，未来AI系统自身将完全能够自主设计并开发出继任者。

“这种现象被称为递归自我改进。我们目前尚未达到这一阶段，但其并非不可避免。它的到来，可能比大多数机构所准备的要来得更早。”文章警告称。

Anthropic结合外部和内部对此进行了举证。从技术发展来看，AI模型改进的速度正在加快，模型能够独立可靠完成的任务时长，约每四个月翻一番，相比此前每七个月翻一番明显加速。

文章提到，Claude Opus 3在2024年3月仅能完成人类约需要四分钟的软件任务，一年后的Claude Sonnet 3.7 能处理约一个半小时的任务，而Claude Opus 4.6已能胜任12小时的任务。

“按这个趋势，需要一个熟练工程师花几天才能完成的任务，今年就可能落入AI的能力范围。到2027年，AI系统可能有能力处理需要一个人花几周完成的任务。”

文章还披露了Anthropic的内部研究。截至今年5月，Anthropic有超过80%的代码都是由Claude编写，而一年前还在低个位数的水平。

今年二季度，这家公司一名典型工程师每天合并的代码量是2024年的8倍，意味着生产力的巨大提升。“大部分代码由Claude编写，工程师的角色转向了指导和审查。”

靠AI撑起万亿估值，临上市却喊"AI将失控，请停手"，Anthropic想拦住谁？图4

文章还提到，Claude的代码能力不断提升。在难度最高的开放式任务中，Claude的成功率在今年5月达到76%，较半年前提升了50个百分点。

“许多人认为，去年末由Claude编写的代码质量仍逊于人类编写的代码，但如今两者的质量已基本相当。我们预计，到今年年底，Claude编写的代码质量将超越人类编写的代码。”

此外，Claude在自主提出实验方面的能力，以及将研究引向更有价值的发现能力越来越出色。

这些证据表明，在AI开发环节，人类作用正在逐渐缩小。人类的比较优势在于研究品味与判断力，包括选择哪些问题值得研究、哪些结果值得信赖等。

Anthropic还在文章中强调，未来真正重要的是那些仍掌握在人类手中的工作——即选择哪些问题去解决。如果没有这种判断力，Claude充其量只是一位称职的助手，而绝非能够独立推动AI进步的系统。

目前尚无法确知，如今的训练方法与架构能否真正激发这种潜力。

不过，文章认为，AI发展多数时候都是渐进式的。未来大规模的研究进步，很大程度上取决于工具与资源，而判断能力、研究品味将是AI系统难以掌握、但会逐渐精通的能力。

靠AI撑起万亿估值，临上市却喊"AI将失控，请停手"，Anthropic想拦住谁？图5

AI未来发展的三条路径

这篇文章还对AI未来发展的三种可能进行了分析。第一是这种趋势停止，技术发展会呈现S型曲线，目前或许正逼近曲线的拐点。

文章提到，能源和计算，芯片制造速度、电网扩容或互连带宽能力，都可能成为制约因素，而非智能本身。要打破技术瓶颈，需要全新思路，比如取代Transformer的全新架构设计。

“我们目前还处于AI模型向更广泛经济领域扩散的初期阶段……这将为政府和社会提供最长的适应时间。我们更担忧接下来的两种情景：它们发展速度更快，准备的时间也少得多。”

第二种情景即AI继续以指数级的速度发展。这将使得AI开发基本实现全面自动化，但人类仍将负责设定研究方向并评判最终成果。采用AI系统的组织和个人的生产力将显著倍增，人类的角色将发生转变，但也可能被用于有害目的。

最后一种情景则是如果技术趋势得以持续，且AI系统能够发展出人类固有的变革性、创造性的能力，那么AI系统完全有可能自行设计并不断完善自身，即具备完全递归自我改进的能力，并可以构建继任者。

在这个世界里，AI发展的步伐完全取决于计算资源的可获得性（或算法训练与推理过程中效率提升的速度），人类所扮演的角色将大幅减弱，更多精力转向对由AI系统运行的监督、验证与确认工作。

Anthropic在文中预计，具备自动化AI研发能力的系统将拥有可迁移到其他科学领域的技能，从而开启一场席卷各领域的革命性变革。

“但未来的对齐问题究竟会得到解决，抑或根本无法解决，这是我们最不确定的。”文章认为这有两个可能性，一是模型可能足够明智，一旦察觉到潜在风险便主动叫停研发进程。

另一种可能性是：如今模型中罕见的对齐偏差现象，随着模型不断迭代升级而逐渐累积放大，变得愈发频繁、愈发难以理解，直至人类彻底失去对其的掌控。

“从本质上讲，一个快速递归自我改进所驱动的世界，可能会逐渐被这种自我改进的模型所主导——其能力将全面超越人类，并将迅速在整个经济体中扩散开来。”

Anthropic进一步预计，具身智能（即机器人技术）可能也会遵循类似路径：效率不断提升、成本不断降低，出现更强大的智能。

这并不意味着生产方式、社会运行模式会立即发生改变。“但这种由递归自我改进驱动的智能加速发展和人类世界、人际关系以及治理结构的碰撞交汇，是未来无法预知的图景。”

靠AI撑起万亿估值，临上市却喊"AI将失控，请停手"，Anthropic想拦住谁？图6

呼吁暂缓研发是营销还是为了人类？

为应对AI自我进化带来的失控风险，Anthropic在文章中呼吁全球实验室一起放缓或暂停对技术的研发。

“但若放缓步伐仅仅让那些最不谨慎的行动者在技术上迎头赶上，反而可能使所有人面临更大的安全风险。”

这句话就差指名道姓，点出Anthropic的最大对手——OpenAI。Anthropic的创始人此前正是因和OpenAI有不同的AI安全理念而自立门户，并以发展安全的AI作为企业使命。

实际上，人类对AI失控的担忧并不是新话题，马斯克等人十年前就表达出类似看法，认为AI远比核武器更危险，不应该由少数企业垄断，这也是其当时参与成立OpenAI的初衷。

三年前，在美国生命未来研究所发起的联合声明中，马斯克、图灵奖得主约书亚·本吉奥等超过3万人签名，呼吁OpenAI等暂停AI研究六个月。

马斯克后来通过成立xAI入局AI竞赛，这也使其呼吁暂停研发的动机长期受到质疑，很多人认为这是马斯克在落后的AI竞赛中采取的一种竞争策略。

实际上，AI自主进化带来的失控风险已在学术界引起重视。

早前，清华大学智能产业研究院创始院长张亚勤，联合本吉奥、姚期智等多位全球顶尖AI科学家发起的一份声明，就呼吁各国正视AI网络攻击、生物安全风险，包括逐步走向自主化的AI系统可能出现失控的问题，并强调各国要加强守护关键基础设施、强化前沿AI模型的安全防护、建立完善的风险评估体系等。

现在，Anthropic再次抗起AI安全的大旗。作为一家通过持续研发实现AI领先的明星企业，这究竟是一种营销竞争策略，还是出于真诚的人类公共安全关切，市场再次陷入争议。

有观点认为，这是Anthropic在上市期间采取的PR动作，意在通过公共利益叙事来强化自身安全“人设”，尽管其已经抛弃了将安全置于最高使命的初心。

也有业内人士认为，这是在玩“恐惧即护城河”的把戏——通过强调自身技术领先，未来无法把控，从而影响监管决策，把后来者挡在门外，是应对激烈竞争的曲线方式，背后是对商业利益和参与制定规则的诉求。

一位国内AI从业者则表示，周围并无太多人讨论Anthropic这篇文章，但其认可AI将会自我进化的判断，AI在模型研发中的比重将会不断增加。实际上，国内已有大模型公司正在尝试用AI进行模型的自我迭代。

但相比马斯克等前述更多出于道德且缺乏建议性的呼吁，Anthropic这次呼吁暂停AI研究则提出了可参考的方向——建立一个全球性的可协调、可验证的透明机制，提供一种放缓或暂停前沿AI发展的选项，从而推动社会结构与对齐研究跟上技术进步的步伐。

Anthropic表示，将与众多合作伙伴携手开展研究，并采取行动，以助力构建实现可信放缓或暂停所必需的各类体系。这些体系将使前沿AI开发者能够验证各方是否确实已停止或放慢了发展步伐，同时确保恶意行为者无法借由放缓之名暗中抢跑。

同时，还必须明确规定：触发暂停的条件、何时解除暂停，以及由谁来负责裁定。Anthropic表示，如果此类体系得以建立，其便会相应地放缓或暂停自身的研发进程。

“某个实验室单方面暂停行动能立即实现，但效果要小得多：它或许能改变谁是领跑者，却无法催生目前所缺失的更广泛的协商与审议过程。”Anthropic表示。

换句话说，Anthropic很清楚，如果自己单方面暂停，而OpenAI、谷歌等企业不停，那自己就可能失去AI赛道的竞争优势，所以要停一起停，而且还要彼此验证是否已经暂停。

“这一切在原则上并非完全不可能，而现在正是共同探讨这些问题的绝佳时机。”但问题是，Anthropic、OpenAI、谷歌们，真的会愿意停下来吗？

靠AI撑起万亿估值，临上市却喊"AI将失控，请停手"，Anthropic想拦住谁？图7

靠AI撑起万亿估值，临上市却喊"AI将失控，请停手"，Anthropic想拦住谁？图8

运营编辑 | 曹倩 审核｜孟莎莎

靠AI撑起万亿估值，临上市却喊"AI将失控，请停手"，Anthropic想拦住谁？图9

靠AI撑起万亿估值，临上市却喊"AI将失控，请停手"，Anthropic想拦住谁？图10

靠AI撑起万亿估值，临上市却喊"AI将失控，请停手"，Anthropic想拦住谁？图14