Claude崩了,全球AI因何“熔断”?

硅星人Pro 2026-03-04 10:03

Claude崩了,全球AI因何“熔断”?图1

文章转载于腾讯科技
作者:晓静

北京时间202632日晚间1949分,AnthropicAI助手Claude在全球范围内突然陷入大面积服务中断。claude.ai网页端、开发者控制台、AI编程工具Claude Code以及移动端应用几乎同时亮起红灯,数千名用户涌入Downdetector报告故障高峰期报障数量。用户在尝试登录时看到的是HTTP 500529错误码,或者一句简短的提示:Claude will return soon.

Claude崩了,全球AI因何“熔断”?图2

对于全球数以百万计已经将Claude深度嵌入日常工作流的开发者、内容创作者和企业用户而言,这场宕机的体感更接近一次大面积停电

社交媒体上,有人自嘲只会prompt怎么;有开发者说,工作写到一半突然断了,只能被迫切换到ChatGPTGemini应急;更有人在群里调侃:AI Native的公司今天不如去团建。

Claude崩了,全球AI因何“熔断”?图3

1

打地鼠宕机

宕机具体原因至今Anthropic官方也没有详细解释但是过去一周发生一系列事情

228日,Anthropic因拒绝将Claude用于大规模国内监控和全自主武器系统,失去了与美国五角大楼的合同。特朗普总统随即在社交媒体上抨击Anthropic左翼疯子,并下令所有联邦机构停止使用Claude。OpenAI迅速接手,宣布与五角大楼达成合作协议。

这一事件在全球用户群体中引发了戏剧性的反转。一场名为QuitGPT的抵制运动在RedditInstagramX.com上迅速蔓延Reddit上一条呼吁取消ChatGPT的帖子获得了3万个赞,Instagram账号quitGPT短时间内吸引了超过78000名关注者。

Tom's Guide报道,约70万用户开始从ChatGPT转投其他平台。Anthropic成了这场数字迁徙的最大受益者。

根据Anthropic官方披露的数据,自20261月以来,Claude免费用户数量增长超过60%,每日新注册用户数较202511月翻了三倍,付费订阅用户在年内已经翻倍。在超级碗LX之前,Claude在美国App Store的排名还在第42位;到228日,它登上了免费应用排行榜第一名,将ChatGPT挤到了第二。

这波泼天富贵来得太猛了。从Sensor Tower的数据看,Claude在整个2月都处于快速攀升通道,但最后几天的用户涌入量远超Anthropic基础设施的承载预期。

外媒在报道中引用Anthropic的说法称,公司在过去一周一直在应对前所未有的需求

Claude崩了,全球AI因何“熔断”?图4

DowndetectorClaude报障飙升曲线

Anthropic官方状态页面的时间线来看,故障的演进呈现出打地鼠式的特征。

UTC11:49(北京时间19:49),团队开始调查问题,最初判断故障集中在claude.ai的登录和登出路径。

UTC12:21北京时间20:21Anthropic宣称核心API运转正常,问题仅限于Web端。

UTC 13:37北京时间21:37,情况出现恶化部分API方法也开始报错。

此后,Claude Opus 4.6模型在UTC 17:09出现异常,紧接着Claude Haiku 4.5UTC 17:56也受到波及。修复、复发、再修复的循环持续了数小时。

Claude崩了,全球AI因何“熔断”?图5

直到UTC 15:47北京时间23:47左右,主要服务才逐步恢复。随后 Opus 4.6 又出现多次短时 elevated errors(含一段延续到约 21:16 UTC 北京时间335:16

而仅仅几个小时后的UTC 33日凌晨3:15北京时间11:15,新一轮故障再次出现,影响范围扩展到了Claude CodeCowork,截至发稿时问题仍在调查中。

Claude崩了,全球AI因何“熔断”?图6

关于宕机原因还有媒体报道中东地区的AWS数据中心疑似遭受不明物体袭击导致起火断电,AWS算力池受到冲击,而高度依赖这些算力节点的Claude模型因此失去支撑。

Claude崩了,全球AI因何“熔断”?图7

AWS 官方状态页的事故通告:阿联酋(UAE)区域(ME-CENTRAL-1)某个可用区因供电事故(数据中心被异物击中引发火花/起火,消防切断电力)导致多项服务与 EC2 网络相关 API 错误率升高、服务受影响。

远在中东地缘冲突为什么可能引起美国 AI公司大规模宕机事件

当下AI 服务的关键链路高度全球化且存在少数“咽喉点”地缘冲突若导致红海—曼德海峡—苏伊士一带的海底光缆受损、区域网络受限,或波斯湾/阿拉伯半岛周边云数据中心与电力设施、跨境骨干网、海缆登陆站出现中断与拥塞,就可能引发跨区域的网络时延飙升、路由收敛异常、认证/计费/控制面访问失败,以及跨区复制和故障切换受阻

而大模型推理与训练对带宽、低时延和云控制面依赖更强,一旦这些“底层要素”被扰动,原本分布式的云服务也会以连锁方式把故障放大为面向全球用户的系统性宕机。

Claude崩了,全球AI因何“熔断”?图8

图:海底光缆在波斯湾的汇聚点“”:TeleGeography 海底光缆地图显示,阿联酋富查伊拉(Fujairah)与伊朗贾斯克(Jask)之间的 UAE–Iran 海缆只是其中一段,周边密集的光缆走廊把中东连接到欧洲与亚洲的主干网络;一旦该区域出现地缘冲突或基础设施扰动,全球数据链路的脆弱性会被放大

值得关注Claude 宕机当天,xAI 官方状态页显示 Grok(Web/iOS/Android)在同日 约 UTC23 点前后也发生了约 40 分钟的暂时不可用“”事件。但两者是否存在共同上游或因果关联,目前缺乏公开证据

这条链路如果属实,意味着这次宕机不仅仅是前端认证系统的问题,而是涉及底层云基础设施的物理脆弱性

在赛博空间里算力通天的大模型,在真实世界的物理打击面前显得格外脆弱。

1

下游生态的连锁反应

Claude这次宕机之所以引发如此大的关注,核心原因在于AI已经一个聊天机器人变为一整条AI Native生产力链条的关键节点。

首先受到冲击的是开发者群体。Claude Code已经成为全球开发者最依赖的AI编程工具之一。据此前的报道,Claude Code产品年化收入估算约2亿美元量级AnthropicClaude Code创始人Boris Cherny曾在播客中透露,他自202511月起就再也没有手动编辑过一行代码。

Claude Code完全不可用时,外媒报道社区普遍反应:开发者们被迫回到生成式AI出现之前的习惯,自己动手写代码。

专业开发者被迫在工作流中途切换到GitHub CopilotChatGPT的编码功能,但这种切换本身就意味着效率损失和上下文断裂。对于那些将Claude API深度集成到自有产品中的公司,影响更为直接。

虽然Anthropic声称API在大部分时间保持正常运转,但UTC 13:37的那段时间,API也出现了故障这恰恰是那些没有多模型容错方案的企业失去所有AI功能的关键时刻。

内容创作领域同样遭受冲击。依赖Claude进行文案撰写、报告生成、数据分析的团队被迫暂停工作。客户服务机器人集体沉默,工单开始堆积。

Deployflow的分析测算,对于一个25人规模的工程团队,即便按每小时90英镑的计费标准,4小时的服务中断也意味着超过9000英镑的生产力损失,还不包括下游的连锁延迟。

更深远的影响在于信任层面。ainvest的分析指出,重复性的服务中断正在侵蚀用户对平台可靠性的信任,尤其是对于那些在Claude之上构建业务的开发者和企业而言,持续的正常运行时间是最基本的要求。

但是,Claude做了什么企业依赖如此

让Claude从好用的模型变成生态链核心的,是Anthropic持续搭建的Agent基础设施。

据Anthropic官方2025年7月披露的数据,Claude Code发布四个月就吸引了11.5万开发者,每周处理1.95亿行代码,周下载量达300万次。

20261刚刚发布Claude Cowork则更激进:一个能点击鼠标、管理文件、跨软件执行任务的桌面智能体,配合11个覆盖法律、销售、财务等领域的行业插件,直接以数字员工的身份接管知识工作。

在底层,Anthropic推出的MCP协议正成为AI连接外部工具的事实标准甚至OpenAI和Google先后宣布支持,围绕它已形成包含500多个商业应用连接器的生态。

Claude当下不仅仅是一个模型API,包含模型(智能大脑)+ Code/Cowork(执行)+ MCP(连接)构成的AI操作系统

Claude开发者企业生态渗透太深很多AI-Native公司形成了基础设施级别的系统性依赖,而这个基础设施的可靠性,还远没有达到它所承载的期望。

1

AI基础设施的脆弱性

这次Claude宕机事件不是孤例。研究机构Forrester在《2026年预测:云计算》报告中做出了一个判断:AI数据中心的升级改造将在2026年触发至少两次重大的、持续多天的云服务中断。其中逻辑是,AWSAzureGoogle Cloud等超大规模云服务商正在将投资重心从传统x86ARM环境转向以GPU为中心的AI数据中心,而老化的基础设施在日益增长的复杂性下变得脆弱不堪。

Forrester还预测,至少15%的企业将在2026年转向私有云上的私有AI部署,以应对不断上升的成本、数据锁定和运营风险。

2025年已经给出了预警信号。AWS曾遭遇超过1700Downdetector报告、持续超过15小时的大规模宕机,影响了NetflixSnapchat等一系列服务。202511月,Cloudflare的服务中断导致包括ClaudeShopifyX在内的大量网站瘫痪。202512月,亚马逊自研的AI编程工具Kiro在自动修复一个客户面向系统时,自主决定删除并重建整个环境,触发了一次长达13小时的AWS Cost Explorer中断。单点故障引发的连锁反应,正在成为AI时代最危险的系统性风险。

这对整个行业的启示是多维度的。第一,多模型冗余不再是可选项,而是必选项。此次宕机中,那些提前部署了多LLM容错方案的企业比如在Claude不可用时自动切换到GeminiGPT模型受到的影响明显更小。未来的AI基础设施架构必须像今天的多云部署一样,将模型冗余纳入核心设计。

第二,观测能力至关重要。Deployflow的分析指出,Token延迟追踪和错误率飙升警报是预判服务崩溃的早期信号,能够让团队在全公司失去AI访问之前就进行切换。

第三,物理基础设施的安全性被严重低估。如果中东数据中心遇袭的因果链条成立,那么AI基础设施面临的威胁不仅来自软件层面,还包括地缘政治风险、物理攻击甚至自然灾害。

Forrester还指出了一个值得关注的趋势:新云neocloudsCoreWeaveLambdaNebius等专注于高性能GPU的专业化云服务商预计将在2026年获得200亿美元的收入,侵蚀超大规模云服务商在生成式AI领域的主导地位。

这些服务商从零开始构建GPU优先的架构,而非在旧数据中心上进行改造,可能为AI基础设施的韧性提供新的解题思路。

对于正在搭建AI基建的企业和平台而言,这次事件留下了清晰的教训:不要把所有鸡蛋放在一个篮子里,也不要假设任何一家供应商能够提供100%的正常运行时间。

AI成为真正水电煤之前,它的基础设施必须先达到水电煤级别的可靠性。否则,每一次宕机都将是一次对整个生态的压力测试。

截至发稿,Claude服务仍存在间歇性故障,Anthropic在持续调查中。

Claude崩了,全球AI因何“熔断”?图9
    

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
原生AI手机惊艳MWC 2026!中兴引领智能手机新阶段|视频
荣耀前CEO赵明正式出任千里科技联席董事长,华为系高管齐聚加速AI商业化落地
MiniMax上市后首份财报:去年业务净亏17亿,AI产品净增上亿用户,手握百亿现金
从 OpenClaw 到 EasyClaw:AI Agent 的「最后一公里」
AI“真人”微短剧爆发式增长,行业进入规模化阶段引演员焦虑
中国AI闪耀巴展,但小米可能正藏着通往未来的钥匙
这届MWC真成了中国AI主场,小米直接把AI从对话框里拽出来接管物理世界了
苹果祭出地表最强AI PC,顶配6万5,M5 Max芯核弹AI性能暴涨4倍
不是GPT-5.4,OpenAI深夜发新模型!幻觉率暴降27%
MWC 2026 | 端侧AI重塑无人零售,广和通AI ECR解决方案亮相
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号