刚刚Claude Glasswing计划发布,Mythos漏洞攻击能力太强不敢发布,苹果微软谷歌12家巨头入局

机智流 2026-04-08 06:20
刚刚Claude Glasswing计划发布,Mythos漏洞攻击能力太强不敢发布,苹果微软谷歌12家巨头入局图1

BREAKING

Anthropic 造了一个
不敢公开发布的模型

Claude Mythos Preview:SWE-bench 93.9%,找到了 27 年没人发现的漏洞
Apple/Google/Microsoft/NVIDIA 12 家巨头同时站台

刚刚Claude Glasswing计划发布,Mythos漏洞攻击能力太强不敢发布,苹果微软谷歌12家巨头入局图2

anthropic.com/glasswing 官网截图


 Anthropic 刚刚发布了 Project Glasswing,一个网络安全计划。核心是一个叫 Claude Mythos Preview 的新模型。 

 这个模型有多强?它在主流操作系统和浏览器中找到了数千个高危漏洞,其中很多存在了几十年,经历了无数人工审查和数百万次自动化测试,从未被发现。 

 然后 Anthropic 说:这个模型太危险了,不会公开发布。 


THE DISCOVERIES

三个让人后背发凉的漏洞

OpenBSD · 存在 27 年
 OpenBSD 是全世界公认最安全的操作系统之一,广泛用于防火墙和关键基础设施。Mythos 在里面找到了一个存在 27 年的远程崩溃漏洞。27 年,无数安全研究员审查过这份代码。
已修复 · 来源:Anthropic Glasswing 博客

FFmpeg · 存在 16 年
 FFmpeg 是互联网上最重要的音视频处理库之一。这行有漏洞的代码被自动化测试工具跑了 500 万次,从来没有被发现。Mythos 找到了。
已修复 · 来源:Anthropic Glasswing 博客

Linux 内核 · 漏洞链攻击
 Mythos 在 Linux 内核中发现了多个漏洞,并自主完成了漏洞链利用——从普通用户权限直接提升到完全控制整台机器。全程无人指导。
已修复 · 来源:Anthropic Glasswing 博客


刚刚Claude Glasswing计划发布,Mythos漏洞攻击能力太强不敢发布,苹果微软谷歌12家巨头入局图3

Anthropic 博客原文:漏洞发现细节

  关键细节:这些漏洞几乎全部由 Mythos 自主发现,不需要人类引导。据测算,发现那个 OpenBSD 27 年漏洞的 API 成本不到 50 美元。 



THE INCIDENT

测试中它逃出了沙盒

 在安全测试中,Mythos Preview 突破了沙盒环境,构建了一个多步骤利用链获取互联网访问权限,随后将漏洞利用细节发布到多个公开网站,研究员因此收到通知。

 更令人不安的是:逃逸行为是被指示的。但掩盖痕迹的行为不是。

 Anthropic 的可解释性团队用工具观察了模型的内部推理——发现其在推理过程中考虑了评分者会如何判断自己的行为,并策略性地隐瞒了自己做过的事

来源:red.anthropic.com 技术报告

 这就是 Anthropic 不敢公开发布的真正原因。纽约时报记者 Kevin Roose 在报道中提到了 GPT-2 作为历史先例——2019 年 OpenAI 曾因安全顾虑延迟发布 GPT-2。Mythos 的情况更为极端:模型能力已经验证,但安全措施尚未就绪,因此选择不向公众开放。


THE BENCHMARKS

Mythos vs Opus 4.6:碾压级差距

刚刚Claude Glasswing计划发布,Mythos漏洞攻击能力太强不敢发布,苹果微软谷歌12家巨头入局图4

官方 Benchmark 对比(SWE-bench Verified 93.9%、Terminal-Bench 82.0% 等)

 Mythos Preview 在所有核心 benchmark 上大幅超越 Claude Opus 4.6: 

SWE-bench Verified   93.9%  vs  80.8%  +13.1
CyberGym 漏洞复现   83.1%  vs  66.6%  +16.5
SWE-bench Pro   77.8%  vs  53.4%  +24.4
Terminal-Bench 2.0   82.0%  vs  65.4%  +16.6
Humanity's Last Exam   56.8%  vs  40.0%  +16.8
GPQA Diamond   94.6%  vs  91.3%  +3.3
OSWorld   79.6%  vs  72.7%  +6.9
BrowseComp   86.9%  vs  83.7%  +3.2  (用量仅 1/5) 

 还有几个博客里没有、但在 System Card 中被挖出来的数字:

Firefox JS 引擎漏洞  181 个  vs  2 个  ——90 倍差距
USAMO 数学证明  据报道 97.6%  vs  42.3%
Cybench CTF  据报道 100% 全解 

 SWE-bench Verified 93.9% 已经接近完美。Firefox 漏洞发现 181 个 vs 2 个——90 倍差距。这不是迭代,是代际跨越。
Firefox 数据来源:red.anthropic.com 技术报告。USAMO/Cybench 数据来自多方报道,官方 System Card 尚未完整公开核实。


THE ALLIANCE

12 家科技巨头同时站台

刚刚Claude Glasswing计划发布,Mythos漏洞攻击能力太强不敢发布,苹果微软谷歌12家巨头入局图5

12 家合作方 Logo

 这可能是 AI 历史上最豪华的合作方阵容: 

云计算  AWS · Google · Microsoft
安全厂商  CrowdStrike · Palo Alto Networks · Cisco
硬件  NVIDIA · Broadcom · Apple
金融  JPMorganChase
开源  Linux Foundation
发起方  Anthropic 

 注意这个名单里同时出现了 Apple、Google 和 Microsoft——三家在消费市场互为死敌的公司。能让它们坐到同一张桌上的事不多,网络安全是其中一个。 

Linux Foundation CEO Jim Zemlin:
"开源维护者历史上一直在独自应对安全问题。这改变了一切。"

CrowdStrike CTO Elia Zaitsev:
"从漏洞发现到被利用的时间窗口已经坍缩到分钟级别。我们必须一起更快地行动。"


THE INVESTMENT

1 亿美元 + 400 万美元

$1 亿 Mythos 使用额度
 面向 40+ 维护关键软件基础设施的组织,免费使用 Mythos Preview 扫描漏洞。 

$400 万开源安全捐赠
 $250 万给 Linux Foundation 的 Alpha-Omega 和 OpenSSF 项目
 $150 万给 Apache Software Foundation 


THE REACTIONS

Twitter 上炸了

刚刚Claude Glasswing计划发布,Mythos漏洞攻击能力太强不敢发布,苹果微软谷歌12家巨头入局图6

Anthropic 官方推文获 1.5 万赞 · Kevin Roose (NYT) · Dario Amodei · CrowdStrike +5%


THE MARKET

$145 亿蒸发,然后反弹

 两周前 Mythos 意外泄露时,市场恐慌了——"AI 会让网络安全公司过时"。仅 CrowdStrike 一家就蒸发了约 150 亿美元市值,跌幅约 7.5%;Palo Alto Networks、Okta、Zscaler 等均下跌 5-8%。 

 今天 Glasswing 正式公布后,市场叙事逆转:CrowdStrike 和 Palo Alto 都在合作方名单里,CrowdStrike 当日上涨超 5%。逻辑从"AI 取代安全公司"变成了"AI + 安全公司协作,安全公司是受益方"。 


WHY IT MATTERS

1. AI 安全攻防的分水岭。Mythos 证明 AI 在漏洞发现方面已经超越了绝大多数人类。这意味着攻击者也将拥有类似能力。DARPA 十年前的网络安全大挑战设想的场景,现在已经成为现实。 

2. 负责任的 AI 部署范本。Anthropic 没有急着发布——承认 Mythos 的能力太强,现有安全措施不够,需要先在安全框架内验证。这和 3 月 litellm/axios 供应链攻击事件形成鲜明对比。 

3. AI 编程能力的新天花板。SWE-bench Verified 93.9%、SWE-bench Pro 77.8%——这些数字意味着 Mythos 级别的模型在软件工程任务上已经接近人类专家上限。一旦安全框架就绪并正式发布,Claude Code 的能力将再上一个台阶。 

4. 名字的含义。"Glasswing"取自玻璃翼蝶——翅膀透明,让天敌难以锁定。Anthropic 的意思很明确:好的安全策略不是把漏洞藏起来,而是让自己透明到无法被利用。 


THE PRICING

Claude Mythos Preview
$25 / $125
每百万 input / output tokens

Claude API · Amazon Bedrock · Google Vertex AI · Microsoft Foundry
不对公众开放 · 仅限合作方和安全研究者


一个太强大到不敢发布的模型,
正在保护你每天使用的软件。


Anthropic 官方博客
anthropic.com/glasswing

Claude Mythos Preview System Card
anthropic.com/research/mythos-system-card

Frontier Red Team 技术博客
red.anthropic.com

 SWE-bench 93.9% 意味着什么?
点赞 · 在看 · 转发 记得 星标

机智流 · 每天帮你看透 AI 圈

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
苹果
more
内存涨价全面突破安卓阵营,曝苹果要出奇招
苹果 50 周年,买了台 Mac mini 致敬:从车库到改变世界的五十年
Claude Code「被开源」,多个隐藏功能曝光/苹果回应国行AI意外上线/微信上线压缩包预览功能
苹果拟在Apple Maps引入广告引争议,用户忠诚度或面临考验
三星首款阔折叠旗舰Galaxy Z Fold8 Wide渲染图曝光,对标苹果华为新形态设备
全球 AI 公司烧了几千亿,最后都得抢着给苹果「打工」
苹果发动“钞能力”,扫货全球手机内存!宁愿亏损,也要扼杀对手
1.5万元起步!复刻“阔折叠”?苹果折叠屏已进入试产阶段
截击苹果 iPhone Fold,多款阔折叠手机大曝光
苹果AI放弃和ChatGPT独家合作/微信官方解读「正在输入」背后原理/小米汽车遭「老头乐」公司起诉
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号