刚刚,OpenAI 推出 Daybreak:要给全世界软件「打补丁」,一场 AI 攻防战

机智流 2026-06-23 09:03
刚刚,OpenAI 推出 Daybreak:要给全世界软件「打补丁」,一场 AI 攻防战图1

SMARTFLOW · AI 前沿深读

刚刚,OpenAI 推出 Daybreak
要给全世界软件「打补丁」

Daybreak 扩军背后的 AI 攻防暗战 · 2026/06/23


北京时间 6 月 23 日凌晨,OpenAI 官推宣布扩军网络安全平台 Daybreak,野心写在标题里——「为全世界每个组织提供安全工具」,要「以机器速度」修补漏洞。[1]但翻开这场发布,你会看到的不只是技术秀:有真实战绩,也有 cURL 创始人的冷水、安全研究者「90 天披露已死」的警告,和它与 Anthropic Mythos 之间一场关于「谁有资格用 AI 攻防」的路线之争。

刚刚,OpenAI 推出 Daybreak:要给全世界软件「打补丁」,一场 AI 攻防战图2

图:OpenAI 官方推文(6/23,54 万+ 浏览)宣布 Daybreak 扩军[1]

01

先看它放了什么大招


Daybreak 不是新东西——它最早于 2026 年 5 月 11 日 发布,核心是把 OpenAI 大模型 + Codex Agent 框架结合,做软件漏洞的「发现—验证—修补」。这次 6/23 扩军,端出了四件套[2]

① Codex Security 插件

在 Codex 里完成「找漏洞—判断代码是否真的可达—给验证证据—生成补丁—验证修复」整条闭环;可扫整库或选定改动、审查近期 commit,产出带严重度/位置/证据的报告。设计哲学:先在隔离环境验证,让团队聚焦能被利用的真问题,而非噪声告警

② GPT-5.5-Cyber 完整版

三档模型里的最高档——GPT-5.5(通用)/ GPT-5.5 + Trusted Access for Cyber(防御主力,对验证过的防御者放低拒答率)/ GPT-5.5-Cyber(明确训练成在高风险双用途场景"限制更少",支持红队、渗透、受控环境生成 PoC)。仅向通过验证的防御团队限量开放。[3]

③ Cyber Partner Program

把能力开放给头部安全公司在其上做产品,合作阵容包括 Akamai、Cisco、Cloudflare、CrowdStrike、Fortinet、NVIDIA、Oracle、Palo Alto Networks、Sophos、Zscaler。[2]

④ Patch the Planet

联合 Trail of Bits、HackerOne 与开源维护者,专攻关键开源项目,把「发现问题」真正推进到「修好」。[4]

02

它真有战绩,不是 PPT


这部分别人吹得多,我们只摆有出处的数字。Patch the Planet 第一周(Trail of Bits 官方):64 个 PR、51 个 issue(19 个已修复)、37 个补丁已合并,跨 19 个项目,30+ 开源项目承诺加入(cURL、pyca/cryptography、aiohttp、Go、Python 等)。[4]

具体案例:Codex Security 独立识别出对应 4 个 dnsmasq CVE 的脆弱模式;研究者在 Chrome V8 引擎发现 5 个、Safari 10+ 个 可利用漏洞。合作方 Palo Alto Networks 用前沿模型一口气识别 26 个 CVE / 75 个 issue,远超其典型月度不到 5 个的量。[2][5]

能力评测上要分清口径:CyberGym 上 GPT-5.5-Cyber 达 85.6%(vs GPT-5.5 的 81.8%)——但这是 OpenAI 自报。更中立的是英国 AI 安全研究院(AISI)独立评测:GPT-5.5 在专家级网络任务平均通过 71.4%,略高于 Claude Mythos 的 68.6%,AISI 称它"可能是我们测过最强的模型"。[6]

但 AISI 也泼了冷水:测试限定在「agent 已有网络访问、指向特定漏洞目标」的理想场景,缺少真实环境里的主动防御者、防御工具和告警惩罚;红队还一度发现「对所有恶意查询都生效的通用越狱」(OpenAI 后修补)。

—— 英国 AI 安全研究院(AISI)评测报告[6]

03

圈内大佬怎么看:叫好与泼冷水


这才是判断力所在——安全圈对它的反应,远不是一边倒

「AI 驱动的代码分析器在源码里找安全缺陷,显著优于过去任何传统代码分析器。」过去 8–10 个月,Codex Security、AISLE 等 AI 工具给 cURL 触发了约 200–300 个 bugfix 合并——这是"AI 找 bug 真有用"最硬的背书。

—— Daniel Stenberg · cURL 创始人[7]

但同一个人也开了枪:对手 Anthropic Mythos 报了 5 个"确认漏洞",cURL 团队复核后只剩 1 个低危 CVE(其余误报 + 普通 bug),零内存安全漏洞;大肆炒作"主要是营销"。他还因海量"AI slop"(自信却常常捏造的 LLM 漏洞报告)一度暂停 cURL 赏金——真实漏洞占比从 1/6 跌到 1/20。

—— Daniel Stenberg(评 Mythos cURL 战绩)[7]

90 天漏洞披露政策,已经死了。」我在自己机器上,用 LLM 把一个已发布的 React 补丁,30 分钟内变成可用 exploit——AI 干了大部分重活:读懂 diff、定位漏洞路径、写 PoC。资深逆向工程师过去要花几天。发现者从此变得廉价而丰富。

—— Himanshu Anand · 安全研究者[8]

「Daybreak 帮 OpenAI 反击『Anthropic 在前沿网络 AI 领先』的认知。它不靠单一秘密模型,而是构建嵌入企业工作流的可扩展网络防御生态。」

—— Pareekh Jain · Pareekh Consulting CEO[9]

04

与 Anthropic Mythos:一场路线之争


Daybreak 普遍被视为对标 Anthropic 的 Claude Mythos。但两家的差别,不在谁的模型强一点,而在「谁有资格用 AI 攻防」的根本分歧[9][10]

维度
OpenAI Daybreak
Anthropic Mythos
开放度
三档分级,任何公司可申请
仅限邀请
(封闭给少数伙伴)
定位
从开发起安全构建 + 持续运营
检测缓解高危漏洞、加固关键软件
合作
10 家安全巨头 + 开源 Patch the Planet
Project Glasswing 选定伙伴(含 Mozilla)

一个细节对照:Mozilla Firefox 150 含 271 个由 Claude Mythos 识别的安全修复(但来自含人工审查的更大工程流程)。两套系统最终撞上同一堵墙——「漏洞报告在通过验证之前,不是安全成果」。Mythos 那次 cURL 翻车(5 报 1 确认),就是最有力的祛魅。[10]

05

最该冷静的:一把双刃剑


GPT-5.5-Cyber「更宽松」的定位是全篇最敏感处——能高效找漏洞、写利用的能力,本就攻防两用。OpenAI 的应对是分层 + 受信访问:自 6 月 1 日起,进 TAC 档需抗钓鱼身份验证(硬件密钥/passkey),只放给验证过的防御者。[3]

但争议正在于此:谁能进、谁不能,由模型厂验证意图说了算——批评者担心这把「谁有资格做攻防」的权力,集中到了 OpenAI 手里。而更底层的数据更吓人:AISI 估计自主 AI 网络能力正以「月」而非「年」的尺度翻倍(约 4.7 个月翻一倍)。[6][11]Daybreak 上线,正撞上德国 BaFin、英格兰银行等监管机构的警告。

06

那,到底怎么用起来?


Daybreak 不是「下载就用」的 App,而是按身份分层开放——你属于哪一档,决定你能用到什么、门槛多高:

🧑‍💻 普通开发者 / 企业团队

门槛最低——装上 Codex Security 插件,在 Codex 里边写代码边扫漏洞、看可达性、生成补丁,用标准 GPT-5.5 档即可。这是大多数人能直接上手的入口。

🛡️ 防御团队 / 安全研究者

想解锁更强能力,要申请 Trusted Access for Cyber(TAC)——需通过 OpenAI 的「防御者意图」验证,且自 6/1 起强制抗钓鱼认证(硬件密钥 / passkey)。通过后才拿到更低拒答率 + GPT-5.5-Cyber(限量预览)。审核严,是刻意的。

🏢 安全公司

走 Cyber Partner Program,在 OpenAI 的网络安全能力之上做自家产品(CrowdStrike、Palo Alto 等已在列)。

🌍 开源项目维护者

加入 Patch the Planet(联合 Trail of Bits)——已有 30+ 项目参与,让 AI 帮你的项目找 + 修关键漏洞。注意:Trail of Bits 会先和维护者协商、人工复现,避免倒一堆噪声给你。

一句话:能力越强的档,门槛越高、审核越严——这正是 OpenAI「分层开放 + 受信访问」的核心思路,也是它和 Anthropic「干脆只邀请」之间的根本区别。

编辑判断

Daybreak 真正的看点,不是「AI 会修 bug 了」,而是它在改写漏洞研究的经济学:发现变廉价、验证变值钱、披露窗口被压缩、攻防两端同时加速。它有实打实的战绩,也有 cURL 创始人提醒的「AI slop」与营销水分。这不是一篇该吹的稿子,而是一场该盯紧的暗战——下半场拼的不是谁找漏洞快,而是谁能把「验证」和「问责」这条最贵的环节守住。

如果这篇有帮助,欢迎 点赞、在看、转发 三连
想第一时间看到前沿深读,记得给机智流加个 星标 ⭐ 我们下次见 👋

参考来源

[1] OpenAI 官方推文:Daybreak — Tools for securing every organization in the world — x.com/OpenAI · 2026-06-22

[2] The Hacker News / MarkTechPost:OpenAI Launches Daybreak(首发、模型档、Codex Security 闭环、合作伙伴) — thehackernews.com · 2026-05

[3] GPT-5.5 with Trusted Access for Cyber(三档模型、抗钓鱼验证、CyberGym 85.6%) — openai.com · 2026

[4] Trail of Bits:Introducing Patch the Planet(第一周 64 PR / 37 合并 / 19 项目 / 噪声治理) — blog.trailofbits.com · 2026-06-22

[5] MLQ News / CyberScoop:dnsmasq 4 CVE、V8 5、Safari 10+、Palo Alto 26 CVE — mlq.ai / cyberscoop.com · 2026

[6] 英国 AISI 独立评测:GPT-5.5 71.4% vs Mythos 68.6% + 测试局限与越狱警告 — aisi.gov.uk · 2026

[7] Daniel Stenberg(cURL 创始人)博客:AI 找 bug 优于传统分析器 / Mythos cURL 5 报 1 确认 / AI slop — daniel.haxx.se · 2026-05-11

[8] Himanshu Anand:The 90-day disclosure policy is dead(30 分钟补丁→exploit) — blog.himanshuanand.com · 2026-05

[9] CSO Online:OpenAI Daybreak takes on Anthropic Mythos(Pareekh Jain / Amit Jaju 分析) — csoonline.com · 2026

[10] Penligent:Daybreak vs Mythos 深度横评(开放度对比、验证才算数) — penligent.ai · 2026

[11] AISI:自主 AI 网络能力增速(约 4.7 个月翻倍) — aisi.gov.uk · 2026

© 2026 机智流 · 本文由 AI 采集前沿信息生成 + 多源交叉核验,可能有误,以官方公告为准

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 软件
more
9点1氪:豆包推出付费后月活减少610万;Anthropic呼吁全球放缓AI开发,警告AI“自我改进”风险;罗永浩卸任锤子软件公司执行董事
刚刚,OpenAI 推出 Daybreak:要给全世界软件「打补丁」,一场 AI 攻防战
【瑞萨RA MCU软件架构与开发实践】系列直播,看直播抽开发板、定制礼物!
IPO之后再举债,马斯克SpaceX首发投资级债券;机器人怕失控?英伟达Halos系统实现「智驾级」安全;AI巨头掏空软件公司高层丨硅谷大事件
嵌入式软件静态分析都干了些啥?
从 openEuler 兼容性测试看 RISC-V 软件生态协同缺口
MCU软件架构之边缘 AI 软件栈实战:从模型到推理部署
黄仁勋盛赞OpenClaw为“当代最重磅软件发布”,称其三周普及速度超越Linux三十年
用OpenClaw的第一件事,不是装Skill,而是装“杀毒软件”!
美国金融科技公司Marquis遭勒索软件攻击,超67万人敏感金融信息被盗
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号