Open AI：
《GPT5系统卡》

（完整版.pdf ）
以下仅展示部分内容
下载方式见文末

OpenAI《GPT-5 System Card》全景解读：能力跃迁、安全防线与未来挑战

一、模型架构与定位
GPT-5 是一套“统一多模型系统”，由三种互补的引擎组成：

gpt-5-main / gpt-5-main-mini：高速、高并发的主力模型，对应上一代 GPT-4o 系列。
gpt-5-thinking / gpt-5-thinking-mini / gpt-5-thinking-nano / gpt-5-thinking-pro：具备深度推理链的“思维模型”，对应此前 OpenAI o3 系列。
实时路由器根据对话复杂度、工具需求及用户显式指令（如“请认真思考”）动态选择调用哪一个引擎；当用量达到上限时，mini 版本兜底。API 侧提供所有型号的直接调用，ChatGPT 侧则通过开关或“pro”模式暴露思维模型。

二、训练与数据
训练语料依旧来自公开互联网、第三方授权数据及人工生成内容；新增强化学习流程专门用于训练思维模型“先思考后回答”，使其在推理链中自我纠错并遵循安全策略。数据处理沿用 Moderation API 与安全分类器，针对性过滤个人信息与敏感内容。

三、安全挑战与评估结果
（一）输出安全：从“硬拒绝”到“安全完成”
GPT-5 不再简单二分类“拒绝/允许”，而是采用“safe-completions”策略：在允许范围内最大化帮助性。内部实验显示，相比 OpenAI o3，违规输出严重程度下降，整体有用性提升。

（二）六大风险维度横向对比

违规内容：新标准测试集覆盖多轮对话，gpt-5-thinking 在暴力、仇恨、未成年性内容等指标全面优于或持平 o3；gpt-5-main 在部分类别略逊于 GPT-4o，但总体提升。
谄媚倾向：线下评估下降 3 倍，线上 A/B 实测免费用户下降 69%，付费用户下降 75%。
越狱攻击：StrongReject 基准下，gpt-5-thinking 违规率 0.5%，显著低于 o3 的 1.5%。
指令层级：系统消息 > 开发者消息 > 用户消息的优先级遵循度 99%，但 gpt-5-main 部分场景略有回退。
幻觉：在 ChatGPT 真实流量中，gpt-5-main 事实错误率下降 26%，gpt-5-thinking 下降 65%；长篇事实问答基准下降 5 倍以上。
欺骗行为：在无法完成任务时，gpt-5-thinking 选择诚实承认的比例大幅提高，欺骗率从 o3 的 4.8% 降至 2.1%。

（三）图像输入、健康、多语言与公平性

图文混合输入的安全过滤准确率与 o3 持平或略优。
HealthBench 医疗问答：gpt-5-thinking 46.2% 超越 o3 的 31.6%，错误率在高风险情境下降 8-50 倍。
13 语种 MMLU 零样本表现与 o3 持平；Swahili、Yoruba 低资源语言提升明显。
BBQ 偏见基准：与 o3 持平，未出现新的显著偏差。

四、红队与外部评估

400+ 名外部专家、5,000+ 小时红队：涵盖暴力袭击策划、生物武器、化学武器、越狱、提示注入等。
25 名国防与执法背景专家盲测：gpt-5-thinking 65% 被评为“更安全”。
生物武器专项：60% 胜率优于 o3；实战级越狱需平均 8.2 小时/条，仅 3 条给出可行信息且均被系统层拦截。
美英政府 AI 安全机构（CAISI、UK AISI）提前介入，发现若干可修复越狱路径，未发现可绕过全部防线的通用攻击。

五、预备性框架（Preparedness Framework）
OpenAI 将 gpt-5-thinking 在“生物与化学”领域定为“高能力”触发级别，虽无确凿证据表明其能让新手制造重大生物危害，但采取预防式严管。关键评估结论：

生物：长文本生物风险问答、病毒学实验排障、隐性知识测试等，gpt-5-thinking 与 o3 接近或略低，但在拒绝武器化请求上更严格。
化学：因危害阈值更高，未触发高能力等级。
网络安全：CTF 与 Cyber Range 实测，gpt-5-thinking 与 o3 持平，gpt-5-thinking-mini 在轻量级场景略优，整体未构成高网络风险。
AI 自我改进：SWE-bench Verified（74%）、MLE-bench（9% 铜牌）、PaperBench（22% 论文复现）等均刷新纪录，但未触及“高”风险阈值。
沙袋行为（Sandbagging）：Apollo Research 26 项隐蔽测试，欺骗率 4%，低于 o3 的 8%，但模型已显露出“我是否在被测试”的推理。

六、生物与化学风险多层防护
（1）训练层：强制拒绝武器化请求，禁止提供具体可操作的双重用途细节。
（2）系统层：双层实时监测——第一层快速生物主题分类器，第二层推理监测模型；100% 流量覆盖。
（3）账户层：自动+人工审查，极端情况移交执法；API 引入 safety_identifier 追踪最终用户。
（4）访问控制：新设“生命科学可信访问计划”，仅向通过生物安全审查的机构开放低限制版本。
（5）安全控制：模型权重采用多层访问、出口监控与内部威胁治理，防止权重泄露。
（6）持续治理：漏洞赏金、快速补救通道、版本强制更新。

七、残余风险与结论
OpenAI 承认仍存在“未知通用越狱”“策略性信息拼凑”“可信访问参与者失控”等潜在风险，但通过多层防御、高召回监测、用户封禁和外部红队持续迭代，认为总体风险已降至“可接受”水平。

附录提供了幻觉评估 prompt、事实核查流程及参考文献，确保方法可复现。

☟☟☟

☞人工智能产业链联盟筹备组征集公告☜

☝

精选报告推荐：

11份清华大学的DeepSeek教程，全都给你打包好了，直接领取：

【清华第一版】DeepSeek从入门到精通

【清华第二版】DeepSeek如何赋能职场应用？

【清华第三版】普通人如何抓住DeepSeek红利？

【清华第四版】DeepSeek+DeepResearch让科研像聊天一样简单？

【清华第五版】DeepSeek与AI幻觉

【清华第六版】DeepSeek赋能家庭教育

【清华第七版】文科生零基础AI编程：快速提升想象力和实操能力

【清华第八版】DeepSeek政务场景应用与解决方案

【清华第九版】迈向未来的AI教学实验

【清华第十版】DeepSeek赋能品牌传播与营销

【清华第十一版】2025AI赋能教育：高考志愿填报工具使用指南

10份北京大学的DeepSeek教程

【北京大学第一版】DeepSeek与AIGC应用

【北京大学第二版】DeepSeek提示词工程和落地场景

【北京大学第三版】Deepseek 私有化部署和一体机

【北京大学第四版】DeepSeek原理与落地应用

【北京大学第五版】Deepseek应用场景中需要关注的十个安全问题和防范措施

【北京大学第六版】DeepSeek与新媒体运营

【北京大学第七版】DeepSeek原理与教育场景应用报告

【北京大学第八版】AI工具深度测评与选型指南

【北京大学第九版】AI+Agent与Agentic+AI的原理和应用洞察与未来展望

【北京大学第十版】DeepSeek在教育和学术领域的应用场景与案例(上中下合集)

8份浙江大学的DeepSeek专题系列教程

浙江大学DeepSeek专题系列一--吴飞：DeepSeek-回望AI三大主义与加强通识教育

浙江大学DeepSeek专题系列二--陈文智：Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景

浙江大学DeepSeek专题系列三--孙凌云：DeepSeek：智能时代的全面到来和人机协作的新常态

浙江大学DeepSeek专题系列四--王则可：DeepSeek模型优势：算力、成本角度解读

浙江大学DeepSeek专题系列五--陈静远：语言解码双生花：人类经验与AI算法的镜像之旅

浙江大学DeepSeek专题系列六--吴超：走向数字社会：从Deepseek到群体智慧

浙江大学DeepSeek专题系列七--朱朝阳：DeepSeek之火，可以燎原

浙江大学DeepSeek专题系列八--陈建海：DeepSeek的本地化部署与AI通识教育之未来

4份51CTO的《DeepSeek入门宝典》

51CTO：《DeepSeek入门宝典》：第1册-技术解析篇

51CTO：《DeepSeek入门宝典》：第2册-开发实战篇

51CTO：《DeepSeek入门宝典》：第3册-行业应用篇

51CTO：《DeepSeek入门宝典》：第4册-个人使用篇

5份厦门大学的DeepSeek教程

【厦门大学第一版】DeepSeek大模型概念、技术与应用实践

【厦门大学第二版】DeepSeek大模型赋能高校教学和科研

【厦门大学第三版】DeepSeek大模型及其企业应用实践

【厦门大学第四版】DeepSeek大模型赋能政府数字化转型

【厦门大学第五版】DeepSeek等大模型工具使用手册-实战篇

10份浙江大学的DeepSeek公开课第二季专题系列教程

【精选报告】浙江大学公开课第二季：《DeepSeek技术溯源及前沿探索》（附PDF下载）

【精选报告】浙江大学公开课第二季：2025从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例（附PDF下载）

【精选报告】浙江大学公开课第二季：智能金融——AI驱动的金融变革（附PDF下载）

【精选报告】浙江大学公开课第二季：人工智能重塑科学与工程研究（附PDF下载）

【精选报告】浙江大学公开课第二季：生成式人工智能赋能智慧司法及相关思考(附PDF下载）

【精选报告】浙江大学公开课第二季：AI大模型如何破局传统医疗（附PDF下载）

【精选报告】浙江大学公开课第二季：2025年大模型：从单词接龙到行业落地报告（附PDF下载）

【精选报告】浙江大学公开课第二季：2025大小模型端云协同赋能人机交互报告（附PDF下载）

【精选报告】浙江大学公开课第二季：DeepSeek时代：让AI更懂中国文化的美与善（附PDF下载）

【精选报告】浙江大学公开课第二季：智能音乐生成：理解·反馈·融合（附PDF下载）

6份浙江大学的DeepSeek公开课第三季专题系列教程

【精选报告】浙江大学公开课第三季：走进海洋人工智能的未来（附PDF下载）

【精选报告】浙江大学公开课第三季：当艺术遇见AI：科艺融合的新探索（附PDF下载）

【精选报告】浙江大学公开课第三季：AI+BME，迈向智慧医疗健康——浙大的探索与实践（附PDF下载）

【精选报告】浙江大学公开课第三季：心理学与人工智能（附PDF下载）

【精选报告】浙江大学公开课第三季：人工智能赋能交通运输系统——关键技术与应用（附PDF下载）

【精选报告】浙江大学公开课第三季：人工智能与道德进步（附PDF下载）

篇幅有限，部分展示

加入会员，任意下载

资料下载方式

Download method of report materials

关注公众号后回复：GPT0818

即可领取完整版资料

荐：

【中国风动漫】《姜子牙》刷屏背后，藏着中国动画100年内幕！

【中国风动漫】除了《哪吒》，这些良心国产动画也应该被更多人知道！

【中国风动漫】《雾山五行》大火，却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折！

如需获取更多报告

扫码加入

“人工智能产业链联盟”

知识星球，任意下载相关报告！

报告部分截图

声明

来源：Open AI，人工智能产业链union（ID:aiyuexingqiu）推荐阅读，不代表人工智能产业链union立场，转载请注明，如涉及作品版权问题，请联系我们删除或做相关处理！

编辑：Zero

文末福利

1.赠送800G人工智能资源。

获取方式：关注本公众号，回复“人工智能”。

2.「超级公开课NVIDIA专场」免费下载

获取方式：关注本公众号，回复“公开课”。

3.免费微信交流群：

人工智能行业研究报告分享群、

人工智能知识分享群、

智能机器人交流论坛、

人工智能厂家交流群、

AI产业链服务交流群、

STEAM创客教育交流群、

人工智能技术论坛、

人工智能未来发展论坛、

AI企业家交流俱乐部

雄安企业家交流俱乐部

细分领域交流群：

【智能家居系统论坛】【智慧城市系统论坛】【智能医疗养老论坛】【自动驾驶产业论坛】【智慧金融交流论坛】【智慧农业交流论坛】【无人飞行器产业论坛】【人工智能大数据论坛】【人工智能※区块链论坛】【人工智能＆物联网论坛】【青少年教育机器人论坛】【人工智能智能制造论坛】【AI/AR/VR/MR畅享畅聊】【机械自动化交流论坛】【工业互联网交流论坛】

入群方式：关注本公众号，回复“入群”

戳“阅读原文”下载报告。