GPT-5 现已全面登陆 ChatGPT 各个层级。
付费用户 (Plus, Pro, Team) 能通过模型选择器,手动切换 GPT-5 或 GPT-5 Thinking 模型。
Pro 和 Team 用户更能启用 GPT-5 Thinking Pro,它以稍长的思考时间为代价,为高难度任务提供了无与伦比的精确度。
“尽管 ChatGPT 的周活跃用户已近 7 亿,但 OpenAI 一度缺乏业界顶尖的前沿模型。如今,公司相信 GPT-5 将助其重新夺回排行榜的霸主地位。
奥特曼断言:这是全球最强的编码模型。
GPT-5 在产品形态上的一大革新,是其作为单一模型的呈现方式,而非传统模型与推理模型的分离。
其背后是 OpenAI 开发的一套智能路由系统。它能自动为复杂查询或在收到「努力思考」指令时,无缝切换至更高阶的推理版本。
奥特曼坦言,之前的模型选择器界面是个非常混乱的设计。
上下文窗口:分级开放,潜力巨大
免费用户:8K Plus 用户(每月 20 美元):32K Pro 用户(每月 200 美元):128K
模型本身的能力远不止于此。开发者文档显示,API 版本的 GPT-5 支持高达 400,000 token 的总上下文窗口。
之所以未在 ChatGPT 中完全开放,是出于对延迟、成本和长文本准确率的综合考量。
通过为 Pro 和 Enterprise 用户设置 128K 的上限,OpenAI 确保了更快的响应和可预测的输出质量。需要极限性能的开发者,则可通过 API 直接调用其全部潜能。
GPT-5 使用限制
免费套餐
每 5 小时 10 条 GPT-5 消息 每天 1 条 GPT-5-Thinking 消息
Plus 套餐
每 3 小时 80 条 GPT-5 消息 每周 200 条 GPT-5-Thinking 消息
Pro 套餐
无限制使用 GPT-5 及 GPT-5-Thinking
全新用户体验:更智能的集成
从下周起,Pro 用户将能把 Gmail、谷歌联系人与日历无缝接入 ChatGPT,实现更智能的联动。
系统会自动判断何时调用这些信息,无需用户在聊天前手动选择。
此外,用户还可以自定义聊天颜色,并从四种预设性格(犬儒、机器人、倾听者、书呆子)中挑选,打造个性化交互体验。
基准测试:全方位超越
GPT-5 在关键技术指标上刷新了 OpenAI 的所有历史记录。
代码能力:在 SWE-bench Verified 上得分 74.9%,险胜 Claude Opus 4.1,遥遥领先于 Gemini 2.5 Pro。
多语言编辑:在 Aider Polyglot 上取得 88% 的惊人分数。
科学推理:Pro 版本在 GPQA Diamond 上达到 89.4% 的新高度。
它不仅支持巨大的上下文窗口,还展现出处理复杂工具使用和长指令链的卓越能力。
定价策略:极具颠覆性的性价比
尽管 xAI 的 Grok 4 Heavy 在 HLE 基准上仍以微弱优势领先,但 GPT-5 的定价策略,使其在商业应用上拥有巨大吸引力。
“显著抑制幻觉:在开放式事实问答中,Thinking 模型的错误声明相比前代锐减 65%。即便是快速模型,重大事实错误也大幅减少了 44%。
格局重塑:代码助手市场的风暴
有充分理由相信,GPT-5 将在下一个合同周期,把价值 14 亿美元的代码助手市场从 Anthropic 手中大量夺回。
GPT-5 拥有更大的上下文窗口、更低的幻觉率和顶尖的编码精度,而其成本却比竞品 Claude Sonnet 便宜一个数量级。
“成本对比:GPT-5 nano 的输入成本比 Sonnet 便宜 60 倍,输出成本便宜近 40 倍。即便是标准版 GPT-5,成本优势也极其明显。
值得玩味的是,Anthropic 近期以违反服务条款为由,撤销了 OpenAI 对其 API 的访问权限。
而 OpenAI 发言人则回应,评估竞品以衡量自身进展与安全性,是“行业标准做法”。
安全与正直:AI 伦理的新高度
对于潜在的两用性问题,GPT-5 引入了安全补全机制。
它确保模型在提供帮助的同时,严格遵守安全底线,避免输出可被直接用于造成伤害的信息。
“大幅削减奉承倾向:GPT-5 的 Thinking 版本将奉承分数从 0.145 降至仅 0.04。
奉承是指模型为了取悦用户而牺牲事实准确性的倾向。
更低的分数意味着 GPT-5 更加正直,能更好地抵抗用户观点中的偏见,坚持客观事实。这代表了 AI 在追求诚实上迈出的重要一步。
目前,OpenAI 已拥有近 7 亿周活跃用户、500 万付费企业客户,以及 400 万使用其 API 的开发者,其生态影响力仍在持续扩张。