比 GPT-5 更值得关注的，是 OpenAI 对系统的重新思考｜奥特曼想让 AI 更无感也更强大

“
编者按：本文提出了一个发人深省的观点：当技术本身足够强大，真正的瓶颈已不再是模型，而是我们人类的想象力、领导力与决策智慧。
希望这篇文章能带给你一份超越技术喧嚣的冷静思考，启发你将目光从外部的工具转向内在的自我。

如果你觉得 OpenAI 的最新发布平平无奇，那你就没抓住重点

作者：CASSIE KOZYRKOV

日期：2025 年 8 月 13 日

上周，GPT-5 终于来了。而就在两天前，OpenAI 刚刚发布了它迄今最强的开放权重模型，名为 gpt-oss。

短短一周，信息量巨大。

如果你曾被市场宣传吊足了胃口，那么 GPT-5 的登场，可能让你觉得雷声大雨点小。

还记得吗？2023 年 3 月 GPT-4 的发布，相比 GPT-3 实现了惊人飞跃，全世界的 CEO 都为此紧急调整日程，召开战略会议。

一晃十八个月过去，GPT-5 的进步相比之下，只能算是迈出了一小步。没有全球性的惊叹，也没有人手忙脚乱地改日程。

这并非因为 GPT-5 能力不强。相反，它在很多方面都相当厉害，尤其是在代码生成和长上下文推理上。

资讯配图

可惜，幸福的公式是「现实 - 期望」。

如果你期待一场革命，却只看到一次演进，你很可能会和大家一样，抱怨这次发布是场混乱，而非奇迹。

现实介于两者之间，但其中已蕴含了大量昭示未来的线索。

系统 vs. 模型

在个性和日常任务表现上，我几乎看不出差别。

如果非要说，我会感觉它的回应更凝练，信息密度更高，那些甜得发腻的客套话也少了。

但尽管 OpenAI 宣称幻觉已大幅减少，想让 GPT-5 自信地胡说八道，也并非难事。

最扑面而来的更新在于用户体验，它将 OpenAI 旗下繁杂的模型统一成一个旗舰产品。

现在，一切都是 GPT-5。

虽然我们习惯用模型来称呼 GPT-4o 这类产品，但这些商业大语言模型，其内核一直都是集成了各种复杂功能的多模型、多模态系统。

今天的不同在于，GPT-5 让这一点变得再也无法忽视。它会自动为你的请求分配处理模式，这早已不是秘密：

思考模式 处理复杂、耗费资源的推理任务，给出更精妙的回应。
快速模式 处理简单、资源消耗低的任务，给出更快捷的答案。

在每种模式之下，都可能是一个像意大利面一样盘根错节的复杂系统，交织着各种嵌套模型、验证逻辑和其他代码。

我们最好现在就开始习惯说系统，而不是模型。

告别模型选择

通过自动分配请求模式，OpenAI 节约了计算成本，用户也省去了在模型设置中纠结的烦恼。

大多数用户会对这门模型选择艺术的消亡乐见其成，但高级用户已经开始抱怨了——就像每次产品更新对普通用户更友好时，他们都会做的那样。

如果你抱怨是因为软件的向后兼容性问题，我深表同情。

但如果你是那种提示词工程师，过去的工作有一半都依赖于这门正在消亡的艺术，那你一定明白，这终究只是一项过渡技能。

他们想打动谁？

由于 GPT-5 对所有人开放，免费用户可能会觉得自己捡到了宝——想想他们当初对 DeepSeek 有多惊艳就知道了。

但对于我们这些付费用户来说，实在很难找到什么值得夸耀的地方。我们这群人，可没那么好打动。

它的惊艳之处在哪？是上下文窗口吗？API 版增长到 40 万，界面版增长到 25.6 万，确实比 GPT-4o 的 12.8 万要高。

但这并不足以撼动谷歌 Gemini 的 100 万上下文窗口的领先地位。

真正的看点在于 OpenAI 降价的力度。个人用户或许感觉不深，但企业用户绝对会注意到。

在三大供应商里，Anthropic 的 Claude 最贵，谷歌的 Gemini 最便宜——等等，情况变了。

有了 GPT-5，Gemini 迎来了一位价格上的新对手。看，竞争多美好。

资讯配图

但对个人而言，这依然不够惊艳。这也再次提醒企业领导者，个人感受和企业应用是两码事。

规模化，确实让个人 AI 和企业 AI 变成了两种截然不同的游戏。

代码与感觉式编程

看一眼价格表就知道，Anthropic 的模型有多贵。在 Claude 还是无可争议的编码之王时，这价格还算公道。

现在，Claude 面临 GPT-5 的真正威胁。GPT-5 在复杂编码任务上的基准测试表现非常出色，并已成为开发环境 Cursor 的默认模型。

我甚至猜测，OpenAI 当前的首要任务就是开发者用例，比如代码生成和工具调用。

GPT-5 似乎特别为单次提示而优化，也就是一次性给出指令，无需反复沟通就能完成任务。

因此，可以预见「感觉式编程」即将迎来爆发。所谓感觉式编程，就是非专业人士抛出一个模糊的想法，让 AI 自己去发挥和创造原型。

如果你觉得这种玩法已经很流行了，等着瞧吧，它还会更火。

视频里有些例子确实亮眼，但也要想到，这其中有不少是精心挑选的结果。

最好的方法，还是用你自己的例子去亲手试试。

口袋里的博士专家？

“
Sam Altman 说：GPT-5 第一次让我感觉像在和任何领域的专家对话，一位博士级的专家。

请注意，这句话里充满了感觉。

不要从字面上理解，以为你口袋里真有了一群可信的博士专家。没有任何模型能在所有领域都达到博士级的推理水平。

而且，任何博士生，如果你不提供正确的背景信息，也给不出好建议。

如果模型缺乏坚实的事实基础，它可能会自信地执行错误的流程。没有高水平的领导者把关，在企业中大规模应用 GPT-5，就是一场过度信任引发的灾难。

所以，请务必保持清醒，无论系统自称多智能，只要它的运行环境有任何变动，都要进行彻底的测试。

工具使用 + 感觉式编程 = 个性化微应用

在博士级的数学和科学能力上，GPT-5 的进步是渐进的。更有趣的是，我们看到它取得成果的两种方式：使用工具，和不使用工具。

工具使用是智能体 AI范式的核心，它能带来最大的性能飞跃。

资讯配图

这再次暗示我们，未来不属于最聪明的独立模型，而属于那些能与其它软件和人类协作的 AI 系统。

在这样的系统里，人类懂得如何正确地引导 AI，使其融入整个决策流程。

当感觉式编程与 AI 系统的工具调用相结合，便催生了即生即灭的个性化微应用。

这些微应用是为超特定任务而生的微型 AI 智能体，启动迅速，体验精致，用完即弃。

听起来像个梦？对消费者和爱好者来说确实如此。但对企业管理者和安全专家而言，这更像一场正在酝酿的混乱。

这又是一个规模化打破美好的例子。无论你爱或恨，微应用模式都在崛起，最终你的整个在线体验都可能被按需定制。

领导者们，瓶颈就是你们

如果所有这些进步让你觉得 AI 的发展进入了平台期，那是因为你看错了地方。

你该看的地方，是一面镜子。

AI 圈里有人说，模型时代结束了，产品时代到来了。他们没说错，但这还不是最终的结论。

“
真正的结论是：领导力的时代已经到来。

当技术变得如此强大和廉价，以至于新产品都无法再让人惊艳时，新的疆域，便在于你如何运用它。

这意味着，真正的瓶颈变成了决策智能：定义愿景、设立目标、构建系统、确保治理。

做好准备吧，未来的瓶颈，就是你和你的想象力。

说真的，这其实是一个无比美妙的挑战。

原文地址：https://substack.com/inbox/post/170782048

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！