“编者按:本文提出了一个发人深省的观点:当技术本身足够强大,真正的瓶颈已不再是模型,而是我们人类的想象力、领导力与决策智慧。
希望这篇文章能带给你一份超越技术喧嚣的冷静思考,启发你将目光从外部的工具转向内在的自我。
如果你觉得 OpenAI 的最新发布平平无奇,那你就没抓住重点
作者:CASSIE KOZYRKOV
日期:2025 年 8 月 13 日
上周,GPT-5 终于来了。而就在两天前,OpenAI 刚刚发布了它迄今最强的开放权重模型,名为 gpt-oss
。
短短一周,信息量巨大。
如果你曾被市场宣传吊足了胃口,那么 GPT-5 的登场,可能让你觉得雷声大雨点小。
还记得吗?2023 年 3 月 GPT-4 的发布,相比 GPT-3 实现了惊人飞跃,全世界的 CEO 都为此紧急调整日程,召开战略会议。
一晃十八个月过去,GPT-5 的进步相比之下,只能算是迈出了一小步。没有全球性的惊叹,也没有人手忙脚乱地改日程。
这并非因为 GPT-5 能力不强。相反,它在很多方面都相当厉害,尤其是在代码生成和长上下文推理上。
可惜,幸福的公式是「现实 - 期望」。
如果你期待一场革命,却只看到一次演进,你很可能会和大家一样,抱怨这次发布是场混乱,而非奇迹。
现实介于两者之间,但其中已蕴含了大量昭示未来的线索。
系统 vs. 模型
在个性和日常任务表现上,我几乎看不出差别。
如果非要说,我会感觉它的回应更凝练,信息密度更高,那些甜得发腻的客套话也少了。
但尽管 OpenAI 宣称幻觉已大幅减少,想让 GPT-5 自信地胡说八道,也并非难事。
最扑面而来的更新在于用户体验,它将 OpenAI 旗下繁杂的模型统一成一个旗舰产品。
现在,一切都是 GPT-5。
虽然我们习惯用模型来称呼 GPT-4o 这类产品,但这些商业大语言模型,其内核一直都是集成了各种复杂功能的多模型、多模态系统。
今天的不同在于,GPT-5 让这一点变得再也无法忽视。它会自动为你的请求分配处理模式,这早已不是秘密:
思考模式 处理复杂、耗费资源的推理任务,给出更精妙的回应。 快速模式 处理简单、资源消耗低的任务,给出更快捷的答案。
在每种模式之下,都可能是一个像意大利面一样盘根错节的复杂系统,交织着各种嵌套模型、验证逻辑和其他代码。
我们最好现在就开始习惯说系统,而不是模型。
告别模型选择
通过自动分配请求模式,OpenAI 节约了计算成本,用户也省去了在模型设置中纠结的烦恼。
大多数用户会对这门模型选择艺术的消亡乐见其成,但高级用户已经开始抱怨了——就像每次产品更新对普通用户更友好时,他们都会做的那样。
如果你抱怨是因为软件的向后兼容性问题,我深表同情。
但如果你是那种提示词工程师,过去的工作有一半都依赖于这门正在消亡的艺术,那你一定明白,这终究只是一项过渡技能。
他们想打动谁?
由于 GPT-5 对所有人开放,免费用户可能会觉得自己捡到了宝——想想他们当初对 DeepSeek 有多惊艳就知道了。
但对于我们这些付费用户来说,实在很难找到什么值得夸耀的地方。我们这群人,可没那么好打动。
它的惊艳之处在哪?是上下文窗口吗?API 版增长到 40 万,界面版增长到 25.6 万,确实比 GPT-4o 的 12.8 万要高。
但这并不足以撼动谷歌 Gemini 的 100 万上下文窗口的领先地位。
真正的看点在于 OpenAI 降价的力度。个人用户或许感觉不深,但企业用户绝对会注意到。
在三大供应商里,Anthropic 的 Claude 最贵,谷歌的 Gemini 最便宜——等等,情况变了。
有了 GPT-5,Gemini 迎来了一位价格上的新对手。看,竞争多美好。
但对个人而言,这依然不够惊艳。这也再次提醒企业领导者,个人感受和企业应用是两码事。
规模化,确实让个人 AI 和企业 AI 变成了两种截然不同的游戏。
代码与感觉式编程
看一眼价格表就知道,Anthropic 的模型有多贵。在 Claude 还是无可争议的编码之王时,这价格还算公道。
现在,Claude 面临 GPT-5 的真正威胁。GPT-5 在复杂编码任务上的基准测试表现非常出色,并已成为开发环境 Cursor 的默认模型。
我甚至猜测,OpenAI 当前的首要任务就是开发者用例,比如代码生成和工具调用。
GPT-5 似乎特别为单次提示而优化,也就是一次性给出指令,无需反复沟通就能完成任务。
因此,可以预见「感觉式编程」即将迎来爆发。所谓感觉式编程,就是非专业人士抛出一个模糊的想法,让 AI 自己去发挥和创造原型。
如果你觉得这种玩法已经很流行了,等着瞧吧,它还会更火。
视频里有些例子确实亮眼,但也要想到,这其中有不少是精心挑选的结果。
最好的方法,还是用你自己的例子去亲手试试。
口袋里的博士专家?
“Sam Altman 说:GPT-5 第一次让我感觉像在和任何领域的专家对话,一位博士级的专家。
请注意,这句话里充满了感觉。
不要从字面上理解,以为你口袋里真有了一群可信的博士专家。没有任何模型能在所有领域都达到博士级的推理水平。
而且,任何博士生,如果你不提供正确的背景信息,也给不出好建议。
如果模型缺乏坚实的事实基础,它可能会自信地执行错误的流程。没有高水平的领导者把关,在企业中大规模应用 GPT-5,就是一场过度信任引发的灾难。
所以,请务必保持清醒,无论系统自称多智能,只要它的运行环境有任何变动,都要进行彻底的测试。
工具使用 + 感觉式编程 = 个性化微应用
在博士级的数学和科学能力上,GPT-5 的进步是渐进的。更有趣的是,我们看到它取得成果的两种方式:使用工具,和不使用工具。
工具使用是智能体 AI范式的核心,它能带来最大的性能飞跃。
这再次暗示我们,未来不属于最聪明的独立模型,而属于那些能与其它软件和人类协作的 AI 系统。
在这样的系统里,人类懂得如何正确地引导 AI,使其融入整个决策流程。
当感觉式编程与 AI 系统的工具调用相结合,便催生了即生即灭的个性化微应用。
这些微应用是为超特定任务而生的微型 AI 智能体,启动迅速,体验精致,用完即弃。
听起来像个梦?对消费者和爱好者来说确实如此。但对企业管理者和安全专家而言,这更像一场正在酝酿的混乱。
这又是一个规模化打破美好的例子。无论你爱或恨,微应用模式都在崛起,最终你的整个在线体验都可能被按需定制。
领导者们,瓶颈就是你们
如果所有这些进步让你觉得 AI 的发展进入了平台期,那是因为你看错了地方。
你该看的地方,是一面镜子。
AI 圈里有人说,模型时代结束了,产品时代到来了。他们没说错,但这还不是最终的结论。
“真正的结论是:领导力的时代已经到来。
当技术变得如此强大和廉价,以至于新产品都无法再让人惊艳时,新的疆域,便在于你如何运用它。
这意味着,真正的瓶颈变成了决策智能:定义愿景、设立目标、构建系统、确保治理。
做好准备吧,未来的瓶颈,就是你和你的想象力。
说真的,这其实是一个无比美妙的挑战。
原文地址:https://substack.com/inbox/post/170782048
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!