比 GPT-5 更值得关注的,是 OpenAI 对系统的重新思考|奥特曼想让 AI 更无感也更强大

智能情报所 2025-08-14 17:03

编者按:本文提出了一个发人深省的观点:当技术本身足够强大,真正的瓶颈已不再是模型,而是我们人类的想象力、领导力与决策智慧。

希望这篇文章能带给你一份超越技术喧嚣的冷静思考,启发你将目光从外部的工具转向内在的自我。

如果你觉得 OpenAI 的最新发布平平无奇,那你就没抓住重点

作者:CASSIE KOZYRKOV

日期:2025 年 8 月 13 日


上周,GPT-5 终于来了。而就在两天前,OpenAI 刚刚发布了它迄今最强的开放权重模型,名为 gpt-oss

短短一周,信息量巨大。

如果你曾被市场宣传吊足了胃口,那么 GPT-5 的登场,可能让你觉得雷声大雨点小。

还记得吗?2023 年 3 月 GPT-4 的发布,相比 GPT-3 实现了惊人飞跃,全世界的 CEO 都为此紧急调整日程,召开战略会议。

一晃十八个月过去,GPT-5 的进步相比之下,只能算是迈出了一小步。没有全球性的惊叹,也没有人手忙脚乱地改日程。

这并非因为 GPT-5 能力不强。相反,它在很多方面都相当厉害,尤其是在代码生成和长上下文推理上。

资讯配图

可惜,幸福的公式是「现实 - 期望」。

如果你期待一场革命,却只看到一次演进,你很可能会和大家一样,抱怨这次发布是场混乱,而非奇迹。

现实介于两者之间,但其中已蕴含了大量昭示未来的线索。

系统 vs. 模型

在个性和日常任务表现上,我几乎看不出差别。

如果非要说,我会感觉它的回应更凝练,信息密度更高,那些甜得发腻的客套话也少了。

但尽管 OpenAI 宣称幻觉已大幅减少,想让 GPT-5 自信地胡说八道,也并非难事。

最扑面而来的更新在于用户体验,它将 OpenAI 旗下繁杂的模型统一成一个旗舰产品。

现在,一切都是 GPT-5。

虽然我们习惯用模型来称呼 GPT-4o 这类产品,但这些商业大语言模型,其内核一直都是集成了各种复杂功能的多模型、多模态系统。

今天的不同在于,GPT-5 让这一点变得再也无法忽视。它会自动为你的请求分配处理模式,这早已不是秘密:

  • 思考模式 处理复杂、耗费资源的推理任务,给出更精妙的回应。
  • 快速模式 处理简单、资源消耗低的任务,给出更快捷的答案。

在每种模式之下,都可能是一个像意大利面一样盘根错节的复杂系统,交织着各种嵌套模型、验证逻辑和其他代码。

我们最好现在就开始习惯说系统,而不是模型。

告别模型选择

通过自动分配请求模式,OpenAI 节约了计算成本,用户也省去了在模型设置中纠结的烦恼。

大多数用户会对这门模型选择艺术的消亡乐见其成,但高级用户已经开始抱怨了——就像每次产品更新对普通用户更友好时,他们都会做的那样。

如果你抱怨是因为软件的向后兼容性问题,我深表同情。

但如果你是那种提示词工程师,过去的工作有一半都依赖于这门正在消亡的艺术,那你一定明白,这终究只是一项过渡技能。

他们想打动谁?

由于 GPT-5 对所有人开放,免费用户可能会觉得自己捡到了宝——想想他们当初对 DeepSeek 有多惊艳就知道了。

但对于我们这些付费用户来说,实在很难找到什么值得夸耀的地方。我们这群人,可没那么好打动。

它的惊艳之处在哪?是上下文窗口吗?API 版增长到 40 万,界面版增长到 25.6 万,确实比 GPT-4o 的 12.8 万要高。

但这并不足以撼动谷歌 Gemini 的 100 万上下文窗口的领先地位。

真正的看点在于 OpenAI 降价的力度。个人用户或许感觉不深,但企业用户绝对会注意到。

在三大供应商里,Anthropic 的 Claude 最贵,谷歌的 Gemini 最便宜——等等,情况变了。

有了 GPT-5,Gemini 迎来了一位价格上的新对手。看,竞争多美好。

资讯配图

但对个人而言,这依然不够惊艳。这也再次提醒企业领导者,个人感受和企业应用是两码事。

规模化,确实让个人 AI 和企业 AI 变成了两种截然不同的游戏。

代码与感觉式编程

看一眼价格表就知道,Anthropic 的模型有多贵。在 Claude 还是无可争议的编码之王时,这价格还算公道。

现在,Claude 面临 GPT-5 的真正威胁。GPT-5 在复杂编码任务上的基准测试表现非常出色,并已成为开发环境 Cursor 的默认模型。

我甚至猜测,OpenAI 当前的首要任务就是开发者用例,比如代码生成和工具调用。

GPT-5 似乎特别为单次提示而优化,也就是一次性给出指令,无需反复沟通就能完成任务。

因此,可以预见「感觉式编程」即将迎来爆发。所谓感觉式编程,就是非专业人士抛出一个模糊的想法,让 AI 自己去发挥和创造原型。

如果你觉得这种玩法已经很流行了,等着瞧吧,它还会更火。

视频里有些例子确实亮眼,但也要想到,这其中有不少是精心挑选的结果。

最好的方法,还是用你自己的例子去亲手试试。

口袋里的博士专家?

Sam Altman 说:GPT-5 第一次让我感觉像在和任何领域的专家对话,一位博士级的专家。

请注意,这句话里充满了感觉。

不要从字面上理解,以为你口袋里真有了一群可信的博士专家。没有任何模型能在所有领域都达到博士级的推理水平。

而且,任何博士生,如果你不提供正确的背景信息,也给不出好建议。

如果模型缺乏坚实的事实基础,它可能会自信地执行错误的流程。没有高水平的领导者把关,在企业中大规模应用 GPT-5,就是一场过度信任引发的灾难。

所以,请务必保持清醒,无论系统自称多智能,只要它的运行环境有任何变动,都要进行彻底的测试。

工具使用 + 感觉式编程 = 个性化微应用

在博士级的数学和科学能力上,GPT-5 的进步是渐进的。更有趣的是,我们看到它取得成果的两种方式:使用工具,和不使用工具。

工具使用是智能体 AI范式的核心,它能带来最大的性能飞跃。

资讯配图

这再次暗示我们,未来不属于最聪明的独立模型,而属于那些能与其它软件和人类协作的 AI 系统。

在这样的系统里,人类懂得如何正确地引导 AI,使其融入整个决策流程。

当感觉式编程与 AI 系统的工具调用相结合,便催生了即生即灭的个性化微应用。

这些微应用是为超特定任务而生的微型 AI 智能体,启动迅速,体验精致,用完即弃。

听起来像个梦?对消费者和爱好者来说确实如此。但对企业管理者和安全专家而言,这更像一场正在酝酿的混乱。

这又是一个规模化打破美好的例子。无论你爱或恨,微应用模式都在崛起,最终你的整个在线体验都可能被按需定制。

领导者们,瓶颈就是你们

如果所有这些进步让你觉得 AI 的发展进入了平台期,那是因为你看错了地方。

你该看的地方,是一面镜子。

AI 圈里有人说,模型时代结束了,产品时代到来了。他们没说错,但这还不是最终的结论。

真正的结论是:领导力的时代已经到来。

当技术变得如此强大和廉价,以至于新产品都无法再让人惊艳时,新的疆域,便在于你如何运用它。

这意味着,真正的瓶颈变成了决策智能:定义愿景、设立目标、构建系统、确保治理

做好准备吧,未来的瓶颈,就是你和你的想象力。

说真的,这其实是一个无比美妙的挑战。

原文地址:https://substack.com/inbox/post/170782048


一键三连点赞」「转发」「小心心

欢迎在评论区留下你的想法!


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
马斯克xAI联合创始人离职
ChatGPT会让大脑退化?OpenAI高管用它救下自己「读写障碍」的女儿
AI笔记又进化了!智能体“入驻”,标签、导图、清单都能自动生成
高德如何造出全球首个地图 AI ?
GPT-4o替代爹味GPT-5!奥特曼光速滑跪,OpenAI连夜回滚「赛博舔狗」
从原理到应用,AI Agent的入门指南
苹果 AI 机器人全家桶曝光:居然有个会撒娇卖萌的「闺蜜机」?
苹果 AI 机器人全家桶曝光:会演戏的「皮克斯台灯」,服务全家人的「监控摄像头」
本地也能玩转AI图片创作?腾讯3B开源模型实测:精准又轻便,统一生成理解,手把手教你部署
相AI相生,共赴未来!《2025中国·AI盛典》今日播出
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号