从 DeepSeek-R1 到OpenAI gpt-oss,开源背后,是中美AI罕见正和博弈

智能情报所 2025-08-06 15:06

编者按:OpenAI 携 gpt-oss 重磅回归开源,这一标志性事件背后,能看到DeepSeek的深刻影响。翻译此文,是希望通过剖析这场罕见的正和竞争,启发读者思考。文末附原文地址。

作者:KEVIN XU

2025年8月6日


OpenAI,终于对得起它名字中的“Open”了。

就在今天,这家美国人工智能巨头发布了其备受期待的开源权重模型:gpt-oss。

早在六个月前,其首席执行官萨姆·奥特曼就在 Reddit 的「问我任何事」活动中预告了此事。他当时直言,OpenAI 不开源模型的行为,是站在了历史错误的一边

资讯配图

确实,在 ChatGPT 横空出世之前,OpenAI 曾频繁地开源其模型与研究,那时的它,更配得上开放之名。

OpenAI 能重回开源轨道,本身就是一个值得欢迎的信号。

但有趣的是,gpt-oss 这款推理模型的开源方式,与 DeepSeek-R1 可以说是如出一辙。

正是 DeepSeek-R1 为 gpt-oss 铺平了道路。没有前者的探索,就不会有后者如今的呈现方式。

一脉相承的开放路径

两款模型的开源方式有着诸多惊人的相似之处,让人不禁看到一种清晰的传承脉络。

首先,是毫无保留的宽松许可。

gpt-oss 采用了 Apache 2.0 许可证,而 DeepSeek-R1 则使用了同样宽松的 MIT 许可证。这意味着,任何人几乎可以不受限制地使用它们。

作为对比,阿里的通义千问模型也采用了 Apache 2.0 许可;而 Meta 的 Llama 模型则带有附加条款,其应用产品的月活跃用户一旦超过 7 亿,就必须申请商业许可。

简而言之,gpt-oss 和 DeepSeek-R1 一样,是真正纯粹的开源软件,没有任何附加的企业限制。

其次,是彻底透明的思维过程。

两款模型都选择完全公开其思维链(CoT)——即模型在得出答案前的完整内部推理过程。

这在业界是一项重大举措。尽管 OpenAI 最早推出了推理模型 o1,但 DeepSeek-R1 才是第一个彻底开放思维链的模型,并因此瞬间赢得了用户的青睐。

无论在何种场景下,展示完整的思考过程都能迅速与用户建立信任。这是 DeepSeek-R1 带来的一项意义深远、却又未被充分讨论的用户体验革新。

起初,OpenAI 等美国实验室并不愿意公开思维链,他们视其为核心知识产权和宝贵的数据,担心被竞争对手通过蒸馏技术利用。

在 DeepSeek 引爆全球开源市场的时候,OpenAI 还曾指责其窃取模型能力,但最终不了了之。

后来,行业风向转变,AI 智能体成为价值创造的主流。智能体需要自主完成复杂的多步任务,因此,展示每一步行动以获取用户信任,变得至关重要。

正因如此,被誉为专为智能体任务设计的 gpt-oss,也几乎必须像 DeepSeek-R1 一样,展示其完整的思维链。

第三,是超越模型本身的工具生态。

两者的开放性不仅限于模型本身,还延伸到了周边的关键工具。

OpenAI 开源了其模型训练所用的分词器 o200k_harmony。DeepSeek 此前也开源了自己的分词器,以及一系列开发库和工具。

开源工具至关重要,它能帮助开发者社区学习、复现、定制和优化模型训练的全流程,从而大幅提升工程效率、降低成本。

当然,在工具开放的彻底性上,DeepSeek 仍领先一步。但 OpenAI 此举已明确表明,它决心在开源世界展开全方位竞争,而不仅是模型本身。

最后,连宣传的套路都如出一辙。

更有趣的是,两款模型在宣传上打马虎眼的方式都惊人地相似。

gpt-oss 的模型卡片声称,其 1200 亿参数的大版本仅用了 210 万 H100 GPU 小时来训练。这几乎可以肯定是误导性的,因为它忽略了最终训练运行前投入的海量准备工作和资源。

这种误导,与 DeepSeek 当初声称仅用 266 万 H800 GPU 小时训练 R1 的做法如出一辙——当时那则消息曾让英伟达股价单日暴跌 17%。

资讯配图

我们越是竞争,就越是相像。

请来更多这样的正和竞争

关于性能,我会等待 Artificial Analysis 和 LMArena 等独立基准测试平台的评估结果再做评判。

但事件背后更宏大、更深刻的叙事,远非一两个基准测试所能涵盖。

(更新:Artificial Analysis 的后续评测显示,gpt-oss-120b 是美国最强的开源模型,但在智能程度上仍稍逊于 DeepSeek-R1 和通义千问3 235B,其主要优势在于效率。)

毫无疑问,DeepSeek 的出现,切实地推动了 OpenAI 走向更彻底的开放——这是 Llama 都未曾做到的。

gpt-oss 中有 DeepSeek-R1 的影子,这并非坏事。

这恰恰是开源精神的完美体现:前人栽树,后人乘凉,在良性的正和循环中不断累积、共同进步。

这堪称中美技术竞争中一个罕见——甚至可能是唯一——的正和博弈案例。

一个国家的创新成果,催化了另一个国家的同类创新,其最终受益者不仅是两国,更是全球整个科技行业。就我个人而言,我由衷欢迎这样的竞争。

长久以来,太多的中美技术竞争都聚焦于从对方手中夺走什么:知识产权、芯片、半导体设备、稀土……不胜枚举。

尽管部分限制源于合理的国家安全考量,但这种不断升级的、时常盲目的零和思维,最终导致了一个怪圈:

赢得胜利的不是最顶尖、最有竞争力的技术,而是最能煽动恐惧、制造不确定性和怀疑论调的声音。

让最好的开放技术胜出,而不是最骇人听闻的恐慌

当梁文锋和萨姆·奥特曼能够在开放的舞台上,为全球所有开发者公平竞争时,整个世界都将因此受益。

p.s. 这篇文章是由 gpt-oss 通过在我的笔记本电脑上进行本地部署进行校对的。

资讯配图

原文地址:https://substack.com/inbox/post/170218355


一键三连点赞」「转发」「小心心

欢迎在评论区留下你的想法!


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 开源
more
汽车早餐 | 华为宣布CANN全面开源开放;上半年全球新能源汽车电池使用量同比增长37.3%;吉利回应智驾团队调整
具身智能本周“全面进击”:IPO、收购、开源、人才流动
6小时复刻AI IMO金牌成果,蚂蚁多智能体新进展已开源
对话阶跃姜大昕:首次开源基座模型,回顾创业两年半
刚刚,OpenAI开源2个推理模型:笔记本/手机就能跑,性能接近o4-mini
【AI】科学能力太强,这个多模态推理「六边形战士」被严重低估!Intern-S1开源登顶
华为宣布 CANN 全面开源开放,共建昇腾生态
对标CUDA,华为全面开源CANN
科研写作神器,超越Mathpix的科学公式提取工具已开源
【AI】扣子开源全家桶,Apache2.0加持,AIAgent又一次卷到起飞
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号