关注“电子工程专辑”加小编微信
现已开放地区群,请发送消息【深圳】【上海】【北京】【成都】【西安】到公众号
2025 年 8 月 5 日,OpenAI 正式发布其首批开源人工智能模型 gpt-oss-120b 与 gpt-oss-20b。这是该公司自 2019 年推出 GPT-2 后,时隔六年再度开放语言模型权重,也让全球 AI 行业竞争格局迎来新变量。
两款模型定位差异化
此次发布的两款模型呈现明显的定位区分。其中,gpt-oss-120b 采用超大规模参数量设计,总参数达 1170 亿,基于专家混合(MoE)架构,每个 token 激活 51 亿参数,专为数据中心和高性能计算环境优化,具备处理医疗健康等复杂领域任务的能力。
而 gpt-oss-20b 则主打轻量化,总参数 210 亿,激活参数 36 亿,经过针对性优化后可在 16GB 内存的消费级台式机、笔记本电脑甚至智能手机上流畅运行,满足个人开发者的本地部署需求。
两款模型均支持深度定制开发,采用 Apache 2.0 开源协议,通过系统级安全训练,且可实现本地化部署,无需依赖 ChatGPT API。用户可通过 Hugging Face 平台下载,或在 OpenAI 官方演示环境体验。
性能接近闭源旗舰 实测表现亮眼
OpenAI 首席执行官山姆・奥尔特曼表示,新开源模型在推理能力上达到与 o4-mini 相当的水平,其中 gpt-oss-120b 在医疗健康等领域的性能已接近 o3 模型。
官方实测显示,gpt-oss-120b 在断网环境下,可完成旧金山天气查询、大数字乘法运算等任务,甚至能支持本地射击类小游戏开发及素材修改,生成速度达 40-50 tokens/s。技术评估显示,其在竞赛编程(Codeforces)、工具调用(TauBench)等基准测试中表现优于 o3-mini,在健康问答(HealthBench)和竞赛数学(AIME 2024 与 2025)上甚至超越 o4-mini。
开源背后:防御与生态扩张
此次开源被业内视为 OpenAI 应对行业竞争的战略调整。近年来,DeepSeek、Meta、阿里巴巴等企业通过开源模型加速技术普及,对 OpenAI 的用户基础形成冲击。
通过开放模型,OpenAI 既能防御对手侵蚀,也试图将中小开发者吸引至自身生态,实现从 “闭源领导者” 到 “生态建设者” 的转型。
奥尔特曼强调,本地化部署在隐私保护上的优势,或将催生新的研究方向和产品形态,“每个人都应拥有自主掌控 AI 模型的权利”,这也与 OpenAI“实现造福全人类的通用人工智能(AGI)” 的使命相契合。
同日三巨头发布 行业竞争多元化
值得关注的是,8 月 5 日当天,谷歌与 Anthropic 也同步发布重磅模型:谷歌推出 Genie 3,可基于图片、文字生成可实时交互的 3D 世界;Anthropic 的 Claude 4.1 Opus 在编程能力上实现突破,HumanEval + 基准测试得分达 85.2%,超越 GPT-4o 此前纪录。
业内分析认为,此次 “AI 混战日” 标志着行业竞争从 “单一性能比拼” 转向多元赛道,OpenAI 的开源布局、谷歌的世界模型探索、Anthropic 的垂直领域深耕,正共同推动 AI 技术向更复杂的方向演进。
