刚刚!OpenAI 自己造芯片了:Jalapeño 推理芯片成本省一半,剑指英伟达

机智流 2026-06-24 23:05
刚刚!OpenAI 自己造芯片了:Jalapeño 推理芯片成本省一半,剑指英伟达图1

SMARTFLOW AI · 前沿洞察

OpenAI 把刀,捅向了英伟达的定价权

2026 年 6 月 24 日 · OpenAI×Broadcom Jalapeño · 共 7 节


一家做模型的公司,开始自己造芯片了。6 月 24 日,OpenAI 联手博通(Broadcom)发布首款自研 AI 芯片 Jalapeño(墨西哥辣椒),专为大模型推理而生。最刺眼的一个数字:比典型 AI GPU 省约 50% 成本——这把刀,直指英伟达最赚钱的地方。

01

一句话:Jalapeño 是什么


Jalapeño 是 OpenAI 与博通于 2026 年 6 月 24 日联合发布的首款自研 AI 芯片,OpenAI 给它的定位是 "Intelligence Processor"(智能处理器)。[1]

它是一颗从零为大模型「推理」设计的 ASIC(专用集成电路)——架构围绕前沿模型最吃重的环节优化:算子(kernels)、内存搬运、网络通信、以及服务/排队模式。[1]注意:是推理(inference)专用,不是训练——这是它能做窄、做省的前提。

02

三个硬指标(都来自官方/财报口径)


💰 成本省约 50%

官方称 Jalapeño 相比典型 AI GPU 有约 50% 的成本节省。对一家每天烧巨量推理算力的公司,这是直接砍向账单的数字。[1][5]

⚡ 能效大幅领先

早期测试显示,其"每瓦性能"(performance per watt)"显著优于当前最先进水平"。能效=电费=规模,这是 AI 工厂时代最硬的约束。[1]

🚀 9 个月流片,号称史上最快 ASIC

从初始设计到制造 tape-out(流片)只用了 9 个月,官方称"可能是高性能先进半导体里最快的 ASIC 开发周期"。[1]

03

为什么 OpenAI 要自己造芯片


一句话:从「造模型」升级到「造全栈」。OpenAI 不再只做前沿模型和产品,而是把模型底下的基础设施也自己设计——芯片架构、算子、内存系统、网络、调度、部署系统,一路到产品体验。因为它横跨整条栈,每一层都能围绕同一个目标优化:让模型更快、更稳、更便宜。[3]

"通过对整条技术栈做优化,我们能拿到巨大的效率提升——这会带来更好的性能、更快的模型、更便宜的模型。"

— OpenAI CEO Sam Altman[3]

翻译成大白话:自己造芯片,是为了把推理成本打下来。模型越用越多、推理账单越来越吓人,与其一直向英伟达买高毛利的 GPU,不如自己定制一颗"只干推理这件事"的专用芯片。

04

怎么落地:一条多代路线 + 10 吉瓦


Jalapeño 不是一锤子买卖,是一个多代计算平台的第一步[1][2]

· 时间表:2026 年底开始首批部署,之后逐代扩展
· 分工:OpenAI 设计加速器 + 博通负责硅实现/网络/互联 + Celestica 出板卡/机柜/系统
· 规模野心:承诺与微软合作,到 2029 年部署 10 吉瓦(GW) 的 OpenAI 自研加速器

10 吉瓦是什么概念?那是一个中等国家级别的电力规模——足见这不是"试做一颗芯片玩玩",而是要把自研算力做成支撑 ChatGPT/Stargate 的底座。

05

ASIC vs GPU:这对英伟达意味什么


要冷静理解这场仗的性质。ASIC 不是"打败 GPU",而是"在推理这个窄场景里更划算"[4][5]

维度
Jalapeño(ASIC)
英伟达 GPU
灵活性
低(为推理定制)
高(训练/推理通吃)
成本
低(约省 50%)
高(毛利高)
适用
OpenAI 自家推理负载
通用、生态最全

所以多家媒体的措辞是"剑指英伟达的定价权"——不是说 OpenAI 要把 GPU 全换掉(短期不可能),而是用自研芯片承接一部分推理量、增加议价筹码、把成本曲线往下压。英伟达仍是训练和通用算力的霸主,但它最肥的"推理高毛利"这块,开始有人自己上手切了。

06

几句冷静的提醒


不吹捧,几条必须说清的边界:[4]

· "省 50%/最快 ASIC"是官方与早期测试口径,尚未经大规模生产验证,真实表现要等 2026 年底部署后看。
· ASIC 是双刃剑:专用换来省钱,但模型架构一旦大变(如推理范式迁移),灵活性差的专用芯片可能要重新设计。
· 自研≠脱离英伟达:OpenAI 仍在大量采购 GPU,Jalapeño 是"补充与议价",不是"替代"。
· 制造端(晶圆代工、先进封装)仍高度依赖 TSMC 等少数厂商,供应链风险没消失。

编辑判断

Jalapeño 真正的信号,不是"OpenAI 多了一颗芯片",而是前沿 AI 公司开始把"算力成本"当成核心竞争力自己掌控。当推理量大到一定程度,"向上游买算力"和"自己造算力"之间,是生死线级别的成本差。Altman 押的是全栈优化——模型、芯片、系统围绕同一目标协同,这条路一旦走通,效率优势会复利式拉开。

但要泼三盆冷水:数字还是早期口径、ASIC 的灵活性代价真实存在、制造端命门仍在别人手里。所以更准确的说法是:这是 OpenAI 向"AI 全栈公司"转型的关键一子,也是对英伟达定价权的一次正面试探——但战争才刚开始,远没到分胜负的时候。

这种前沿解读每天看不够?

机智流 PRO:每周深度研报 + 飞书/微信群双通道 + AI 工具清单。点下方「阅读原文」加入 →

如果这篇有帮助,欢迎 点赞、在看、转发 三连
想第一时间看到前沿深读,记得给机智流加个 星标 ⭐ 我们下次见 👋

参考来源

[1] OpenAI 官方:OpenAI and Broadcom unveil LLM-optimized inference chip(Jalapeño/Intelligence Processor/能效/50%成本/9月流片/多代平台) — openai.com · 2026-06-24

[2] Broadcom 投资者关系:OpenAI and Broadcom Unveil LLM-Optimized Intelligence Processor(合作分工/部署时间) — investors.broadcom.com · 2026-06-24

[3] CNBC:OpenAI unveils first chip... "build the full stack"(含 Sam Altman 全栈优化原话) — cnbc.com · 2026-06-24

[4] Bloomberg / Axios:Jalapeño 更快更便宜 / OpenAI 自研芯片 vs 英伟达 — bloomberg.com · axios.com · 2026-06-24

[5] The Decoder / Startup Fortune:Jalapeño 是 ASIC、约省 50%、剑指英伟达定价权(ASIC vs GPU 分析) — the-decoder.com · 2026-06-24

© 2026 机智流 · 本文由 AI 采集前沿信息生成 + 多源交叉核验,可能有误,以官方公告为准

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 芯片 英伟达
more
突发 |OpenAI 发布首款芯片,只花了九个月
霍尼韦尔发布“卓越随行”飞书版,用AI+协同平台连接生产和办公
Karpathy投了一家AI记忆公司,撞名DeepSeek Engram记忆架构
微信 AI 助手小微,还有许多做不到的事情|产品观察
物理AI竞赛,正从“造本体”转向“铺基建”
腾讯研究院AI速递 20260625
2030年五大AI预言,半导体产业或将洗牌
谷歌AI摘要正在杀死网页?
Mimo Code 爆火:我们挖开源代码,找到小米 AI 的真创新
订单排到2027年,全球AI算力建设急需中国光纤
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号