刚刚！OpenAI 自己造芯片了：Jalapeño 推理芯片成本省一半，剑指英伟达

SMARTFLOW AI · 前沿洞察

OpenAI 把刀，捅向了英伟达的定价权

2026 年 6 月 24 日 · OpenAI×Broadcom Jalapeño · 共 7 节

一家做模型的公司，开始自己造芯片了。6 月 24 日，OpenAI 联手博通（Broadcom）发布首款自研 AI 芯片 Jalapeño（墨西哥辣椒），专为大模型推理而生。最刺眼的一个数字：比典型 AI GPU 省约 50% 成本——这把刀，直指英伟达最赚钱的地方。

一句话：Jalapeño 是什么

Jalapeño 是 OpenAI 与博通于 2026 年 6 月 24 日联合发布的首款自研 AI 芯片，OpenAI 给它的定位是 "Intelligence Processor"（智能处理器）。^[1]

它是一颗从零为大模型「推理」设计的 ASIC（专用集成电路）——架构围绕前沿模型最吃重的环节优化：算子（kernels）、内存搬运、网络通信、以及服务/排队模式。^[1]注意：是推理（inference）专用，不是训练——这是它能做窄、做省的前提。

三个硬指标（都来自官方/财报口径）

💰 成本省约 50%

官方称 Jalapeño 相比典型 AI GPU 有约 50% 的成本节省。对一家每天烧巨量推理算力的公司，这是直接砍向账单的数字。^[1]^[5]

⚡ 能效大幅领先

早期测试显示，其"每瓦性能"（performance per watt）"显著优于当前最先进水平"。能效=电费=规模，这是 AI 工厂时代最硬的约束。^[1]

🚀 9 个月流片，号称史上最快 ASIC

从初始设计到制造 tape-out（流片）只用了 9 个月，官方称"可能是高性能先进半导体里最快的 ASIC 开发周期"。^[1]

为什么 OpenAI 要自己造芯片

一句话：从「造模型」升级到「造全栈」。OpenAI 不再只做前沿模型和产品，而是把模型底下的基础设施也自己设计——芯片架构、算子、内存系统、网络、调度、部署系统，一路到产品体验。因为它横跨整条栈，每一层都能围绕同一个目标优化：让模型更快、更稳、更便宜。^[3]

"通过对整条技术栈做优化，我们能拿到巨大的效率提升——这会带来更好的性能、更快的模型、更便宜的模型。"

— OpenAI CEO Sam Altman^[3]

翻译成大白话：自己造芯片，是为了把推理成本打下来。模型越用越多、推理账单越来越吓人，与其一直向英伟达买高毛利的 GPU，不如自己定制一颗"只干推理这件事"的专用芯片。

怎么落地：一条多代路线 + 10 吉瓦

Jalapeño 不是一锤子买卖，是一个多代计算平台的第一步：^[1]^[2]

· 时间表：2026 年底开始首批部署，之后逐代扩展
· 分工：OpenAI 设计加速器 + 博通负责硅实现/网络/互联 + Celestica 出板卡/机柜/系统
· 规模野心：承诺与微软合作，到 2029 年部署 10 吉瓦（GW） 的 OpenAI 自研加速器

10 吉瓦是什么概念？那是一个中等国家级别的电力规模——足见这不是"试做一颗芯片玩玩"，而是要把自研算力做成支撑 ChatGPT/Stargate 的底座。

ASIC vs GPU：这对英伟达意味什么

要冷静理解这场仗的性质。ASIC 不是"打败 GPU"，而是"在推理这个窄场景里更划算"：^[4]^[5]

维度	Jalapeño（ASIC）	英伟达 GPU
灵活性	低（为推理定制）	高（训练/推理通吃）
成本	低（约省 50%）	高（毛利高）
适用	OpenAI 自家推理负载	通用、生态最全

所以多家媒体的措辞是"剑指英伟达的定价权"——不是说 OpenAI 要把 GPU 全换掉（短期不可能），而是用自研芯片承接一部分推理量、增加议价筹码、把成本曲线往下压。英伟达仍是训练和通用算力的霸主，但它最肥的"推理高毛利"这块，开始有人自己上手切了。

几句冷静的提醒

不吹捧，几条必须说清的边界：^[4]

· "省 50%/最快 ASIC"是官方与早期测试口径，尚未经大规模生产验证，真实表现要等 2026 年底部署后看。
· ASIC 是双刃剑：专用换来省钱，但模型架构一旦大变（如推理范式迁移），灵活性差的专用芯片可能要重新设计。
· 自研≠脱离英伟达：OpenAI 仍在大量采购 GPU，Jalapeño 是"补充与议价"，不是"替代"。
· 制造端（晶圆代工、先进封装）仍高度依赖 TSMC 等少数厂商，供应链风险没消失。

编辑判断

Jalapeño 真正的信号，不是"OpenAI 多了一颗芯片"，而是前沿 AI 公司开始把"算力成本"当成核心竞争力自己掌控。当推理量大到一定程度，"向上游买算力"和"自己造算力"之间，是生死线级别的成本差。Altman 押的是全栈优化——模型、芯片、系统围绕同一目标协同，这条路一旦走通，效率优势会复利式拉开。

但要泼三盆冷水：数字还是早期口径、ASIC 的灵活性代价真实存在、制造端命门仍在别人手里。所以更准确的说法是：这是 OpenAI 向"AI 全栈公司"转型的关键一子，也是对英伟达定价权的一次正面试探——但战争才刚开始，远没到分胜负的时候。

这种前沿解读每天看不够？

机智流 PRO：每周深度研报 + 飞书/微信群双通道 + AI 工具清单。点下方「阅读原文」加入 →

如果这篇有帮助，欢迎 点赞、在看、转发 三连
想第一时间看到前沿深读，记得给机智流加个 星标 ⭐　我们下次见 👋

参考来源

[1] OpenAI 官方：OpenAI and Broadcom unveil LLM-optimized inference chip（Jalapeño/Intelligence Processor/能效/50%成本/9月流片/多代平台） — openai.com · 2026-06-24

[2] Broadcom 投资者关系：OpenAI and Broadcom Unveil LLM-Optimized Intelligence Processor（合作分工/部署时间） — investors.broadcom.com · 2026-06-24

[3] CNBC：OpenAI unveils first chip... "build the full stack"（含 Sam Altman 全栈优化原话） — cnbc.com · 2026-06-24

[4] Bloomberg / Axios：Jalapeño 更快更便宜 / OpenAI 自研芯片 vs 英伟达 — bloomberg.com · axios.com · 2026-06-24

[5] The Decoder / Startup Fortune：Jalapeño 是 ASIC、约省 50%、剑指英伟达定价权（ASIC vs GPU 分析） — the-decoder.com · 2026-06-24