突发｜OpenAI 发布首款芯片，只花了九个月

就在刚刚，OpenAI 史上首颗芯片诞生了。

名字相当火辣，叫 Jalapeño，墨西哥辣椒（doge）。

它是 OpenAI 的第一颗「Intelligence Processor」（智能处理器），专门为大模型推理设计。从一张白纸到流片，整个过程只花了九个月。

OpenAI 管这叫「史上最快的高性能先进半导体 ASIC 开发周期」。

啧啧，要知道，造芯片这种活儿，通常一搞就是好几年。更有趣的是，帮他们加速设计的，正是 OpenAI 自己家的模型。自己造的 AI，造出了自己要跑的芯片。

一颗「辣椒」，亲手交到奥特曼手上

颇有画面感的一幕是，这颗 Jalapeño 芯片，正是博通的总裁兼 CEO Hock Tan 和半导体事业部总裁 Charlie Kawwas，亲手交给 OpenAI 的 CEO Sam Altman 和总裁 Greg Brockman 的。

OpenAI 在官宣博客中表示，这标志着 OpenAI「为自家模型和产品构建全栈」战略的重要一步。

而且合作不止博通一家。

OpenAI 出脑子：从零开始设计芯片架构，靠的是它对大模型底层逻辑的深度理解，再结合自己的模型路线图、kernel、服务系统和产品需求；

博客地址🔗 https://openai.com/index/openai-broadcom-jalapeno-inference-chip/

博通出手艺：负责芯片实现、网络，还有把东西做成大规模量产；另一家叫 Celestica，管板卡、机架、系统组装这些活。博通还明确提到它的 Tomahawk 网络芯片，被用来帮平台走向大规模量产。

整体来看，未雨绸缪的 OpenAI 这次是真的打算把整条产业链都捏在自己手里了。

以前它只干两件事：训练出最强的模型，再拿模型做产品（ChatGPT、Codex、API 那一套）。现在它往基准设施底部又挖了一层——芯片架构、kernel、内存系统、网络、调度、部署系统，全自己来。

用 OpenAI 自己的话讲，这叫「全栈」。

而更好的基础设施→更高的算力效率→更好的训练和服务→更强的模型→更好的产品→更多用户和收入→再回头投下一代基础设施。转着转着，智能就越来越强、越来越稳、越来越便宜。

九个月，模型帮自己造芯片

令人震惊的是，从最初设计到流片（就是把设计交给工厂做成实物的那一步），中间只隔了九个月。这大概是高性能先进半导体里，跑得最快的一次 ASIC 开发。

那凭什么只花了这么短的时间？

究其原因，一方面是靠软硬件一起开发，比如 OpenAI 的工程师和博通的造芯团队贴在一起干；另一方面则是 OpenAI 直接用自家的模型，去加速芯片设计和优化的部分环节。

也就是说，给用户用的那些模型，反过来在帮 OpenAI 造下一代模型要跑的硬件。

负责 OpenAI 硬件项目的 Richard Ho 说，他们是围着那些「最要紧的东西」来优化架构的——kernel、内存搬运、网络、服务模式。根据早期测试，Jalapeño 能把 OpenAI 最重要的活儿，跑到接近硬件理论极限。

简单理解就是，芯片的纸面性能是 100 分，一般芯片实际只能发挥个六七十分，剩下的都在数据搬来搬去的路上耗掉了。Jalapeño 的架构就是要减少数据搬运，把算力、内存、网络几样资源配平，让实际发挥无限逼近那 100 分。

不过，性能到底多强，OpenAI 还没给最终数字，说详细技术报告过几个月再发。但早期测试透了个底：每瓦性能会「大幅优于」目前业界最强水平。（至于是否在画饼，日后便见分晓了。）

实验室里，工程样片已经在跑真实的机器学习任务了，频率和功耗都按量产目标来，其中就包括 GPT‑5.3‑Codex‑Spark 这种模型。

还有一点值得一提的是，Jalapeño 不是拿以前的 AI 芯片改改凑出来的，而是为现代大模型推理从零设计的。

它参考的，就是 OpenAI 每天在 ChatGPT、Codex、API 以及未来 Agent 产品上跑的那些真实系统。

目标也很明确。既要有顶级 AI 加速器的算力和吞吐，又要把延迟压到接近最快的专用推理系统那种水平，专门伺候大规模、要交互的大模型产品。

无法停止的飞轮

Jalapeño 不是一锤子买卖。

它是一个「多代计算平台」的第一步。计划 2026 年底先部署起来，之后几年接着扩。整个平台是 OpenAI 设计的加速器，加上博通的芯片实现、网络和连接技术，再加 Celestica 的板卡、机架、系统能力，三家拼起来的。

Hock Tan 表示，这只是个开头，后面是一张跨好几代的路线图。他还顺嘴提了一句——靠着跟 OpenAI 直接共同开发的芯片，他们要在 2026 年开始，跟微软等伙伴一起，铺起吉瓦级（gigawatt）的数据中心。

吉瓦是什么概念？

一座大型核电站的发电量级别。OpenAI 是真打算用电厂的规模来堆算力。Greg Brockman 甚至还给这次合作上了个价值——「世界正在转向一个由算力驱动的经济」。

在他的逻辑里，Jalapeño 是 OpenAI 长期全栈基础设施战略的一环，自己设计的栈越多，就能用更高的效率「卖」出更多的智能，把先进 AI 推向更广的人群。

至于为什么死磕推理芯片，逻辑其实不难理解：

推理，就是 AI 触达用户/抵达人的重要一环。成本降一点、速度快一点、稳定多一点，落到用户那头，就是 ChatGPT 答得更快、Codex 能多干几步少等会儿、API 更便宜好搭、高峰期更不容易崩。

所以这颗辣椒最后想干的事，说穿了不复杂：把更多算力变成普通人能天天用得起的智能。学生、开发者、小老板、研究员、企业，谁想学东西、想创作、想解决难题，都能用上。

当然，最妙的还是技术的反复套娃：AI 设计芯片，芯片跑 AI，AI 再去设计下一代芯片。而这个圈一旦转起来，就有点停不下来的意思了。

*封面由 AI 生成

我们正在招募伙伴

📮 简历投递邮箱hr@ifanr.com

✉️ 邮件标题「姓名+岗位名称」（请随简历附上项目/作品或相关链接）