突发 |OpenAI 发布首款芯片,只花了九个月

APPSO 2026-06-24 22:47
突发 |OpenAI 发布首款芯片,只花了九个月图1
就在刚刚,OpenAI 史上首颗芯片诞生了。
名字相当火辣,叫 Jalapeño,墨西哥辣椒(doge)。
它是 OpenAI 的第一颗「Intelligence Processor」(智能处理器),专门为大模型推理设计。从一张白纸到流片,整个过程只花了九个月。
突发 |OpenAI 发布首款芯片,只花了九个月图2
OpenAI 管这叫「史上最快的高性能先进半导体 ASIC 开发周期」。
啧啧,要知道,造芯片这种活儿,通常一搞就是好几年。更有趣的是,帮他们加速设计的,正是 OpenAI 自己家的模型。自己造的 AI,造出了自己要跑的芯片。
一颗「辣椒」,亲手交到奥特曼手上
颇有画面感的一幕是,这颗 Jalapeño 芯片,正是博通的总裁兼 CEO Hock Tan 和半导体事业部总裁 Charlie Kawwas,亲手交给 OpenAI 的 CEO Sam Altman 和总裁 Greg Brockman 的。
OpenAI 在官宣博客中表示,这标志着 OpenAI「为自家模型和产品构建全栈」战略的重要一步。
而且合作不止博通一家。
OpenAI 出脑子:从零开始设计芯片架构,靠的是它对大模型底层逻辑的深度理解,再结合自己的模型路线图、kernel、服务系统和产品需求;
突发 |OpenAI 发布首款芯片,只花了九个月图3
博客地址🔗 https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
博通出手艺:负责芯片实现、网络,还有把东西做成大规模量产;另一家叫 Celestica,管板卡、机架、系统组装这些活。博通还明确提到它的 Tomahawk 网络芯片,被用来帮平台走向大规模量产。
整体来看,未雨绸缪的 OpenAI 这次是真的打算把整条产业链都捏在自己手里了。
以前它只干两件事:训练出最强的模型,再拿模型做产品(ChatGPT、Codex、API 那一套)。现在它往基准设施底部又挖了一层——芯片架构、kernel、内存系统、网络、调度、部署系统,全自己来。
用 OpenAI 自己的话讲,这叫「全栈」。
而更好的基础设施→更高的算力效率→更好的训练和服务→更强的模型→更好的产品→更多用户和收入→再回头投下一代基础设施。转着转着,智能就越来越强、越来越稳、越来越便宜。
九个月,模型帮自己造芯片
令人震惊的是,从最初设计到流片(就是把设计交给工厂做成实物的那一步),中间只隔了九个月。这大概是高性能先进半导体里,跑得最快的一次 ASIC 开发。
那凭什么只花了这么短的时间?
究其原因,一方面是靠软硬件一起开发,比如 OpenAI 的工程师和博通的造芯团队贴在一起干;另一方面则是 OpenAI 直接用自家的模型,去加速芯片设计和优化的部分环节。
也就是说,给用户用的那些模型,反过来在帮 OpenAI 造下一代模型要跑的硬件。
负责 OpenAI 硬件项目的 Richard Ho 说,他们是围着那些「最要紧的东西」来优化架构的——kernel、内存搬运、网络、服务模式。根据早期测试,Jalapeño 能把 OpenAI 最重要的活儿,跑到接近硬件理论极限。
突发 |OpenAI 发布首款芯片,只花了九个月图4
简单理解就是,芯片的纸面性能是 100 分,一般芯片实际只能发挥个六七十分,剩下的都在数据搬来搬去的路上耗掉了。Jalapeño 的架构就是要减少数据搬运,把算力、内存、网络几样资源配平,让实际发挥无限逼近那 100 分。
不过,性能到底多强,OpenAI 还没给最终数字,说详细技术报告过几个月再发。但早期测试透了个底:每瓦性能会「大幅优于」目前业界最强水平。(至于是否在画饼,日后便见分晓了。)
实验室里,工程样片已经在跑真实的机器学习任务了,频率和功耗都按量产目标来,其中就包括 GPT‑5.3‑Codex‑Spark 这种模型。
还有一点值得一提的是,Jalapeño 不是拿以前的 AI 芯片改改凑出来的,而是为现代大模型推理从零设计的。
它参考的,就是 OpenAI 每天在 ChatGPT、Codex、API 以及未来 Agent 产品上跑的那些真实系统。
目标也很明确。既要有顶级 AI 加速器的算力和吞吐,又要把延迟压到接近最快的专用推理系统那种水平,专门伺候大规模、要交互的大模型产品。
无法停止的飞轮
Jalapeño 不是一锤子买卖。
它是一个「多代计算平台」的第一步。计划 2026 年底先部署起来,之后几年接着扩。整个平台是 OpenAI 设计的加速器,加上博通的芯片实现、网络和连接技术,再加 Celestica 的板卡、机架、系统能力,三家拼起来的。
Hock Tan 表示,这只是个开头,后面是一张跨好几代的路线图。他还顺嘴提了一句——靠着跟 OpenAI 直接共同开发的芯片,他们要在 2026 年开始,跟微软等伙伴一起,铺起吉瓦级(gigawatt)的数据中心。
吉瓦是什么概念?
一座大型核电站的发电量级别。OpenAI 是真打算用电厂的规模来堆算力。Greg Brockman 甚至还给这次合作上了个价值——「世界正在转向一个由算力驱动的经济」。
突发 |OpenAI 发布首款芯片,只花了九个月图5
在他的逻辑里,Jalapeño 是 OpenAI 长期全栈基础设施战略的一环,自己设计的栈越多,就能用更高的效率「卖」出更多的智能,把先进 AI 推向更广的人群。
至于为什么死磕推理芯片,逻辑其实不难理解:
推理,就是 AI 触达用户/抵达人的重要一环。成本降一点、速度快一点、稳定多一点,落到用户那头,就是 ChatGPT 答得更快、Codex 能多干几步少等会儿、API 更便宜好搭、高峰期更不容易崩。
所以这颗辣椒最后想干的事,说穿了不复杂:把更多算力变成普通人能天天用得起的智能。学生、开发者、小老板、研究员、企业,谁想学东西、想创作、想解决难题,都能用上。
当然,最妙的还是技术的反复套娃:AI 设计芯片,芯片跑 AI,AI 再去设计下一代芯片。而这个圈一旦转起来,就有点停不下来的意思了。
*封面由 AI 生成
我们正在招募伙伴
📮 简历投递邮箱hr@ifanr.com
✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)
突发 |OpenAI 发布首款芯片,只花了九个月图6

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 芯片
more
「AI 同事」,把人干抑郁了
从预测到干预,Aether AI为什么押注因果世界模型?
刚刚!OpenAI 自己造芯片了:Jalapeño 推理芯片成本省一半,剑指英伟达
微信6年来最大改版——关于微信AI助手小微的15条思考
AWS 的老身份和新角色:做 Agentic AI 时代的基础设施
不安全指令,一拒了之?TRIAD用三路决策:修复AI智能体的危险计划
快手系AI芯片公司再融资数亿,销量近十万颗,视频压缩性能超英伟达丨早起看早期
求职党必看!我用豆包AI,3分钟自制专属高级简历生成器
苹果推出 watchOS 27 Beta 2,AirPods 也迎来新测试固件!
深圳见!澎峰科技携 DF35 AI 一体机亮相 SSA2026 亚洲智能传感器与应用技术博览会
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号