
【科技24时区】当地时间周三,OpenAI正式揭开了其首款定制推理处理器的面纱。这款名为Jalapeño(墨西哥辣椒)的芯片,由OpenAI与半导体巨头博通(Broadcom)联手打造,旨在精准契合OpenAI推理系统的独特需求。值得注意的是,这并非一次简单的硬件采购,而是OpenAI利用自家AI模型辅助芯片开发流程的深度尝试。尽管该芯片目前仍处于测试阶段,但早期数据已释放出强烈信号:其在“每瓦性能”这一关键指标上,显著优于当前市面上最顶尖的替代方案。
这场合作早在去年十月便已官宣,但关于OpenAI造芯的传闻早已在业界流传许久。其核心动机不言而喻——减少对英伟达GPU的过度依赖。事实上,这种通过定制硅片来加速机器学习工作负载的策略,并非OpenAI独有。谷歌和亚马逊此前均已构建了类似的“AI加速器”,以服务于各自庞大的云计算生态。然而,OpenAI的入局,标志着顶级AI实验室对算力控制权的争夺进入了更深层的垂直整合阶段。
就在宣布与博通合作后不久,OpenAI总裁格雷格·布罗克曼(Greg Brockman)在公司内部播客中阐述了这一战略背后的逻辑。“我们对工作负载有着深刻的理解,”布罗克曼坦言,“我们一直在寻找那些未被充分满足的特定工作负载,并追问:如何构建某种东西,能够突破现有的可能性边界?”这种从应用层反推底层架构的思路,正是Jalapeño诞生的原点。
Jalapeño专为“推理”场景设计,即运行预构建AI模型以响应用户指令的过程。在官方公告中,OpenAI特别强调了该芯片在运行实时编码模型时的低运营成本优势。虽然诸如预训练等更高强度的计算任务可能仍需依赖英伟达的硬件集群,但对于OpenAI而言,即便是在推理成本上实现微小的降幅,也足以对其财务底线产生巨大影响。毕竟,随着AI应用的普及,推理环节占据了算力消耗的大头,优化这一系统的经济性,将成为未来AI商业模式能否跑通的关键变量。
这种优化不仅仅停留在软件层面,而是贯穿了整个技术栈。OpenAI正在构建包括Codex在内的代理型产品及其底层模型,同时也在建设运行这些模型的数据中心。进军专用芯片领域,让该公司在这一进程中走得更远。正如公告中所言:“OpenAI不仅在开发前沿模型或在其之上构建产品;它还在设计底层的 инфраструктура:芯片架构、内核、内存系统、网络、调度、部署系统以及产品体验。”
由于OpenAI横跨整个技术栈,每一层都可以围绕同一个目标进行极致优化:让模型对用户来说更快、更可靠、更实惠。从某种角度看,Jalapeño的出现,不仅是OpenAI摆脱单一供应商束缚的一步棋,更是其试图通过全栈自研,重塑AI基础设施经济模型的一次大胆实验。当算法公司开始定义硬件,算力的游戏规则或许正在悄然改变。