Cerebras押注高速AI推理,数据中心扩容竞速至2027年

半导体产业研究 2026-06-24 18:01
Cerebras押注高速AI推理,数据中心扩容竞速至2027年图1


Cerebras押注高速AI推理,数据中心扩容竞速至2027年图2

图源:AFP

Cerebras Systems正在把“速度”从技术指标包装成可出售的核心产品。在上市后首次财报电话会上,这家晶圆级AI芯片公司强调,快速AI推理不是小众市场,而是整个推理市场的潜在入口。公司同时披露,将在2027年底前按季度推动新的数据中心容量上线,以承接OpenAI、AWS及其他客户带来的推理需求。

关键数据

Cerebras押注高速AI推理,数据中心扩容竞速至2027年图3

从卖芯片转向卖“高速推理”

Cerebras管理层刻意淡化单颗芯片或晶圆出货数量,强调可销售单元不是晶圆本身,而是CS-3系统,以及运行在这些系统上的云端推理时间。这一表述意味着公司希望资本市场关注收入、token消耗量和云服务利用率,而非传统硬件厂商常用的出货量指标。在AI推理进入商业化阶段后,响应速度、单用户吞吐和延迟控制正在变成可定价能力,而不只是实验室跑分。

晶圆级架构绕开HBM稀缺叙事

Cerebras的差异化来自Wafer-Scale Engine晶圆级架构。公司称其芯片面积约为主流GPU的58倍,并通过高速片上SRAM执行推理,减少对高带宽内存(HBM)的直接依赖。在GPU路线中,HBM成本、供给和先进封装产能是决定AI服务器扩张节奏的重要变量;Cerebras则试图用更大的单一晶圆级计算平面,降低跨芯片通信和外部内存访问带来的延迟。不过,这一路线也伴随系统部署、功耗、数据中心工程与客户迁移成本等挑战,是否能规模化复制仍取决于容量爬坡和客户留存。

“快推理”是否能覆盖整个推理市场

Cerebras CEO Andrew Feldman认为,快推理不应被视为推理市场中的一个窄分支,而应被视为整个推理市场的可替代方案。其逻辑是:当同一个模型同时存在快、慢两种服务时,用户通常更愿意选择速度更高的服务,尤其在搜索、代码生成、智能代理、语音交互和实时分析等场景中,延迟直接影响产品体验。公司还指出,快速token已经具备溢价能力,部分服务商正在以更高价格出售低延迟推理能力。

解耦式推理打开合作空间

值得关注的是,Cerebras并未把竞争关系限定为“取代GPU”。其提出的解耦式推理方案把工作负载拆成两个阶段:由合作伙伴芯片承担并行度较高的预填充(prefill)阶段,再由Cerebras负责顺序性更强、对延迟更敏感的解码(decode)阶段。这一路线既能与AWS Trainium等云厂商自研芯片形成互补,也为未来与其他GPU或ASIC平台合作留下空间。若该模式成立,Cerebras可以在既有AI基础设施中切入最重视响应速度的环节,而不是要求客户全面替换现有集群。

容量成为真正瓶颈

从财报电话会传递的信息看,Cerebras当前最直接的限制并非订单,而是可上线的数据中心容量。公司称正在全球范围内与大量数据中心业主和运营商讨论容量获取,新站点覆盖美国、加拿大、欧洲等地,并推进到2027年底前连续上线新容量。为缩短交付时间,公司甚至选择从既有客户处临时租回自家系统,以便更快对外提供云端推理服务。这会在短期内压低利润率,但反映出公司优先争取客户、收入和市场份额的策略。

产业观察:速度路线的机会与风险

Cerebras的核心判断是,AI推理时代的竞争不只取决于每美元算力,还取决于每次交互的等待时间。如果推理需求从批量处理转向实时、多轮、代理式工作流,低延迟能力将具备更高商业价值。但公司仍需证明三件事:第一,晶圆级系统能否以足够快的节奏进入更多数据中心;第二,云服务毛利率能否在扩容后恢复;第三,OpenAI和AWS之外的客户是否会形成稳定、分散的收入结构。因此,Cerebras正在挑战的不只是GPU供应链,而是AI基础设施的定价方式:从“买多少芯片”转向“买多快的智能响应”。

原文标题:Cerebras bets on speed as a product, racing to add data center capacity through 2027

原文媒体:DIGITIMES Asia

Cerebras押注高速AI推理,数据中心扩容竞速至2027年图4
Cerebras押注高速AI推理,数据中心扩容竞速至2027年图6



声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
Karpathy投了一家AI记忆公司,撞名DeepSeek Engram记忆架构
今日直播:赋能AI 数据中心 | 英飞凌AI电源参考设计系列研讨会
物理AI竞赛,正从“造本体”转向“铺基建”
不安全指令,一拒了之?TRIAD用三路决策:修复AI智能体的危险计划
电子布价格翻倍:AI产业链的利润,正向上游转移
AI数据中心爆发,功率半导体大涨
中国移动AI-eSIM让Token无处不在 | MWC上海2026
报名开启丨HICOOL 2026全球创业大赛·集成电路前沿技术:RISC-V+AI协同创新挑战赛启动
OpenAI自研芯片,正式发布
求职党必看!我用豆包AI,3分钟自制专属高级简历生成器
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号