高通发布AI推理芯片,入局数据中心

维科网人工智能 2025-10-28 18:52

高通这波从手机芯片跨界向 AI 数据推理进攻,以功耗和成本优势为利刃,期望撕开英伟达的防线。

10 月 27 日,手机芯片巨头高通宣布推出 AI200 和 AI250。

高通发布AI推理芯片,入局数据中心图1

两款芯片既不是手机 SoC,也不是车规芯片,而是正儿八经的数据推理大杀器,争夺英伟达占据优势的 AI 芯片市场。

消息一出,其股价盘中飙 20%,收盘仍涨 11%。

AI 大模型真正能持续产生利润的是推理环节,也就是 AI 完成问答、生图、生视频等实际任务的过程。目前推理市场年增速达 40%,但市场主流英伟达 H100 芯片价格高、耗电量大,还经常缺货。

高通正是瞄准这一市场空档,将其做手机芯片时 “控制功耗” 的技术优势迁移到数据中心芯片上,提出 “每花费一美元,能多处理 30% token(AI 处理数据的基本单位)” 的核心卖点。

参数上,AI200 搭载 768GB LPDDR 内存,内存容量是同类产品的约 3 倍,能轻松容纳大模型。AI250 采用 “近内存计算” 技术,将算力模块靠近内存,使数据传输带宽提升 10 倍,同时降低功耗,大幅减少数据中心的电费支出。

此外,两款芯片都支持冷板液冷散热,单机架可承载 160kW 算力,能有效降低数据中心的 PUE(能源使用效率)指标,减少能源浪费。

在软件适配方面,高通借鉴了安卓系统的打法:支持从 Hugging Face(AI 模型开源平台)一键导入模型,通过 Transformers Library 工具可将模型适配为高通芯片兼容的格式,最快 15 分钟就能完成部署,实现零修改迁移,降低了云厂商等客户的使用门槛。

不过需要注意的是,这两款芯片的上市时间存在 “时间差”:AI200 预计 2026 年推出,AI250 则要等到 2027 年。 这给了英伟达应对时间,其可提前推出 B100、Rubin 等新一代芯片抢占市场。云巨头会不会用高通报价去压英伟达?明年硅谷有好戏看了。

沙特的 AI 公司 Humain 已经抢先下单,计划用 AI200 搭建 200 兆瓦的算力中心。高通发布AI推理芯片,入局数据中心图2

高通发布AI推理芯片,入局数据中心图3

高通发布AI推理芯片,入局数据中心图4
高通发布AI推理芯片,入局数据中心图5

「往期推荐」





 ··        
高通发布AI推理芯片,入局数据中心图6
高通发布AI推理芯片,入局数据中心图7


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 芯片 高通
more
1-9月域控榜单!AI座舱渗透率突破10%,端侧大模型/舱驾一体发力
AI不再「炫技」,淘宝要让技术解决用户每一个具体问题
联想moto X70 Air开启预售:比iPhone Air更轻更薄
高通发布AI推理芯片,入局数据中心
就在本周五!全球首款 AI 主题桌游试玩会丨Convo AI&RTE2025
7年“滴普”终穿石:这家京企成为港股“企业级大模型AI应用第一股”!
维基百科,终结了!马斯克开源版上线,用AI重写「真相」
Excel新AI插件!华尔街「表哥表姐」对手来了
【征集】2025 甲子Cool Vendor AI原生企业招募开启!| 甲子光年智库
风投押注AI脑机接口:2025年全球资本流向的“智能神经密码”
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号