10倍带宽突破、市值暴涨200亿美元，高通能否「分食」千亿级AI推理市场？

“英伟达的「迭代速度」将让高通倍感压力。 ”

作者丨刘伊伦

编辑丨包永刚

雷峰网消息显示，当地时间10月27日，高通宣布推出针对数据中心场景的AI推理优化解决方案。该方案由Qualcomm AI200、AI250云端AI芯片，及对应的加速卡、机架等组成。

千亿级云端推理市场的入局动态，让高通在资本市场收获积极反馈。其股价在交易时段内最高上涨22%，收盘时涨幅收窄至11%。截至美股10月27日收盘，高通股价报187.68美元/股，公司市值约2025亿美元，市值单日增加近200亿美元。

“站在美国的角度看，英伟达的市值已经很高了，再向上涨一个数量级有比较高的难度，而美股近期能够上涨的股票都跟AI概念相挂钩，高通推出AI推理芯片属于补涨。”芯片行业分析师陈冲表示。

不少行业人士认为，高通在端侧芯片有很多经验和技术上的积累，进军AI推理芯片可以为高通带来新的业务增量，并且市场也不想看到英伟达一家独大，因此此举在行业预期之内。关于国内外AI芯片市场的竞争格局，欢迎添加微信 YONGGANLL6662 交流更多信息。

但这份行业预期背后，高通的低TCO主张能否真正形成竞争力，仍需接受检验。

“高通主打行业最低总拥有成本（TCO）的概念，而其高能效和内存处理能力是否有足够的竞争优势还需要在实际场景中验证后才能判断。”二级市场分析师张翔表示，“AI推理芯片主要看的是固定成本下的Token吞吐率，即在一段时间内产生的Token数量与总成本的比例，在这个方面，英伟达具备很大的优势，其迭代能力太强了。”

从Blackwell到新一代Rubin，英伟达的迭代速度在不断加快。

Rubin CPX以解耦推理设计支持百万级Token处理，GDDR7内存让成本大降，投资回报率达30-50倍，Vera Rubin NVL144平台算力较前代提升3.3倍，单位Token成本进一步摊薄。

面对竞争，高通也在通过实际合作推进产品落地验证，其宣布了与沙特AI公司HUMAIN的合作。

根据规划，HUMAIN将从2026年起部署高通AI200、AI250机架解决方案，总规模达200兆瓦，同时双方还将联合开发尖端AI数据中心，落地云到边缘混合AI推理服务。

“大规模订单合作往往伴随定制化开发逻辑。现阶段模型网络架构已趋于成熟，不会出现颠覆性变化，因此无需过度追求通用性很高的产品，通过定制化模式可以精准匹配客户特定需求，实现深度性能优化。”国产芯片厂商从业者李沐表示，“而高通在成本管理及端侧NPU领域积累的经验，也能为这种模式提供支撑，理论上具备一定可行空间。”

聚焦AI推理赛道，则是当前高通面对英伟达的最优选。

据QYResearch调研显示，2024年全球推理AI芯片市场规模大约为142.1亿美元，预计2031年将达到690.1亿美元，2025-2031期间，年复合增长率为25.7%。

AI推理包含Prefill（预填充）和Decode（解码）两个阶段，和模型训练相比，它对硬件的要求存在明显差异，推理更看重显存带宽的稳定性、适配性以及充足的显存容量，同时无需训练所需的极致浮点算力，转而追求高效能效比与低延迟。

在集群建设方面，存力的重要性也日益凸显。

“算力集群的计算过程是将数据从存储搬运到计算单元，计算完成之后，计算的中间结果以及最终结果会返存回存力集群，在这个过程中，存力是不是能以更大的带宽、更低的时延将数据搬移到算力集群中进行计算，将影响整个计算单元的算力利用率。”存储芯片专家陈峰表示。

此外，由于计算集群会不定时发生故障，此时需要将中间的参数以及计算结果定期保存回存力集群，这个检查点的保存时间耗时越短，那整个计算过程被中断的时间便越少，同样可以进一步提升计算的效率，且保证计算的可靠性。

高通此次推出AI推理芯片的重要亮点便是更高的内存容量，Qualcomm AI200支持每卡768 GB LPDDR，而Qualcomm AI250则将首次采用基于近内存计算的创新内存架构，通过提供超过10倍的有效内存带宽和更低的功耗，实现AI推理工作负载效能的提升。

“现在推理Token用量每个月都在大幅上涨，高通的推理卡显存非常大，单卡可以支持768GB，相当于单卡可以跑完整的DeepSeek，是当前所有卡中显存最大的，方便私有化部署。”陈冲表示。

除了硬件上的显存容量与内存架构创新，高通在软件生态建设上也同步发力，为产品落地铺路。

其AI软件栈覆盖从应用层到系统层的端到端链路，并针对AI推理场景做了优化，支持领先的机器学习框架、推理引擎、生成式AI框架及LLM/LMM推理优化技术。开发者可以通过相关套件，实现模型导入与Hugging Face模型一键部署。

“英伟达在云端芯片市场一家独大，但凭借差异化的硬件设计以及丰富的软件栈，高通的入局具有合理性，后续将其网络芯片集成进去，能打造出具有性能优势的产品。”大厂数据中心专家江杰表示。

作者长期追踪芯片行业相关动态，欢迎添加微信 YONGGANLL6662 互通有无。

注：文中陈冲、张翔、李沐、陈峰、江杰均为化名。