庆祝“AI云第一”,字节阿里分蛋糕

智能涌现 2025-09-28 20:20
庆祝“AI云第一”,字节阿里分蛋糕图1

如果在同一赛道无法超越对手,就给自己创造一条赛道。


邓咏仪

编辑苏建勋

9月末,杭州,阿里与字节在“AI云市场”排位的激烈竞争,让火药味蔓延在整个城市。

正值阿里云年度活动“云栖大会”举行,不少来参与的观众都能看到,在杭州萧山机场、杭州东站等重要交通枢纽,火山引擎打出大幅广告,当中强调市占率数字:“占中国公有云大模型市场份额46.4%”。

这一表述很值得玩味。火山引擎虽未使用任何“最”、“第一”的极端形容,但众所周知,国内排得上号的云厂商有10家左右,火山引擎一人独占近半份额——相当于什么没说,又什么都说了。

庆祝“AI云第一”,字节阿里分蛋糕图2

△来源:36氪拍摄

有云行业人士对该广告表示了疑问:火山这个数字是按照MaaS形态统计的,主要是闭源形态,如果是购买了云厂商IaaS和PaaS部署开源社区下载的模型,就不在这个统计范围内,单纯从MaaS形态模型消耗判断竞争格局,不够有全局性。

其实,不止火山引擎,如今各家都能成为“AI云市场第一”。

在不同的广告、市场机构报告中,阿里、字节、百度都在官宣“第一”,只不过表述方式各有侧重,场面甚为剑拔弩张。

庆祝“AI云第一”,字节阿里分蛋糕图3

△制图:《智能涌现》

谁才是中国AI云第一?这成为9月云厂商、AI公司们的最火话题。

有人建厨房,有人送外卖

首先,要明确的一个事实是:模型厂商的这些AI云第一,都没错。问题核心不在于数据真假,而在于对“AI云市场”这块蛋糕的切分方式不一,即统计口径不同。

那么,各家都是在哪个维度上“赢了”?

我们来具体进行拆解:

选择哪个计算口径,无可厚非。这是因为云计算已经是个成熟的生意,产品模块众多,采购和服务方式也非常多元。

举个例子,一个中小企业,可能直接在云厂商按月租用一个虚拟服务器;而个人开发者,很多时候不需要长期租用服务器,直接注册一个api,按需取用。当有用户开始使用AI应用时,才会请求云厂帮忙处理业务需求。

到了大模型,道理也是同样。从个人、中小企业到大企业,对大模型的需求也不尽相同。

打个比方,火山强调的“大模型调用量”,就像是一家体系化、规模化的连锁店,只提供外卖服务,交付的是一道菜(模型推理结果)。

直白点说,火山认为客户不需要关心后厨如何搭建,比如买的是不是字节的豆包模型、芯片、推理框架,都无所谓——只要最终上菜够快、质量够好就行了。

所以你会看到,火山引擎在不少公开表达中,都在强调自家模型的“快”。

8月,DeepSeek更新V3.1版本后,火山强调的就是20-40ms的吐字间隔(TPOT),以及500万的初始并发TPM(Tokens per Minute),后者当时拉到了业界的最高水平。

TPM,指每分钟可以处理的token数量,是衡量模型服务能力的重要指标。放在一个中度使用场景(如文档总结、代码生成),假设每个用户每分钟消耗500 token,500万的TPM,就意味着可以服务1万用户。

这是一种更偏流量逻辑的打法,起量快。换句话说,也更适合拥有弹性业务需求的互联网AI应用,中小开发者等等的业务需求。

阿里和百度所强调的AI云市场,更多核算的是营收。

比如,阿里云所定义的AI云,统计范围涵盖了从底层的IaaS(基础设施,如GPU算力)、PaaS(平台),再到上层的MaaS(模型即服务)完整体系,所产生的营收数字。

这就好比一个功能齐全的厨房。客户不仅可以拥有厨房里的高级厨具(底层算力),也能直接点菜(模型服务),能做的事情更多了。

为什么要选择全栈自研路线?

单纯卖模型服务,很难形成长期壁垒。一位从事大模型推理服务的工程师对《智能涌现》打了个比方:“比如一个人每周都要去超市(全栈云服务)购物,当他要买一个杯子(API)的时候,除非其他地方的杯子有出众之处,否则,如果在超市有,他大概率会在这个超市顺手买了。”

无论是云还是大模型,真正的粘性来自于整体解决方案和数据绑定,大部分客户最后用的,肯定不会只有纯模型推理服务,比如API,很容易就迁走。

“大多是要用API,再加数据库、虚拟机等完整的产品组合。”上述人士称。

差异化时代来临

需要承认的另一个事实是,如今大模型领域看着热闹,增长迅速,但本质上整体盘子还很小。

2024年5月,火山用降价彻底打开了MaaS服务市场。当时,火山将豆包旗舰模型Pro-32k降至0.0008元/千Tokens,降幅达99.3%。

这直接引爆了行业价格战,阿里、腾讯、百度等厂商纷纷跟进降价。结果是,火山引擎的调用量,从降价前的1200亿Tokens,暴涨到超过5000亿Tokens。

2025年上半年,IDC统计称,全国大模型调用量的在536.7万亿Tokens。如果按豆包Pro 128k去年刚降价定价(0.0005元/千Tokens)粗略计算,2025年全年的MaaS市场总盘子,约为5-6亿元。

相较之下,单是阿里云2024年全年营收,就已经超过800多亿元,和传统意义上的云计算市场相比,如今的MaaS市场不可同日而语。

问题在于,各家厂商现阶段更信什么,更愿意优先投入什么,这导致了不同的市场策略。

云计算是个规模化生意,马太效应显著。阿里云依托传统云服务的优势,天然倾向于提供全栈解决方案,增加模型服务吸引客户。

而火山引擎作为新进入者,抢固有的云计算市场(如CPU)是更困难的,才会专注于在未来的GPU和MaaS(模型推理服务)增长。

5月的公开报道中,火山引擎CEO谭待,就表示“马拉松刚跑了500米”,未来市场空间最少会扩大100倍——比如,根据火山引擎最近公布的数据,豆包大模型日均tokens使用量超过16.4万亿,较去年5月首次发布时,已经增长137倍。

到底谁才是AI市场的第一名?现在并没有统一的标准。

在云栖大会上,阿里云就直接回应了对统计口径的看法:如果只看大模型在公有云上的调用量,就像只看到了冰山一角。

之所以这么说,是因为大量客户并没有在公有云上直接调用模型。阿里云的通义大模型家族走的是开源路线,很多企业会直接把模型下载下来,部署在自己公司的私有云或本地服务器上运行。

这部分客户自己部署使用的调用量非常大,但外部的数据报告根本统计不到。

阿里云衡量的,是整个“AI云”业务的总收入。这个范围很广,包括了出租GPU算力(基础设施)、提供平台服务(PaaS)以及模型调用服务(MaaS)等所有相关收入。按照这个“营收总额”的维度,阿里云是第一。

为了证明自家的大模型影响力更强,其实还有很多细分维度可挖。

在云栖大会会后采访中,阿里云还提出,应该区分厂商卖的是自己研发的模型,还是转售的别家模型;而提供的模型服务,处理的是复杂任务(需要高质量旗舰模型才能完成),还是一些简单的离线打标工作?

9月份的一份沙利文报告,就体现了这种更看重自研能力的思路。按各厂商“自研模型”的日均调用Token份额,数据显示,2025年上半年,阿里通义占17.7%,字节跳动豆包占14.1%,DeepSeek则占10.3%。

价格战难以长期持续。大模型正在从比拼基础设施规模,Token调用量等单一指标,过渡到比拼效能、服务深度。

典型迹象是,2024年,单纯降价格,还能让Token市场有所爆发;但到了2025年,这已经不是灵丹妙药。因为Token已经足够便宜,企业更多关注模型效果和效率。

对规模更小的AI模型厂商而言,他们没有资源做大厂的全栈式路线。那么,差异化会变得前所未有地重要。

最近的例子是,2025年,月之暗面推出的新模型K2,对代码任务做了深度优化,性价比足够高,调用量瞬间起飞;上周,智谱也针对编程场景推出了GLM Coding套餐,并提升了编程服务的并发数。

商业竞争是相当朴实无华的。一个不破的道理是:当在对手擅长的指标上落后时,不如在自己的长板上,重新定义一个指标。而究竟有多少客户买单,才是当下大模型领域最重要的问题。

封面来源公开网络


👇🏻 AI👇🏻
庆祝“AI云第一”,字节阿里分蛋糕图4

庆祝“AI云第一”,字节阿里分蛋糕图5
庆祝“AI云第一”,字节阿里分蛋糕图6
36AI
👇🏻  👇🏻
庆祝“AI云第一”,字节阿里分蛋糕图7
庆祝“AI云第一”,字节阿里分蛋糕图9

庆祝“AI云第一”,字节阿里分蛋糕图10
庆祝“AI云第一”,字节阿里分蛋糕图11

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
AI时代下,我们需要新一代的金融基础软件
全球AI功耗正在迅速失控
《WAIC UP!》独家上新:Hinton养虎,姚期智、Stuart Russell、王树国、Craig Mundie训虎有道!
【2025最燃新基建】别只盯着算力!先进存力中心正在悄悄“囤”下整个中国AI的未来
vivo X300推出“AI电影分镜”功能,超高像素“一图多裁”
【AI加油站】第五十六部:《我看见的世界-李飞飞自传》从移民少女到 AI 先驱:李飞飞与 ImageNet 的破晓之路(附下载)
当智算变局到来,我们该如何 “用对” 算力?| GAIR Live
AI生成的文本在研究论文中呈上升趋势 | 深度报道
被AI围剿的外语系学生:毕业了,我的专业也没了
AIR快讯|自动驾驶产业闭门沙龙暨Apollo理事会年会2025成功举办
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号