专访火山引擎谭待:模型好对 MaaS 来说是最重要的事,豆包 2.1 算「上牌桌」了

智能涌现 2026-06-23 19:29
专访火山引擎谭待:模型好对 MaaS 来说是最重要的事,豆包 2.1 算「上牌桌」了图1

MaaS 生意如何才能一直赢下去?



邓咏仪

编辑张雨忻

过去三年,火山引擎总裁谭待给团队定 MaaS(模型即服务) 营收目标的过程,也重复了三次:年初,定一个很高的目标,团队都觉得太难了,完不成;到了年中,居然完成的差不多了,随后目标再度上调。

2026 年初,字节的视频模型 Seedance 2.0 让火山引擎迎来了一场漂亮的开门红。作为云市场的后来者,火山引擎乘着 AI 的风,实现了让行业意想不到的增长。

两年前我就和大家说 MaaS 是个大生意,当时你们都不信。谭待对智能涌现说。

 2025 年下半年开始, Coding 和视频模型陆续解锁了商业化生产的场景,这让大家发现,现阶段,模型的能力边界依旧难以预测,顶尖模型是 MaaS 服务当下颇为核心的增长引擎

 6 月 23 日的火山引擎 Force 大会上,字节新一代旗舰模型豆包大模型 2.1 Pro 登场。这也代表着字节在视频生成之外,模型侧终于补上了 Coding 的拼图。

谭待对豆包大模型 2.1 Pro 的定义是,在 Coding 和 Agent 能力方面,终于可以上桌了在知名编程评测 Terminal Bench 上 ,豆包大模型 2.1 Pro 已经能与 Claude Opus 4.7 基本持平,在长程任务,复杂任务上都表现优秀,达到可用门槛。 

这是火山更在意的市场。 Coding/Agent 能力的进步,意味着模型能进入更多企业、个人的核心生产环节。换句话说,也能创造更多商业价值。

除了旗舰模型,火山还带来了一系列模型更新,包括 Seedance 2.0 4K 版、图像生成模型 Seedream 5.0 ,豆包语音生成模型 1.0 ,以及即将在 月发布的 Seedance 2.5 

视频生成模型其实是世界模型的其中一种实现方案,并且目前来看,是一种比较成熟的,可以通过无监督的方式进行大规模扩展的技术方案。” 谭待提到, Seedance 模型,因为表现出对物理世界精准的还原与理解,这也使得高质量的视觉数据合成更可行,加速了具身智能、无人驾驶等等领域的研究进展。

2024 年,我们访谈谭待时,他认为大模型才刚到大哥大时代;两年后的今天,已经快进到了功能机——大模型不再是少数人的玩具,而是真实地进入到了更多人的生活和工作中。

目前,火山在 MaaS 市场已经做到行业头部水平。最新的数据是,相较 2025 年底,火山的日均 Token 消耗量又提升了50%,达到 180 万亿,相比两年前增长超过 1500 倍;万亿俱乐部(累计 Token 消耗达到万亿量级)的客户数也实现翻倍,超过 200 家。

谭待说,随着这次发布的模型,以及今年还有可能发布的模型,火山今年的营收目标已经上调。

这背后是模型的定价逻辑有所变化。2024年,火山曾经是最早让大模型降到地板价的厂商,但这次大会上,他们不再谈及这点。

“ 2024 年之所以降价,是因为所有模型能做的就是 Chatbot ,模型就值那个价。他对智能涌现表示。但如今,模型已经能够进入到核心生产环节。

这也引出了一个更大的问题:当大模型真正进入到更多行业的核心生产环节, AI 究竟会给云行业带来什么变化?

2024 年底,有人曾经问谭待:如果卖 API 就能挣钱,为什么还要做云?后者曾经被认为是长坡厚雪的好生意,但经过十多年发展,在国内也已经卷成红海。

在谭待看来,这个问题本身就不成立。MaaS 和云从来不是对立关系——未来的云,更可能是用 Agent 去调度 IaaS PaaS 、 SaaS ,传统云不会消失,而是会变成 AI 云的一部分。基于模型和 Agent 构建的新负载,可能是传统云的 10 倍、20 倍大。

谭待也反驳了“ MaaS 服务没有忠诚度的观点。云计算早期卖主机的时候也没有粘性,他说,现在大家对 AI 用得还比较浅,等模型真正进入一家企业的核心生产系统,耦合性就大了。

很显然,当下无论是火山还是其他云厂商,都把 AI 当作最重要的、甚至唯一的增长引擎。谭待觉得这是理所当然的:如果回到 2012 年字节成立那一年,你会在那个时间点大做 PC 搜索吗?

而接下来留给火山的问题则是:要如何在 MaaS 市场中一直赢下去?

谭待对此还没有一个完整的答案,但有一件事是确认的,也是难度最大的,那就是:要让模型长期保持领先。

模型终于真正进入了核心生产环节

智能涌现:过去一年,火山增长得很快,核心驱动力来自哪里?

谭待:本质是因为模型解锁了真正的生产级场景,进入了核心生产环节。越是有挑战、有价值的生产力场景或环节,解锁之后带来的价值就越大。

一条主线是视频生成, Seedance 是全球第一个真正解锁了商业化生产场景的模型。

另外一条主线是 LLM / Agent ,生产级的解锁是去年 Claude Opus 4.6 出来之后做到的。Cursor 有个分析:Agent 自动完成代码和点 Tab 补全代码这两种模式的比例,在Claude Opus 4.6 出来之前,点 Tab 补全的比例是更高的,但在那之后,就发生了逆转。说明 4.6 之后,模型的能力有了很大提升,能真正用在生产级的 Coding 和 Agent 场景上了。

智能涌现:怎么判断 Seedance 2.0 真的做到了商业化生产?

谭待: Seedance 2.0 出来之前,大多数视频模型都是用来生产些 UGC 、 PGC 的娱乐视频,比较难应用到严肃创作场景,比如电影、电视剧、广告。

我们从用户的用量情况里也可以看到这个变化:以前,视频生成模型的用量是周末大于工作日的,跟很多娱乐类的 C 端产品一样。但 Seedance 2.0 出来之后就不是这样了,它的工作日负载会比周末大两倍以上,说明大家真的是用它在工作。

视频生成也是通往世界模型的路径之一,在实体产业中有很大的应用潜力。Seedance 已在具身智能、工业制造、智能驾驶等领域落地,为数据合成、场景仿真、流程演示等业务需求提供新的工具能力。

智能涌现: Seedance 2.0 出来前,你们内部预料到了会大爆吗?

谭待:也不算大爆吧。我们本来还定了一个更激进的目标呢,但现在看起来完成还是有挑战的。

智能涌现: Seedance 2.0 为什么能做到这么好的效果?

谭待:它是我们综合能力的体现。你要把视频生成做好,需要有比较好的语言模型作为基础,并且图片生成、以及 VLM (视频理解模型)的能力也要够强。

Seedance 2.0 做得好,可以认为它依托了豆包本身的能力。这是我们相比单纯做视频模型的垂直公司的一个重要优势。

还有一个点是,中国的内容创作领域在全球来看都是很活跃的。中国最早做出最好的视频模型,跟这有关系。

智能涌现:一些市场声音觉得视频生成领域的战争已经告一段落了,字节占据了统治级地位,你怎么看?

谭待:还没到那个阶段。整个 AI 在视频生成上的渗透率其实还非常低。

现在外界过多关注了 Seedance 的短期收入,忽视了 Seedance 的技术价值。视频生成是一种比较成熟的,可以通过无监督的方式进行大规模扩展的技术方案。 Seedance 模型表现出对物理世界精准的还原与理解,这也使得高质量的视觉数据合成更可行,加速了具身智能、无人驾驶等等领域的研究进展,在实体产业中会有非常大的应用潜力。

而且 AI 如果真的创造价值,不是要替代过去,而是让这个行业整体变得更大。

智能涌现:这次 Force 大会,你们也发了新的旗舰模型豆包大模型 2.1,你们怎么定义这个模型?

谭待:我觉得豆包大模型 2.1 Pro 已经达到了可用的标准,可以对标 Claude Opus 4.6 的水平,进入到了 Agent 的可用门槛。

豆包大模型 2.1 也标志着我们在 Coding 领域真正上牌桌了。这是很重要的事,国内真上牌桌的还没有几个。

智能涌现:你们对可用的定义是?

谭待:有几个特点:

第一, Coding 能力很强。在数字世界里 Coding 能力强意味着你能灵活地调用脚本、调用工具,泛化能力也很强。

第二,能完成复杂的通用 Agent 任务。这意味着要能更好地调用工具,有长程任务的能力,跟记忆有好的结合,能适配各种 Harness 和框架,还要有很好的 VLM 能力——很多输入是要通过视觉处理的,比如 Computer Use

第三,具备可规模化应用的能力。如果模型很好但价格太贵,是不行的;延迟太高,比如 Throughput(吞吐量)20多毫秒也不行;模型还要能大规模支持更多服务。

豆包大模型 2.1 在这些方面都做得非常不错。Coding 能力跟 Claude Opus 4.6 比的话,也能超过。规模化应用方面,豆包 App 刚上的任务模式,就是用豆包大模型 2.1 来做的。

智能涌现:在 Coding 场景,你觉得中国的模型什么时候才算是真正追赶上来了?

谭待:大概会在今年 Q2 的时候。虽然很多模型以前都说我要比肩谁谁谁,但光说是没用的。你如果真的追上了、甚至超越了,大家会为你付费。看 ARR 就能知道你到底有没有做到。

智能涌现:和视频相比,为什么国内在 Coding 场景上速度整体要慢一些?

谭待:首先,全球范围来看 LLM 的竞争都是更激烈的。第二,我们起步还是晚的, Anthropic 和 OpenAI 起步早非常多, Coding 这个方向也是他们最早定义并且发力的。我们起步晚,现在整体进度比人家晚也正常,它本来就是很难的一件事。

智能涌现:原来 Seed 还有单独的 Coding 模型 SeedCode,现在还会做吗?

谭待:豆包大模型 2.1 发布后就没有了,Coding 和 Agent 能力都合到主版里面去了。

模型现在迭代太快了,我们不想等一两个月才发一次版,所以现在出了一个新的系列叫 Seed Evolving,它在豆包大模型 2.1 的基础上,每一两周就会更新一次。

智能涌现:这是主要面向开发者群体的模型吗,围绕 Coding 和 Agent 方向做优化?

谭待:不只是开发者。有的企业追求模型的稳定表现,不要有惊吓也不需要惊喜,那他们直接用豆包大模型 2.1 就行。但还有很多人就希望始终能用到最新最智能的版本, Seed Evolving 就是来满足他们的。但它不是小白鼠版本,会有很严格的评估。

智能涌现:你们现在两条生产级场景的主线都解锁了,那 LLM 和视频生成,你觉得目前哪个更重要?

谭待:站在我的角度,LLM 其实更重要一些,它能创造的价值空间更大。虽然我们的现状是 Seedance 卖的多一点,但我希望后面 LLM 能成为大头。

要让模型充分释放能力,还需要一个中间层

智能涌现:一个市场共识是,现在是模型牵引产品增长的年代,大家会觉得模型足够 SOTA 就能卖的好,那火山的价值怎么体现呢?

谭待我们能做的其实有很多。模型能力越强,责任越大。

比如,春节前 Seedance 2.0 就火了,但火山的 API 推出至少晚了两个月,到 月份才推出。我们在干啥呢?主要就是在做版权保护的事。因为我们觉得,模型推理要做好,Guardrail(模型护栏)也很重要。

我们看 LLM ,它的模型能力其实是通过 Harness 才充分释放出来的。现在 Seedance 其实还缺少一层属于它的 Harness。我们最近就在思考,应该怎么和行业结合,把不同模型的这层 Harness 做起来?我们现在就有 FDE(前沿部署工程师)的团队在跟各个行业一起做这个事情。

智能涌现:展开讲讲,各行各业需要有什么样的 Harness 

谭待:比如在影视创作领域里,有很多数字资产没有被管理起来,很多技能也没有积累起来,这些都限制了模型的发挥。我们觉得未来在视频创作领域,也会有像 Claude Code 这样的东西出来。

智能涌现:视频领域的 Harness ,必须字节自己做吗?

谭待:我们会跟大家一起合作,重要的是要找到懂这个事情的人。

Coding,因为程序员很懂,所以能做出对应的 Harness 。那么视频创作领域,你也得懂创作流程,所以我们最近也在努力给团队招导演。

比如说,这次Seedance新上线的功能“3D白模预演,就是来自一位业内知名导演,也是火山引擎客户的建议。科幻电影里有很重要的一个制作环节叫白模,可以来表达场景、人物关系,剧情怎么推演,把白模作为参考,直接让模型生成对应镜头,我们也是全球第一个在视频模型上线这个功能的。

智能涌现:那你觉得现在视频模型的能力还没有被充分释放出来吗?

谭待:不能这么说。视频模型在国内的落地速度是快的,因为有一个很不错的中间层——中国的视频创作领域一直很活跃,所以创作者能很敏感地知道怎么用这些新技术,作为中间层把 API 变成内容,最终商业落地。当然,火山在这个过程里也还有优化的空间。

智能涌现:LLM(大语言模型) 的落地也是难在没有中间层吗?

谭待:如果 SaaS 生态足够好的话,是可以做一个桥梁的。国内 SaaS 基础是比较薄弱的,终端的企业直接用上 API 有点难。当然反过来想,也意味着有弯道超车的机会。

智能涌现:企业客户现在最关心的是模型怎么落地的问题吗?

谭待:大家都相信 AI,但 AI 在我这个企业怎么落地,确实大家还不是特别清楚。

有一类场景已经走通了从 0 到 1,变成更具体的需求问题了,比如 Seedance 的客户会跟我们说,我要 4K 版本。

还有一类是复杂问题,特别是针对非 Digital Native 的企业,它要怎么通过 AI 最终产生业务价值,这还需要我们陪跑,给建议。

智能涌现:现在模型的边界还很模糊,怎么能够在模型迭代很快的时候,又做好企业端的落地?

谭待:落地有敏态和稳态两种方式。稳态是把工作流程抽象出来,通过 AI 改造;敏态是把好的工具给人,让大家广泛尝试,试出好的实践再用稳态落地。对于敏态来说,陪跑是很重要的事情。

智能涌现:你觉得 MaaS 市场要再往下一个阶段走,还差什么?

谭待:还是模型,模型需要更好。另外各个行业相关的 Harness 要能做出来。

火山会成为一个纯 MaaS 公司吗?

智能涌现:听说一鸣在 2024 年问过你,既然卖 API 或者卖 Token 可以挣钱,为什么还要做云?

谭待:不是他问的,是别人问的。

智能涌现:那你现在会怎么回答这个问题?

谭待:我一直讲的一个观点是, MaaS 就是云的一部分,不要把 MaaS 和云对立起来看。

两年前 MaaS 规模还特别小,我当时老说 MaaS 会是个很大的生意,毛利也不错,但别人都不信,都觉得我们在亏钱卖。

智能涌现:什么时候大家开始信了?

谭待:就是今年。今年老黄(黄仁勋)讲了 Token 经济学,大家都开始相信这件事情了。

智能涌现:听说火山今年的 Token 消耗一直在涨,最近的情况是怎么样的?

谭待:客户肯定是越来越多的,我们企业和个人用户数已经 100 多万了。万亿俱乐部(累计消耗过万亿 Tokens 的企业)现在已经 200 家了,去年 12 月是 100 家。而且我们的客户留存很好,原来那 100 家基本没有流失的。

智能涌现:今年 MaaS 的增长,主要来自什么模型?

谭待:现在 Seedance 肯定还是大头,超过一半,但 LLM 这块也不少。

长期来看 LLM 会是更大的市场。比如你做一个视频创作的 Agent ,除了调 Seedance ,肯定也要调 LLM 

智能涌现:一些火山同学想问你,未来火山会成为一个纯 MaaS 公司吗?

谭待:火山的目标一直没有变化,就是要做最好的 AI 云公司。但我一直强调的观点是,不要把 MaaS 和云对立来看。

以前云叫 IaaSPaaS 、 SaaS,以后的云就是 AI 云,就是 MaaSAgentAI 云时代,IaaS 还会在,只不过以后是 Agent 去调用这些 IaaS 组件了。

智能涌现:但是从市场的角度看,火山一直强调的是 MaaS 营收。

谭待:我们一直对外讲 MaaS 的口径、市占率,是因为只有这个东西才是 AI 云真正的核心。如果 AI 云还要去卖 IaaS,跟以前有什么区别?无非是把 CPU 变成 GPU 而已。

智能涌现:那传统云计算的存量市场,火山还要不要抓?

谭待:如果你回到 2012年,字节成立那一年,你会去大做 PC 搜索吗?

AI 驱动的云是比传统云大 10 倍的市场,以后更多的负载会跑到这上面。可能现在传统云是 1000 亿美金的市场规模,将来也还是1000亿美金,但 AI 云可能是 万亿美金

智能涌现:你认为 MaaS 的壁垒来自哪里?如果说 MaaS 就是跟着 SOTA 模型在走,那粘性似乎比公有云还低。

谭待:把模型做好确实很重要,但这也意味着上牌桌的壁垒本身就很高。把模型这个事做好的挑战,比把云做好更大。做云是更偏工程驱动的事,做模型除了有工程能力,还需要一群有天才想法的人。

但我并不觉得 MaaS 比云粘性更低,它只是阶段的问题。云最开始只卖主机也没有粘性,后来有了很多产品后才有粘性。

智能涌现:什么时候 MaaS 服务会变得有粘性?

谭待:如果只是用来做 Coding 提效,没有跟生产系统深度结合,这种应用程度是很浅的,容易没有粘性。但如果把它做成公司安全或其他核心生产系统的一部分,耦合性就大了。

智能涌现:MaaS 市场刚兴起的时候,你们主要说的是 Token 消耗量。一些友商觉得这不够本质,你怎么看?

谭待:他们现在都叫 Token 事业部了,不就认同这个观点了吗?

智能涌现:当下,你觉得 MaaS 什么指标最重要?

谭待:Token 营收肯定是最重要的事。

智能涌现:我们听说火山上半年不断在调高 MaaS 营收目标,最新的数字是 150 亿,实际上呢?

谭待:具体数据就不说了。照这个增长趋势来看,我们年初的目标肯定是能完成的,也确实提高了目标。

智能涌现:火山目前的首要目标还是营收规模吗?

谭待:我们从成立第一天起,一直追求的就是有毛利的规模,没有毛利的规模我们是不要的。第一是要有毛利,二是在这个基础上要有规模。

智能涌现:大模型时代,我们会更早看到利润吗?智谱的 GLM 因为供不应求,已经往上调了三次价格。

谭待:你的模型好,创造的价值高,就能赚更多钱。

2024 年做模型降价,是因为那时模型就只值那个钱。现在能力更强,能帮客户创造更大的价值,所以能定更高的价格。

智能涌现:怎么理解模型的定价逻辑?

谭待:定价不是按毛利率多少来反推的,而是看 Token 到底能创造多少价值。你的定价要让客户的迁移收益高于迁移成本至少两三倍以上,大家才有意愿来用。比如,以前拍一个广告 秒钟成本 100 块,现在用 Seedance 做只要几块钱,那肯定值得用。客户都很聪明的,他知道模型创造的价值跟过去比是值这个定价的,本质还是模型价值提升了。

智能涌现:据说 Seedance 的利润在 70% 左右?

谭待:这个数据是外部传的,我们没怎么算过这块的毛利。

AI 带来的变化,比绝大多数人想象的都要巨大

智能涌现: 2024 年的时候,你说大模型还在大哥大时代,现在呢?

谭待:比大哥大好一点点,至少到功能机了吧。

大哥大的年代,只有少数人能用,现在已经很多人把 AI 用起来了,但肯定还没有完全到智能机时代。

一个很重要的变化是,模型进入到了创作、CodingAgent 的商业生产级领域。一旦进去之后,它就可以走出商业闭环,可以赚到钱,有钱就可以做更好的模型,创造更大的价值,这个飞轮就转起来了。

智能涌现:海外市场在火山今年的优先级里面有多高?

谭待我们一直都很重视全球化,火山成立的同年,我们也同步成立了BytePlus,来做非中市场(中国以外的市场)。

智能涌现:今年,海外市场投入力度会有多大提升?

谭待:我觉得这不取决于我们,而是取决于你模型有没有竞争力。没有竞争力的时候,你怎么投入也没用嘛。

智能涌现:我们听说, Seedance 的市占率已经超过了谷歌的 Veo ,成为全球第一了?这显然已经有竞争力了。

谭待:在国内是第一,在海外发展也很快,海外市场在 Seedance 整体的占比已经快一半了。但不清楚全球市场的排名。

智能涌现:今年,海外市场在你们的业务优先级里会有多高?

谭待:很多中国的创作领域工具公司都在出海,我们也鼓励和陪伴他们一起出海。海外也会有本地客户来用我们,比如 WPP 全球的 Agency ,在很多地方跟我们都有合作。

智能涌现:现在 MaaS 市场已经到了白热化竞争的阶段?

谭待:很难估算。MaaS市场每年还是 到 10 倍的增长,我说的都是增量市场。

智能涌现:还是一起做大蛋糕的阶段。

谭待对,现在的竞争都是一些局部竞争。

智能涌现:你今年的 OKR 什么?有变化吗?

谭待:没什么变化,我们战略很稳定——MaaS做第一,把AI的云原生的产品栈打磨好,把组织建设好。

有变化的一点,前年写的是扩大云市场份额,今年改成了聚焦在AI云上。

智能涌现:你自己这两年最大的变化是什么?

谭待:英文变好了一点,因为要见好多海外客户。

智能涌现:对组织和管理有什么新的思考?

谭待:第一,最重要的还是把战略想清楚,不要老变,要看得更长久。火山在 AI 这件事上战略做得比较早,也比较坚定。

第二是人才,多样性很重要。比如最近 Seedance 就得招一些导演来团队, AI 要渗透各行各业,不能纯靠IT背景的人去做。

第三是自己要不断反省,人在看到一点成绩的时候很容易飘。

智能涌现:最近一次的反思是什么?

谭待:不要做太多微观操作。我发现前段时间自己的微观操作太多了,一般你很有自信的时候就容易这样。但现在事情细节太多了,很多事情你又不够了解,少干涉一点会好一些,要信任团队。

智能涌现:火山成立时,定下了 2030 年千亿营收目标,时间表会提前吗?

谭待:2025 年就已经把这个时间表提前了,今年还会再提一点。

智能涌现:时间表不断提前,你觉得现在任何对 AI 市场的规模预估还是有效的吗?

谭待:我们过去三年都是这样的:年初定一个很高的目标,团队都觉得太难了,然后年中发现快完成差不多了,就要往上调。AI带来的变化比绝大部分人想的都要更大、更快。


封面来源企业提供


👇🏻 AI👇🏻
专访火山引擎谭待:模型好对 MaaS 来说是最重要的事,豆包 2.1 算「上牌桌」了图2

专访火山引擎谭待:模型好对 MaaS 来说是最重要的事,豆包 2.1 算「上牌桌」了图3
专访火山引擎谭待:模型好对 MaaS 来说是最重要的事,豆包 2.1 算「上牌桌」了图4
36AI
👇🏻  👇🏻
专访火山引擎谭待:模型好对 MaaS 来说是最重要的事,豆包 2.1 算「上牌桌」了图5
专访火山引擎谭待:模型好对 MaaS 来说是最重要的事,豆包 2.1 算「上牌桌」了图7

专访火山引擎谭待:模型好对 MaaS 来说是最重要的事,豆包 2.1 算「上牌桌」了图8
专访火山引擎谭待:模型好对 MaaS 来说是最重要的事,豆包 2.1 算「上牌桌」了图9

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
前苹果工程师跨界骨传导耳机,独创技术路线,打破头部企业专利垄断|早起看早期
独家丨OpenAI、Meta都在押注的摄像头AI耳机,被这家中国明星创业公司抢先发布
直降4000华为官网手机平板耳机手表全系优惠
中国"耳机式脑机"引爆CES.2026 !当不到6克的耳机读懂你的大脑,可穿戴脑机接口接口迈入‘’大众消费时代‘’
AirPods对手来了!OpenAI首款硬件是耳机,今年下半年上市
自研ASIC芯片、AI耳机,OpenAI在下什么棋?
4799 小米17 Max发布 耳机手环全家桶亮相!
索尼INZONE H6 Air首发1399元:轻量化开放式设计,继承监听耳机声学基因
荣耀Earbuds 4耳机开售:349元,无Pro版
狐讯 | 苹果谷歌达成 AI 深度合作;消息称 OpenAI 正研发 AI 耳机
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号