2026年字节AI的四个关键命题丨36氪独家

36氪 2026-06-04 17:22
2026年字节AI的四个关键命题丨36氪独家图1
2026年字节AI的四个关键命题丨36氪独家图2
周鑫雨
编辑张雨忻 杨轩
来源|智能涌现(ID:AIEmergence)
封面来源视觉中国

“智能涌现”从多个信源处独家获悉,2026年,字节AI有四个重要的命题:

2026年字节AI的四个关键命题丨36氪独家图3

字节的未竟之地:世界模型

如今,字节的AI矩阵中,有让字节终于得以进入中国大模型第一梯队的Seed 2.0,还有做到世界SOTA水平的Seedance 2.0,另外在应用侧,豆包也形成了断层式领先——我们从多方了解到,2026年春节过后,豆包DAU达到2亿

“没有明显短板。”一名大厂AI战略如此评价字节的AI业务矩阵。

但在一众模型中,唯独少了大模型研究下一阶段的关键:世界模型。

几名接近Seed团队人士告诉我们,字节是入场世界模型赛道较晚的玩家。2024年,刚从阿里加入字节的周畅,扛起了世界模型研究的大旗。

但当时内部的判断是,世界模型路线和商业化场景还不明确,更重要的是打好视频模型的仗。

直到2025年,字节才在小范围内成立研究组,开始对世界模型中的VLA(视觉-语言-动作模型)路线进行探索。带队人有两位:

一是字节AI Lab负责人李航——2025年4月,AI Lab整体(包含Robotics团队)并入了Seed,目的之一是提升模型和应用(具身智能)之间的沟通效率——主要基于仿真数据进行世界模型训练。

另一位是Seed多模态研究员王文千,主要基于自然数据做训练。

来到2026年,吴永辉终于在Seed全员会上为世界模型设立了一个明确的目标:2026年底之前至少发布一版世界模型,性能对标目前的世界SOTA(最佳)——Google在2025年8月发布的Genie 3

但从目前的进度来看,追赶的速度不够。一位接近Seed人士告诉我们,吴永辉多次在Seed内部会直言字节世界模型和具身智能的效果不及预期。

另有Seed成员透露,根据内部评测,截至2026年初,字节世界模型的综合性能距离全球SOTA还存在10%的差距。

但这场仗代表未来。

一方面,世界模型的下游,便是至少千亿美金体量的具身智能市场,以及想象空间极大的游戏和娱乐场景。

一名前Seed研究员曾对我们表示,字节机器人此前的落地场景主要为物品运输、工业搬运,但内部判断天花板较低,“市场前景更广阔的人形机器人是字节一定会入局的方向。”

另一方面,世界模型的路线仍然存在诸多非共识,包括视频生成派、VLA(视觉-语言-动作模型)派、JEPA(像素预测)派等。

“赌,以字节的人才密度和资金投入,大概率能赢。”一名AI投资人对我们分析,“不赌,则一定会输。”

围绕跻身世界第一梯队的目标,2026年以来,字节针对世界模型训练,也已经做了不少调整。

“智能涌现”得知,2026年春节后,Seed新设立了一支世界模型研究组,负责人为前Meta FAIR Lab研究员范浩奇,汇报给Seed多模态和世界模型负责人周畅;

与此同时,原来李航和王文千带领的两个VLA研究组合并,统一向周畅汇报。

多名知情人士告诉“智能涌现”,原来李航和王文千的研究组所探索的路线,主要是VLA,追求“即兴”、“真实”,目标应用场景是具身智能;而范浩奇带领的新队伍走的则是3D仿真路线,主打娱乐和游戏这类应用场景。

除了人力和探索路线的扩张,世界模型在资金投入上也是文本、Coding、视频等多个模型方向中最高的一个。

很显著的是数据预算。一名字节数据平台的员工告诉我们,训练数据“走量”的策略,此前在LLM(大语言模型)和Seedance 2.0上取得了显著收益,团队计划将同样的“数海战术”应用在世界模型的训练上。

这也对应着更高昂的数据投入——我们从多方了解到,2026年,字节批给世界模型的训练数据(包括VLA、长视频、3D等模态)的预算,在各个模态中是最高的,金额达到数千万元。

一名数据供应商提到,字节在世界模型上的数据投入,能达到其它厂商的3-4倍。

2026年字节AI的四个关键命题丨36氪独家图4
Coding:追求更极致的数据工程

Coding能力是基础,是决定Agent效果上限的关键——这已成为业界的共识。

多名知情者曾对我们提及字节对Coding的重视。“字节对Coding的投入一直很高,仅次于今年的世界模型。”有接近Seed的人士告诉“智能涌现”。

比如,内部会定向采购数据,或是研究Claude Code、CodeX等海外顶尖Coding模型的训练数据demo。

在2025年的火山引擎Force大会上,字节跳动技术副总裁洪定坤也表示,Coding作为一种高度结构化、逻辑严密的任务,对模型理解复杂的语义结构、逻辑推理、算法设计和精确表达都有很高的要求,能助力模型智能上限的探索。

但在外界,字节Coding业务的存在感一直不强。无论是2025年11月发布的模型Doubao-Seed-Code,还是2025年初发布的AI编程工具Trae,效果和声量都不及智谱的GLM 5和月之暗面的K2。

“字节Coding效果难以取得突破原因在于缺少数据回流。”一名知情者评价。由于模型能力有限,字节相关业务都不愿意使用Seed-Code。

就连AI Coding应用Trae,最早接入的也是DeepSeek和Claude Code,以及产品内部自己训练的Coding模型。

这就导致,字节Coding模型缺少来自真实应用场景的反馈。

2026年以来,不少字节员工感受到,各个业务方正在加大对Seed模型的支持力度。一名Seed员工告诉“智能涌现”,原来字节并不限制业务侧使用第三方Coding模型做开发,但2026年以来,多个应用部门被强制要求使用Seed模型。

不过,在更极致的数据投入下,Seed在人才招聘上的速度倒是稍有放缓。

有AI圈猎头告诉“智能涌现”,字节HR现在对外释放的信号是:粗放高薪招聘的时代已经结束了,接下来的命题是内部培养、提拔年轻人才,提高算法待遇。

如今,Seed为数不多的招聘口子,主要开放给了来自DeepSeek,以及OpenAI、DeepMind、Meta等海外大厂的AI人才,比如前DeepSeek核心成员郭达雅、前英伟达研究员董鑫。

2026年字节AI的四个关键命题丨36氪独家图5

Seedance如何保持SOTA地位

2026年字节在AI模型上的另一个重点,则是维持Seedance在全球视频生成领域的SOTA地位。

“Seedance 2.0的胜利,是数据的胜利。”某视频生成初创企业的创始人曾对“智能涌现”这样评价Seedance 2.0。我们得知,庞大的训练数据量和超过2000人的评测团队造就了Seedance 2.0的亮眼效果。

但持续靠“走量”的训练方式也存在隐忧。一些研究表明,视频生成领域存在“Anti-Scaling Law”现象,简单而言,训练数据越多,模型越容易“偷懒”,只学习某些关键帧,而忽视完整叙事——因此,越到训练后期,数据“走量”的收益往往越低。

两名数据侧的知情人士告诉我们,Seedance在预训练上已经做到了天花板,接下来想要提升性能,就必须清洗训练数据,进行更精细的后训练。

与此同时,动态生成”能力是2026年Seedance团队关注的新方向。

所谓的“动态生成”,也就是互动视频,指的是用户可以输入指令,随时调整视频生成的内容和剧情。在这一赛道上,已经跑出了估值高达13.2亿美金的Vivix AI(前商汤高级研究总监刘宇创立)。

多名知情者告诉“智能涌现”,周畅一直十分看好动态生成的落地前景。

“互动视频可以做成小游戏,也可以做互动剧集,同时也能和世界模型的探索接轨(视频生成也是世界模型的一条探索路径)。”一名接近Seed人士表示。

2026年字节AI的四个关键命题丨36氪独家图6

加速豆包的商业化和出海

36氪曾独家报道,豆包预计将在6月下旬正式上线付费内容;与此同时,豆包也在计划与抖音电商打通,完善付费场景。

2026年5月初,豆包曾在App Store中更新过付费订阅方案,月订阅价格在免费到500元不等。

6月3日,豆包官方也宣布,即将针对专业人群的生产力需求推出“豆包专业版”,包含软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究等专业服务。

多名知情者透露,春节后,豆包DAU已经突破2亿。“今年豆包的投流预算很低。”在一名知情者看来,高DAU带来的是高昂的推理成本和运维压力,豆包在这个时间点推进商业化,带有降一降增长的增速,以及自我造血的双重目的。

PPT生成,是豆包建立用户付费心智的核心切入点。“豆包希望加强PPT生成功能,是为了面向金融、法律等高净值行业的白领收费。”一名接近豆包人士告诉“智能涌现”,下一阶段,豆包还计划推出企业版,与企业内部的系统打通,但内部仍在讨论具体的结合方式

他表示,这一想法,是受到了海外模型商业模式的启发。目前,面向办公场景收费这条商业化路径,在海外已经得到了验证。据Anthropic披露的数据,Claude Code上线仅6个月,ARR就达到了10亿美元;上线一年后,2026年2月的ARR已经达到了25亿美元。

面向企业开发场景的Claude Code带来的可观现金流,也让成立比OpenAI晚了6年的Anthropic,在今年年初一跃反超OpenAI的ARR。

那么现在,豆包要解决的问题就是把自己的用户心智从一个可以免费问一切的“通用入口”转变为一个虽然要花钱但能帮你提高效率的“办公助手”。

不过,豆包想进入的这个市场已经开始拥挤。有豆包人士对智能涌现提到,在调研企业客户的过程中,字节发现企业AI工具市场已经被不少行业AI解决方案供应商占领,迟来的豆包必然要面对更高的获客成本。

“智能涌现”了解到,出海也是豆包今年的重要命题之一。

此前,据“界面新闻”报道,豆包海外版应用Dola在2025年底的DAU已经突破千万。“智能涌现”了解到,Dola2026年的增长目标为:年底达到3000万DAU。

一名知情人士表示,小语种国家是Dola面向的主要市场。目前,海外AI Chatbot市场,已经基本被ChatGPT、Claude、Gemini占据。不在欧美市场与“AI御三家”正面对抗,差异化切入小语种市场,是Dola的增长策略。

第三方数据显示,2025年下半年以来,Dola频频登上印尼、马来西亚、墨西哥等国家的应用商店下载榜。

2026年字节AI的四个关键命题丨36氪独家图7

加入字节一年来,吴永辉的命题就是带领Seed一边修Bug,一边做SOTA模型。而2026年,在AI的每一个战场中,字节的目标都是做赢家。

如今,Seed 2.0、Seedance 2.0成果初显,Seed积累的工程、数据经验、人才,也将会以更高效的方式,复用到新一轮战争中。

(“智能涌现”作者邓咏仪对本文亦有贡献。)

2026年字节AI的四个关键命题丨36氪独家图8

2026年字节AI的四个关键命题丨36氪独家图9
2026年字节AI的四个关键命题丨36氪独家图10
2026年字节AI的四个关键命题丨36氪独家图11
2026年字节AI的四个关键命题丨36氪独家图12

2026年字节AI的四个关键命题丨36氪独家图15

2026年字节AI的四个关键命题丨36氪独家图16

2026年字节AI的四个关键命题丨36氪独家图17

2026年字节AI的四个关键命题丨36氪独家图18

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 字节
more
蚂蚁灵光圈上线!一句话生成应用;苹果宣布库克卸任CEO;字节澄清2025年净利润下滑超七成;华为发布Pura系列!余承东:手机可能会涨价
字节Seed启动全球校招 百位大模型人才计划聚焦2027届应届生与实习生
黄仁勋:DeepSeek在华为芯片上发布「很可怕」;抖音集团副总裁辟谣郭达雅亿元年薪入职字节;五角大楼与通用、福特等汽车制造商讨论造军火
紫光国微19亿重磅收购;中国首款4nm智驾芯片发布;字节跳动自研CPU芯片
字节通报了,内部多人被抓
对话自变量CEO王潜:国内唯一被四家大厂投资的具身智能企业,小米、字节、阿里、美团看中了什么?
Omdia:蜂窝物联网数据流量到2035年将达到218.6艾字节
字节Seed架构再变:周畅统管具身智能,李航转任顾问
字节跳动发布行业首个规模化落地的全双工语音大模型Seeduplex
马斯克 600 亿美元锁定 Cursor;字节、荣威合作推出「AI 汽车」;传今年存储厂商人均奖金超 300 万元 | 极客早知道
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号