腾讯 AI · 五问丨混元的三年战争

雷锋网 2026-04-15 12:32
腾讯 AI · 五问丨混元的三年战争图1
腾讯 AI · 五问丨混元的三年战争图2
如果少走一半弯路,混元今天或许仍在业界第一梯队。 ”     

作者丨董子博

编辑丨林觉民
腾讯 AI · 五问丨混元的三年战争图3
 
 

2025年,从阿里巴巴离职的语音专家鄢志杰,正面临一个重要抉择。

腾讯 AI · 五问丨混元的三年战争图4

鄢志杰

一边是急于在AI领域大展拳脚的京东,其研究院正招兵买马,尤其从阿里、商汤、百度等企业招揽英才;另一边是腾讯的AI Lab团队,俞栋团队也正在寻找一位值得信赖的语音领域顶尖人才。

当时,早就有意亲自管理京东研究院的刘强东求贤若渴,甚至直接与鄢志杰会面,希望将这位通义实验室语音团队的前负责人招入麾下,最终却被鄢志杰婉拒。

鄢志杰婉拒老刘的原因,并非腾讯AI Lab给出的待遇优厚——在他心中,俞栋是自己在微软时期的同事,这份情谊重逾千钧。

腾讯 AI · 五问丨混元的三年战争图5

俞栋

于是,鄢志杰义无反顾地加入了俞栋的团队。

天有不测风云,鄢志杰到岗,俞栋麾下语音团队已经开始跟混元团队合作,共同开发对标豆包语音的项目——“混元-O”,此时混元团队研发任务紧张,语音+视觉理解的团队已成建制,项目已经在跑起来了。

人员调动,刚入职腾讯的鄢志杰也受到了影响。一说鄢志杰本人被调到混元,无法和俞栋“双剑合璧”;一说鄢志杰的团队被调走了一批人,而把鄢和一个三五个人的小团队留在了 AI Lab。

然而,“混元-O”项目的开发却并不顺利。由于缺乏语音数据,团队巧妇难为无米之炊,最终的训练结果自然不及预期。

这也在一定程度上导致了鄢志杰入职仅3个月便离开腾讯,转而加入京东研究院。

再之后,俞栋也在各种组织变动之下离职。俞栋走后,AI Lab 的三剑客正式全部离开了腾讯,这也为后来AI Lab的撤销埋下了伏笔。

不难发现,AI 大模型的出现,直接地挑战着互联网大厂的组织架构。

当 Transformer 架构一统语言、视觉、声音等能力,当大量算力不得不向尖端部门集中,当技术的迭代开始以周为单位计算……

面临历史的浪潮,腾讯该何去何从?

(腾讯的 AI Lab 往事,雷峰网仍在持续跟进中,欢迎添加作者微信:william_dong,交流爆料。)

 
01

张正友时代:分工与重整

 

张潼离开腾讯之际,卢山及一众腾讯高层都不得不认真反思:

“腾讯对管理科学家的用人方式,是不是出了问题?”

或许是此前给予张潼的发展空间过于有限,使其难以充分施展才华,这才促使他选择离开,重返自己更为熟悉的学术界。

于是,接下了张潼 AI Lab 主任之位的张正友,也就被总办赋予了更大的自由和话语权。甚至有消息称,张正友加入腾讯时,总办明确不为他和团队设置硬性的 KPI,好让科学家们能更自由地研究、发展。

腾讯 AI · 五问丨混元的三年战争图6

张正友

而向外看去,2019 年前后,正是 AI 市场的又一个低潮期,资本逃出 AI 深水区、深度学习遇上瓶颈、落地场景受限严重等因素,导致市场对 AI 技术的评价开始两极反转,而大厂们也转而关注怎样把 AI 工程落地,实打实地赚到真金白银。

张正友所在的 AI Lab,自然也有如此的焦虑。

此后数年,AI Lab 下设了产研中心,大批“工程部门”应运而生。Lab 的人员编制(HC)开始从研究中心向产研中心倾斜,管理层甚至会直接通过产研中心,调配 NLP 团队的成员,这引发了团队内部不少人的不满。

而在张正友的管理下,核心技术骨干主要就是前文提及的 AI Lab 副主任俞栋,以及 AI Lab 原 NLP 中心负责人史树明、视觉中心刘威等人。

俞栋 2017 年便加入腾讯 AI Lab,和张正友原本是在微软的老同事,他身处美国西雅图,在这座美国阴雨天最多的城市之一组建了 AI 实验室。曾师从俞栋的齐筠这样评价他:他是一位“传统”的科学家,能力出众,行事沉稳,少有权力欲,也鲜少过问其他部门的事务。

而掌管 NLP 中心的史树明,也是一位特点鲜明的技术领袖。在前员工戴棕的眼中,史性格上和俞栋一样温和,同时有着研究者特有的“刚”劲,专注于“把事做成”。哪怕凌晨独自编写规则,连续工作 12 小时不停测试,他也非要把成果硬生生“拱”出来,不会一味追求技术层面是否完美。

腾讯 AI · 五问丨混元的三年战争图7

史树明

俞栋、史树明这样的中流砥柱,不仅学术影响力不小,接触的项目也够多,扛起了腾讯体系内 AI Lab 的这杆大旗。

时间来到 2023 年,ChatGPT 横空出世。要做大语言模型,站在学术前沿的 AI Lab 与张正友,在当时必然要一马当先。

混元最早在 2022 年底-2023 年初立项,成立虚拟组织,当时的负责人是张正友,由他调动公司其他团队共同研发,主要的分工包括:机器学习平台部负责预训练、AI Lab 负责强化学习和后训练,数据平台部负责评测。当时TEG 的其他团队也纷纷被调动起来,包括数据标注、安全等等。

机器学习平台部的王迪,过去最早在 AI 平台部做过搜索,自姚星离职后就汇报给蒋杰,一段时间以来,主攻方向是广告场景中的搜广推,在NLP领域有多年的经验和积累。

腾讯 AI · 五问丨混元的三年战争图8

王迪

与此同时,因其辖内多个部门均与混元团队有合作,TEG 的蒋杰也多少参与其中。

大模型的研发关乎 TEG 的整体命运。于是,实际分属张正友与蒋杰的团队双管齐下,向着大模型的共同目标,开启了一场影响深远的“团队合作”。

张正友是当时混元的项目组组长,手下是俞栋的西雅图实验室,史树明的深圳 NLP 中心,和制衡着 NLP 中心的产研中心三拨力量。

而在 TEG,王迪率领的机器学习平台部(机平)、刘煜宏和刘威领衔的数据平台部(数平),虽然仍然虚线汇报给张正友,但实际仍然是实线汇报给蒋杰。

“对待机平和数平两个部门,正友过问的频率相对 AI Lab 低一些,一起开会的次数也少很多。”一位 AI Lab 的前员工蒲佗如是说道。

数据平台部的刘威是 AI Lab 创始 “三剑客” 之一,与张潼、俞栋同期加入团队。他最早向张潼汇报,是早期 AI Lab CV 领域的技术大牛

腾讯 AI · 五问丨混元的三年战争图9

刘威

在公司内部,刘威一直以他的性格耿直、仗义执言著称。

在 AI Lab 早期,张潼曾发全员邮件,要求 AI Lab 不要打无准备之仗,除非有把握能取得前三的成绩,否则不要参与外部的比赛。而刘威则直接在全员邮件中回复“昨天我们说好,只要能进前五,就可以参赛”,直直地把矛盾暴露在所有人面前。

张潼走后,仍在 AI Lab 的刘威本是向张正友汇报,但奈何两人关系一度紧张,便活水到了数平,实际向蒋杰一系汇报,通过 CV 技术帮助腾讯的广告业务。

尽管对其他人,刘威显得有些太过直白,但在团队内,受到刘威照顾的人不少,他的技术实力也广受认可,大家都亲切地喊他一声“威哥”。

在数据平台部,刘威的上峰,是腾讯的老员工刘煜宏,早在2005 年加入腾讯。

据悉,刘煜宏懂得在大厂内部处理关系,能力以沟通见长。他的办公室里常备着一副茶具,进入他办公室的同学,他都会泡上一杯热茶,总令他的手下联想到“潮汕老板的作风”。

腾讯 AI · 五问丨混元的三年战争图10

刘煜宏

TEG 的机平、AI Lab 和数平三个部门,就这样开始了混元第一个版本模型的研发。

王迪的机器学习平台部负责预训练、俞栋旗下的 AI Lab 负责后训练,刘煜宏的数平则负责为模型做评测。

鄂梅回忆,当时的 AI Lab,几乎三军用命,领导们也带头冲锋,团队每天加班到凌晨两三点,周末无休,每天除了五个小时左右的睡眠,几乎都在工作,这样的日子持续了三四个月之久。

在这个过程中,联合项目组陆续交付了几个版本的模型,几乎是每个月都有迭代,但是效果却不能让人满意,加上当时国内百度、阿里巴巴都陆续发布了自研的模型,大家都觉得压力很大,此时项目组也到了不得不交作业的时候。

这场围绕混元的竞争,大概在 2023 年的五六月份就初见变化——上峰突然表示,AI Lab 不再负责后训练,只专注强化学习。而这一切的导火索,则是数平部拿出了一个“号称比 AI Lab 更好的模型”

此前,数平一直在广告场景对模型进行后训练,因而积累了不少实战技术和经验。很快,数平便拿出来了一个新版本的模型,测试后发现效果还不错,这就是当年 9 月面向公众推出的混元 1.0 版本。

但在整个流程中,数平却掌握着评定模型的大权,但又和机平同属蒋杰一系。

如果说,数平的评分可以做到公平公正,那么在算力和数据上的巨大悬殊,也是 AI Lab 团队绕不开的一道坎。

算力上,AI Lab 的团队要进行如此大体量的工作,手里的 GPU 仅有小几千张,规模甚至比不上一个初创公司,反观机平的算力家底,甚至能达到 AI Lab 的数倍之多。

在数据上,鄂梅对雷峰网说,AI Lab 的数据获取屡屡碰壁——拿到 PCG、WXG 的数据自是天方夜谭,只能通过买数据、爬公域数据的方式来支持强化学习。同时,AI Lab 和机平、数平在蒸馏的策略上也有所差别,最终也影响了他们具体的训练成果。

这之后,AI Lab 的败势便难以逆转,后来即使在强化学习的领域做的不错,AI Lab  也还是把混元 RLHF 的业务交了出去。

“AI Lab 已经决定退出了,即使继续做下去,某一天还是要交出去。”鄂梅对雷峰网如是说道。一段时间后,后训练又从数平迁往了机平,完成了业务的又一次交棒。

有消息称,在 AI Lab 在混元竞赛中宣告失败的当天,刘威曾只身来到 AI Lab 所在的楼层,挨个向工位上的同学嘘寒问暖,自豪与喜悦之情溢于言表。

腾讯内部透露,混元的节奏进展缓慢,算力和数据上的制约也是一个很大的原因,早期不管是AI Lab 还是机平,总的卡数量不足几千张,跟外界的数万张比起来,差距非常悬殊。

自此,张正友 AI Lab 一系在混元全线撤退,但即使如此,这也并非他离开 AI Lab 最核心的原因。

(混元的实际开发细节,由于篇幅限制,有不少信息没有录入文中,腾讯的 AI 故事还远没讲完,欢迎添加作者微信:william_dong,获取更多八卦。)

2023 年到 2024 年,AI Lab 爆发了一场大规模的中层离职潮,技术、工程两大板块都有人离开。从分管视觉中心的 T15 技术专家王珏,到医疗中心负责人黄俊洲、分管虚拟人的暴林超,再到语音技术中心的苏丹与翁超,一众核心骨干相继离开了腾讯。

而自知在腾讯难以为继的史树明,则是坚持到了最后一刻,等待团队里大部分想走的同事尘埃落定,才最终选择与腾讯分手。

离开了腾讯的史树明,甚至自嘲“太好了,终于可以好好地学一下大模型了”,并自己独力写完了一个 VLLM 的推理架构——3.5 比特量化的推理框架 inferflow,还完成了一篇颇具前瞻性的技术报告,之后也觅到了一个好去处,过得自在。

而腾讯 AI Lab 这边,史树明一走,NLP 中心没了员工,也没了主心骨,组织就也散了。

一个总监离职事小,一个团队跟着没了就变成了大事。

于是,在 2024 年 8 月,腾讯召开了一场内部大会,张正友随后离开 AI Lab,也自然不再负责混元相关事务。

 
02

蒋杰时代:大调整的全面酝酿

 

张正友离开 AI Lab 后,把棒交给了蒋杰。此时蒋杰也正是混元的主要负责人,当时组织调整的一大考虑,就是希望团队之间的拉通和融合更加深入。

然而,AI Lab 已经开始走向下坡路,蒋杰接下的,正是这样一个摊子。

相比张正友,蒋杰更像姚星——管理军事化、高压化,言语并不避讳,刚猛的气魄和他在公司内部的英文名 Zeus(宙斯)相当契合。而他手下的骨干们,身上也有他从阿里带来的“领地意识”,即使面对并不擅长、从未接触过的工作,也敢于接活,充斥着“有战用我,用我必胜”的乐观。

腾讯 AI · 五问丨混元的三年战争图11

蒋杰

于是,混元在蒋杰治下,迎来了前所未有的组织变革,目标是以 AI 为轴心的“大一统”。

首先,是史树明离职后的 NLP 中心,与俞栋团队合并,成为 AGI 中心,仍然分属 AI Lab 旗下。

然而,AI Lab 终究不是蒋杰的“主战场”,只是他攻伐下的又一个领地——最大的变化,却首先发生在刘威身上。

混元一役前后,刘威便快速得以晋升,正以高速逼近腾讯内部技术线的天花板。

然而,出乎外界所有人预料,大厂前途一片光明的刘威,却在升职不久后火速离职,外出创业 Video Rebirth,专研视频生成算法。刘威为何在事业巅峰期急流勇退?内部人士透露了哪些关键信息?他的创业项目又藏着怎样的野心?欢迎添加作者微信:william_dong 深度交流。)

2024 年,正是 OpenAI 通过 Sora 引爆视频生成技术的风口期,但技术路径显然还并不可见。刘威受命开发视频模型,进展却不如人意,在总办也承压不少。

在这个时候,刘煜宏则在外部,引入了华为的天才少年——钟钊,来接手腾讯的混元视频与图像业务。

腾讯 AI · 五问丨混元的三年战争图12

钟钊

在华为,钟钊的主要工作是神经架构搜索(NAS),但作为科研的常态,这条技术路径不久就被证明是一条的“弯路”。到了腾讯,钟钊在内部对过去的工作几乎全盘否定,要求把视频模型的研发从头来过,技术理念不同,刘威也在同年离职创业。

在腾讯站稳脚跟,钟钊便开始招揽华为的同袍。而另一方面,面对技术路径,有传闻称,钟钊不怕“跟进”,让团队的应届生、实习生纷纷找到自己母校实验室的师哥师姐取经,要来他们的实现方案、数据来源和清洗方法,以此强化混元的多模能力。

不久,钟钊也将图像生成团队兼并进了自己的麾下。

然而,去年九月,团队内部就有人提出,可以将音频和视频同步训练,不仅能增加“音画同出”的能力,更能让模型的智能和鲁棒性进一步提升。而这个今天被可灵 3.0 和 Seedance 2.0 验证了的技术路径,彼时却被钟钊当场否掉,直到今年三月才开始亡羊补牢。

钟钊接管刘威团队后,原先刘的手下几乎流失八成。

刘威离职 8 个月之后,从阿里离职的薄列峰(也就是网上风传的“Linus”)加入了腾讯混元,分管混元的多模态模型部,一揽文生图、文生视频、文生 3D 和数字人四大部门。

腾讯 AI · 五问丨混元的三年战争图13

薄列峰

在腾讯,罗福对薄列峰的评价不错,说他对技术细节相当关注,甚至会过问自己 -2 的具体工作,把管理抓得很细。

薄列峰的到任,总算是暂时稳住了混元多模态模型部的结构,让改变得以缓慢发生。

与此同时,AI Lab 的组织调整却还在继续,R1-R4 四个部门兴起,并且以合伙人制的方式,打破了原有的体系设置。

其中,R1 的合伙人还是 AI Lab 的副主任俞栋;R2 的合伙人则是 2025 年一月入职,MSRA 视觉计算组前首席研究员胡瀚;R3 的合伙人是在字节曾任Seed大模型视觉基础研究团队负责人的冯佳时;R4 的合伙人则是曾经开发了王者“绝悟”的技术负责人,也是公司最年轻的 leader 总监,最年轻的首席专家——叶德珩。

腾讯 AI · 五问丨混元的三年战争图14

胡瀚

然而,新变阵的 AI Lab,最终还是出了问题,而且问题出在了素来与世无争的俞栋身上。

鄢志杰事件之后,俞栋重新梳理了一个 20 人的团队,准备重新出发。然而一年还没过去,俞栋又接收到了要把团队并进多模态模型部的信号。

公平地说,语音工作与混元在多模态领域的布局,在某种程度上的确密不可分。新的技术路线之下,语音工作必须依托于大模型底座,才能取得更好的效果。

但对俞栋而言,这无疑是第二次触动了他的痛处。

“俞老师本来就是一个技术能力极强的人,”原先在俞栋团队的常白评价道,“让他带一个小团队突破,他能做出很好的成果——而如果把俞老师推到管理岗承压,最后结果就不会太好。

于是,就如先前在中说道的一样,俞栋几乎在静默中悄然离职,不久后,他的语音团队被正式划入薄列峰治下,成为了多模态模型部的第五个板块。

自此,张潼、刘威、俞栋先后离职,AI Lab 的三剑客正式全部离开了腾讯。

而俞栋的离开,难免让腾讯的总办想起短短两年前的史树明等人——与其放任 AI Lab 成为一具空壳,不如先破后立,重新设计混元的组织架构。

于是 AI Lab 成为了历史,蒋杰也退出了混元体系。混元的姚顺雨时代要来了。

 
03

姚顺雨时代:让 AI Native 的人领路

 

和不少 AI Lab 做研究的科学家交流,他们往往会提到一个情况:在实际的研究工作中,他们长期碰不到基模。

一方面原因,是过去根深蒂固的部门墙,阻隔了 AI Lab 和基模团队之间的通路;而另一方面,基模是与自己无关的工作,AI Lab 也不愿涉入太深,生怕踩了别人领地。

而在宣布 AI Lab 撤销的全员会上,姚顺雨则直言,要打破这面“坚不可摧”的墙。

腾讯 AI · 五问丨混元的三年战争图15

姚顺雨

事实上,选择姚顺雨,一定是腾讯总办的深思熟虑——小马哥和总办高层在硅谷聊人无数,但最后选择了这个博士毕业仅两年的 95 后,必然有他们的道理。

加入腾讯时,姚顺雨虽然不在总办,却能给总办“上课”,直接对刘炽平汇报

在今天的 AI Lab 撤销后,姚顺雨的混元大语言模型部和 AI Infra 部,与 TEG 薄列峰的混元多模态模型部平行,在不同的方向展开工作。

在姚顺雨旗下,有多方信源确认,当下有五大板块,分别是预训练、后训练、Baseline Infra、模型评估和 Frontier(前沿)。其中,前沿组则招纳了不少原来 AI Lab 的人。

“大家做的事情还是一样的,只是换个地方而已。” AI Lab 的一位科学家贺澜说道。

除了王迪以外,胡瀚也在被薄列峰辞去了在多模态模型部的工作后,加入了姚顺雨的旗下,专注多模态理解的研究。原先 R3 实验室的冯佳时仍然还在,研究 GUI Agent 的相应工作。

腾讯 AI · 五问丨混元的三年战争图16

冯佳时

而其他的十余个小组中,不乏来自 Seed、DeepSeek、Qwen、Kimi 的大牛以及大量从顶尖院校毕业的应届生。混元的团队也正变得越来越年轻,越来越敏捷。卢山曾在内部讲话中提及,大模型时代,要让AI Native的带来新想法和新思路。

但即使如此,腾讯混元的变革仍在继续。姚顺雨也正在面临一场大考,想法再大,最后也要用模型说话。

(姚顺雨时代的腾讯混元,会变得更好吗?他的第一场“大考”成绩究竟如何?雷峰网正在持续关注中,欢迎添加作者微信:william_dong,获取更多一手信息。)

终究不愿再谈不切实际的美梦,姚顺雨的目标,就是在 2026 年中,让混元做进国内第一梯队。

 
04

结语

 

事后,当常白问及离职的真正原因时,俞栋的反应只有一句淡淡的“体感不好”。

而这句“体感不好”,或许也体现出了不少科学家们在 AI Lab 的处境。

理论上,科学家应该是最好管的一批人。

他们大多自驱,不需要人在后面拿着鞭子赶。给他们一片花园,告诉他们边界在哪里,他们会自己翻土、播种、浇水、施肥,日复一日,静待花开。科学研究有自己的规律,急不得,也快不了。

但AI时代的问题在于,商业逻辑和技术演进路线的变化太快了。

过去的科研可以“花大钱办小事”——投一个实验室,养一拨人,三五年出一篇顶会论文,企业照样觉得值。

但今天,时代变了。

AI正在从“多个独立方向的平行研究”收敛为“一个统一架构的工程化落地”。独立AI Lab是第一个时代的最优组织形式,但在当前范式下,它的存在反而制造了摩擦——研究和产品之间隔了一层,资源在多个方向上分散,决策链条被拉长。

所以AI Lab们的落幕,是一种必然,也是AI朝向更宽广方向发展的必经之路。

实验室时代结束了,大模型时代来了,混元的故事才刚刚开始。

(腾讯 AI Lab 往事系列文章仍在继续推出,雷峰网将持续关注写作,欢迎添加作者微信:william_dong,交流认知,分享八卦。)

*齐筠、戴棕、蒲佗、严荡、鄂梅、巫宕、罗福、常白、贺澜等均为化名。

/

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
美国AI对华领先优势已消失?斯坦福423页AI报告划重点
全球AI芯片被一家味精厂卡脖子?份额超95%,英伟达也得排队抢产能
在硅谷和两个 AI 工程师聊完,我觉得下一代汽车可能不是车了
刚刚,OpenAI收购一家创企,“算计”你兜里的钱
亚太AI及生成式AI支出将大幅增加 2029年有望达到3700亿美元
毛利率53%!光刻机之王的AI红利
阿里ATH事业群推零代码AI开发平台Meoo,1分钟生成全栈应用
曝 iPhone Air还有第二代,你期待吗?
B站上最会用AI的创作者,关于AI的25条思考
半年融资近2亿,他要用AI发球机器人解决全球1亿人的训练难题丨36氪专访
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号