
【新智元导读】千团大战杀出三匹黑马,200万大奖竟被这届00后卷走了!历时4个月的广告算法大赛收官,全球2800支战队全部死磕「全模态生成式推荐」。令人惊喜的是,高校学生们的最新方案,已与工业界没有代差。
三人组队,独揽200万巨额大奖!

历经四个月的鏖战,「腾讯广告算法大赛」终极战果正式揭晓——
集结了华中科技大学、北京大学、中国科学技术大学三所顶尖高校的「Echoch」战队脱颖而出,强势问鼎冠军宝座!
而在他们身后,狭路相逢的对决同样精彩。
其中,来自中山大学的「leejt」战队,以及由一位香港大学单枪匹马组成的「也许明天」战队,凭硬实力杀入三甲。
最令人心动的是,前十名所有成员,全员喜提Offer意向书,直通鹅厂!

本届大赛以「智AI『荐』未来」为题,是一场名副其实的「千团大战」:
全球30个国家、8400多名技术精英、2800余支战队参与角逐。
从6月启幕到巅峰决战,最终杀入决赛的TOP 20,绝对称得上是「万里挑一」。
这场国内数据规模空前的赛事,如同一方浓缩的「练兵场」,不仅见证了00后和90后们的热血,更揭示了一个技术风向:
推荐系统正告别「检索-排序」的旧时代,大步迈入「端到端生成」的新纪元。

回溯这场大赛的起源,不得不提到其核心赛题——「全模态生成式推荐」。
这是一个直击广告行业痛点的前沿课题。

为何要押注「生成式推荐」?
在AI时代流量迁移的大背景下,用户逐渐从搜索走向聊天交互,「问AI」代替了「搜索」。
而且,这个全新入口具备了交互多轮、长记忆的特点,人们停留时间更长,由此流量必然发生迁移。

在传统广告推荐中,往往采用的是「多阶段级联」的策略,存在着明显的局限性。
比如,召回信息不可逆损失、各阶段目标不一致,难以统一优化等。
从召回,到粗排,再到精排,过去常用的是不同的特征空间与模型结构,「割裂」难以避免。
有些特征在召回阶段不可用,但在精排中又是必需的,也就意味着,特征交互无法跨越阶段共享。
结果就是,推荐系统难以端到端学习,只能「拼贴式」调参。
更直白一点,传统推荐系统中,用户的兴趣往往通过点击率、停留时间来推断,但这种「判别式」方法,忽略了多模态数据的丰富性。
一张图的色彩情感、一段视频的叙事节奏,这些元素不能有效融合,推荐难以触及用户内心。
也就是说,推荐的核心,在于「懂」。恰恰,全模态生成式推荐,是大势所趋。
放眼全球,「生成式推荐」成为了行业的风向标,诸如谷歌、Meta等硅谷巨头,在这一范式下展开布局。
前段时间,Meta团队发布了GEM,一款全新的生成式广告基础模型。
在Meta旗下社交平台上,它可以从每天数十亿用户交互中学习,包括文本、图像、音频、视频等数据,可以捕捉信息背后细微的差别,对内容智能排序推荐。

亚马逊也在主攻「生成式推荐」,用生成模型理解用户购物意图,再用LLM生成搜索查询匹配广告。
还有Shopify,将「语言模型+商品理解+个性化」结合打造出超级电商推荐引擎。
他们认为,「当商品会介绍自己,推荐就做好了」。

判别式推荐框架,往往局限于二元判断,无法真正捕捉用户动态需求,而生成式推荐能实时生成个性化的内容序列,让推荐不再冰冷。
全模态生成式推荐,是这一范式的升级版本。
它要求AI不仅要理解文本的语义,还要整合、解读多模态信息,从用户复杂行为序列中,深度挖掘出潜在的兴趣。
AI不仅能看懂,还能实时生成下一秒最可能点开的广告。
只有这样的推荐系统,才真正实现了从「被动匹配」到「主动创造」的飞跃。

为了让选手直面真实业务挑战,腾讯广告直接给到了脱敏后的「用户全模态序列」数据,在业内实属罕见。
需要明确的是,所有这些信息都「不是原始数据」。
而是用大语言模型和多模态模型,从广告素材和文本中抽取出「embedding」向量。
每个行为包含了广告的ID类特征,以及多模态信息,如文本、图像等等。
这场比赛,真正的核心是:基于脱敏后的「全模态历史行为」数据,预测下一次可能交互的广告。
初赛阶段,TencentGR-1M包含了百万量级的数据。到了复赛阶段,TencentGR-10M规模直接爆冲千万级。
具体包含了约1000万用户与1800万广告素材,涉及约1000万条序列数据。
尤其是在复赛阶段,选手们还需要预估「点击」和「转化」两种行为。
预测用户高价值行为——「转化」,同时成为了比拼的重中之重。
要求是,在「序列」和「预估目标」中同时引入转化,并且预测成功转化,便会得到比点击更高的分数。

在计算HitRate和NDCG指标时,会赋予二者不同的分数:「点击」分数为1,「转化」分数为2.5
想要在复赛中通关,核心难点在于——
-
多模态噪声与缺失
原始多模态特征虽提供了图像、文本语义信息,但缺失率高、信噪比低。
特别是,fid=84-86被识别为高噪特征,若不经过清洗,便会导致训练不收敛,甚至性能直接倒挂。
-
超大规模稀疏ID,带来了计算瓶颈
千万级数据规模若是实建完整的Embedding矩阵,显存直接原地爆炸。
因此,需要设计高性能的模型架构和训练方式,优化模型复杂度,提升训练和推理效率。
-
冷启动,训练与推理数据分布差异
在推理阶段,也会出现训练集中未见的item,且缺乏对应的统计特征和完整的行为序列上下文,难以精准建模其推荐逻辑。
因此,模型需具备强大的「泛化」能力,依靠有限内容特征,准确分析推断出潜在受众。
-
特征种类多且复杂
除了6种多模态特征,还包括多个稀疏类别特征以及数组特征、行为特征以及时间特征。对诸多特征如何进行特征工程处理是关键。
不难看出,这一届大赛,是真刀真枪的巅峰对决。
它以「真实场景+前沿方向」锻造赛题,聚焦生成式推荐和多模态融合,为下一代推荐算法路径破局。

在决赛现场,20强选手齐聚一堂,他们的方案如同一场技术盛宴,让人目不暇接。
冠军战队Echoch的方案尤为亮眼,聚焦于「生成式行为条件化建模」核心挑战,在特征工程、模型创新、语义ID生成与Muon优化层面做出了创新。

想象一下,用户浏览广告的行为序列往往杂乱无章,Echoch则巧妙将这些「行为条件化」(Action-Conditioned)。
由于用户行为具备「长短周期」特点,团队构建了三级会话体系,同时补全一系列时间感知特征。
面对点击和转化天然冲突,他们彻底重构了PinRec思想,提出了「逐位置行为条件化」。
在特征空间变换层(FiLM),把下一个目标动作投射到不同子空间。同一个用户序列,在预测点击和转化时,表征完全不同。
在注意力匹配(ATTMatch)上,如果当前目标是「转化」,模型会在Attention中历史上出现过的转化给予更高的权重。
在整个架构上,他们采用了LLM风格的Dense Model作为基座,即标准Transformer+RoPE位置编码。
将用户行为按物理时间坐标排好,最终在给定的曝光、点击、转化条件下,实现精准召回。
在LLM基座+RoPE中,线上核心指标提升+0.013,且单卡显存占用减少约5GB的空间。
针对语义ID数量级大、稀疏性的特点,他们采用了「SVD降维+层次化聚类」生成语义ID,得以让长尾item训练关注度提升190倍,码表利用率从81.2%飙至100%。
在训练过程中,Muon优化器很好地解决了参数量大的问题,再加上工程优化,大大加速了训推过程。
亚军战队leejt则从另一角度切入,将核心发力点放在了「如何更好地处理用户数据和安全数据」。
在广告推荐中,用户数据往往涉及隐私和安全,他们为此设计了「Encoder-Decoder」架构。
Encoder端使用了G-MLP处理用户和Item特征,Decoder端使用改进版的SASRec Transformer。
这套创新训练策略,实现了高效的性能提升,最终获得了评审团的高度认可。
另外,「也许明天」战队,一人参战,对广告推荐系统Scaling Law进行了深刻探讨。
他验证了单纯增加Embedding维度和模型层数,也能带来性能的显著提升,若用更多GPU,则可获得更强的性能。
这份方案极具启发性,让人看到了生成式推荐的无限潜力。
三支不同队伍,在具体实现路径上展现了截然不同的风格:
Echoch胜在模型结构的深度魔改与优化器创新;
leejt胜在多模态特征的精细化处理;
也许明天则胜在对Scaling Law的极致信仰。
尽管切入点有所不同,但在生成式推荐任务中均拿下了高分,不论在核心架构,还是工程优化方面,他们技术路线又存在一些共同点。
从这些选手的创新方案中,我们可以清晰看到腾讯广告的战略布局。

作为连接全球技术人才的平台,本届腾讯广告算法大赛,从技术探索、人才培养、生态共建三大维度,为广告行业注入了持续创新的动能。
一场历时四个月的比赛,沉淀了无数实战成果。

全球2800+战队提出的方案,覆盖了生成式推荐创新架构、多模态对齐方法,以及系统性能优化路径。
这些不仅具有学术价值,还可以为行业提供宝贵的参考价值。
腾讯公司副总裁蒋杰提到,「我看到了一个很惊喜的点,现在的学生与工业界几乎没有代差,甚至更有创意,与过去形成了鲜明的对比」。
如今,1-3人组队就能完成一个大团队的活,这是与互联网时代学生们的本质区别。
在技术探索上,选手们不再局限于实验室中的数据,而是采用「分布式」工业级做法。
并且,在处理长序列数据时,熟练运用RQ-VAE、RQ-KMeans等主流手段进行向量化处理。
在人才培养上,大赛构建「以赛育才、以赛选才」的良性生态。
通过真实场景实战,让高校学子衔接学术与产业。TOP 10选手获得Offer,正是这一机制的体现。
在采访中,蒋杰突出强调了加入腾讯,能够为学生们带来的价值所在。
直入「青云计划」,在内部有一套高端培养体系,包括导师、资源、计算卡,这对学生来说是巨大的吸引力。
更重要的是,腾讯业务的多样化生态,让学生可以接触丰富的数据和场景,实现快速成长。
而在生态共建上,大赛联动「产学研用」:全球学术专家、技术精英与青年人才,还邀请香港中文大学副校长金国庆教授分享了前沿趋势。

不仅如此,腾讯广告还将开源数据集,让更多研究者参与进来,推动多模态推荐领域的进步。
这届腾讯广告算法大赛完美收官,给人最大的感受是——标杆已经立住了。
它不只是一场比赛,更是新征程的起点。
展望未来,腾讯广告还将持续搭建高规格平台,与全球人才共赴算法宇宙的星辰大海。