震撼全网！3位00后夺200万大奖，卷走鹅厂顶级Offer

【新智元导读】千团大战杀出三匹黑马，200万大奖竟被这届00后卷走了！历时4个月的广告算法大赛收官，全球2800支战队全部死磕「全模态生成式推荐」。令人惊喜的是，高校学生们的最新方案，已与工业界没有代差。

三人组队，独揽200万巨额大奖！

历经四个月的鏖战，「腾讯广告算法大赛」终极战果正式揭晓——

集结了华中科技大学、北京大学、中国科学技术大学三所顶尖高校的「Echoch」战队脱颖而出，强势问鼎冠军宝座！

而在他们身后，狭路相逢的对决同样精彩。

其中，来自中山大学的「leejt」战队，以及由一位香港大学单枪匹马组成的「也许明天」战队，凭硬实力杀入三甲。

最令人心动的是，前十名所有成员，全员喜提Offer意向书，直通鹅厂！

本届大赛以「智AI『荐』未来」为题，是一场名副其实的「千团大战」：

全球30个国家、8400多名技术精英、2800余支战队参与角逐。

从6月启幕到巅峰决战，最终杀入决赛的TOP 20，绝对称得上是「万里挑一」。

这场国内数据规模空前的赛事，如同一方浓缩的「练兵场」，不仅见证了00后和90后们的热血，更揭示了一个技术风向：

推荐系统正告别「检索-排序」的旧时代，大步迈入「端到端生成」的新纪元。

全模态生成，推荐终极形态

回溯这场大赛的起源，不得不提到其核心赛题——「全模态生成式推荐」。

这是一个直击广告行业痛点的前沿课题。

为何要押注「生成式推荐」？

在AI时代流量迁移的大背景下，用户逐渐从搜索走向聊天交互，「问AI」代替了「搜索」。

而且，这个全新入口具备了交互多轮、长记忆的特点，人们停留时间更长，由此流量必然发生迁移。

判别式，跟不上时代了

在传统广告推荐中，往往采用的是「多阶段级联」的策略，存在着明显的局限性。

比如，召回信息不可逆损失、各阶段目标不一致，难以统一优化等。

从召回，到粗排，再到精排，过去常用的是不同的特征空间与模型结构，「割裂」难以避免。

有些特征在召回阶段不可用，但在精排中又是必需的，也就意味着，特征交互无法跨越阶段共享。

结果就是，推荐系统难以端到端学习，只能「拼贴式」调参。

更直白一点，传统推荐系统中，用户的兴趣往往通过点击率、停留时间来推断，但这种「判别式」方法，忽略了多模态数据的丰富性。

一张图的色彩情感、一段视频的叙事节奏，这些元素不能有效融合，推荐难以触及用户内心。

也就是说，推荐的核心，在于「懂」。恰恰，全模态生成式推荐，是大势所趋。

放眼全球，「生成式推荐」成为了行业的风向标，诸如谷歌、Meta等硅谷巨头，在这一范式下展开布局。

前段时间，Meta团队发布了GEM，一款全新的生成式广告基础模型。

在Meta旗下社交平台上，它可以从每天数十亿用户交互中学习，包括文本、图像、音频、视频等数据，可以捕捉信息背后细微的差别，对内容智能排序推荐。

亚马逊也在主攻「生成式推荐」，用生成模型理解用户购物意图，再用LLM生成搜索查询匹配广告。

还有Shopify，将「语言模型+商品理解+个性化」结合打造出超级电商推荐引擎。

他们认为，「当商品会介绍自己，推荐就做好了」。

判别式推荐框架，往往局限于二元判断，无法真正捕捉用户动态需求，而生成式推荐能实时生成个性化的内容序列，让推荐不再冰冷。

全模态生成式推荐，是这一范式的升级版本。

它要求AI不仅要理解文本的语义，还要整合、解读多模态信息，从用户复杂行为序列中，深度挖掘出潜在的兴趣。

AI不仅能看懂，还能实时生成下一秒最可能点开的广告。

只有这样的推荐系统，才真正实现了从「被动匹配」到「主动创造」的飞跃。

这届学生，实力紧追工业界

为了让选手直面真实业务挑战，腾讯广告直接给到了脱敏后的「用户全模态序列」数据，在业内实属罕见。

需要明确的是，所有这些信息都「不是原始数据」。

而是用大语言模型和多模态模型，从广告素材和文本中抽取出「embedding」向量。

每个行为包含了广告的ID类特征，以及多模态信息，如文本、图像等等。

这场比赛，真正的核心是：基于脱敏后的「全模态历史行为」数据，预测下一次可能交互的广告。

初赛阶段，TencentGR-1M包含了百万量级的数据。到了复赛阶段，TencentGR-10M规模直接爆冲千万级。

具体包含了约1000万用户与1800万广告素材，涉及约1000万条序列数据。

尤其是在复赛阶段，选手们还需要预估「点击」和「转化」两种行为。

预测用户高价值行为——「转化」，同时成为了比拼的重中之重。

要求是，在「序列」和「预估目标」中同时引入转化，并且预测成功转化，便会得到比点击更高的分数。

在计算HitRate和NDCG指标时，会赋予二者不同的分数：「点击」分数为1，「转化」分数为2.5

想要在复赛中通关，核心难点在于——

多模态噪声与缺失

原始多模态特征虽提供了图像、文本语义信息，但缺失率高、信噪比低。

特别是，fid=84-86被识别为高噪特征，若不经过清洗，便会导致训练不收敛，甚至性能直接倒挂。

超大规模稀疏ID，带来了计算瓶颈

千万级数据规模若是实建完整的Embedding矩阵，显存直接原地爆炸。

因此，需要设计高性能的模型架构和训练方式，优化模型复杂度，提升训练和推理效率。

冷启动，训练与推理数据分布差异

在推理阶段，也会出现训练集中未见的item，且缺乏对应的统计特征和完整的行为序列上下文，难以精准建模其推荐逻辑。

因此，模型需具备强大的「泛化」能力，依靠有限内容特征，准确分析推断出潜在受众。

特征种类多且复杂

除了6种多模态特征，还包括多个稀疏类别特征以及数组特征、行为特征以及时间特征。对诸多特征如何进行特征工程处理是关键。

不难看出，这一届大赛，是真刀真枪的巅峰对决。

它以「真实场景+前沿方向」锻造赛题，聚焦生成式推荐和多模态融合，为下一代推荐算法路径破局。

冠军方案

在决赛现场，20强选手齐聚一堂，他们的方案如同一场技术盛宴，让人目不暇接。

冠军战队Echoch的方案尤为亮眼，聚焦于「生成式行为条件化建模」核心挑战，在特征工程、模型创新、语义ID生成与Muon优化层面做出了创新。

想象一下，用户浏览广告的行为序列往往杂乱无章，Echoch则巧妙将这些「行为条件化」（Action-Conditioned）。

由于用户行为具备「长短周期」特点，团队构建了三级会话体系，同时补全一系列时间感知特征。

面对点击和转化天然冲突，他们彻底重构了PinRec思想，提出了「逐位置行为条件化」。

在特征空间变换层（FiLM），把下一个目标动作投射到不同子空间。同一个用户序列，在预测点击和转化时，表征完全不同。

在注意力匹配（ATTMatch）上，如果当前目标是「转化」，模型会在Attention中历史上出现过的转化给予更高的权重。

在整个架构上，他们采用了LLM风格的Dense Model作为基座，即标准Transformer+RoPE位置编码。

将用户行为按物理时间坐标排好，最终在给定的曝光、点击、转化条件下，实现精准召回。

在LLM基座+RoPE中，线上核心指标提升+0.013，且单卡显存占用减少约5GB的空间。

针对语义ID数量级大、稀疏性的特点，他们采用了「SVD降维+层次化聚类」生成语义ID，得以让长尾item训练关注度提升190倍，码表利用率从81.2%飙至100%。

在训练过程中，Muon优化器很好地解决了参数量大的问题，再加上工程优化，大大加速了训推过程。

亚军战队leejt则从另一角度切入，将核心发力点放在了「如何更好地处理用户数据和安全数据」。

在广告推荐中，用户数据往往涉及隐私和安全，他们为此设计了「Encoder-Decoder」架构。

Encoder端使用了G-MLP处理用户和Item特征，Decoder端使用改进版的SASRec Transformer。

这套创新训练策略，实现了高效的性能提升，最终获得了评审团的高度认可。

另外，「也许明天」战队，一人参战，对广告推荐系统Scaling Law进行了深刻探讨。

他验证了单纯增加Embedding维度和模型层数，也能带来性能的显著提升，若用更多GPU，则可获得更强的性能。

这份方案极具启发性，让人看到了生成式推荐的无限潜力。

三支不同队伍，在具体实现路径上展现了截然不同的风格：

Echoch胜在模型结构的深度魔改与优化器创新；

leejt胜在多模态特征的精细化处理；

也许明天则胜在对Scaling Law的极致信仰。

尽管切入点有所不同，但在生成式推荐任务中均拿下了高分，不论在核心架构，还是工程优化方面，他们技术路线又存在一些共同点。

从这些选手的创新方案中，我们可以清晰看到腾讯广告的战略布局。

一场比赛，做成了行业标杆

作为连接全球技术人才的平台，本届腾讯广告算法大赛，从技术探索、人才培养、生态共建三大维度，为广告行业注入了持续创新的动能。

一场历时四个月的比赛，沉淀了无数实战成果。

全球2800+战队提出的方案，覆盖了生成式推荐创新架构、多模态对齐方法，以及系统性能优化路径。

这些不仅具有学术价值，还可以为行业提供宝贵的参考价值。

腾讯公司副总裁蒋杰提到，「我看到了一个很惊喜的点，现在的学生与工业界几乎没有代差，甚至更有创意，与过去形成了鲜明的对比」。

如今，1-3人组队就能完成一个大团队的活，这是与互联网时代学生们的本质区别。

在技术探索上，选手们不再局限于实验室中的数据，而是采用「分布式」工业级做法。

并且，在处理长序列数据时，熟练运用RQ-VAE、RQ-KMeans等主流手段进行向量化处理。

在人才培养上，大赛构建「以赛育才、以赛选才」的良性生态。

通过真实场景实战，让高校学子衔接学术与产业。TOP 10选手获得Offer，正是这一机制的体现。

在采访中，蒋杰突出强调了加入腾讯，能够为学生们带来的价值所在。

直入「青云计划」，在内部有一套高端培养体系，包括导师、资源、计算卡，这对学生来说是巨大的吸引力。

更重要的是，腾讯业务的多样化生态，让学生可以接触丰富的数据和场景，实现快速成长。

而在生态共建上，大赛联动「产学研用」：全球学术专家、技术精英与青年人才，还邀请香港中文大学副校长金国庆教授分享了前沿趋势。

不仅如此，腾讯广告还将开源数据集，让更多研究者参与进来，推动多模态推荐领域的进步。

这届腾讯广告算法大赛完美收官，给人最大的感受是——标杆已经立住了。

它不只是一场比赛，更是新征程的起点。

展望未来，腾讯广告还将持续搭建高规格平台，与全球人才共赴算法宇宙的星辰大海。