震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer

新智元 2025-12-03 12:12
震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图1

【新智元导读】千团大战杀出三匹黑马,200万大奖竟被这届00后卷走了!历时4个月的广告算法大赛收官,全球2800支战队全部死磕「全模态生成式推荐」。令人惊喜的是,高校学生们的最新方案,已与工业界没有代差。
 

三人组队,独揽200万巨额大奖!

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图2

历经四个月的鏖战,「腾讯广告算法大赛」终极战果正式揭晓——

集结了华中科技大学、北京大学、中国科学技术大学三所顶尖高校的「Echoch」战队脱颖而出,强势问鼎冠军宝座!

而在他们身后,狭路相逢的对决同样精彩。

其中,来自中山大学的「leejt」战队,以及由一位香港大学单枪匹马组成的「也许明天」战队,凭硬实力杀入三甲。

最令人心动的是,前十名所有成员,全员喜提Offer意向书,直通鹅厂!

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图3

本届大赛以「智AI『荐』未来」为题,是一场名副其实的「千团大战」:

全球30个国家、8400多名技术精英、2800余支战队参与角逐。

 

从6月启幕到巅峰决战,最终杀入决赛的TOP 20,绝对称得上是「万里挑一」。

这场国内数据规模空前的赛事,如同一方浓缩的「练兵场」,不仅见证了00后和90后们的热血,更揭示了一个技术风向:

推荐系统正告别「检索-排序」的旧时代,大步迈入「端到端生成」的新纪元。

 

 

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图4
全模态生成,推荐终极形态

 

回溯这场大赛的起源,不得不提到其核心赛题——「全模态生成式推荐」。

这是一个直击广告行业痛点的前沿课题。

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图5

为何要押注「生成式推荐」?

在AI时代流量迁移的大背景下,用户逐渐从搜索走向聊天交互,「问AI」代替了「搜索」。

而且,这个全新入口具备了交互多轮、长记忆的特点,人们停留时间更长,由此流量必然发生迁移。

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图6

判别式,跟不上时代了

 

在传统广告推荐中,往往采用的是「多阶段级联」的策略,存在着明显的局限性。

比如,召回信息不可逆损失、各阶段目标不一致,难以统一优化等。

从召回,到粗排,再到精排,过去常用的是不同的特征空间与模型结构,「割裂」难以避免。

有些特征在召回阶段不可用,但在精排中又是必需的,也就意味着,特征交互无法跨越阶段共享。

结果就是,推荐系统难以端到端学习,只能「拼贴式」调参。

更直白一点,传统推荐系统中,用户的兴趣往往通过点击率、停留时间来推断,但这种「判别式」方法,忽略了多模态数据的丰富性。

一张图的色彩情感、一段视频的叙事节奏,这些元素不能有效融合,推荐难以触及用户内心。

也就是说,推荐的核心,在于「懂」。恰恰,全模态生成式推荐,是大势所趋。

放眼全球,「生成式推荐」成为了行业的风向标,诸如谷歌、Meta等硅谷巨头,在这一范式下展开布局。

前段时间,Meta团队发布了GEM,一款全新的生成式广告基础模型。

在Meta旗下社交平台上,它可以从每天数十亿用户交互中学习,包括文本、图像、音频、视频等数据,可以捕捉信息背后细微的差别,对内容智能排序推荐。

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图7

亚马逊也在主攻「生成式推荐」,用生成模型理解用户购物意图,再用LLM生成搜索查询匹配广告。

还有Shopify,将「语言模型+商品理解+个性化」结合打造出超级电商推荐引擎。

他们认为,「当商品会介绍自己,推荐就做好了」。

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图8

判别式推荐框架,往往局限于二元判断,无法真正捕捉用户动态需求,而生成式推荐能实时生成个性化的内容序列,让推荐不再冰冷。

全模态生成式推荐,是这一范式的升级版本。

它要求AI不仅要理解文本的语义,还要整合、解读多模态信息,从用户复杂行为序列中,深度挖掘出潜在的兴趣。

AI不仅能看懂,还能实时生成下一秒最可能点开的广告。

只有这样的推荐系统,才真正实现了从「被动匹配」到「主动创造」的飞跃。

 

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图9
这届学生,实力紧追工业界

 

为了让选手直面真实业务挑战,腾讯广告直接给到了脱敏后的「用户全模态序列」数据,在业内实属罕见。

需要明确的是,所有这些信息都「不是原始数据」。

而是用大语言模型和多模态模型,从广告素材和文本中抽取出「embedding」向量。

每个行为包含了广告的ID类特征,以及多模态信息,如文本、图像等等。

这场比赛,真正的核心是:基于脱敏后的「全模态历史行为」数据,预测下一次可能交互的广告。

初赛阶段,TencentGR-1M包含了百万量级的数据。到了复赛阶段,TencentGR-10M规模直接爆冲千万级。

具体包含了约1000万用户与1800万广告素材,涉及约1000万条序列数据。

尤其是在复赛阶段,选手们还需要预估「点击」和「转化」两种行为。

预测用户高价值行为——「转化」,同时成为了比拼的重中之重。

要求是,在「序列」和「预估目标」中同时引入转化,并且预测成功转化,便会得到比点击更高的分数。

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图10

在计算HitRate和NDCG指标时,会赋予二者不同的分数:「点击」分数为1,「转化」分数为2.5

想要在复赛中通关,核心难点在于——

原始多模态特征虽提供了图像、文本语义信息,但缺失率高、信噪比低。

特别是,fid=84-86被识别为高噪特征,若不经过清洗,便会导致训练不收敛,甚至性能直接倒挂。

千万级数据规模若是实建完整的Embedding矩阵,显存直接原地爆炸。

因此,需要设计高性能的模型架构和训练方式,优化模型复杂度,提升训练和推理效率。

在推理阶段,也会出现训练集中未见的item,且缺乏对应的统计特征和完整的行为序列上下文,难以精准建模其推荐逻辑。

因此,模型需具备强大的「泛化」能力,依靠有限内容特征,准确分析推断出潜在受众。

除了6种多模态特征,还包括多个稀疏类别特征以及数组特征、行为特征以及时间特征。对诸多特征如何进行特征工程处理是关键。

不难看出,这一届大赛,是真刀真枪的巅峰对决。

它以「真实场景+前沿方向」锻造赛题,聚焦生成式推荐和多模态融合,为下一代推荐算法路径破局。

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图11

冠军方案

 

在决赛现场,20强选手齐聚一堂,他们的方案如同一场技术盛宴,让人目不暇接。

冠军战队Echoch的方案尤为亮眼,聚焦于「生成式行为条件化建模」核心挑战,在特征工程、模型创新、语义ID生成与Muon优化层面做出了创新。

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图12

想象一下,用户浏览广告的行为序列往往杂乱无章,Echoch则巧妙将这些「行为条件化」(Action-Conditioned)。

由于用户行为具备「长短周期」特点,团队构建了三级会话体系,同时补全一系列时间感知特征。

面对点击和转化天然冲突,他们彻底重构了PinRec思想,提出了「逐位置行为条件化」。

在特征空间变换层(FiLM),把下一个目标动作投射到不同子空间。同一个用户序列,在预测点击和转化时,表征完全不同。

在注意力匹配(ATTMatch)上,如果当前目标是「转化」,模型会在Attention中历史上出现过的转化给予更高的权重。

在整个架构上,他们采用了LLM风格的Dense Model作为基座,即标准Transformer+RoPE位置编码。

将用户行为按物理时间坐标排好,最终在给定的曝光、点击、转化条件下,实现精准召回。

在LLM基座+RoPE中,线上核心指标提升+0.013,且单卡显存占用减少约5GB的空间。

针对语义ID数量级大、稀疏性的特点,他们采用了「SVD降维+层次化聚类」生成语义ID,得以让长尾item训练关注度提升190倍,码表利用率从81.2%飙至100%。

在训练过程中,Muon优化器很好地解决了参数量大的问题,再加上工程优化,大大加速了训推过程。

亚军战队leejt则从另一角度切入,将核心发力点放在了「如何更好地处理用户数据和安全数据」。

在广告推荐中,用户数据往往涉及隐私和安全,他们为此设计了「Encoder-Decoder」架构。

Encoder端使用了G-MLP处理用户和Item特征,Decoder端使用改进版的SASRec Transformer。

这套创新训练策略,实现了高效的性能提升,最终获得了评审团的高度认可。

另外,「也许明天」战队,一人参战,对广告推荐系统Scaling Law进行了深刻探讨。

他验证了单纯增加Embedding维度和模型层数,也能带来性能的显著提升,若用更多GPU,则可获得更强的性能。

这份方案极具启发性,让人看到了生成式推荐的无限潜力。

三支不同队伍,在具体实现路径上展现了截然不同的风格:

Echoch胜在模型结构的深度魔改与优化器创新; 

 

leejt胜在多模态特征的精细化处理; 

 

也许明天则胜在对Scaling Law的极致信仰。

 

尽管切入点有所不同,但在生成式推荐任务中均拿下了高分,不论在核心架构,还是工程优化方面,他们技术路线又存在一些共同点。

从这些选手的创新方案中,我们可以清晰看到腾讯广告的战略布局。

 

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图13
一场比赛,做成了行业标杆

 

作为连接全球技术人才的平台,本届腾讯广告算法大赛,从技术探索、人才培养、生态共建三大维度,为广告行业注入了持续创新的动能。

一场历时四个月的比赛,沉淀了无数实战成果。

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图14

全球2800+战队提出的方案,覆盖了生成式推荐创新架构、多模态对齐方法,以及系统性能优化路径。

这些不仅具有学术价值,还可以为行业提供宝贵的参考价值。

腾讯公司副总裁蒋杰提到,「我看到了一个很惊喜的点,现在的学生与工业界几乎没有代差,甚至更有创意,与过去形成了鲜明的对比」。

如今,1-3人组队就能完成一个大团队的活,这是与互联网时代学生们的本质区别。

 

在技术探索上,选手们不再局限于实验室中的数据,而是采用「分布式」工业级做法。

并且,在处理长序列数据时,熟练运用RQ-VAE、RQ-KMeans等主流手段进行向量化处理。

在人才培养上,大赛构建「以赛育才、以赛选才」的良性生态。

通过真实场景实战,让高校学子衔接学术与产业。TOP 10选手获得Offer,正是这一机制的体现。

在采访中,蒋杰突出强调了加入腾讯,能够为学生们带来的价值所在。

直入「青云计划」,在内部有一套高端培养体系,包括导师、资源、计算卡,这对学生来说是巨大的吸引力。

更重要的是,腾讯业务的多样化生态,让学生可以接触丰富的数据和场景,实现快速成长。

而在生态共建上,大赛联动「产学研用」:全球学术专家、技术精英与青年人才,还邀请香港中文大学副校长金国庆教授分享了前沿趋势。

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer图15

不仅如此,腾讯广告还将开源数据集,让更多研究者参与进来,推动多模态推荐领域的进步。

这届腾讯广告算法大赛完美收官,给人最大的感受是——标杆已经立住了。

它不只是一场比赛,更是新征程的起点。

展望未来,腾讯广告还将持续搭建高规格平台,与全球人才共赴算法宇宙的星辰大海。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
谷歌TPUv7挑战AI芯片王座(五):光交换网络——万级芯片互联架构
存储芯片大涨,背后的逻辑是什么?
融资超20亿,这家“非GPU”芯片公司跻身国产AI算力第一梯队
杭州芯片“小巨人”,要IPO了
英特尔大涨10%,有望拿下苹果芯片订单
2025年中国激光芯片行业产业链、市场规模、竞争格局及前景展望:国产替代空间广阔,行业规模将增长至538.43亿元[图]
芯片暗战:安世风波下的全球产业变局
氮矽累计推出两款GaN PIIP低压氮化镓芯片,有效简化电源系统设计
Arm 和 RISC-V 在高性能计算市场正打破x86统治地位
谷歌TPU:Meta投怀送抱、英伟达暴跌,都跟这颗“自救芯片”有关
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号