
新智元报道
新智元报道

【新智元导读】当推荐算法行业步入深度深耕阶段,行业发展全新增长突破口在哪里?
多年来,短视频推荐系统在协同过滤、序列推荐、多目标优化等方向上经历了多轮技术迭代。
伴随现有技术体系日渐完善,通过模型结构优化、常规特征开发、可观测目标学习带来的效能提升逐步放缓,行业亟需开辟创新研究思路。
清华大学经济管理学院的陈柯均博士生、张佳音教授、徐心教授与快手消费策略算法部合作探索完成了一项联合实验:从视频传递的价值观的角度,去理解观看视频后用户的行为和心理变化。
实验尝试利用大模型的模拟和推理能力,将社会学和心理学领域中的价值观理论引入推荐排序策略,并在快手主站进行了大规模随机在线对比实验。
初步结果显示,这一方向不仅技术上可行,更在用户使用APP时长、电商、直播、社交、搜索等多个业务维度上实现了同步正向增长,创新性且系统性地实现了推荐系统在社会价值观层面上通过算法手段满足用户需求的功能。

如何将抽象的价值观概念从理论落地到推荐系统,是本项目需要解决的核心问题之一。
团队基于前期合作的产出[1],分两个阶段完成了 视频价值的大模型推理 和 轻量蒸馏模型线上生效 的完整解决方案,将离线实验验证的方法论转化为真实推荐系统的策略工具。

图1–ValueOpt技术框架

团队利用大语言模型模拟短视频受众群体,推理不同类型用户在观看视频后的行为和心理变化,进而推断用户所能感知到的价值观,大致方案沿用前期工作[1]。
完整的大模型推理流程针对部分随机采样视频进行,采样视频时间跨度为6个月,视频量累计超过650万条,基本覆盖全部类目。
注:实验中团队发现,提示大模型在过程中扮演短视频相关受众群体,能够更好地从内容语义层面识别视频所传递的价值观信号,生成的标注结果会更准确地反映受众侧的感知结果。其中视频受众群体的提取在工程上采用了 TagCF[2] 方案,理论上也可以根据场景需求通过自定义的推理模版实现。

为了应对每天数以千万计的视频理解需要,团队进一步完成了蒸馏模型规模化部署。
模型以快手自研的视频embedding为特征,以大模型推理结果为监督信号,训练轻量级蒸馏模型,将大模型强大的受众模拟和价值观推理能力迁移到可实时在线高通量服务的小模型中,实现对全量视频的价值观标签预估,从而具备多场景规模化应用的能力。
离线测试发现蒸馏小模型在充分训练后可以达到85%以上准确率,人工评测也认为其与大模型推理结果无明显差异,满足线上落地需求。
视频价值标签预估结果在线上推荐系统生效时,存在另一个关键挑战,即视频价值与用户可观测反馈关联的不可预知性。
虽然前期离线实验已验证视频价值推理结果能够有效提升视频排序的准确率,但线上真实场景中用户存在多种反馈信号(APP时长、点赞、关注、打赏、长期留存),目前也并没有任何理论论证这些反馈信号与视频价值的相关性和互补性。
此外,团队也认为不同推荐业务场景下由于其作者生态和消费者群体不同,其价值内容也会呈现明显差异,因此只有通过完整的线上对比试验才能准确判断系统隐藏的价值需求和短板。


实验在快手主站精选页的重排阶段进行,采用经典A/B实验范式 实验规模:每组约5%流量,每组覆盖千万级用户群体 实验周期:AA期观察一周,AB实验持续进行超过一个月 实验干预:每个实验组,在重排阶段,适度提升某一类价值观视频的分发权重,观察对各业务指标的影响

这是本研究最值得关注的发现——价值观调控能够拉动多个业务维度,且不同价值与多业务指标关联存在差异。
内容消费:个人安全组,显著提升了用户APP使用时长及留存指标。 直播业务:多个价值观组别(个人安全、传统、仁慈-关怀等)对直播送礼金额有显著正向影响。 电商业务:享乐主义、个人安全、社会安全等价值观组别对大盘结算GMV有明显正向贡献,买家数也呈现同步增长。 社交互动:多个价值观组别显著提升了双关用户的内容互动与分享行为,平台社交活跃度有所改善。 主动搜索:大多数实验组均显著提升了用户主动搜索次数,其中刺激类价值观视频的提升幅度最为突出。


这一系列结果背后,有两个值得深思的发现。
其一,供需平衡需求。原有的推荐分发策略以主题作为内容的主要表征维度,视频的价值观属性在分发过程中并未被显式考量。
这意味着,某些价值观类型的视频,在平台上的供给比例可能长期低于用户的潜在需求——当我们主动提升这类内容的分发权重,用户的正向反馈便随之而来。
其二,价值观的行为驱动力。本研究在全体用户层面统一提升某类价值观视频的曝光比例。实验结果表明,特定价值观维度的内容在大盘层面更容易激发用户的观看、互动与转化行为。
这一发现也具有一定的理论意义:它将社会心理学中成熟的价值观理论与推荐系统的内容理解问题连接起来,同时也为价值观理论本身提供了新的经验证据——在数字内容消费这一大规模真实场景下,不同价值观类型对人类行为的影响存在因果性、系统性差异,这是以往依赖问卷或小样本实验的价值观研究所难以探讨的问题。

这些发现的意义在于:人类的行为选择背后,往往由深层价值观驱动。不同价值观类型的内容,在激发用户消费、互动与转化行为上存在系统性差异。
除视频主题外,价值观可以作为视频内容的一个新维度,帮助推荐系统识别出那些在业务带动上更具潜力的内容,并通过调整分发策略加以放大。

图2 – 价值观在用户行为和心理转化中的驱动性影响
此外,本研究展示了一个颇具潜力的方向:将人文社科领域的理论构念引入工业级推荐系统,为工业推荐场景提供了新思路、新视角。
当然,推荐系统作为整合并匹配生产者与消费者资源的核心算法节点,可能其内在本质上就是一个「研究人的学科」。

zhangjy5@sem.tsinghua.edu.cn
liushuchang@kuaishou.com
参考资料:

