AIR学术 | 伦敦大学王鹤:Deep learning with Priors

6月19日下午,由DISCOVER实验室主办的第47期AIR青年科学家论坛如期举行。本期论坛主题为 “Deep learning with Priors”。本次活动有幸邀请到王鹤教授为AIR的老师和同学们做报告。

讲者介绍

王鹤现为伦敦大学学院(UCL)计算机系副教授,其研究聚焦于计算图形学、计算机视觉、科学机器学习和深度学习。此前,他曾任利兹大学副教授及迪士尼洛杉矶研究院高级研究员,主持及联合主持多项由欧盟和英国研究理事会资助的数百万英镑科研项目。他是前图灵研究员,现任《Computer Graphics Forum》副编辑、英联邦奖学金委员会学术顾问,并在多项国际顶级会议中担任大会主席等重要角色。

报告内容

王鹤教授首先介绍了其在图形学、计算机视觉与科学机器学习领域的研究背景,指出传统深度学习模型虽然能够高效压缩大量信息,却难以直观理解每个神经节点的具体含义。为此,他们提出将传统物理或经验模型的先验知识(inductive bias/prior)嵌入深度网络中,以兼顾可解释性与性能提升。在此基础上,团队探讨了四种AI应用范式:纯黑盒模式(如直接用深度网络解Partial Differential Equations)、黑白分离模式(物理模型与深度模型各自独立并结合使用)、白盒带黑盒成分模式(以物理模型为主、辅以深度学习)、以及黑白混合模式(两者深度融合)。通过这种混合方式,系统能够自动识别关键区域并动态调整权重,从而在物理与非物理问题上都取得了显著的预测准确性提升。之后报告的主要内容,在围绕最后一种两者深度融合的方式上,以三篇文章作为具体样例进行展开。这三篇文章的研究聚焦于理解和预测人群在不同密度和运动复杂性上运动模式。

王鹤教授在运动曲线预测中对比了基于模型(model-based)与无模型(model-free)两类方法:前者可解释但精度有限,后者精度更高却不易解析。为兼顾二者,王鹤教授团队提出通过引入以深度神经网络参数化的社会力模型,同时结合随机性来增强预测精度,将个体运动视作受吸引力、排斥力和环境力共同作用的结果。在此基础上,王鹤教授团队进一步发展了“神经社会物理”(neuros social physics)框架:按照一般多人场景中人与人之间的运动关系来制定出相互作用力的模型,并将这些力学表达嵌入神经网络,从而更好地学习与预测复杂群体运动行为。

“神经社会物理”在预测模型的可解释性与物理信息应用方面,以平均距离误差(ADE)和最终点误差(FDE)两项指标评估模型性能,结果表明,融合物理先验的模型不仅在精度上优于多种现有算法,还具有良好的可解释性,能够为每一次轨迹预测提供合理的物理依据。

第二篇文章针对高密度场景下的人群预测的特殊挑战,他们以“人群绕中心障碍逆时针旋转”为示例,展示了模型在极端密度突增时依然能保持稳定预测。此外,鉴于真实活动(如法国音乐节)中人群行为数据匮乏,王鹤教授团队依赖光流(optical flow)数据构建了基于质点法的可微分求解器,用以从噪声速度场中学习人群运动规律。该方法能够在已知光流的基础上,预测下一时刻的速度场,从而提前识别潜在踩踏风险,为抢救争取宝贵的两分钟预警时间。

王鹤教授团队将流体动力学模型引入紧急疏散仿真,对比多种算法后发现,其模型在计算精度和规模上均具优势,且能真实再现障碍物布局对疏散速度的影响,并在此基础上构建了危险人群识别与响应策略。

第三篇文章聚焦于高密度危险人群(可能出现踩踏情况)中,个人在外力作用下的运动预测。在室内高密度场景中,他们通过倒中摆动态模型来建模单个人的运动,结合深度学习,实时预测个体摔倒风险,为安全监控系统提供预警,从而防范踩踏事故;此外,团队还将物理先验嵌入深度网络,在单人和多人场景下的人体运动预测中表现卓越,不仅在恢复平衡和形变预测上获得更高精度,也证明了物理知识在数据稀缺与模型受限条件下提升可解释性与效率的巨大潜力。

总结:王鹤教授团队不仅将物理学视为一条丰富的先验知识源:通过将物理模型与神经网络结合或直接作为网络结构的一部分,他们在提升模型可解释性、提高参数效率、并减少对大规模数据的依赖方面取得了显著进展;更广泛地,他们还计划将类似的研究模式带入心理学、经济学、神经科学与认知科学等经验证的学科知识作为“AI + X”的先验,打造多维度的模型设计与学习框架。

AIR长期招聘人工智能领域优秀科研人员

点这里关注我们

关于AIR

清华大学智能产业研究院(Institute for AI Industry Research, Tsinghua University,英文简称AIR,THU)是面向第四次工业革命的国际化、智能化、产业化的校级研究机构。AIR的使命是利用人工智能技术赋能产业升级、推动社会进步。通过大学与企业创新双引擎,突破人工智能核心技术,培养智能产业领军人才,推动智能产业跨越式发展。
AIR于2020年由多媒体及人工智能领域的世界级科学家、企业家张亚勤院士创建。
智慧交通(AI+Transportation)、智慧物联(AI+IoT)、智慧医疗(AI+Life Science)是清华大学智能产业研究院的三个重点研发方向。
往期精彩:
祝贺!AIR院长张亚勤荣获中国政府友谊奖
关于AI for Science的一些观点
AIR快讯|2025 “太湖对话·AI for Science” 活动在滨湖成功举办
张亚勤:人工智能发展的一些观点(2025)
AIR科研|推出AI数学家,独立分析数学理论并构建证明
全球智驾领袖齐聚上海,共绘自动驾驶未来蓝图——2025年「Autonomy and Beyond」高端闭门研讨会成功举办

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI AR
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号