Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity

ScienceAI 2025-10-24 12:00

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图1


Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图2

作者 | 论文团队

编辑 | ScienceAI

2025 年 10 月,一篇题为《Hierarchical affinity landscape navigation through learning a shared pocket-ligand space》的论文,作为封面文章发表于 Cell 旗下期刊《Patterns》。该研究由粤港澳大湾区数字经济研究院(IDEA)AI4Science 团队、晶泰科技(XtalPi)及华盛顿大学的研究团队联合攻关,成功开发了名为 LigUnity 的亲和力基础模型。

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图3

论文地址:https://www.cell.com/patterns/fulltext/S2666-3899(25)00219-3?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS2666389925002193%3Fshowall%3Dtrue

项目地址:https://idea-xl.github.io/LigUnity

开源代码:https://github.com/IDEA-XL/LigUnity

此项工作不仅是对传统虚拟筛选工具的优化,更是一次范式级的革新 —— 它通过构建蛋白质与配体的共享表示空间,让 AI 统一学习并驾驭从大规模筛选到精细活性优化的完整药物发现流程。

任务背景与挑战

在人体中,上万种蛋白质维持着复杂的生命活动,其中许多蛋白质的异常与疾病直接相关,是潜在的药物靶点。然而,目前仅有约 10% 的蛋白质能被已知的药物分子高效结合,绝大多数靶点仍处于「黑暗」 之中,等待着被有效的药物「点亮」。

为这些靶点找到合适的药物分子,通常分为两个关键步骤:

1. 虚拟筛选 (Virtual Screening):利用计算方法,从包含数亿甚至数十亿分子的巨大化合物库中,快速筛选出少数可能与目标蛋白质结合的「苗头化合物」。此阶段的核心诉求是速度。

2. 苗头化合物优化 (Hit-to-Lead Optimization):在找到苗头化合物后,需要对其化学结构进行精细的修改和优化以增强其活性(活性优化),最终得到可进入后续试验的「先导化合物」。此阶段的核心诉求是精度。

传统方法往往将这两个任务割裂开来,使用不同的工具和模型。这种分离导致了模型效果限制:专注于筛选的模型可能无法精确区分结构相似但活性差异巨大的分子;而专注于优化的模型则难以泛化到具有全新化学骨架的潜力分子。

模型方法与核心创新

LigUnity 的核心创新在于构建了一个统一的亲和力基础模型,让 AI 学会一种能同时理解蛋白质结合口袋和药物分子的「共同语言」。

为实现这一目标,研究团队首先构建了迄今为止规模最大的、以实验(Assay)组织的亲和力数据库 PocketAffDB,其中包含了蛋白质口袋结构信息和近百万活性数据。基于此,LigUnity 通过一种创新的「层级式学习」策略进行训练:

1. 化学骨架判别:首先,模型利于对比学习(Contrastive learning)进行粗粒度的区分。它学习识别活性分子和非活性分子的骨架差异,为虚拟筛选任务打下基础。

2. 药效团排序:然后,模型利于列表排序(Listwise ranking)进行细粒度的优化。它学习对一群结构相似的活性分子,根据其活性的高低进行精确排序,以胜任苗头化合物优化任务。

在预训练期间,LigUnity 同时优化上述目标;在推理时,LigUnity 将蛋白和口袋映射至同一空间,使用余弦相似度计算其活性。在保证了高精度的同时,LigUnity 的速度比传统的分子对接方法(如 Glide-SP)快了百万倍。

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图4

实验结果

LigUnity 在横跨 6 大类应用场景的 8 个基准测试中,展现了其卓越的性能。

1. 虚拟筛选任务

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图5

2. 苗头化合物优化任务

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图6

3. 多场景应用的通用性

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图7
Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图8

结论与展望

LigUnity 通过一个统一的、层级式的学习框架,成功地将虚拟筛选与活性优化相结合,在速度、精度和泛化性上均取得了突破。它不仅是一个强大的预测工具,更是一个具备广泛适用性的基础模型,为加速早期药物发现的全流程奠定了坚实的基础。

人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
英伟达为何要投资EDA龙头新思科技?
英伟达Q3狂揽570亿美元!黄仁勋:AI芯片订单已排到2026年;闻泰科技:对安世控制权仍然受限;Meta首席AI科学家宣布辞职
告别 “造车梦”!富士康牵手OpenAI、英伟达,聚焦算力服务
信步科技陈伟秋:给出四款大小脑融合方案,和英伟达英特尔合作,天工智元都是客户|EAIRCon 2025
黄仁勋承诺:英伟达不因AI裁员,鼓励员工多用AI
TechWeb早报:DeepSeek发布全新模型V3.2,英伟达20亿美元入股新思科技
业绩超预期,英伟达盘后大涨
刚刚,2026年英伟达奖学金名单公布,华人博士生霸榜占比80%
美国考虑允许英伟达对华出售H200芯片
英伟达GPU不妙!
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号