Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity

ScienceAI 2025-10-24 12:00

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图1


Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图2

作者 | 论文团队

编辑 | ScienceAI

2025 年 10 月,一篇题为《Hierarchical affinity landscape navigation through learning a shared pocket-ligand space》的论文,作为封面文章发表于 Cell 旗下期刊《Patterns》。该研究由粤港澳大湾区数字经济研究院(IDEA)AI4Science 团队、晶泰科技(XtalPi)及华盛顿大学的研究团队联合攻关,成功开发了名为 LigUnity 的亲和力基础模型。

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图3

论文地址:https://www.cell.com/patterns/fulltext/S2666-3899(25)00219-3?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS2666389925002193%3Fshowall%3Dtrue

项目地址:https://idea-xl.github.io/LigUnity

开源代码:https://github.com/IDEA-XL/LigUnity

此项工作不仅是对传统虚拟筛选工具的优化,更是一次范式级的革新 —— 它通过构建蛋白质与配体的共享表示空间,让 AI 统一学习并驾驭从大规模筛选到精细活性优化的完整药物发现流程。

任务背景与挑战

在人体中,上万种蛋白质维持着复杂的生命活动,其中许多蛋白质的异常与疾病直接相关,是潜在的药物靶点。然而,目前仅有约 10% 的蛋白质能被已知的药物分子高效结合,绝大多数靶点仍处于「黑暗」 之中,等待着被有效的药物「点亮」。

为这些靶点找到合适的药物分子,通常分为两个关键步骤:

1. 虚拟筛选 (Virtual Screening):利用计算方法,从包含数亿甚至数十亿分子的巨大化合物库中,快速筛选出少数可能与目标蛋白质结合的「苗头化合物」。此阶段的核心诉求是速度。

2. 苗头化合物优化 (Hit-to-Lead Optimization):在找到苗头化合物后,需要对其化学结构进行精细的修改和优化以增强其活性(活性优化),最终得到可进入后续试验的「先导化合物」。此阶段的核心诉求是精度。

传统方法往往将这两个任务割裂开来,使用不同的工具和模型。这种分离导致了模型效果限制:专注于筛选的模型可能无法精确区分结构相似但活性差异巨大的分子;而专注于优化的模型则难以泛化到具有全新化学骨架的潜力分子。

模型方法与核心创新

LigUnity 的核心创新在于构建了一个统一的亲和力基础模型,让 AI 学会一种能同时理解蛋白质结合口袋和药物分子的「共同语言」。

为实现这一目标,研究团队首先构建了迄今为止规模最大的、以实验(Assay)组织的亲和力数据库 PocketAffDB,其中包含了蛋白质口袋结构信息和近百万活性数据。基于此,LigUnity 通过一种创新的「层级式学习」策略进行训练:

1. 化学骨架判别:首先,模型利于对比学习(Contrastive learning)进行粗粒度的区分。它学习识别活性分子和非活性分子的骨架差异,为虚拟筛选任务打下基础。

2. 药效团排序:然后,模型利于列表排序(Listwise ranking)进行细粒度的优化。它学习对一群结构相似的活性分子,根据其活性的高低进行精确排序,以胜任苗头化合物优化任务。

在预训练期间,LigUnity 同时优化上述目标;在推理时,LigUnity 将蛋白和口袋映射至同一空间,使用余弦相似度计算其活性。在保证了高精度的同时,LigUnity 的速度比传统的分子对接方法(如 Glide-SP)快了百万倍。

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图4

实验结果

LigUnity 在横跨 6 大类应用场景的 8 个基准测试中,展现了其卓越的性能。

1. 虚拟筛选任务

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图5

2. 苗头化合物优化任务

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图6

3. 多场景应用的通用性

Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图7
Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity图8

结论与展望

LigUnity 通过一个统一的、层级式的学习框架,成功地将虚拟筛选与活性优化相结合,在速度、精度和泛化性上均取得了突破。它不仅是一个强大的预测工具,更是一个具备广泛适用性的基础模型,为加速早期药物发现的全流程奠定了坚实的基础。

人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
具身智能×肌电神经接口:清华×手亿发布EgoEMG数据集
脑机接口 X 空间智能:下一代脑机系统为什么需要理解世界?
硬件 | 低成本开源脑机接口硬件:为嵌入式测试打通实用化路径
博睿康IPO辅导完成,"脑机接口第一股"冲刺科创板
重磅突破!两年3800小时,ALS患者输出200万词,脑机接口第一次变成“生活工具”
医疗 | 国内首个支持植入式脑机接口全技术路径的智慧手术平台启用!南充/荆州/梅州等脑机接口落地应用
产业 | 国家医保局:全球脑机接口×医保创新场景大赛启动、脑韵科技发布全球首款脑电TWS耳机、三星代工Neuralink第四代芯片、欢影医疗融资
2026“脑启蓝海、创势未来”AI 脑机接口全球挑战赛暨优脑聚创|NeuroHub Accelerator加速计划启动仪式顺利举办
生殖学博士入局脑机接口,想做一款缓解女性经期情绪问题的脑机「发箍」
倒计时1天 | 脑机接口社区诚邀您共赴2026上交会脑科学盛会!
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号