AI药物发现再进化:分子之心、斯坦福开发SurfFlow系统,破解治疗性肽设计表面互补难题

ScienceAI 2025-07-08 11:59

将 ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯


编辑 | 萝卜皮

近年来深度生成模型的进步,使得科学家可以相对精准地设计靶向难成药位点的治疗性肽,但是却低估了蛋白质相互作用(PPI)中分子表面的关键影响——就像找到了锁芯却忽略了开门的正确角度,这极大阻碍了治疗性肽的设计与发现。

为了弥补这一差距,分子之心许锦波团队与斯坦福大学团队合作提出了一种全设计肽生成范例,称为 SurfFlow,这是一种基于表面的新型生成算法,可以对肽的序列、结构和表面进行全面的共同设计。

SurfFlow 采用多模态条件流匹配 (CFM) 架构来学习表面几何形状和生化特性的分布,从而提高肽结合的准确性。

在全面的 PepMerge 基准测试中,SurfFlow 在所有指标上均始终优于全原子基线。这些结果展现了在从头肽发现中考虑分子表面的优势,并展示了整合多种蛋白质模态以更有效地发现治疗性肽的潜力。

该研究的相关技术论文已被数据挖掘领域最具影响力的国际会议KDDACM SIGKDD Conference on Knowledge Discovery and Data Mining,国际知识发现与数据挖掘大会)2025 收录。

研究背景

肽是由大约250个氨基酸组成的短链蛋白质,在各种生物过程中发挥着关键作用,包括细胞信号传导、酶催化和免疫反应。

肽是药理学中必不可少的介质,因为它们能够以高亲和力和特异性结合细胞表面受体,例如具有低毒性、低免疫原性且易于递送的细胞内效应。

传统的肽发现方法依赖于物理能量函数的频繁计算,但由于肽设计空间庞大,这种方法效率较低,因此推动了计算方法的快速发展。

近年来,在研究蛋白质-蛋白质相互作用(PPI)时,分子表面越来越受到关注,因为 PPI 很大程度上取决于相互作用蛋白质表面的互补性。表面的静电势和疏水性是决定 PPI 强度和特异性的关键因素,而其几何形状(例如突起、凹槽和裂缝)则能够实现特异性结合所必需的「锁钥」或「诱导契合」机制。

图示:有无表面约束的全原子肽设计的比较。(来源:论文)

这些表面充当着决定蛋白质如何相互识别和结合的基本界面。由于这些原因,在肽生成过程中同时考虑所有分子模式(序列、结构和表面)至关重要,从而增强所谓的全设计各个方面的一致性。

SurfFlow 

为了实现这一目标,斯坦福大学及分子之心团队提出了一种名为 SurfFlow 的新型全设计生成算法。

它将多模态流匹配 (FM) 应用于内部结构和分子表面,这些结构和表面由表面点位置和单位范数向量表示,并作为 SE(3) 中的刚性框架。

由于仅靠互补的表面几何形状并不能保证成功的结合——结合界面的精确性和电荷、极性和疏水性的放置也是必要的,因此 SurfFlow 将这些生物化学性质的约束纳入其中。

图示:SurfFlow 工作流程用于肽全方位设计,它考虑了生成过程中序列、结构和分子表面之间的多模态一致性。(来源:论文)

具体来说,它利用离散FMDFM)来处理一些分类表面特征的离散数据空间,并使用连续时间马尔可夫链(CTMC)。

此外,考虑到以可扩展的方式捕捉不规则表面几何形状、多尺度特征和蛋白质间相互作用的挑战,研究人员提出了一种等变表面几何网络(ESGN),它可以动态地模拟异构表面图,同时独特地结合表面内和表面间的相互作用。

鉴于环状性和二硫键等关键肽属性会影响稳定性和结合亲和力,他们将这些因素作为附加条件,从而增强 SurfFlow 的容量和泛化能力。

性能评估

该团队全面评估了 SurfFlow 在非条件和条件序列结构协同设计任务以及侧链填充问题上的表现。为了进行基准测试,他们使用了源自 PepBDB  Q-BioLip  PepMerge 数据集。评估结果如以下图表所示,它在所有指标上均始终优于全原子基线。

表:评估序列结构协同设计任务中不同方法的优劣,并针对 SurfFlow 关键组件进行消融研究。最佳结果和次优结果以粗体和下划线标记。(来源:论文)

图示:设计和天然肽的结合能分布,越低越好。(来源:论文)

图示:通过 DL 算法和参考文献设计的肽(左);具有循环条件的肽设计。(右)。(来源:论文)

虽然 SurfFlow 机制在原有的全原子设计机制上有所改进,但仍有进一步探索的空间。例如,如果将受体表面信息纳入联合分布模型,可以期待进一步的优化。此外,RFDiffusion 的成功表明,在 PDB 中对常规蛋白质进行预训练是有益的。

尽管如此,SurfFlow 模型是一种能够同时生成所有蛋白质模态(序列、结构和表面)的新型模型。研究人员应用 SurfFlow 解决了一个特定的肽设计难题,并将循环性和二硫键等关键特征整合到生成过程中。

据说团队很快会上线 SurfFlow,感兴趣的朋友可以期待一下。

人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展

欢迎注标星,并点击右下角点赞在看

点击读原文,加入专业从业者社区,以获得更多交流合作机会及服务。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI RF
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号