将 ScienceAI 设为星标
第一时间掌握
新鲜的 AI for Science 资讯

编辑丨&
生物实验中,时常会出现这样的情况:同样的实验步骤,同样的顺序,做出来的结果却会各不一样,仿佛是因为某种奇妙的玄学在掌控着概率,为每一位敢于尝试的勇者带来挑战。
在精准医疗的蓝图中,最大的挑战之一也是如此:同样的基因变异,为什么在一个人身上会导致严重疾病,而在另一个人身上却几乎没有表现?这就是所谓的「外显率」(penetrance)难题,且长期以来,研究者缺乏能在群体规模上系统解析这个难题的工具。
来自西奈山伊坎医学院的研究人员开发了一种强大的新方法,基于机器学习,利用超过 100 万份电子健康记录,为 10 种遗传病构建 ML 模型,成功预测了不同变异在群体中实际致病的可能性。
该研究以「Machine learning–based penetrance of genetic variants」为题, 于 2025 年 8 月 28 日发布在《Science》。

论文链接:https://www.science.org/doi/10.1126/science.adm7066
外显率的有效性验证
测序技术的进步使得人们在与疾病相关的基因中发现了大量罕见的遗传变异,这些变异数据汇集了来自不同来源的变异解读。然而,基于对日益庞大的人群数据集的分析,学者们对许多此类变异的临床解读提出了质疑。一些所谓的致病变异在相对健康的人群中出现的频率表明,以往的解读可能存在分类错误、缺乏因果关系。
临床遗传学中现有的变异解读过程中,大多存在医生的主观性与不确定性。这就需要利用电子健康记录这种承载了数百万患者信息的库,对遗传变异相关的疾病风险进行更少偏倚的评估,为更准确的变异解读和风险评估提供支持。
本次研究的核心是利用梯度提升树(gradient boosting trees) 来识别不同因素之间的非线性关系。这一方法能更精细地刻画某一遗传变异在不同人群、不同背景下的真实外显率。换句话说,它并不是只回答「有或没有」,而是告诉你 「发生的概率是多少」。

图1. 研究设计和工作流程示意图。
与传统的统计回归相比,它不再假设单一变量与结果的线性关系,而是能自动识别基因、环境、个体背景等多维因素的组合效应。输出结果里,不仅包含基因序列层面的信息,还涵盖疾病表型、人口学特征等。最终输出的不是一个「致病/不致病」的标签,而是一个概率:这一变异在这类人群中,究竟有多大概率导致疾病?
各类验证问题
尽管机器学习外显率有更精确和定量的估计,但它仍与诊断外显率相关。
外显率是介于 0 到 1 之间的分数,反映患病的可能性。通过这种评估方式,团队计算了超过 1,600 个遗传变异的「ML 患病率」分数,并展示出了预料之内的梯度表现:致病(P)与失活(LoF)变异最高,良性(B)变异最低,在不同人群中差异显著。

图 2:不同类别、等位基因频率(AFs)和体外功能效应评分的变异体的 ML 外显率验证。
团队评估了功能丧失(LoF)变异体的 ML 外显率,在共 228 个 LoF 变异中,48 个(21%)被标为高渗透率(≥0.75),41 个(18%)为低渗透率(≤0.25)。也就是说,哪怕是「教科书式」致病机制(LoF)里,渗透率也并非铁板一块。
高渗透 LoF 携带者在纵向数据中,肾小球滤过率(GFR)显著下降,病例复核显示其中 6 人已确诊 PKD,1 人诊断为未特指 CKD;并记录到 4 例 ESRD、2 例透析、1 例肾移植 等严重事件;相比之下,低渗透 LoF 的携带者更稳定一些,印证了「渗透率低 → 临床表型淡化」。
这种外显率预测方法的突破性之处在于,它为遗传学带来了更贴近现实的风险评估。对于携带 BRCA1 变异的个体,不再只是「高风险」模糊提示,而是能得到一个明确的概率区间。对外显率数据集的分析将有助于识别疾病风险中的关联、模式或时间趋势,医生得以深入了解疾病的发病机制、致病变异体等信息。
在更复杂的多基因疾病背景下,模型还能帮助筛选出值得进一步随访的重点人群。研究团队强调,这种概率化解读能帮助医生在遗传咨询、预防性手术决策、药物干预选择中做出更有根据的判断。
医学中的概率语言
研究者表示,AI 模型并不旨在取代临床判断,但它可以作为一个重要的指导,尤其是在测试结果不明确时。未来,医生可以使用患病率评分来决定患者是否需要更早的筛查或预防措施,如果变体风险较低,也可以避免不必要的担忧或干预。
团队也提醒,目前的模型仍依赖样本库的质量与规模,不同人群的代表性不足可能限制外推。未来,他们计划结合更多跨疾病、跨地区的数据库,并与电子病历系统深度整合,真正实现基因检测到临床实践的无缝衔接。
人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。