哈佛重磅突破!AI确定17000多种疾病候选药物,罕见病“孤儿药”不再遥远?
西甲第10轮,皇马客场对阵塞尔塔,姆巴佩上半场远射破门,打入皇马生涯首粒禁区外进球。此役客场对阵塞尔塔,首发出战的姆巴佩在比赛第20分钟抓住对手后场出球失误,在禁区外兜射破门,帮助皇马取得1-0领先。
“对于罕见病患者而言,有药可用永远都是 位的。”
中国国际经济交流中心理事长毕井泉曾于 2022 年这样说。
,顾名思义,是患病相对较低的一类疾病。由于患病人数少、市场需求小,以及 研发难度大、成本高、周期长,罕见病 难度居高不下,罕见病用药更被称为“”。绝大多数罕见病患者都面临着困难、 短缺的问题。
据世界卫生组织(WHO)报道,在全球发现的超过 7000 种的罕见病中,有获批的相应 方案或 的病种不到10%,且大多需要终身 。在这一严峻背景下,如何为罕见病寻求有效 是缓解罕见病患者 困境的关键一步。
这一步,在人工智能(AI)的帮助下有望向前迈出“一小步”。
日前,来自哈佛医学院的研究团队及其合作者开发了一个名为 TxGNN 的 AI 模型,这是首个专门为识别罕见疾病和无药可治病症的候选 而开发的新办法,它从现有 中确定了 17000 多种疾病的候选 ,其中许多疾病没有任何现有 方法。与用于 再利用的同类 AI 模型相比,TxGNN 在识别候选 方面平均提高了近 50%,在预测哪些 会有禁忌症方面,准确率也高出 35%。
相关研究论文以“A found ion model for clinician-centered drug rep posing”为题,已发表在 N e 子刊 N e Medicine 上。
AI 如何促进 再利用?
传统的 再利用(drug rep posing)策略,虽然利用现有 的安全性和有效性数据,可以加快新 在临床中的应用,但这种方法往往是偶然的且机会性较强,很难系统地 罕见病的 研发问题。
在这种背景下,TxGNN 应运而生,为 重新利用带来了革命性的突破,特别是在罕见病 发现中展现出巨大的潜力。
TxGNN 是一种基于图神经网络(GNN)的基础模型,专门用于零样本 再利用。与传统方法不同,TxGNN 并不局限于现有 和疾病的已知关系,而是通过训练一个医学知识图谱(KG),将疾病和 之间的复杂关系嵌入到一个潜在的表示空间中,从而能够针对任何给定的疾病预测潜在的 。该知识图谱包含了 17080 种疾病、7957 种 、27671 种蛋白质等医学概念,为 TxGNN 的训练提供了丰富的数据基础。
图|TxGNN 是 再利用的图基础模型,可为 选择有限且分子数据有限的疾病确定候选 。(来源:该论文)
在多次实验中,TxGNN 展现出了其强大的预测能力。与 8 种现有的方法进行对比,TxGNN 在零样本环境下表现出了显著的优势。根据论文中的实验数据,TxGNN 在 指征预测的准确率上提高了 19%,在副作用预测上提高了 23.9%。
这些结果表明,TxGNN 不仅能够在现有 方案中找到潜在的新用途,更能够在没有已知 方案的情况下,准确地预测出可能的 。这对于罕见病的 具有重要意义,因为罕见病中超过 95% 没有现有的 ,而 TxGNN 为这些疾病快速发现新 创造了可能性。
图|TxGNN 可准确预测 适应症和。(来源:该论文)
除了预测能力,TxGNN 还特别设计了一个解释模块,用于帮助医生和研究人员理解模型的预测逻辑。这个模块通过多跳路径(multi-hop p hs),展示了 与疾病之间的潜在联系。
解释模块不仅能够指出某种 为何对特定疾病可能有效,还能提供详细的医学知识路径,让使用者能够追溯到预测背后的科学依据。通过这项功能,TxGNN 克服了许多 AI 模型在医学应用中的“黑箱问题”,大大提高了模型的可解释性和信任度。
图|TxGNN Explainer 中多跳可解释路径的开发、可视化和评估。(来源:该论文)
研究团队对 TxGNN 在罕见病 发现中的实际应用进行了验证,并取得了令人鼓舞的成果。在实验中,TxGNN 的许多预测与实际的临床非 使用具有高度一致性。
例如,在对 1272085 名患者的电子病历数据分析中,研究人员发现,TxGNN 预测的 在这些患者群体中的使用频率显著高于随机预测。log(OR)(共现比值)的分析显示,TxGNN 预测出的 与罕见病的使用关联性比底层 预测高出 107%,进一步证明了该模型在实际临床环境中的有效性。
图|在大型医疗系统中评估 TxGNN 的预测结果。(来源:该论文)
一个具体的案例是,TxGNN 在预测 Wilson 病(一种导致铜代谢异常的罕见病)的潜在 时,推荐了去铁酮(Deferasirox)作为最有前途的候选 。该 在临床中已被用于 铁超载疾病,TxGNN 通过其解释模块展示了去铁酮可能通过代谢途径对 Wilson 病的 产生积极作用。这一预测也与医学文献中的相关研究结果相符,显示了该模型的科学合理性。
在当前 开发周期漫长、成本高昂的背景下,TxGNN 为现有 的重新利用提供了系统化的 方案。
未来,随着这一技术的不断完善,它有望成为加速 开发、特别是使罕见病患者“有药可用”的关键驱动力。
在医学领域,AI 大有可为
除罕见病领域,AI 在其他医学领域也有着广泛的应用。
2019 年 9 月,AI 研发公司 Insilico Medicine 开发了一个名为 GENTRL 的生成式 AI ,该 已用于设计用于 纤维化和癌症等疾病的新药。通过使用 GENTRL,研究人员仅使用 21 天就发现了盘状蛋白结构域受体 1 (DDR1) 的 抑制剂,极大缩短了 发现时间。
2022 年,伦敦研究所的研究人员创建了一个原型 ,可以在 24-48 小时内预测哪些 组合可能对癌症患者有效。他们使用 AI 分析来自肿瘤样本的大规模数据,可以比目前的方法更准确地预测患者对 的反应。
2023 年,美国公司 Nuance Communic ions 推出一款新型 AI 驱动的语音 软件应用程序——Dragon Ambient Expe ence (DAX) Express。该计划旨在通过利用自然语言处理技术,促进患者咨询期间医疗记 实时转录,有效帮助减轻临床医生的管理负担。
2024 年,来自医学院的研究团队及其合作者提出了临床组织病理学成像评估基础(CHIEF)模型,用于提取病理成像特征以进行系统的癌症评估。在包含 11 种癌症类型的 15 个数据集上,CHIEF 在癌症检测方面实现了近 94% 的准确率,显著优于之前的 AI 方法。
毋庸置疑,AI 在改善罕见疾病检测、 再利用以及临床流程优化方面的潜力将会越来越大,能够更好地帮助我们更好抗击疾病。
作者:阮文韵
如需转载或投稿,请直接在公众号内留言