哈佛重磅突破！AI确定17000多种疾病候选药物，罕见病“孤儿药”不再遥远？

理想主义者 10-21 73

默认

摘要： 西甲第轮皇马客场对阵塞尔塔姆巴佩上半场远射破门打入皇马生涯首粒禁区外进球此役客场对阵塞尔塔首发出战的姆巴佩在比赛第分钟抓住对手后场出球失误在禁区外兜射破门帮助皇马取得领先对于罕见病...

西甲第10轮，皇马客场对阵塞尔塔，姆巴佩上半场远射破门，打入皇马生涯首粒禁区外进球。此役客场对阵塞尔塔，首发出战的姆巴佩在比赛第20分钟抓住对手后场出球失误，在禁区外兜射破门，帮助皇马取得1-0领先。

“对于罕见病患者而言，有药可用永远都是位的。”

中国国际经济交流中心理事长毕井泉曾于 2022 年这样说。

，顾名思义，是患病相对较低的一类疾病。由于患病人数少、市场需求小，以及研发难度大、成本高、周期长，罕见病难度居高不下，罕见病用药更被称为“”。绝大多数罕见病患者都面临着困难、短缺的问题。

据世界卫生组织（WHO）报道，在全球发现的超过 7000 种的罕见病中，有获批的相应方案或的病种不到10%，且大多需要终身。在这一严峻背景下，如何为罕见病寻求有效是缓解罕见病患者困境的关键一步。

这一步，在人工智能（AI）的帮助下有望向前迈出“一小步”。

日前，来自哈佛医学院的研究团队及其合作者开发了一个名为 TxGNN 的 AI 模型，这是首个专门为识别罕见疾病和无药可治病症的候选而开发的新办法，它从现有中确定了 17000 多种疾病的候选，其中许多疾病没有任何现有方法。与用于再利用的同类 AI 模型相比，TxGNN 在识别候选方面平均提高了近 50%，在预测哪些会有禁忌症方面，准确率也高出 35%。

相关研究论文以“A found ion model for clinician-centered drug rep posing”为题，已发表在 N e 子刊 N e Medicine 上。

AI 如何促进再利用？

传统的再利用（drug rep posing）策略，虽然利用现有的安全性和有效性数据，可以加快新在临床中的应用，但这种方法往往是偶然的且机会性较强，很难系统地罕见病的研发问题。

在这种背景下，TxGNN 应运而生，为重新利用带来了革命性的突破，特别是在罕见病发现中展现出巨大的潜力。

TxGNN 是一种基于图神经网络（GNN）的基础模型，专门用于零样本再利用。与传统方法不同，TxGNN 并不局限于现有和疾病的已知关系，而是通过训练一个医学知识图谱（KG），将疾病和之间的复杂关系嵌入到一个潜在的表示空间中，从而能够针对任何给定的疾病预测潜在的。该知识图谱包含了 17080 种疾病、7957 种、27671 种蛋白质等医学概念，为 TxGNN 的训练提供了丰富的数据基础。

图｜TxGNN 是再利用的图基础模型，可为选择有限且分子数据有限的疾病确定候选。（来源：该论文）

在多次实验中，TxGNN 展现出了其强大的预测能力。与 8 种现有的方法进行对比，TxGNN 在零样本环境下表现出了显著的优势。根据论文中的实验数据，TxGNN 在指征预测的准确率上提高了 19%，在副作用预测上提高了 23.9%。

这些结果表明，TxGNN 不仅能够在现有方案中找到潜在的新用途，更能够在没有已知方案的情况下，准确地预测出可能的。这对于罕见病的具有重要意义，因为罕见病中超过 95% 没有现有的，而 TxGNN 为这些疾病快速发现新创造了可能性。

图｜TxGNN 可准确预测适应症和。（来源：该论文）

除了预测能力，TxGNN 还特别设计了一个解释模块，用于帮助医生和研究人员理解模型的预测逻辑。这个模块通过多跳路径（multi-hop p hs），展示了与疾病之间的潜在联系。

解释模块不仅能够指出某种为何对特定疾病可能有效，还能提供详细的医学知识路径，让使用者能够追溯到预测背后的科学依据。通过这项功能，TxGNN 克服了许多 AI 模型在医学应用中的“黑箱问题”，大大提高了模型的可解释性和信任度。

图｜TxGNN Explainer 中多跳可解释路径的开发、可视化和评估。（来源：该论文）

研究团队对 TxGNN 在罕见病发现中的实际应用进行了验证，并取得了令人鼓舞的成果。在实验中，TxGNN 的许多预测与实际的临床非使用具有高度一致性。

例如，在对 1272085 名患者的电子病历数据分析中，研究人员发现，TxGNN 预测的在这些患者群体中的使用频率显著高于随机预测。log(OR)（共现比值）的分析显示，TxGNN 预测出的与罕见病的使用关联性比底层预测高出 107%，进一步证明了该模型在实际临床环境中的有效性。

图｜在大型医疗系统中评估 TxGNN 的预测结果。（来源：该论文）

一个具体的案例是，TxGNN 在预测 Wilson 病（一种导致铜代谢异常的罕见病）的潜在时，推荐了去铁酮（Deferasirox）作为最有前途的候选。该在临床中已被用于铁超载疾病，TxGNN 通过其解释模块展示了去铁酮可能通过代谢途径对 Wilson 病的产生积极作用。这一预测也与医学文献中的相关研究结果相符，显示了该模型的科学合理性。

在当前开发周期漫长、成本高昂的背景下，TxGNN 为现有的重新利用提供了系统化的方案。

未来，随着这一技术的不断完善，它有望成为加速开发、特别是使罕见病患者“有药可用”的关键驱动力。

在医学领域，AI 大有可为