当前位置:首页 > 科技资讯 > 正文

AI预测未来健康:Delphi-2M模型开启个性化医疗新篇章

疾病的发生往往并非孤立事件,而预测不同疾病间的相互作用则是个复杂挑战。

在医疗决策的核心,精准预测患者的未来健康状况始终是关键。人工智能(AI)模型利用患者记录中的海量数据,试图揭示疾病的进展模式。然而,其潜力尚未完全释放,特别是在大规模人群中的应用。

近期,德国海德堡德国癌症研究中心等团队在Nature期刊上发表了一项突破性成果:Delphi-2M模型。该模型基于生成式预训练Transformer(GPT)技术,通过分析个人病历和生活方式,对超过1000种疾病提供长达20年的风险评估,并生成保护隐私的合成数据,为个性化医疗和长期健康规划开辟了新路径。

AI预测未来健康:Delphi-2M模型开启个性化医疗新篇章 Delphi-2M模型 AI医疗预测 个性化医疗 健康轨迹 第1张

论文链接:https://www.nature.com/articles/s41586-025-09529-3

革新GPT-2,AI绘制未来20年健康蓝图

Delphi-2M模型的核心在于,通过解析患者当前及过去的健康状况,预测未来的疾病风险并实施干预。

以往,尽管AI能从医疗记录中学习和预测疾病进展,但受限于模型架构,难以实现对多疾病、长周期、大规模的精准预测。随着人口老龄化的加剧,疾病预测的重要性愈发凸显。在此背景下,能够精准模拟多疾病进展的AI模型,将成为医疗规划与资源分配的关键工具。

为了模拟疾病历史数据,研究团队对GPT-2架构进行了改进。Transformer模型通过映射输入到嵌入空间,逐步聚合信息以实现自回归预测。他们用正弦和余弦基函数对连续年龄进行编码,并在输出头中加入另一个模块,通过指数等待时间模型预测下一时间。该架构允许用户通过提供部分健康轨迹,计算出疾病及死亡事件的每日新增率,并根据这些速率对后续token及对应时间进行抽样,逐步完成完整健康轨迹的抽样。

AI预测未来健康:Delphi-2M模型开启个性化医疗新篇章 Delphi-2M模型 AI医疗预测 个性化医疗 健康轨迹 第2张

图|Delphi-2M模型架构

Delphi-2M的训练与验证依托内、外两大高质量数据集,确保模型的泛化能力与可靠性。训练数据主要来自英国生物样本库的40万名参与者,涵盖ICD-10顶级诊断代码、性别、体重指数(BMI)、吸烟/饮酒习惯及死亡信息。

内部验证数据:英国生物样本库剩余20%参与者(约10.2万人),用于模型超参数优化;同时选取47.1万名2020年7月1日仍存活的参与者,追踪至2022年7月1日,验证模型的纵向预测能力。

外部验证数据:丹麦全国疾病登记系统的193万国民数据,时间跨度从1978-2018年。值得注意的是,应用于丹麦数据时,模型未调整任何参数,直接复用英国数据训练的权重,以此检验其跨人群、跨医疗体系的适用性。

传统临床风险模型往往注重专精,而Delphi-2M近乎实现了“全谱覆盖”,可同时预测1256种疾病及死亡风险,且精准度表现出色。

AI预测未来健康:Delphi-2M模型开启个性化医疗新篇章 Delphi-2M模型 AI医疗预测 个性化医疗 健康轨迹 第3张

图|Delphi-2M模型精准模拟了多种疾病的发病率。

内部验证表现方面,在英国生物样本库数据中,模型对多数疾病的年龄-性别分层AUC(受试者工作特征曲线下面积)平均达0.76,97%的疾病AUC超过0.5。其中,死亡风险预测的AUC最高,男女均达0.97。

与临床工具对比时,研究团队发现当使用模型预测心血管疾病、痴呆时,AUC与QRisk3、UKBDRS等经典工具相当;预测死亡风险时,AUC优于Charlson共病指数、Elixhauser共病指数等常用指标。仅在糖尿病预测上略逊于临床金标准HbA1c。

AI预测未来健康:Delphi-2M模型开启个性化医疗新篇章 Delphi-2M模型 AI医疗预测 个性化医疗 健康轨迹 第4张

图|Delphi-2M inform生成未来健康轨迹的建模方法。

不同于传统模型仅能预测1-5年的发病概率,Delphi-2M的“生成式”特性使其能模拟个体未来长达20年的健康路径。研究团队以英国生物样本库中60岁参与者为例,基于其60岁前的病史数据生成未来健康轨迹。结果显示:

首先,群体层面的吻合度较高。Delphi-2M的70-75岁疾病发病率与实际观察值高度一致。若随机打乱参与者的既往病史,模拟结果的准确性会明显下降。

其次,个体风险区分清晰。对于胰腺癌等疾病,模型能区分出“高风险”与“低风险”个体。

此外,实验证明长期预测仍然有效。随着预测时间延长,模型准确性会逐渐下降,但仍优于仅基于年龄和性别的预测。