新闻中心 >> 公司新闻 >>

能预测一千种疾病的AI,会改变医学的未来吗?

2025-10-29 11:00:12

【导语】人一生健康状况动态变化,疾病间关联复杂,科学家一直寻求更早、更准预测疾病的方法。今年9月《自然》发表研究,展示基于GPT架构的Delphi-2M人工智能模型,能依个体健康信息预测超千种疾病未来风险。它虽展现潜在价值,但尚处科研阶段,存在数据代表性、可解释性及伦理监管等挑战,未来走向临床实践仍需完善相关体系 。

在人的一生中,健康状况始终处于动态变化之中,并且许多疾病之间也存在着复杂的关联,比如慢性病常常伴随其他健康问题一起出现。这些健康变化(huà)和(hé)疾(jí)病(bìng)发(fā)生(shēng)与(yǔ)人(rén)的(de)遗(yí)传(chuán)特(tè)征(zhēng)、生(shēng)活(huó)习(xí)惯(guàn)以(yǐ)及(jí)所(suǒ)处(chù)的(de)社(shè)会(huì)环(huán)境(jìng)都(dōu)有(yǒu)关系(xì)。科(kē)学(xué)家(jiā)们(men)一(yī)直(zhí)在(zài)努(nǔ)力(lì)寻找方法,希望能更早、更准确地预测疾病的发展趋势,不仅帮助个人保持健康,也为公共卫生决策提供依据。

人工智能正在从语言、图像的理解领域,逐步进入医学预测的核心地带。今年9月,《自然》杂志发表了一项由德国癌症研究中心、欧洲分子生物学实验室和哥本哈根大学等机构合作完成的研究,展示了一个名为Delphi-2M的人工智能模型。该系统基于生成式预训练变换模型(GPT)架构,能够根据个体的健康记录、生活习惯和既往病史(shǐ),预(yù)测(cè)超(chāo)过(guò)一(yī)千(qiān)种(zhǒng)疾(jí)病(bìng)在(zài)未(wèi)来(lái)数(shù)年(nián)甚(shén)至(zhì)数(shù)十(shí)年(nián)内(nèi)的(de)发(fā)生(shēng)风(fēng)险(xiǎn)。

发(fā)表(biǎo)在(zài)《自(zì)然(rán)》上(shàng)可(kě)预(yù)测(cè)疾(jí)病(bìng)的(de)AI模(mó)型(xíng)(图(tú)片(piàn)来(lái)源(yuán):参(cān)考(kǎo)文献(xiàn)[1])

AI如(rú)何(hé)学(xué)习(xí)疾(jí)病(bìng)的(de)时(shí)间(jiān)规(guī)律(lǜ)

传(chuán)统(tǒng)上(shàng),医(yī)生(shēng)在(zài)诊(zhěn)断(duàn)时(shí)往(wǎng)往(wǎng)关注(zhù)当(dāng)前(qián)的(de)症(zhèng)状(zhuàng)或(huò)某(mǒu)一(yī)类(lèi)疾(jí)病(bìng),但(dàn)事(shì)实(shí)上(shàng),健(jiàn)康(kāng)是(shì)一(yī)条(tiáo)不(bù)断(duàn)变(biàn)化(huà)的(de)时(shí)间(jiān)线(xiàn)。很(hěn)多(duō)疾(jí)病(bìng)并(bìng)不(bù)是(shì)突(tū)然(rán)出(chū)现(xiàn)的(de),它(tā)们(men)之(zhī)间(jiān)存(cún)在(zài)复(fù)杂(zá)的(de)先(xiān)后(hòu)关系(xì)——比(bǐ)如(rú)肥(féi)胖(pàng)可(kě)能(néng)增(zēng)加(jiā)糖(táng)尿(niào)病(bìng)的(de)风(fēng)险(xiǎn),而(ér)糖(táng)尿(niào)病(bìng)又(yòu)会(huì)影(yǐng)响(xiǎng)心(xīn)血(xuè)管(guǎn)健(jiàn)康(kāng)。

研(yán)究(jiū)团(tuán)队(duì)开(kāi)发(fā)的(de)Delphi-2M模(mó)型(xíng),尝(cháng)试(shì)让(ràng)人(rén)工(gōng)智(zhì)能(néng)去(qù)学(xué)习(xí)这(zhè)种(zhǒng)疾(jí)病(bìng)的(de)时(shí)间(jiān)规(guī)律(lǜ)。它(tā)的(de)原(yuán)型(xíng)来(lái)自(zì)GPT语(yǔ)言(yán)模(mó)型(xíng),也(yě)就(jiù)是(shì)支(zhī)撑(chēng)聊(liáo)天(tiān)机(jī)器(qì)人(rén)的(de)那(nà)种(zhǒng)人(rén)工(gōng)智(zhì)能(néng)。GPT能(néng)通(tōng)过(guò)分(fēn)析(xī)句(jù)子(zi)中(zhōng)词语(yǔ)的(de)前(qián)后(hòu)关系(xì),预(yù)测(cè)下(xià)一(yī)个(gè)词;而(ér)Delphi-2M则(zé)把(bǎ)这(zhè)种(zhǒng)逻(luó)辑(ji)迁(qiān)移(yí)到(dào)医(yī)学(xué)领(lǐng)域——根(gēn)据(jù)一(yī)个(gè)人(rén)的(de)病(bìng)史(shǐ)、体(tǐ)检(jiǎn)结(jié)果(guǒ)和(hé)生(shēng)活(huó)习(xí)惯(guàn),去(qù)预(yù)测(cè)他(tā)未(wèi)来(lái)最(zuì)可(kě)能(néng)出(chū)现(xiàn)的(de)疾(jí)病(bìng)以(yǐ)及(jí)大(dà)致(zhì)的(de)时间。

健康轨迹示意图(图片来源:参考文献[1])

为了训练这个模型,科学家使用了英国生物样本库的大规模数据,涵盖约40万人从年轻到老年的诊疗记录。这些数据包括上千种疾病,从感冒、哮喘到糖尿病、癌症,还有个人的性别、体重、吸烟饮酒等信息。模型学习的目标,是找到不同疾病(bìng)之间的时间顺序与联系。

研究结果显示,Delphi-2M不仅能预测常见疾病的风险,准确度与现有的临床评估工具相当,甚至在某些疾病上更高;它还可以发现疾病之间的隐性关系,比如代谢问题可能与神经系统疾病的发生有关。更重要的是,它能基于一个人的健康记录,模拟未来20年的疾病变化趋势,为早期干预和预防提供参考。

潜在价值与现实挑战

Delphi-2M的研究成果展示了人工智能在疾病预测领域的潜在价值。它不仅能识别个体层面的健康风险,还能在群体尺度上推算未来的疾病负担。

研究团队利用模型模拟不同体重指数、吸烟与饮酒水平人群的健康轨迹,结果显示这些生活方式因素与疾病风险的变化趋势高度一致,说明模型能够反映现实中的流行病学规律。这种能力使其有望成为公共卫生规划与资源配置的重要辅助工(gōng)具(jù)。

在(zài)医(yī)学(xué)研(yán)究(jiū)层(céng)面(miàn),Delphi-2M提(tí)供(gōng)了(le)新(xīn)的(de)分(fēn)析(xī)维(wéi)度(dù)。通(tōng)过(guò)可(kě)解(jiě)释(shì)人(rén)工(gōng)智(zhì)能(néng)方(fāng)法(fǎ),研(yán)究(jiū)者(zhě)能(néng)够(gòu)追(zhuī)踪(zōng)不(bù)同(tóng)疾(jí)病(bìng)之(zhī)间(jiān)的(de)时(shí)间(jiān)依(yī)赖(lài)关系(xì)。例(lì)如(rú),模(mó)型揭示出恶性肿瘤在诊断后的数年内仍显著提高死亡率,而败血症或急性心肌梗死的风险则会在短期内逐步下降。这种时间分层的风险评估,有助于改进疾病监测和随访策略。

然而,研究团队也明确指出该模型目前仍处于科研探索阶段。首先,训练数据的代表性不足可能导致偏差。英国生物样本库的参与者以中老年白人群体为主,健康状况相对较好,模型在其他族群或社会经济群体中的适用性仍需验证。其次,模型的可解释性有限。虽然使用了可视化和因果权重分析方法,但其内部决策机制仍难以完全理解。最后,伦理与监管问题尚未解决。如何在保护隐私的同时利用健康预测结果,如何避免预测信息在保险或就业等场景中的误用,都是未来必须面对的关键议题。

总体来看,Delphi-2M展(zhǎn)示(shì)了(le)人(rén)工(gōng)智(zhì)能(néng)在(zài)医(yī)学(xué)预(yù)测(cè)与(yǔ)疾(jí)病(bìng)建(jiàn)模(mó)中(zhōng)的(de)前(qián)沿(yán)能(néng)力(lì),但(dàn)要(yào)真(zhēn)正(zhèng)进(jìn)入(rù)临(lín)床(chuáng)与(yǔ)公(gōng)共(gòng)卫(wèi)生(shēng)实(shí)践(jiàn),还(hái)需(xū)要(yào)在(zài)数(shù)据多样性、算法透明度与伦理监管方面建立更完善的体系。

结论

Delphi-2M的出现代表了人工智能在疾病预测领域的一次重要尝试。通过对数百万条健康数据的分析,它能够在个体和群体层面揭示疾病之间的时间规律和潜在联系。这种以全生命周期为视角的健康建模,为未来的精准预防、早期筛查和医疗资源规划提供了新的思路。

但研究者也强调,任何预测模型都不能取代临床判断。Delphi-2M目前仍需更多人群验证和(hé)长(zhǎng)期(qī)随(suí)访(fǎng)数(shù)据(jù)来(lái)完善性能。在医疗体系真正采用此类技术之前,如何保证数据的公平性、透明性与安全性,是必须解决的问题。

参考文献:

[1] Shmatko, Artem, et al. "Learning the natural history of human disease with generative transformers." Nature (2025): 1-9.

[2] Zhu, Zhihong, et al. "Causal associations between risk factors and common diseases inferred from GWAS summary data." Nature communications 9.1 (2018): 224.

[3] Kraljevic, Zeljko, et al. "Large Language Models for Medical Forecasting--Foresight 2." arXiv preprint arXiv:2412.10848 (2024).

策划制作

作者丨张玮杰 中国科学院大学博士;杨超 中国科普作家协会

审核丨邵文亚 福建医科大学副教授

400-85643322
广东省广州市番禺区长沙路103号
PR:com@czzscl.com; Sales:ccm@czzscl.com
粤ICP备19042278号 | © 2025 汽车芯片科技有限公司官方网站【登录入口】. All rights reserved. | 网站地图