PhenoBrain:AI 助力罕见病精准诊断,突破传统困境

时间:2025年1月29日
来源:npj Digital Medicine

编辑推荐:

罕见病临床诊断面临诸多挑战,研究人员开发 PhenoBrain 这一全自动人工智能(AI)流程。经多数据集评估,其诊断性能超越人类专家及多种预测方法。该研究有望提升临床罕见病诊断准确率,意义重大。

广告
   X   

在医学领域,罕见病一直是临床诊断的难题。全球约 3.5 亿人受罕见病影响,这些疾病大多源于遗传,严重时可危及生命或导致慢性残疾,给患者带来沉重的疾病负担。然而,由于缺乏经验丰富的医生,以及众多罕见病之间症状复杂、难以区分,临床诊断率一直不尽如人意。例如,医生可能因从未见过某种罕见病而无法正确识别其症状,或者在面对大量具有相似症状的疾病时难以做出准确诊断。为了解决这些问题,来自清华大学、北京协和医院等机构的研究人员开展了一项关于罕见病诊断的研究,相关成果发表在《npj Digital Medicine》杂志上。
研究人员开发了 PhenoBrain,这是一个全自动的人工智能流程,旨在通过电子健康记录(EHR)对罕见病进行差异诊断。PhenoBrain 主要包含两个关键模块:表型提取模块和差异诊断模块。

在表型提取模块中,研究人员使用了基于深度学习的自然语言处理(NLP)方法 PBTagger。PBTagger 首先利用 TopWORDS 算法从 EHR 中识别医学术语,然后通过基于孪生 ALBERT 网络和判别深度度量学习(DDML)开发的 HPO 链接模型,将这些医学术语映射为 HPO 标准表型。为了评估 PBTagger 的性能,研究人员将其与基于标准词典的 NLP 方法进行比较,结果显示 PBTagger 在从中文 EHR 数据中提取疾病相关表型方面表现更优,其召回率达到 0.824,F1 分数为 0.732 。

差异诊断模块则利用提取的 HPO 表型来预测罕见病的排名。该模块整合了 OMIM、Orphanet 和 CCRD 等多个罕见病知识库的信息,涵盖了 9260 种罕见病的表型注释。在此基础上,PhenoBrain 采用了 17 种机器学习方法进行差异诊断,其中包括研究人员新开发的 5 种方法,如语义相似性度量模型(ICTO)、基于概率图的贝叶斯模型(PPO)等。

研究人员使用了多种数据集对 PhenoBrain 进行评估,这些数据集分为公开数据集和来自北京协和医院(PUMCH)/ 国家罕见病注册系统(NRDRS)的数据集。在公开测试集和 PUMCH 相关数据集上的实验结果表明,PhenoBrain 的 5 种新计算方法性能均优于 12 种基准方法。例如,PPO 模型在公开测试集中达到了中位数排名 4.0,前 3 召回率 0.467,前 10 召回率 0.613;集成方法在所有数据集上表现出色,其在合并的 EHR 数据集(PUMCH-L 和 PUMCH-ADM)上平均中位数排名 3.3,前 3 召回率 0.513,前 10 召回率 0.654 。

在人机对比实验中,研究人员选取了 PUMCH 五个临床科室的 75 例患者数据,对比了 PhenoBrain 与 50 名专科医生以及大型语言模型(如 ChatGPT 和 GPT-4)的诊断性能。结果发现,PhenoBrain 的平均前 3 召回率为 0.613,前 10 召回率为 0.813,显著优于医生借助外部辅助的诊断结果(前 3 召回率 0.511,前 10 召回率 0.524),也超越了 ChatGPT 和 GPT-4 。

此外,研究人员还进行了人机协作实验,将医生的诊断结果与 PhenoBrain 的预测结果相结合。结果显示,这种协作方式显著提高了诊断准确率,前 1 召回率达到 0.677,前 3 召回率达到 0.768 。

研究结论表明,PhenoBrain 在罕见病诊断方面展现出强大的性能,能够有效诊断多种罕见病,且在多个国家的数据集上表现稳健。它不仅超越了专科医生的诊断能力,还能与医生的专业知识互补,有望融入临床工作流程,提高罕见病的诊断效率和准确性。

然而,该研究也存在一定的局限性。例如,当前版本的 PhenoBrain 未将遗传信息纳入诊断过程,且由于许多罕见病症状相似,仅依靠住院文本信息难以做出准确诊断。此外,验证研究采用回顾性设计,未对表型信息不足的病例进行研究。但总体而言,PhenoBrain 为罕见病诊断提供了一种创新且有价值的解决方案,为未来的临床实践和研究开辟了新的方向。

生物通微信公众号
微信
新浪微博


生物通 版权所有