综述:基于磁共振成像的阿尔茨海默病人工智能诊断研究进展:一项综合性综述

时间:2026年6月1日
来源:Frontiers in Medicine

编辑推荐:

人工智能(Artificial Intelligence, AI),尤其是深度学习(Deep Learning, DL),已被证实可通过医学影像显著加速神经系统疾病的检测与诊断。本研究聚焦于阿尔茨海默病(Alzheimer’s Disease, AD),该疾病

广告
   X   

人工智能(Artificial Intelligence, AI),尤其是深度学习(Deep Learning, DL),已被证实可通过医学影像显著加速神经系统疾病的检测与诊断。本研究聚焦于阿尔茨海默病(Alzheimer’s Disease, AD),该疾病可通过磁共振成像(Magnetic Resonance Imaging, MRI)观察到特征性结构改变。尽管大量采用卷积神经网络(Convolutional Neural Networks, CNNs)及其他人工智能模型的研究显示出良好的诊断准确率,但现有方法仍存在诸多局限性。研究人员对近期(2000–2025年)的相关研究进行了全面评估,旨在归纳限制基于MRI的AD人工智能检测临床转化的关键瓶颈。研究明确了五大核心挑战:其一,缺乏大规模、经过严格标注且多样化的多模态数据集;其二,模型复杂度过高,在小样本队列中存在过拟合风险;其三,人工智能决策的可解释性及临床验证不足;其四,计算效率低下及能耗过高;其五,模型在异质性队列及不同成像规范间的泛化能力受限。研究表明,当前多数研究过度关注准确率的微小提升,而非解决这些关键的转化障碍。研究人员最后提出了未来的重点研究方向,强调需利用联邦学习(Federated Learning)应对数据稀缺问题,推进可解释人工智能(Explainable AI, XAI)框架的发展,并建立标准化基准测试协议,以开发灵活且适用于临床的AD早期检测人工智能方法。
1 引言
阿尔茨海默病是一种以进行性认知功能衰退为特征的神经退行性疾病,主要表现为痴呆及相关记忆功能障碍。全球范围内,2010年约有3500万患者,预计到2050年将增至8500万。仅美国2010年就有约500万确诊病例,每年因治疗、药物及护理产生的经济负担约为2.3亿美元。欧洲现有患者超过690万,预计2050年这一数字将翻倍。AD病程呈渐进性,初期表现为近期记忆受损,随后波及中期及远期记忆。由于临床症状出现前,疾病追踪可能长达十余年,因此在高危人群中进行早期识别至关重要。MRI利用磁场与无线电波成像,能够识别特定脑区维度的改变,通过评估疾病进展导致的脑区萎缩程度,可作为早期诊断的指标。
AD在老年人群中患病率为2%至5%,偶可见于年轻群体。病理机制与海马区细胞损伤及乙酰胆碱水平变化相关,神经元损伤伴随斑块沉积,导致细胞大量丢失。大脑皮层及神经递质乙酰胆碱对记忆形成至关重要。患者典型表现为无法识别新信息,如刚获知的地址,且定向力存在障碍,但远期记忆相对保留。痴呆是AD的主要临床表现,影像学技术在排除其他可逆性病因及评估病情中具有重要价值。CT及MRI可识别非退行性痴呆病因,但常规扫描并非总能直接反映痴呆病理改变。正常脑结构与健康扫描图像一致,而认知障碍患者的扫描图像则呈现异常模式。当前研究正致力于通过图像处理技术实现AD超早期(症状出现前)检测。人工智能通过机器学习(Machine Learning, ML)及深度学习算法分析脑部MRI或CT数据构建模型,已应用于包括AD在内的神经系统疾病诊断。
2 综述方法学
研究人员检索了2000年以来关于AI技术用于AD检测的相关文献,覆盖Web of Science、PubMed Central、MEDLINE、SpringerLink、ScienceDirect及MDPI等主流学术数据库,检索词包括“阿尔茨海默病严重程度”“阿尔茨海默病中的人工智能”“脑疾病诊断中的深度学习”等。研究通过Web of Science及PubMed的高影响因子索引验证文献的全面性,筛选标准聚焦于ML及DL在生物医学研究中的应用,涵盖疾病进展的各个阶段,包括“暴露期”“亚临床期”“临床期”及“恢复期”。此外,研究人员利用ResearchGate及Google Scholar补充检索,并通过追溯参考文献完善文献收集。研究采用PRISMA流程图表征文献筛选过程,检索截止日期为2025年9月30日。统计显示,领域内DL方法的应用占比(64%)高于ML方法(36%),相关发文量在2021年达到峰值。
3 CT与MRI在AD诊断中的比较
3.1 CT的观察变化
CT扫描常用于诊断及探索脑功能与行为的关联,但在AD评估中通常作为MRI禁忌时的替代方案。随着年龄增长,脑细胞伴随全身器官同步发生退行性改变。约66%的AD患者在CT上可见脑萎缩表现,但早期病变常无异常发现。认知层面,颞叶新皮质、顶叶及大脑皮层受累导致整体脑萎缩,海马区亦随病情从正常认知向损伤及痴呆进展而受损。标准CT难以区分AD与正常衰老或其他认知障碍原因。斜轴位CT可用于评估颞叶状态,其对内侧颞叶维度缩小的检测在AD鉴别中表现出较高的敏感度与特异度,但未受过专业训练的评估者仍易将AD与血管性痴呆或抑郁等非器质性因素混淆。海马评估作为放射学标志物,在痴呆初步评估中收缩准确率达91%,伴随纵裂增宽,诊断敏感度达91%,特异度为89%。CT的优势在于急诊场景下成像速度快,可辅助快速诊断。
3.2 MRI的观察变化
MRI与CT的核心区别在于成像原理:MRI利用强磁场成像,CT则利用X射线。认知障碍个体可在临床症状出现前3年被识别。证据表明,颞叶内部结构(尤其是海马及内嗅皮层)的萎缩发生于疾病极早期,甚至早于症状显现。轻度认知障碍(Mild Cognitive Impairment, MCI)患者的临床检查显示,海马体积可能已缩减超过25%。尽管海马体积与记忆测试结果及病理结果相关,但MRI观察到的白质高信号等病灶与认知损害程度的相关性尚存争议。最新实验证实,白质过度兴奋病灶会破坏皮层与皮下区域的连接,加重认知衰退。除海马萎缩外,白质高信号会导致执行功能障碍及记忆缺陷,并加速疾病进展,常提示合并血管性病变,因此需采用多模态成像技术以实现早期精准识别。对比而言,MRI无辐射、软组织分辨率高,但扫描时间长(可达60分钟)、费用高且普及率较低;CT则有辐射、骨组织分辨率高,扫描仅需数分钟、费用低且普及率高。
4 文献中的人工智能方法
4.1 图像处理
图像处理主要包括图像增强与计算机视觉两大分支。图像增强通过模糊滤波及对比度调整改善视觉质量;计算机视觉则实现图像理解与解析,服务于学习与机器人领域。Alabduljabbar等提出基于图像融合的自适应阈值原型,整合多模态MRI及CT数据,通过多级颜色编码区域区分健康组织、萎缩区及病灶区,降低噪声并优化边界检测,为AI模型提供更可靠的生物标志物。最新DL研究显示,AI可识别多种神经退行性疾病的共有解剖特征:AD与路易体痴呆(Lewy Body Dementia, LBD)均表现为海马及皮层萎缩,而血管性痴呆则以白质高信号为特征。基于多模态MRI训练的AI模型可有效区分这些差异,提升诊断精准度。脑萎缩与遗传及AD进展中的脑容量减少密切相关,遗传因素是重要的诊断指标。传统图像处理技术将图像视为二维信号,采用常规信号处理手段进行分析。2020年提出的自动阈值算法结合Sobel边缘检测与灰度梯度统计,可实现脑区分割,优化生物标志物提取。Otsu阈值法在脑肿瘤边缘识别中的应用,进一步提升了AI模型的诊断可靠性。
4.2 机器学习(ML)
ML方法分为监督与无监督学习。典型流程包括:采用基于轮廓的脑分割法(Contour-based Brain Segmentation Method, CBSM)去除颅骨,利用快速模糊聚类分割脑组织(白质与灰质),通过计算杰卡德系数(Jaccard coefficient)及骰子系数(Dice coefficient)与健康脑组织的相似度实现AD识别。支持向量机(Support Vector Machine, SVM)是应用最广泛的分类器,集成SVM策略在多变量痴呆分类中表现优异。Akbar等对比了遗传算法(Genetic Algorithm, GA)、粒子群优化(Particle Swarm Optimization, PSO)、灰狼优化(Gray Wolf Optimization, GWO)及布谷鸟搜索(Cuckoo Search, CS)四种优化算法,发现GWO在获取全局最优解方面表现最佳。预处理环节常采用自适应直方图均衡化及双向经验模态分解(Bidirectional Empirical Mode Decomposition, BEMD)提取局部二值模式(Local Binary Pattern, LBP)特征。ResNet与先进计算神经科学网络(Advanced Computational Neuroscience Network, ACNN)的对比实验表明,ResNet在469组3D MRI数据上的诊断准确率显著优于传统CNN。常用数据集包括开放存取影像研究序列(Open Access Series of Imaging Studies, OASIS)及阿尔茨海默病神经影像计划(Alzheimer’s Disease Neuroimaging Initiative, ADNI)。
4.3 深度学习(DL)
DL在图像分类中展现出巨大潜力。卷积神经网络(Convolutional Neural Networks, CNNs)的参数规模与能耗差异显著:LeNet仅5层、6万参数,能耗低;GoogLeNet达27层、6230万参数,能耗高;DenseNet-121虽仅760万参数,但因层数达121层,能耗同样处于高位。长短期记忆网络(Long Short-Term Memory, LSTM)作为循环神经网络(Recurrent Neural Network, RNN)的变体,通过输入门、遗忘门及输出门调控信息传递。视觉变换器(Vision Transformers, ViT)作为CNN的新兴替代方案,在计算效率与准确率上可达CNN的4倍,已在自然语言处理(Natural Language Processing, NLP)领域确立主导地位。Jain等结合正电子发射断层扫描(Positron Emission Tomography, PET)与生成对抗网络(Generative Adversarial Network, GAN)实现96.03%的诊断准确率,但训练耗时较长。Sørensen等采用VGG19与DenseNet169架构,灵敏度达98%,但缺乏病灶区域定位能力。多项研究证实,ResNet系列在AD诊断中表现最优,但普遍存在特征选择环节缺失的问题。2025年Zhou等提出的3D卷积块注意力模块(3D Convolutional Block Attention Module)结合Swin Transformer,准确率达92.92%,但需500轮训练,耗时过长。总体而言,DL面临数据依赖性强、计算成本高、可解释性差及泛化能力不足等局限。
4.4 集成方法
集成方法通过组合多个基模型生成最优预测模型,通常优于单一模型。研究结合功能MRI(动脉自旋标记ASL、静息态BOLD-fMRI)与熵分析,实现AD的鉴别诊断。Sone等首次在高维空间应用集成技术,将单核苷酸变异(Single Nucleotide Variants, SNVs)映射到基因组位点,通过全基因组关联研究(Genome-Wide Association Studies, GWAS)与随机森林(Random Forest, RF)分析,提出新型集成评分算法,挖掘不同数据集中的疾病相关变异信息,整合多源信息构建后验集成模型,识别复杂的AD相关遗传变异。
4.5 熵方法
熵用于量化数据集或系统的随机性或信息缺失程度,信息熵则衡量数据集

生物通微信公众号
微信
新浪微博


生物通 版权所有