综述:基于神经影像数据利用人工智能技术对阿尔茨海默病进行分类的研究进展

时间:2026年5月18日
来源:Frontiers in Artificial Intelligence

编辑推荐:

阿尔茨海默病(Alzheimer‘s disease, AD)是一种以记忆障碍为特征的渐进性脑部疾病。该疾病无法治愈且具有进展性,最终会导致痴呆阶段。治疗在早期阶段有效,可控制但无法治愈。人工智能(Artificial Intelligence, AI)学习模

广告
   X   

阿尔茨海默病(Alzheimer‘s disease, AD)是一种以记忆障碍为特征的渐进性脑部疾病。该疾病无法治愈且具有进展性,最终会导致痴呆阶段。治疗在早期阶段有效,可控制但无法治愈。人工智能(Artificial Intelligence, AI)学习模型在医学科学中被用于检测疾病并将其分类为特定类别。研究人员从医学影像中提取特征,并使用AI学习模型进行训练,以实现对AD的精确诊断。机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)模型的最新进展,在利用神经影像、遗传信息和临床评估等多种数据模态识别AD方面展现出巨大潜力。本研究重点探讨了先进的ML和DL技术在AD识别与分类中的应用,包括回归模型、决策树、随机森林、支持向量机(Support Vector Machine, SVM)、k近邻(K-Nearest Neighbors, KNN)、集成模型、卷积神经网络(Convolutional Neural Network, CNN)、循环神经网络(Recurrent Neural Network, RNN)和生成对抗网络(Generative Adversarial Network, GAN)。研究分析了每种模型的优势、局限性和性能指标,并特别强调了数据预处理和增强技术对于提高模型准确性和鲁棒性的重要性。该综述指出,与单一模态模型相比,多模态方法,特别是磁共振成像(Magnetic Resonance Imaging, MRI)与正电子发射断层扫描(Positron Emission Tomography, PET)数据的融合,提高了分类准确性。此外,迁移学习技术通过利用预训练模型,在克服数据限制方面显示出潜力。该综述还强调了评估指标在衡量模型性能中的关键作用,指出需要一套包含准确率、精确率、召回率、F1分数和Cohen’s Kappa在内的多样化指标。本研究指出了当前文献中的一些空白,包括某些指标的报告不足以及需要进行更全面评估的必要性,并为未来研究提供了建议。最后,本研究讨论了该领域面临的挑战与机遇,包括提高模型的泛化能力、增强可解释性、先进的数据预处理与增强、与临床工作流程的整合以及多模态数据融合。本综述提供了整合性信息,可能对研究人员、临床医生和数据科学家有所裨益,为AI驱动的AD检测领域的当前趋势、挑战和未来研究方向提供了见解。
2 调查方法
本综述文章介绍了用于AD检测的最新ML和DL技术。其目的是识别研究空白,并帮助设计更好的模型以获得准确结果。本综述旨在帮助研究人员在一份稿件中了解最新技术,以继续他们的研究方向。2.1 研究问题与PICO框架 本综述遵循De-La-Cruz等人(2022)提出的系统综述方法指南。它由以下三个研究问题指导,这些问题构建了文献范围、模型分析以及多模态策略评估的框架。RQ1:有哪些用于神经影像数据AD分类的ML/DL技术?RQ2:这些模型在准确率、精确率、召回率和F1分数方面报告的对比性能如何?RQ3:哪些数据模态和多模态融合策略展现了最高的分类效能?本系统综述的范围由PICO框架明确界定。其四个要素分别为:人群、干预、对照和结局。2.2 纳入与排除标准 一项系统的文献检索在PubMed、Scopus、IEEE Xplore和Web of Science四个主要电子数据库中进行,涵盖2018年至2025年的出版物。搜索词是“Alzheimer's disease”、“mild cognitive impairment”、“classification”、“detection”、“diagnosis”、“ML”、“DL”、“convolutional neural network”、“MRI”、“PET”、“EEG”、“multimodal”和“neuroimaging”的组合。2.3 研究选择过程 经过筛选,最终纳入108篇参考文献,包括84项主要的AD分类研究、10篇基础模型/算法参考文献、5篇数据集参考文献、7篇综述和临床背景参考文献以及2篇系统综述方法参考文献。选择过程总结在PRISMA流程图中。
3 数据集
大多数研究使用了来自阿尔茨海默病神经影像学倡议(Alzheimer's Disease Neuroimaging Initiative, ADNI)和开放获取系列成像研究(Open Access Series of Imaging Studies, OASIS)的数据。ADNI是最大且使用最广泛的数据库。ADNI存储库包含成像、遗传和临床数据。它包括研究特征,如ADNI-1、ADNI-2、ADNI-3和ADNI-GO。每个研究特征包括正常对照组、轻度认知障碍、早期MCI、晚期MCI和AD受试者。OASIS有五个子集:OASIS-1、OASIS-2、OASIS-3、OASIS-3_TAU和OASIS-4。这些数据集中每一个都为AD研究提供了独特的优势。3.1 数据预处理技术 神经影像数据在用于AI模型之前必须经过广泛的预处理。文献中最常见的预处理步骤包括:3.1.1 数据清洗与归一化 这包括颅骨剥离、强度归一化、运动校正、空间归一化和分割。3.1.2 从成像数据中提取特征 预处理后,神经影像数据会进行特征提取,包括体积分析、纹理与形态特征以及功能连接测量。3.2 数据增强 为了克服数据限制并提高AI模型的泛化能力,增强技术非常重要。增强技术包括基于图像的增强和合成数据生成。
4 阿尔茨海默病检测的机器学习模型研究
ML模型是一种直接从数据中学习模式和关系以执行特定任务的计算模型。在利用神经影像进行AD检测的背景下,大多数研究采用监督学习来解决分类任务。本节分析了用于AD检测和分类的各种ML模型以及所使用的医学影像类型。4.1 回归 回归用于发现因变量与一个或多个自变量之间的关系。多元逻辑回归应用于早期AD检测的排列熵。在静息态脑电图和结构MRI的比较中,结构MRI的表现优于脑电图。4.2 决策树 决策树是一种强大的监督学习算法,用于回归和分类任务。Oltu等人(2021)从静息态脑电图信号中提取判别性特征,并输入到装袋树分类器。Ahmed等人(2022)应用Boruta特征选择,并使用梯度提升树模型对受试者进行分类。4.3 随机森林 随机森林是一种流行的监督学习算法,用于回归和分类任务。Khan等人(2022)开发了一个使用OASIS数据库纵向MRI图像的多模态ML流程。随机森林在多种分类器中实现了最高的早期AD检测准确率。Gaubert等人(2021)结合多模态生物标志物来筛查临床前AD,随机森林因其处理高维相关数据并提供特征重要性的能力而被选为最佳分类器。De和Chowdhury(2021)在扩散张量成像数据上提出了排名调制融合方法,在决策级别将随机森林预测与CNN输出融合。Parameswari等人(2022)使用随机森林处理阿尔茨海默病阶段热分析中缺失和不规则采样的数据。4.4 k近邻 KNN算法是一种基本的分类算法。KP和Thiyagarajan(2022)将Fisher评分与贪婪搜索相结合进行特征选择,然后在多模态数据上应用KNN。Lu等人(2023)使用樽海鞘群算法优化模糊KNN变体。Elgammal等人(2022)在应用KNN之前提出了基于多重分形几何的策略以增强特征表示。4.5 支持向量机 支持向量机是一种用于线性或非线性回归和异常值检测的监督ML算法。Arco等人(2021)应用基于搜索灯方法的多元模式分析来整合MRI和神经心理学数据。Kishore等人(2021)的研究报告,在使用纵向MRI数据集结合认知测量时,带有线性核的SVM优于其他ML算法。Richhariya等人(2020)使用泛支持向量机-递归特征消除来识别判别性脑组织特征。Rallabandi等人(2020)在大型神经影像数据集中,非线性SVM在区分MCI和AD受试者方面实现了最高的分类准确率。Lei等人(2020)利用功能性和结构性大脑数据构建大脑连接网络,其中SVM分类器有效地利用这些特征进行AD预测。Ghoraani等人(2021)将步态分析与蒙特利尔认知评估分数结合使用来检测MCI。4.6 极限学习机方法 Sudharsan和Thailambal(2021)使用基于正则化极限学习机的决策树训练了来自ADNI的214名受试者。Lin等人(2021)在AD诊断中使用线性判别分析评分方法融合图像。4.7 集成模型 集成学习是一种结合多个个体模型的预测以获得比单一模型更好性能的ML算法。Qu等人(2021)使用自动纤维量化来提取沿18个白质纤维束的扩散测量值,并使用XGBoost进行分类。Khan等人(2022)使用极端梯度提升、决策树和具有多项式核的支持向量机来提高诊断准确性。Ma等人(2023)的集成模型将三维残差卷积模块与宽度学习系统集成,从MRI图像中捕获深度和广度特征。Chen等人(2023)结合了多个CNN与Transformer架构。Jenber Belay等人(2024)的模型将深度集成学习技术与量子机器学习方法相融合。Kavitha等人(2022)训练了不同的ML算法,包括决策树分类器、随机森林分类器、支持向量机和XGBoost,然后将它们集成以预测最终结果。Sharma和Dey(2021)使用随机森林和正则化回归模型的集成来探索前额叶皮层、中颞回、海马和内嗅皮层的遗传生物标志物。

生物通微信公众号
微信
新浪微博


生物通 版权所有