结合机器学习的血清傅里叶红外光谱分析技术:一种用于快速诊断慢性阻塞性肺疾病的新型策略

时间:2026年5月25日
来源:Vibrational Spectroscopy

编辑推荐:

方子怡|赵慧|郑向翔|纳扎卡凯蒂·西马伊利|夏子涵|林仁勇|吕国东中国新疆医科大学第一附属医院临床医学研究所中亚高发疾病发病机制、预防与治疗国家重点实验室,乌鲁木齐830054摘要慢性阻塞性肺疾病(COPD)是一种普遍存在的进行性呼吸系统疾病,其特征是持续的气流受限,对全球公共卫

广告
   X   

方子怡|赵慧|郑向翔|纳扎卡凯蒂·西马伊利|夏子涵|林仁勇|吕国东
中国新疆医科大学第一附属医院临床医学研究所中亚高发疾病发病机制、预防与治疗国家重点实验室,乌鲁木齐830054

摘要

慢性阻塞性肺疾病(COPD)是一种普遍存在的进行性呼吸系统疾病,其特征是持续的气流受限,对全球公共卫生和社会经济发展产生了重大影响。目前,由于早期检测困难且缺乏特异性,诊断COPD具有挑战性。然而,血清傅里叶红外光谱(FTIR)技术提供了一种快速的方法,能够捕捉代谢光谱特征,为COPD的诊断提供了新的途径。本研究评估了结合主成分分析-线性判别分析(PCA-LDA)、支持向量机线性(SVM-linear)、SVM-径向基函数(SVM-RBF)、K最近邻(KNN)和决策树(DT)的血清FTIR光谱在COPD诊断中的潜力。在COPD组和健康个体的血清FTIR光谱中,1078、1172、1240、1310、1396、1452、1538、1639、2873、2928、2958和3278 cm⁻¹波长处观察到了差异。通过在2800–3080 cm⁻¹范围内使用PCA-LDA算法,分类准确性得到了最大化。当与血清FTIR结合使用时,该方法实现了100%的准确率,表明血清FTIR光谱和PCA-LDA在COPD检测中具有广阔的应用前景。

引言

慢性阻塞性肺疾病(COPD)是一种全球范围内普遍存在的进行性慢性呼吸系统疾病,其特征是持续的气流受限,给全球公共卫生和社会经济发展带来了沉重负担[1]。根据最新的全球疾病负担研究,COPD是全球三大主要死因之一[2],其患病率由于人口老龄化、长期吸烟暴露、空气污染和职业危害等因素而持续上升[3]。研究表明,从2020年到2050年,204个国家或地区可能面临总计4.326万亿美元的宏观经济损失,这考虑了不确定性和国家分布[4]。
COPD的临床表现往往是非特异性的,包括轻微咳嗽、痰液产生和劳力性呼吸困难,这些症状容易被误诊或遗漏,导致干预延迟和肺功能不可逆的恶化[5]。虽然支气管扩张剂后肺功能测定是诊断COPD的金标准,但它存在明显局限性:不适合大规模筛查,会漏诊早期或无症状病例,并且无法揭示准确表型和个性化治疗所需的分子多样性[6]、[7]。近年来,检测血清中的生物标志物作为一种无创、方便且可靠的诊断方法受到了广泛关注[8]。血清中含有蛋白质、脂质、碳水化合物和核酸等生物分子,这些分子在COPD中的表达和结构会发生显著变化,使其成为潜在的诊断和分类指标[9]。传统的血清生物标志物检测方法(如酶联免疫吸附测定(ELISA)受到通量低、成本高和特异性差的限制[10]、[11],难以捕捉COPD中的复杂分子变化,从而限制了其临床应用。
傅里叶变换红外(FTIR)光谱是一种强大的工具,可以快速捕捉血清生物分子的完整光谱特征,突出显示C-H、O-H、N-H和C-O等官能团的变化[12]。FTIR技术对蛋白质、脂质、核酸和碳水化合物等核心生物分子的分子振动模式具有固有的敏感性[13]。值得注意的是,COPD的特点是持续的全身炎症、氧化应激损伤和周围代谢紊乱[14]。这些病理变化不可避免地会导致血清生物分子的构象变化、结构重塑和相对含量变化。根据先前关于具有类似病理途径的慢性炎症和代谢疾病(如自身免疫疾病、慢性胃肠炎症、布鲁氏菌病等)的光谱研究,这些生物分子的变化可以直接改变特征振动带的吸收强度、峰位和峰形,尤其是酰胺带、脂质相关峰和碳水化合物吸收区域[15]、[16]、[17]、[18]。
FTIR光谱具有快速检测、样品用量少、非破坏性分析和经济实惠等优点[19],因此在医学诊断中得到广泛应用。Pabico等人[20]利用血清FTIR光谱对乳腺癌进行了分类,显示出区分健康人和乳腺癌患者的高精度。Kepesidis等人[21]使用血清FTIR光谱对肺癌患者进行了分类,并发现红外分子指纹(IMF)与肿瘤分期之间存在强相关性。随后,Fang等人[18]通过血清FTIR光谱对布鲁氏菌病患者进行了高度可靠的分类。血清FTIR光谱数据复杂且维度高。机器学习作为人工智能的一个子领域,在处理此类数据方面表现出色,越来越多地用于医学诊断和分类[18]、[20]、[21]、[22]、[23]、[24]、[25]。Severcan等人[26]结合主成分分析(PCA)和支持向量机(SVM)机器学习算法,对24名未经治疗的重症肌无力(MG)患者和42名健康对照者的血清样本进行了研究。在蛋白质光谱区域,该研究的诊断准确性、敏感性和特异性达到了100%。Pacher等人[27]使用FTIR光谱和机器学习(PCA和SVM)检测了感染Leishmania amazonensis的BALB/c小鼠的血清样本,在1800–700 cm⁻¹范围内实现了72.2%的外部验证准确率。尽管FTIR光谱已广泛用于生物分子的指纹分析和疾病诊断辅助,但目前尚无关于血清FTIR与机器学习算法结合用于COPD分类的研究。这构成了当前光谱诊断研究中的一个重要且未解决的科学空白。
本研究旨在通过将血清FTIR光谱与机器学习技术相结合,创建一种新的诊断方法,为COPD的诊断提供新的视角。

章节摘录

血清样本采集

本研究的所有血清样本均来自新疆医科大学第一附属医院。共使用了114份COPD患者样本和120份健康对照组(HC)样本(见表S1)。血清样本在4℃和3000 RPM下离心10分钟后,提取2毫升上清液并保存在−80℃。使用前,将其在4℃下解冻。本研究严格遵循了相关伦理指南进行

平均FTIR光谱和带分配

图1(A)显示了COPD组和健康对照组的标准化平均傅里叶变换红外光谱,波长范围分别为550–1700 cm⁻¹和2800–4000 cm⁻¹。分析的光谱范围为900–1200、1200–1500、1500–1700、2800–3080和3090–3700 cm⁻¹。这五个带在图1(A)中用方框表示。900–1200 cm⁻¹处的吸收峰主要与碳水化合物和核酸的结构单元相关。

讨论

由于缺乏特异性症状和生物标志物,COPD通常在晚期才被诊断出来,这给早期诊断带来了困难[1]、[5]。分析血清生物标志物被认为是一种有前景的疾病监测方法,因为它易于使用且侵入性小[28]、[29]。同样,FTIR光谱可以分析血清中生物分子的分子成分,许多研究表明其在血清样本中的有效性[18]、[20],

结论

我们的研究发现COPD患者和健康对照组的血清FTIR光谱存在显著差异,并发现了特定的峰。通过使用血清FTIR光谱和机器学习,特别是PCA-LDA算法,我们能够以高精度有效区分这两组。该方法覆盖2800–3080 cm⁻¹范围,比传统诊断方法更简单、更快、更具成本效益。

CRediT作者贡献声明

郑向翔:软件、资金获取、概念构思。纳扎卡凯蒂·西马伊利:正式分析、数据管理。方子怡:撰写——初稿、验证、调查、正式分析、数据管理。赵慧:资源获取、调查、正式分析、概念构思。吕国东:撰写——审阅与编辑、可视化、监督、资金获取、概念构思。夏子涵:调查。林仁勇:撰写——审阅与编辑、可视化、监督,

利益冲突声明

作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。

致谢

本工作得到了新疆医科大学重大科学研究项目培育基金(项目编号XYD2024ZX08)和中亚高发疾病发病机制、预防与治疗国家重点实验室基金(项目编号SKL-HIDCA-2024-BC2和SKL-HIDCA-2024-14)的支持。

生物通微信公众号
微信
新浪微博


生物通 版权所有