慢性阻塞性肺疾病(COPD)是一种全球范围内普遍存在的进行性慢性呼吸系统疾病,其特征是持续的气流受限,给全球公共卫生和社会经济发展带来了沉重负担[1]。根据最新的全球疾病负担研究,COPD是全球三大主要死因之一[2],其患病率由于人口老龄化、长期吸烟暴露、空气污染和职业危害等因素而持续上升[3]。研究表明,从2020年到2050年,204个国家或地区可能面临总计4.326万亿美元的宏观经济损失,这考虑了不确定性和国家分布[4]。
COPD的临床表现往往是非特异性的,包括轻微咳嗽、痰液产生和劳力性呼吸困难,这些症状容易被误诊或遗漏,导致干预延迟和肺功能不可逆的恶化[5]。虽然支气管扩张剂后肺功能测定是诊断COPD的金标准,但它存在明显局限性:不适合大规模筛查,会漏诊早期或无症状病例,并且无法揭示准确表型和个性化治疗所需的分子多样性[6]、[7]。近年来,检测血清中的生物标志物作为一种无创、方便且可靠的诊断方法受到了广泛关注[8]。血清中含有蛋白质、脂质、碳水化合物和核酸等生物分子,这些分子在COPD中的表达和结构会发生显著变化,使其成为潜在的诊断和分类指标[9]。传统的血清生物标志物检测方法(如酶联免疫吸附测定(ELISA)受到通量低、成本高和特异性差的限制[10]、[11],难以捕捉COPD中的复杂分子变化,从而限制了其临床应用。
傅里叶变换红外(FTIR)光谱是一种强大的工具,可以快速捕捉血清生物分子的完整光谱特征,突出显示C-H、O-H、N-H和C-O等官能团的变化[12]。FTIR技术对蛋白质、脂质、核酸和碳水化合物等核心生物分子的分子振动模式具有固有的敏感性[13]。值得注意的是,COPD的特点是持续的全身炎症、氧化应激损伤和周围代谢紊乱[14]。这些病理变化不可避免地会导致血清生物分子的构象变化、结构重塑和相对含量变化。根据先前关于具有类似病理途径的慢性炎症和代谢疾病(如自身免疫疾病、慢性胃肠炎症、布鲁氏菌病等)的光谱研究,这些生物分子的变化可以直接改变特征振动带的吸收强度、峰位和峰形,尤其是酰胺带、脂质相关峰和碳水化合物吸收区域[15]、[16]、[17]、[18]。
FTIR光谱具有快速检测、样品用量少、非破坏性分析和经济实惠等优点[19],因此在医学诊断中得到广泛应用。Pabico等人[20]利用血清FTIR光谱对乳腺癌进行了分类,显示出区分健康人和乳腺癌患者的高精度。Kepesidis等人[21]使用血清FTIR光谱对肺癌患者进行了分类,并发现红外分子指纹(IMF)与肿瘤分期之间存在强相关性。随后,Fang等人[18]通过血清FTIR光谱对布鲁氏菌病患者进行了高度可靠的分类。血清FTIR光谱数据复杂且维度高。机器学习作为人工智能的一个子领域,在处理此类数据方面表现出色,越来越多地用于医学诊断和分类[18]、[20]、[21]、[22]、[23]、[24]、[25]。Severcan等人[26]结合主成分分析(PCA)和支持向量机(SVM)机器学习算法,对24名未经治疗的重症肌无力(MG)患者和42名健康对照者的血清样本进行了研究。在蛋白质光谱区域,该研究的诊断准确性、敏感性和特异性达到了100%。Pacher等人[27]使用FTIR光谱和机器学习(PCA和SVM)检测了感染Leishmania amazonensis的BALB/c小鼠的血清样本,在1800–700 cm⁻¹范围内实现了72.2%的外部验证准确率。尽管FTIR光谱已广泛用于生物分子的指纹分析和疾病诊断辅助,但目前尚无关于血清FTIR与机器学习算法结合用于COPD分类的研究。这构成了当前光谱诊断研究中的一个重要且未解决的科学空白。
本研究旨在通过将血清FTIR光谱与机器学习技术相结合,创建一种新的诊断方法,为COPD的诊断提供新的视角。