综述：利用机器学习增强光谱技术进行乳腺癌诊断：综述

时间：2026年5月8日

来源：Lasers in Medical Science

编辑推荐：

摘要本文献综述探讨了机器学习（ML）和深度学习（DL）在提升乳腺癌诊断光谱技术方面的变革性作用。通过综合2015至2025年间发表的同行评审研究结果，我们评估了ML/DL整合如何改进与恶性肿瘤相关的生化变化的检测，从而实现健康组织和癌组织的非侵入性、快速且准确的区分。本文重

摘要
本文献综述探讨了机器学习（ML）和深度学习（DL）在提升乳腺癌诊断光谱技术方面的变革性作用。通过综合2015至2025年间发表的同行评审研究结果，我们评估了ML/DL整合如何改进与恶性肿瘤相关的生化变化的检测，从而实现健康组织和癌组织的非侵入性、快速且准确的区分。本文重点介绍了拉曼光谱、荧光光谱、扩散光学光谱（DOS）和光声光谱（PAS）等关键技术，并分析了它们与卷积神经网络（CNNs）、支持向量机（SVMs）和逻辑回归等AI驱动模型的结合方式。这些技术通过分析血红蛋白、脂质和胶原蛋白等光谱生物标志物，实现了高达94%的亚型分类准确率（例如，luminal A型、HER2阳性）。同时，也深入评估了数据变异性、模型可解释性以及临床应用障碍等挑战。研究结果表明，ML/DL增强的光谱技术有潜力标准化诊断流程、减少不必要的活检，并实现个性化治疗监测。未来的发展方向包括发展可解释的AI（XAI）、多模态数据融合以及大规模多样化数据集，以解决技术转移中的关键问题。通过克服技术、伦理和监管方面的障碍，这种整合有望促进早期检测、改善临床效果，并重塑精准肿瘤学的发展。

图形摘要
该图形摘要展示了机器学习（ML）在乳腺癌诊断光谱中的应用。ML通过卓越的模式识别能力、早期检测和个性化治疗方式，显著提升了乳腺癌诊断的光谱技术。它实现了自动化、高通量分析以及多模态数据集成，进而提高了诊断的准确性、一致性和可扩展性。

引言
乳腺癌是指乳腺组织中细胞快速增殖的现象。乳腺主要由腺体和间质两种组织构成，大多数乳腺癌起源于腺体组织，尤其是乳腺导管和小叶内的细胞。乳腺癌约占所有癌症病例的11.6%，是女性中第二常见的癌症[1,2,3]。该疾病主要影响女性，且发病率随年龄增长而上升，80%的病例发生在50岁以上的女性中，而35岁以下女性被诊断出的比例不到5%[4]。根据多项研究，2020年全球约有68.5万人死于乳腺癌[2, 4, 5]；到了2021年，这一数字降至约4.36万人[1]，这归功于先进的治疗技术和早期诊断的进步。世界卫生组织（WHO）和国际癌症研究机构（IARC）预测，到2040年癌症负担（包括乳腺癌）将增加超过46%[6]。鉴于低收入地区的乳腺癌发病率预计将持续上升，加强预防、早期检测和治疗策略变得尤为紧迫。尽管癌症的发展和扩散受多种因素影响，但遗传易感性是一个重要因素，BRCA1和BRCA2基因突变会显著增加患癌风险（10%[7]）。乳腺癌通常表现为乳房内的肿块，其中90%为良性且无痛[4]。乳腺癌的临床表现包括乳房形状和大小的变化、凹陷、水肿、起泡、乳头形态改变以及分泌物异常，在严重情况下还可能出现溃疡，因此定期进行自我检查非常重要[7, 8]。根据雌激素受体阳性（ER+）、孕激素受体阳性（PR+）、人表皮生长因子受体阳性（HER+）及三阴性（缺乏上述任何受体表达）等免疫组化特征，乳腺癌被分为四种亚型：luminal A型、luminal B型、HER2型和TNBC型[5]。了解亚型有助于更精确的诊断和制定有效的治疗方案。早期发现乳腺癌可有效治疗约90%的早期病例，以及50-80%的中晚期病例[9]。常用的乳腺癌诊断方法包括乳腺X光摄影、热成像和超声检查[1, 4, 9]：超声能深入扫描异常区域，而乳腺X光摄影则专注于关注区域，可揭示良性或恶性病变[1, 4]；热成像则通过测量表面体温生成热图像并转化为电信号[9]。尽管这些方法基于组织病理学和受体状态对肿瘤进行分类，但新兴的分子谱分析揭示了这些亚型内的显著异质性，增加了诊断和治疗的复杂性[10]。现有的筛查方法在特异性（≤85%）、患者舒适度和可及性方面存在局限，特别是在资源有限的环境中。乳腺X光摄影在致密乳腺组织中的敏感性较低（40-78%），超声检查的依赖性强，导致人群中的假阴性率在15-30%之间[11,12,13]。这些不足促使人们关注能够检测形态变化前生化改变的非电离、低成本替代技术。除了上述诊断方法外，还有多种成像技术用于乳腺癌的诊断，如X射线成像、磁共振成像、磁共振光谱以及光学成像和光谱技术[14]。光学成像和光谱技术因其实时性、高灵敏度和非侵入性而被认为适用于难以到达区域的癌症检测。这些技术利用光在组织中的传播来评估其光学特性，反射、折射、吸收和散射是光与组织相互作用的主要原理。血红蛋白作为主要的吸光分子，在整个光谱范围内吸收光线[14]，其浓度变化能反映血管生成情况，是监测癌症进展的重要指标[15]。Chohan等人的综述[15]讨论了多种用于乳腺癌检测的生物标志物，如胶原蛋白、弹性蛋白、烟酰胺腺嘌呤二核苷酸（NADH）和黄素腺嘌呤二核苷酸（FAD）。光学光谱技术已被证明能够有效标记组织和细胞中的物理化学变化，特别是在区分健康组织和恶性肿瘤方面具有突破性。其中，拉曼光谱（RS）是一种快速、无创且高效的诊断方法，基于非弹性散射原理；荧光光谱用于检测血液、尿液或痰液中的生物分子浓度，作为癌症存在的标志[14]。尽管传统的拉曼和荧光光谱仍在使用，但最近的发展带来了更先进和高效的方法，例如扩散光学光谱（DOS）和光声光谱（PAS）。DOS利用近红外光区分恶性和良性组织，通过检测血红蛋白、水和脂质等生物标志物；PAS结合激光光和超声生成高分辨率的肿瘤血管和氧合图像，有效检测肿瘤缺氧情况及监测患者的治疗反应[16]。虽然上述方法应用广泛，但还可以单独或与其他方法结合使用以获得更准确的诊断结果。人工智能（尤其是机器学习（ML）和深度学习（DL）在乳腺癌诊断中发挥了重要作用，AI在医学领域的应用尤其是早期疾病诊断方面取得了显著进展[9]。AI辅助诊断（CAD）有助于降低癌症导致的死亡率[17]。目前医学图像仍主要由受过培训的放射科医生评估，他们能够直观识别疾病的存在与否、界定肿瘤边界、评估治疗反应和检测疾病复发。基于AI的医学成像因其对医学的实际和虚拟影响而得到广泛应用[18]。机器学习（ML）是一种利用神经网络算法的AI分支，帮助机器理解和解决类似人类大脑的问题[18]。深度学习（DL）基于人工神经网络（ANN）概念，模仿大脑分析图像特征、检测疾病和处理数据[17, 18]。本文总结了当前该领域的发展情况，探讨了常用光谱方法、ML/DL对光谱数据分析和改进诊断精度的贡献，以及人工智能辅助光谱技术在乳腺癌诊断中的实际应用前景。

方法论
本综述综合了近年来结合机器学习和深度学习方法应用于乳腺癌诊断的光谱技术进展。尽管这不是一项系统的回顾性研究，但采用了一种透明且结构化的文献搜索策略，以确保全面覆盖相关研究，最小化选择偏差，并提供对当前发展、诊断能力以及机器学习/深度学习辅助的光谱学癌症诊断中剩余挑战的严谨、基于证据的综述。

**文献搜索与选择**

使用PubMed、Scopus、Web of Science和Google Scholar数据库进行了彻底的文献搜索。为了找到其他相关研究，还检查了检索到的出版物和相关综述的参考文献列表。优先考虑了包含关于光学光谱技术（包括拉曼光谱、荧光光谱、漫射光谱和光声光谱）与机器学习或深度学习方法结合用于乳腺癌诊断的实验性、方法学或临床研究的同行评审文章。

**使用的关键词**

搜索字符串结合了以下术语的不同布尔组合：“光学光谱”、“拉曼光谱”、“荧光光谱”、“漫射光谱”、“光声光谱”、“生物医学光谱”、“机器学习”、“深度学习”、“人工智能”、“光谱分析”、“卷积神经网络”、“支持向量机”、“光谱生物标志物”、“乳腺癌诊断”、“肿瘤分类”和“光学成像”。

**时间范围**

考虑了2010年至2025年期间发表的文章，以捕捉乳腺癌研究的历史和近期进展。

**语言**

仅包括以英语发表的研究，以确保对机制发现的准确解释和比较。

**纳入标准**

- 原创的实验性、计算性或临床研究，探讨使用光学光谱技术（如拉曼光谱、荧光光谱、漫射光谱或光声光谱）进行乳腺癌检测或特征分析。
- 结合机器学习或深度学习方法（例如卷积神经网络、支持向量机、随机森林或逻辑回归）进行光谱分析、肿瘤分类或生物标志物识别的研究。
- 报告定量诊断结果的文章，包括与光谱乳腺癌检测相关的性能指标，如准确性、敏感性、特异性或曲线下面积（AUC）。
- 讨论光学光谱、人工智能辅助的光谱分析或光谱技术在临床应用中进展的综述文章和方法学研究，以提供背景和比较信息。

**排除标准**

- 非同行评审的文献，包括没有完整论文的会议摘要、社论、评论或观点文章，以确保科学严谨性。
- 专注于非相关癌症类型、非光学诊断技术或非基于光学光谱的成像模式的研究。
- 缺乏足够方法学细节、定量诊断结果或与机器学习辅助的光谱乳腺癌检测不明确相关性的报告。
- 仔细筛选并移除了重复出版物或来自同一数据集的重叠报告，以避免冗余。

应用纳入和排除标准后，共选取了121篇同行评审的研究进行详细分析。

**光学光谱的类型**

光学光谱是一种非侵入性技术，可以感知微小变化，并提供有关组织状态的定量生化信息。光谱技术有潜力区分恶性致癌组织和良性非癌组织。此外，它可以检测指示乳腺癌进展的具体光学生物标志物（图1）。对光学光谱技术的系统比较表明，每种模式都提供了互补的诊断信息（表1）。

**图1**
该图像的替代文本可能是使用AI生成的。

**表1**
各种光学光谱模式的比较及其优缺点

**拉曼光谱（RS）**

拉曼光谱是一种强大的分子振动光谱技术，用于检测分子振动并提供有关样本组成的信息[27]。它提供了振动光谱的“指纹”，从而识别样本的每个成分[12, 28]。拉曼光谱基于单色光与非弹性散射的原理，大部分光发生弹性散射（瑞利散射），而一小部分光与分子振动发生能量交换，这被称为拉曼散射。如果分子获得能量，则发生斯托克斯散射；如果失去能量，则发生反斯托克斯散射。拉曼位移揭示了每种分子独特的振动能量水平（图2 [29, 30]）。拉曼光谱可以区分四种主要类型的乳腺癌：腔内A型、腔内B型、HER-2+型和三阴性乳腺癌（TNBC）。在拉曼光谱中，可以观察到与DNA、脂质和氨基酸相关的独特光谱特征，这些特征可作为癌症检测的生物标志物[31, 32]。

**图2**
该图像的替代文本可能是使用AI生成的。

**示意图展示了通过拉曼光谱检测光散射的过程。**
- 瑞利散射不涉及能量变化，
- 斯托克斯散射导致能量损失，
- 反斯托克斯散射导致光子能量增加。

这可以通过直接分析组织来实现，在组织中观察到DNA/RNA、脂质和蛋白质成分的变化。例如，脂质含量的减少和核酸的增加可能表明细胞增殖[33]；液体活检分析涉及从血液和血浆等体液中收集和分析肿瘤来源的物质。检测到的关键成分包括外泌体、循环肿瘤细胞（CTCs）、无细胞DNA/RNA和蛋白质[32, 34, 35, 36, 37]。

蛋白质在癌症生物学中起着核心作用，因为它们影响细胞凋亡、增殖、信号传导和免疫侵袭，这些都是癌症发展的主要原因。在拉曼光谱中，可以检测到不同波长的多种蛋白质，例如在肿瘤组织中升高的苯丙氨酸（1002 cm⁻¹），这表明蛋白质合成增加[29, 38]。酰胺III（~ 1271 cm⁻¹）与二级结构相关[39]，而芳香环（1518 cm⁻¹）的强度在HER2+肿瘤中降低，反映了芳香含量的减少[29, 35, 40]。脂质是第二个重要的生物标志物，对膜结构和细胞信号传导有贡献，任何脂质代谢的变化都可以作为癌症的标志。例如，CH2弯曲（~ 1448 cm⁻¹）在肿瘤组织中的减少表明膜降解或脂质耗尽[32, 38, 39]。CH3/CH2（~ 1309 cm⁻¹）反映脂肪酸链含量，在侵袭性肿瘤中较低；而CH拉伸振动（2850–2950 cm⁻¹）在癌症血清中可能由于代谢变化而减少[38, 39]。

核酸如DNA和RNA作为生物标志物，在724–754 cm⁻¹的波长范围内反映肿瘤细胞的复制和转录活性；在癌症组织中，核苷酸的环呼吸模式增加；800–900 cm⁻¹的磷酸骨架振动增加；在HER2+癌症中，DNA–蛋白质相互作用减少[12, 32, 35, 39]。胶原蛋白的变化在869 cm⁻¹的波长范围内反映肿瘤相关的细胞外基质重塑（脯氨酸和羟脯氨酸）在癌症中的减少[38, 40]。外泌体生物标志物是携带母细胞分子特征的细胞外囊泡，包括HER2和EGFR，在治疗过程中动态跟踪以预测反应。CTCs作为转移和疾病功能的指标，通过SERS偶联抗体检测EpCAM和HER2，允许进行非侵入性监测；微钙化是原位癌的早期标志物，通过拉曼光谱检测特定的磷酸振动[34, 35, 41]。

**荧光光谱**

荧光光谱是一种广泛用于检测乳腺癌中特定生物标志物的分析工具。这些生物标志物包括蛋白质、核酸和细胞外载体（如外泌体）[42]。这些方法基于某些因素，如荧光探针、量子点和纳米材料，以提高信号灵敏度和特异性[42, 43, 44]。荧光是一种光物理过程，其中物质在吸收较短波长的光后发出较长波长的光（图3）。当分子吸收光子时，其电子被激发到更高的能量水平。当电子返回基态时，它们以可见光或近可见光的形式释放能量。在乳腺癌诊断中，荧光光谱通过检测荧光团发出的光和激发波长提供分子对比度。这种荧光团与某些特定生物分子（生物标志物）相互作用，导致可测量的荧光强度[45]。这有助于区分癌细胞和正常乳腺细胞。

**图3**
该图像的替代文本可能是使用AI生成的。

**示意图展示了荧光过程的Jablonski图：**
分子吸收光并转化为更高电子状态（激发态），然后通过荧光回到最低振动能级，再回到基态。

**尼古酰胺腺嘌呤二核苷酸（NAD）和黄素腺嘌呤二核苷酸（FAD）的还原形式提供了对肿瘤代谢和氧化还原状态的洞察，**
它们作为癌细胞代谢活动的标志物，可用于评估雌激素受体表达如何影响代谢过程[46]。由于NADH/FAD的增加，由于糖酵解活动的增加（Warburg效应）和线粒体功能障碍，可以观察到代谢变化，从而导致氧化还原状态和荧光发射增强[42, 47]。来自肿瘤的外显子携带致癌miRNAs（如miR-21）、突变DNA（ctDNA）和肿瘤特异性蛋白质（如HER2和ER）。所有这些化合物都可以通过超速离心、尺寸排阻色谱或免疫亲和捕获从血浆、尿液或唾液中提取[44, 45, 48, 49, 50, 51]。

荧光光谱仪记录强度并校准曲线，确定miR-21的准确浓度。含有miR-21的生物样本与附着在荧光碳点（CDs）上的互补单链DNA探针结合，形成双链杂交体[49, 52]。这导致荧光强度降低，表明miR-21水平升高，与癌症进展相关[49]。如果存在突变的ctDNA，荧光探针会与之结合并增强荧光强度，从而确认突变的存在。此外，使用激发光（例如488 nm）激发荧光团，使其发出荧光[48]。虽然HER2促进细胞生长并在侵袭性乳腺癌中过表达，但ER结合雌激素并影响激素依赖性乳腺癌的发展，从而导致荧光强度的变化[44, 45]。总的来说，荧光光谱是一种有价值的工具，可以提供关于组织代谢、组成和治疗反应的见解，使其成为乳腺癌检测的有前景的工具。

**漫射光谱**

漫射光谱（DOS）是一种非侵入性技术，使用近红外（NIR）光来探测组织生理学。在这种技术中，NIR光与浑浊的生物组织相互作用，其中多次散射占主导地位，导致光子场呈扩散散射。光通过这种介质的传输可以通过扩散理论有效描述[53]。在乳腺癌中，DOS用于获取关于光学生物标志物（如血红蛋白浓度、氧饱和度、水和脂质含量、血管化、胶原沉积和散射特性）的光谱信息[14]。胶原和高铁血红蛋白（metHb）是潜在的绝对乳腺癌生物标志物。metHb在患者间的变异性较低，使其成为更可靠的恶性标志物，而胶原的变异性较大，因为它们也存在于正常乳腺组织中。Vasudevan等人[54]将metHb描述为区分恶性和良性病变的有希望的指标（图4d-e）。从组织吸光剂计算 chromophore 浓度，并通过普通最小二乘回归将其吸收光谱拟合到已知的摩尔消光系数光谱中。在含病变的乳腺和对侧正常乳腺上定义了感兴趣区域（ROI），并使用病变与正常组织比率（L/N）来区分良性与恶性肿瘤[54]。

**图4**
该图像的替代文本可能是使用AI生成的。

-(a–c) 使用405 nm和660 nm照射，在第0天以及第3天和第7天进行PDT后的肿瘤组织重建吸收光谱，显示血红蛋白吸收峰的变化。转载自Orlova等人[55]，《Photonics》9, 19 (2022)，采用Creative Commons Attribution 4.0 International License (CC BY 4.0)许可条款。(d–e) 测量吸收光谱定量分解为个别组织 chromophore，包括氧合血红蛋白（HbO）、脱氧血红蛋白（HHb）、水、脂质和高铁血红蛋白（MetHb）。转载自Vasudevan等人[54]，《J. Biomed.》。《Opt. 26(6), 065004 (2021)》, 遵循 CC BY 4.0 协议。组织氧合是癌症的一个非常重要的标志，DOS（组织光学密度扫描）能够有效测量氧合血红蛋白（HbO2）和脱氧血红蛋白（HHb）的浓度，从而评估组织血液氧饱和度（StO₂）和总血红蛋白（tHb）作为血液含量的指标。Orlova 等人[55]展示了在使用红光（660 nm）和蓝光（405 nm）进行光动力疗法（PDT）前后通过 DOS 监测疗效的可行性。治疗前，所有肿瘤组的氧饱和度（StO₂）水平相似，且氧合血红蛋白 peaks 明显（在 540 和 570 nm 处）。治疗后，红光 PDT 使 StO₂ 迅速下降，而蓝光 PDT 保持了较高的氧水平，这表明蓝光 PDT（405 nm）更能保护肿瘤的氧合状态，可能会影响治疗效果（图 4：a-c）。DOS 测量结果证实氯菁 e6 光敏剂不会干扰光谱读数[55]。

肿瘤的高水分含量表明存在水肿和细胞增生。与良性组织相比，恶性乳腺病变的水分含量较高，脂质含量较低。当皮肤到胸壁的距离从大约 20 mm 减少时，Hb 浓度增加；当距离进一步减少到大约 15 mm 时，水分含量增加，而脂质含量减少。将 DOS 与超声检查结合使用可以提高评估乳腺结构和检测异常的准确性[56]。在 Ohmae 等人的另一项研究中[57]，通过检测脂质 C-H 键（930 nm）和水 O-H 键（978 nm）的振动泛音来测定 TD-DOS 的脂质和水分含量。DOS 已经成为研究乳腺组织光学和生理特性的强大无创工具，可用于分析重要生物标志物、区分恶性与良性病变、监测治疗反应，并补充成像诊断方法。

**光声光谱学（Photoacoustic Spectroscopy, PAS）**
光声光谱学（PAS）是一种结合光学吸收和声学检测的技术，用于分析材料的成分和性质。在乳腺癌研究中，PAS 可用于获取关于水分和脂质含量、血管化以及肿瘤微环境中氨基酸和胶原蛋白沉积的光谱信息。胶原蛋白是细胞外基质（ECM）的主要成分，在肿瘤进展过程中会发生显著重构，这种重构促进了癌症的侵袭和转移。传统方法（如组织病理学、二次谐波生成和质谱分析）具有侵入性，主要适用于体外分析，不适合早期乳腺癌筛查。Li 等人[58]使用了 1200 至 1700 nm 的 PAS 激光波长。他们的研究引入了功率谱密度（APSD）作为新的 PA 参数来半定量胶原蛋白水平。在以胶原蛋白为主的波段中，腺泡组织的 APSD 值较低，证实了肿瘤中胶原蛋白的降解[图 5]。此外，癌样本间 APSD 值的较大差异表明细胞外基质（ECM）的异质性，为癌症发生提供了无创的生化见解[59]。癌组织在以胶原蛋白为主的波段（1260–1370 nm）中显示出较低的 APSD 值，证实了 HER2 和 TNBC 亚型中胶原蛋白的降解。进一步的光谱分析揭示了三个主要生物大分子的光学吸收带，即胶原蛋白（1260–1370 nm）、脂质（1200–1250 nm 和 1510–1700 nm）以及水分（1380–1500 nm）带，有效地区分了高胶原蛋白含量的 luminal 型和低胶原蛋白含量的 HER2 和 TNBC 亚型[58]。

**色氨酸（Tryptophan）**
色氨酸是一种必需氨基酸，在癌症代谢中起着关键作用。肿瘤细胞吸收色氨酸并通过犬尿氨酸途径代谢它，这会促进免疫抑制和肿瘤进展。Rodrigues 等人[60]表明，随着肿瘤的生长，血清色氨酸水平会下降，说明肿瘤会主动吸收色氨酸。用 281 nm 的脉冲激光光激发肿瘤组织，这种波长被色氨酸特异性吸收。在以色氨酸为主的光谱区域，肿瘤组织的 PAS 信号强度增加。随着 MCF-7 注射后肿瘤进展到第 5、10、15 和 20 天，与色氨酸相关的 PAS 信号增强，证实了其在癌组织中的积累。血清色氨酸水平下降，表明肿瘤会主动代谢这一生物标志物[60, 61]。肿瘤组织，包括乳腺癌组织，通常由于细胞快速增殖和血液供应不足而具有异常血管结构和缺氧区域。这些缺氧条件不仅促进肿瘤进展和转移，还增加了对治疗的抗性。PAS 通过使用调制的或脉冲激光光诱导富含血红蛋白的血管局部热弹性膨胀来实现这一功能评估。由此产生的声波因其受氧合血红蛋白（HbO₂）和脱氧血红蛋白（Hb）的光吸收特性不同而有所不同，从而可以确定氧饱和度水平。多波长 PAS，尤其是使用 680 nm 和 808 nm 等激光波长时，可以利用 HbO₂ 和 Hb 的不同吸收峰来量化组织区域的氧饱和度。这种能力在乳腺癌诊断中特别有价值，因为缺氧是恶性肿瘤区域的特征。

**机器学习和深度学习（Machine Learning and Deep Learning）**
机器学习（ML）和深度学习（DL）领域彻底改变了包括医学诊断在内的各个领域的数据驱动决策。随着光学光谱技术在无创乳腺癌诊断中持续展现出潜力，将其与 ML 和 DL 结合变得越来越重要。这些数据驱动的方法实现了自动模式识别、特征提取和预测建模，非常适合分析来自光学光谱的复杂光谱数据[62]。本节介绍了人工智能（AI）、ML 和 DL 的基本概念，并讨论了它们在乳腺癌应用中的适用性。AI、ML、DL 和人工神经网络（ANN）之间的关系可以分层理解，其中 DL 是 ML 的一个子集，而 ML 又是 AI 的一个子集。AI 指的是开发能够复制人类行为并执行通常与人类智能相关的功能的机器的总体概念。它采用多种方法使机器能够通过模仿人类认知功能（包括推理、感知、解决问题和学习）来表现出智能行为。ML 是 AI 更广泛领域中的一个分支，使计算机能够从数据中学习并做出明智的决策，而无需明确编程[63]。ML 技术通常分为四大类：监督学习、无监督学习、半监督学习和强化学习[62]。监督学习涉及在标记的数据集上训练算法，使模型能够识别输入-输出关系并生成预测。这类中常用的算法包括支持向量机（SVMs）、随机森林（RFs）和 k-最近邻（k-NNs），它们在基于光谱的诊断应用中的分类和回归任务中特别有效。相比之下，无监督学习侧重于揭示未标记数据中的隐藏模式和结构。k-均值聚类和主成分分析（PCA）等方法在降低维度和分类光谱特征方面非常有用[50]。半监督学习结合了标记和未标记的数据，特别适用于光谱数据量大且仅有少量标注的情况。通过利用这两种来源的信息，模型可以训练来识别化学特征或解释复杂的光谱数据，否则手动标注将非常耗时和繁琐[64]。强化学习通过与环境互动进行模型训练，模型通过接收奖励或惩罚的形式学习最佳策略。尽管在光谱学中尚未广泛应用，但强化学习在提高诊断决策系统的效率方面显示出潜力[58]。

深度学习（DL）是 ML 的一个独特子集，它使用多层人工神经网络来捕获大规模数据集中的复杂模式。与传统依赖手动特征提取的 ML 技术不同，DL 算法能够直接从原始数据中自主学习层次化特征。这一能力使得 DL 特别适合分析高维和非线性的光谱数据[65]。DL 在许多领域（从计算机视觉到光谱分析）中迅速发展，专门的实现展示了出色的性能。正如综合评论所指出的，DL 模型通过无需人工干预即可实现更复杂的模式识别和特征提取，彻底改变了 AI 的概念[66, 67]。

**人工神经网络（Artificial Neural Networks, ANNs）**
人工神经网络（ANNs）由多层相互连接的节点（或神经元）组成，通过加权链接处理输入数据。作为 DL 的基础，ANNs 能够近似复杂的非线性函数。然而，这些方法通常计算要求较高，通常需要大量数据集才能有效运行[68]。卷积神经网络（CNNs）最初是为图像分析设计的，但在处理光谱和光谱成像数据方面表现出显著效果。通过使用卷积滤波器，CNNs 可以识别光谱中的局部特征，如可能与特定生物标志物相关的位移或峰[69, 70]。循环神经网络（RNNs）及其高级变体（如长短期记忆（LSTM）和门控循环单元（GRUs）非常适合处理序列数据并捕捉时间依赖性。虽然尚未在光谱学中广泛采用，但这些架构在分析时间分辨或动态光谱信息方面具有潜力[71]。迁移学习允许重用在相关任务上预训练的模型，从而减少了对大量标记数据集的需求。这种方法在医学光谱学中特别有利，因为数据收集既昂贵又费时。生成模型（如变分自编码器（VAEs）和生成对抗网络（GANs）用于生成合成光谱数据、增强现有数据集并提高模型的泛化能力。这些模型还支持异常检测和无监督特征提取等任务，从而提高了分析流程的稳健性和灵活性[72]。

光学光谱数据的固有复杂性，包括高维度、微妙的光谱变化和潜在的测量误差，给传统统计方法带来了相当大的挑战[73, 74]。传统的分析方法往往缺乏从这些复杂数据集中提取临床意义信息所需的精度和适应性。然而，ML 和 DL 的最新发展为解决这些限制提供了希望[75]。ML 和 DL 方法特别适合处理光谱数据的高维和非线性特性。这些算法能够有效建模复杂关系，同时最小化过拟合的风险，尤其是在结合 PCA 或自编码器等降维策略时[76,77,78]。这些技术保留了数据中的关键方差，同时减少了噪声和冗余。此外，深度神经网络在自动特征提取方面表现出色，能够检测与恶性组织生化变化相关的光谱特征（Warrier 等人，2022；[75, 79]）。这种揭示细微光谱差异的能力对于提高诊断敏感性至关重要，尤其是对于超出传统分析或专家解释范围的差异。实证研究强调了 DL 模型的准确性和泛化能力，特别是在多样化和增强数据集上训练时。通过交叉验证、dropout 正则化和集成等方法，模型性能得到了进一步改进[79,80,81]。这些模型的可扩展性使其能够在各种光谱技术（包括拉曼、荧光和漫反射光谱）和不同的临床环境中广泛应用[78, 82]。总体而言，ML 和 DL 方法代表了推进基于光学光谱诊断的强大工具。这些方法处理复杂数据结构、发现具有诊断意义的模式以及提供可扩展且可解释的输出的能力，凸显了它们在下一代癌症检测平台中的潜在作用。选择机器学习（ML）或深度学习（DL）模型并非随意决定，而是主要由光谱信号的物理和数学特性所决定。理解这种关系至关重要，以避免在不了解其工作原理的情况下应用模型，并确保模型的可靠性。拉曼光谱具有成千上万个特征，如波数和较低的信噪比（SNR）。ID-CNN特别适用于这类数据，因为它们的卷积滤波器可以作为自动特征提取器，无需手动预处理即可去除信号中的噪声并识别窄频振动峰值。差分光学光谱（DOS）通常在有限的波长范围内捕捉广泛的生理特征，如血红蛋白和水分含量。由于这些数据代表的是众所周知的生物标志物，因此通常更倾向于使用线性模型，如逻辑回归或线性判别分析（LDA）；它们具有较高的可解释性，并且在临床DOS研究中常见的较小患者群体上不容易过拟合。光声光谱（PAS）生成的声压波是时间分辨的。分析这些信号需要能够处理时间依赖性和非线性的模型。带有RBF核的支持向量机（SVM）或带有注意力机制的残差神经网络（ResNets）通过小波变换将时频表示转换为稳健的分类特征，在这方面表现出色。

**光学光谱中ML/DL的应用：乳腺癌**

这部分综述探讨了将各种光谱技术与ML方法结合起来用于癌症检测、分类和生物标志物发现，特别关注乳腺癌诊断。我们讨论了关于拉曼光谱、光声光谱、荧光光谱和漫反射光谱的最新研究，强调了它们各自的贡献以及该领域的总体趋势和挑战。

**拉曼光谱与卷积神经网络**

拉曼光谱作为一种有价值的分석工具在乳腺癌诊断中日益受到重视，能够快速且无创地检查生物样本。通过测量分子功能团的振动和旋转能量模式，该技术生成独特的光谱特征，反映了潜在的生物分子组成[83]。用于乳腺癌检测时，拉曼光谱能够有效识别健康组织和恶性组织之间的分子和结构差异，捕捉到核酸、蛋白质、脂质和碳水化合物等关键生物分子之间的差异[84]。健康组织和癌变组织之间的光谱差异显著且具有诊断价值。例如，研究报道在癌变组织中特定拉曼带（1298、1437、1742 cm⁻¹）的强度降低，这表明由于癌细胞增殖过程中能量消耗增加而导致脂质含量减少。同样，865 cm和1116 cm⁻¹处的拉曼带发生了变化，暗示蛋白质和核酸发生了重要的构象变化[84]。Ma等人[84]率先应用了一维卷积神经网络（1D-CNN）通过拉曼光谱进行乳腺癌组织分类（见图6）。他们的模型架构包括一个卷积层、一个池化层和两个全连接层，并结合了批量归一化，从而可以直接从原始光谱输入中提取特征，无需手动特征工程。该模型显示出强大的诊断性能，准确率达92%，灵敏度为98％，特异性为86％，能够区分健康组织和癌变组织。Zeng等人[85]比较了三种DL模型用于分类三阴性乳腺癌和HER2阳性乳腺癌：神经网络语言模型（NNLM）、双向长短期记忆网络（BILSTM）和CNN。其中，CNN模型的表现优于其他模型，准确率为91.11％，而NNLM为87.78％，BILSTM为90.37％。他们的CNN架构包括一个卷积层、一个最大池化层、一个展平层和一个全连接层，以及批量归一化，以提高训练效率和模型收敛性。在另一项研究中，Li等人[83]通过Sparrow搜索算法（SSA）引入了一种优化的CNN模型用于乳腺癌亚型分类。这种优化集中在调整关键的CNN超参数上，如滤波器的数量和大小、学习率和批量大小。SSA增强的CNN在五种乳腺癌亚型（腔内A型、腔内B型、Claudin低表达型、基底型和HER2阳性型）上的分类准确率为95.34％（±2.18％），显示出比传统机器学习技术更显著的性能优势。

**应用ML/DL进行乳腺癌的光学光谱分析**

这一部分综述探讨了将各种光谱技术与ML方法结合用于癌症检测、分类和生物标志物发现，特别关注乳腺癌诊断。我们讨论了拉曼光谱、光声光谱、荧光光谱和漫反射光谱的最新研究，强调了它们各自的贡献以及该领域的总体趋势和挑战。

**拉曼光谱与卷积神经网络**

拉曼光谱作为一种有价值的分석工具，在乳腺癌诊断中得到了广泛应用，能够快速且无创地检查生物样本。通过测量分子功能团的振动和旋转能量模式，该技术生成独特的光谱特征，反映了潜在的生物分子组成[83]。当用于乳腺癌检测时，拉曼光谱能够有效识别健康组织和恶性组织之间的分子和结构差异，捕捉到核酸、蛋白质、脂质和碳水化合物等关键生物分子的差异[84]。健康组织和癌变组织之间的光谱差异显著且具有诊断价值。例如，研究表明在癌变组织中特定拉曼带（1298、1437、1742 cm⁻¹）的强度降低，表明由于癌细胞增殖过程中能量消耗增加而导致脂质含量减少。同样，865 cm和1116 cm⁻¹处的拉曼带发生位移，表明蛋白质和核酸发生了与恶性相关的构象变化[84]。Ma等人[84]率先应用了一维CNN（1D-CNN）通过拉曼光谱进行乳腺癌组织分类（见图6）。他们的模型架构包括一个卷积层、一个池化层和两个全连接层，并结合了批量归一化，从而可以直接从原始光谱输入中提取特征，无需手动特征工程。该模型表现出强大的诊断性能，在区分健康组织和癌变组织时准确率达到92％，灵敏度为98％，特异性为86％。Zeng等人[85]比较了三种DL模型用于分类三阴性乳腺癌和HER2阳性乳腺癌：神经网络语言模型（NNLM）、双向长短期记忆网络（BILSTM）和CNN。其中，CNN模型的表现最好，准确率为91.11％，而NNLM为87.78％，BILSTM为90.37％。他们的CNN架构包括一个卷积层、一个最大池化层、一个展平层和一个全连接层，以及批量归一化，以提高训练效率和模型收敛性。在另一项研究中，Li等人[83]通过Sparrow搜索算法（SSA）引入了一种优化的CNN模型用于乳腺癌亚型分类。这种优化集中在调整关键的CNN超参数上，如滤波器的数量和大小、学习率和批量大小。SSA增强的CNN在五种乳腺癌亚型（腔内A型、腔内B型、Claudin低表达型、基底型和HER2阳性型）上的分类准确率为95.34％（±2.18％），显示出比传统机器学习技术更显著的性能优势。

**1D-CNN模型的损失函数曲线（a）和准确率曲线（b）用于实时可视化训练过程，图像来自Ma等人[84]**

**近年来对卷积神经网络（CNN）在乳腺癌诊断中应用的研究**

最近的研究利用了多种类型的生物样本进行了拉曼光谱的研究。血清样本作为一种微创且可重复的疾病检测方法被广泛使用。例如，Wang等人[86]收集了241名健康志愿者、463名乳腺癌患者和100名导管原位癌（DCIS）患者的血清样本。他们的CNN模型实现了98.76％的惊人分类准确率。同样，Zeng等人[85]使用了23名三阴性乳腺癌患者、22名HER2阳性患者和30名健康对照者的血清样本。血清分析是无创的、成本效益高的且高度可重复的。新鲜的乳腺组织样本可以直接分析肿瘤微环境中的分子变化。Ma等人[84]收集了20名患者的组织样本，每位患者都提供了健康组织和癌变组织样本。这种配对样本的方法有效减少了可能混淆分类结果的个体差异。此外，J. Li等人[83]利用已建立的乳腺癌细胞系——MCF-7、BT474、MDA-MB-231、MDA-MB-468和SKBR3——以及正常乳腺上皮细胞（Hs 578Bst）在高度可控的实验条件下开发和验证了他们的分类模型。细胞系为光谱分析提供了高度可控的实验条件。多项研究表明，CNN在拉曼光谱分析中始终优于传统的ML方法。Wang等人[86]将CNN与支持向量机（SVM）、随机森林（RF）和K最近邻（KNN）方法进行了比较，用于DCIS和乳腺癌分类。CNN的准确率为98.76％，显著高于SVM（94.63％）、RF（80.99％）和KNN（78.93％）。J. Li等人[83]证明他们的CNN模型（95.34% ±2.18%准确率）在乳腺癌亚型分类方面优于SVM（94.90% ±1.88%）、PLS-DA（94.52% ±2.22%）和KNN（80.00% ±5.27%）。Ma等人[84]报告称，1D-CNN在乳腺组织分类方面的表现优于Fisher判别分析（FDA）和SVM，总体准确率至少高3.5％。

CNN模型之所以表现优异，有几个关键优势：无需人工干预即可从原始光谱数据中自动提取特征；更好地处理复杂光谱数据中的非线性模式；减少了对广泛预处理和特征选择的依赖；具有更强的泛化能力，过拟合风险较低；并通过数据增强技术提高了稳定性。在拉曼光谱应用方面的一个重要进步是开发了可视化技术来识别关键光谱特征。Li等人[83]应用了梯度加权类激活映射（Grad-CAM）来可视化对分类决策贡献最大的拉曼光谱区域。这种方法通过对最后一个卷积层的梯度进行全局平均池化来计算每个特征图的重要性，从而能够可视化最显著影响模型分类决策的光谱区域。通过Grad-CAM识别的关键特征与已建立的免疫组化信息相符，验证了所识别光谱区域的生物学相关性。研究还探讨了全光谱还是特定光谱区域对分类准确率的贡献更大。此外，Li等人[83]评估了全范围光谱（400–4000 cm⁻¹）还是仅指纹区域（400–1800 cm⁻¹）对诊断准确率的贡献更大。他们的发现表明，两种方法之间的性能差异小于2%，这表明仅关注指纹区域就能捕获最多的诊断信息。这在实际应用中有重要意义，因为专注于指纹区域可以简化拉曼光谱的采集，减少计算负担，并在不牺牲准确性的情况下提高临床适用性。详细的光谱分析揭示了区分乳腺癌亚型和阶段的特定拉曼带。Zeng等人[85]识别出在786、1003、1154、1282、1447、1514和1580 cm⁻¹处的特征峰，这些峰分别与细胞成分（如胞嘧啶、β-胡萝卜素、酰胺III（胶原蛋白）和脂质）相对应。Wang等人[86]在他们的血清分析中也报告了类似的显著峰。

**光声光谱与深度神经网络**

在将ML应用于光声光谱时，提取和选择相关特征是一个关键步骤。最近的研究采用了小波变换技术来分析时域光声信号。特别是连续小波变换（CWT）已被证明能有效将这些信号转换为时频域表示，从而揭示与乳腺肿瘤发展相关的微妙光谱变化[87]。在特征选择方面，最小冗余最大相关性（mRMR）算法受到了重视。这种基于滤波器的技术通过互信息来评估特征，平衡相关性和冗余性，以排除可能影响模型准确性的无关变量[60, 87]。一项值得注意的研究使用mRMR从小波变换后的光谱中分离出20个最具信息量的特征，随后用于构建ML分类的输入矩阵，如图7所示[60]。

**支持向量机（SVM）分析**

支持向量机（SVM）分析在乳腺癌检测的光声光谱分类中取得了显著的成功。研究比较了不同的SVM核函数，包括径向基函数（RBF）、多项式和线性核，其中SVM-RBF通常表现出更优越的性能[15, 87]。这种方法特别有价值，因为它能够在保持分类准确性的同时处理高维数据。在一项使用小鼠模型的临床前研究中，SVM-RBF的总体准确率为94.5％，特异性为100％，不同肿瘤进展阶段的灵敏度范围为85%至100％。SVM模型的交叉验证测试显示平均准确率为97.5 ± 1.75%，表明了这种分类方法的稳健性[87]。这些发现突显了基于ML的光声光谱在非侵入性评估乳腺肿瘤进展方面的潜力。深度学习的最新进展导致了专门为光声图像分析设计的复杂神经网络架构的开发。一项值得注意的创新是将注意力机制与残差神经网络（ResNets）相结合，以改善特征提取和分类性能[83]。与传统方法相比，PAUS-ResAM50模型结合了ResNet50架构和注意力机制来分析光声超声（PA-US）图像，表现出更优越的诊断能力[83]。该模型在临床验证中取得了令人印象深刻的性能指标，AUC为0.917（95% CI: 0.884–0.951），灵敏度为0.750，准确率为0.854，特异性为0.920。即使在测试集中，该模型也保持了高性能，AUC为0.870（95% CI: 0.778–0.962）。Li等人[83]对应用于光声成像的不同DL架构进行了全面比较。与不带注意力机制的标准ResNet50模型相比，带注意力机制的变体始终表现出更优的性能。此外，光声成像模型（PAUS-ResAM50）显著优于仅基于传统超声的模型（BMUS-ResAM50），表明光声数据提供了额外的诊断价值。DeLong测试的统计验证确认了这些性能差异的显著性（p < 0.05），强调了光声数据和注意力机制在提高诊断准确性方面的价值。这些发现表明，针对PA成像特性的DL方法能够提取比传统成像模式更多的临床相关信息。光声辅助乳腺癌诊断的一个重要进步是结合了分析肿瘤内和肿瘤周围区域特征的放射组学方法。研究表明，结合肿瘤内和肿瘤周围区域的光声成像特征比单独使用肿瘤内特征带来了更好的诊断性能[88]。Huang等人[88]研究了不同的肿瘤周围区域大小（2 mm、5 mm和8 mm），并确定5 mm肿瘤周围区域提供了最佳的诊断信息。结合肿瘤内和肿瘤周围5毫米范围的光声（PA）成像特征的模型在训练集中的AUC达到0.924（95%置信区间：0.892–0.957），在测试集中达到0.873（95%置信区间：0.801–0.945）。这种方法认识到肿瘤边界超出了可见范围，周围的组织环境提供了有价值的诊断信息，这些信息可以通过全面的放射组学分析来捕获。为了促进临床应用，研究人员开发了将光声放射组学特征与临床风险因素结合的诺模图模型。在Huang等人的研究中[88]，一个综合了肿瘤内和肿瘤周围5毫米范围PA图像的放射组学特征以及临床风险因素的预测模型在训练集中的AUC为0.950（95%置信区间：0.925–0.975），在测试集中为0.899（95%置信区间：0.841–0.956）。这些集成模型在区分良性与恶性乳腺结节方面表现出出色的诊断能力，可能减少不必要的活检需求。决策曲线分析进一步证实了这些诺模图在BI-RADS 3–5级乳腺结节干预中的显著临床效益[88]。Gröhl等人[87]对体内和体外光声光谱进行的比较分析揭示了一些有趣的结果。虽然体外研究显示出稍高的性能指标（99%的准确率、100%的特异性、98–100%的敏感性），但体内应用仍然保持了令人印象深刻的诊断能力（总体准确率94.5%、特异性100%、敏感性85–100%）。体内评估的优势在于它能够从同一受试者身上纵向捕获信号，从而克服了体外研究中受试者间差异带来的异质性问题。人工智能在光声成像中的一个有前景的应用是作为放射科医生的诊断辅助工具。Li等人[83]报告称，将深度学习（DL）模型与放射科医生的评估相结合可以显著提高诊断准确性。PAUS-ResAM50模型作为辅助工具使用时，提高了放射科医生的诊断特异性而没有降低敏感性，突显了其在临床环境中的价值。这种协同方法结合了放射科医生的解读专长和人工智能的计算能力，从而实现更准确和一致的诊断结果。将这些技术整合到临床工作流程中有可能减少读者的主观差异，并提高整体诊断性能，特别是对于经验较少的从业者。

由于机器学习和深度学习（ML和DL）模型的进步，荧光光谱技术也变得非常重要。这种技术能够分析高分辨率、信息丰富的荧光图像。To等人[89]的研究中，图像被分割成不重叠的区域，并在ResNet架构等模型上进行预训练。ResNet50因其高准确率和对梯度消失问题的抵抗力而被广泛使用。其跳跃连接对于分析复杂的荧光图像至关重要。Boosters如XGBoost因其抗过拟合能力和处理不平衡数据集的能力而被采用。此外，Grad-CAM与DenseNet169结合使用，后者将每一层与其他层连接起来，最大化特征提取，减少冗余并提高整体效率。尽管深度神经网络取得了显著进展，但在数据集有限或需要临床可解释性时，经典的ML技术仍然是有价值的替代方案。支持向量机（SVM）使用径向基函数（RBF）核，因为它们不依赖于原始像素值；相反，它们从生物手工制作的特征开始，将其转换为高维向量空间进行分类。这种策略允许模型捕获与HER2、TP53和BRCA2等分子标记相关的低级视觉线索和高级结构模式[89]。

扩散光学光谱（DOS）作为一种有前景的非侵入性诊断技术，能够通过近红外光提取丰富的生物化学和血液动力学信息。鉴于患者数据集的变异性，选择一个既准确又稳健的ML模型变得至关重要。逻辑回归作为一种经典的ML技术，在这方面是一个很好的例子。它是透明的，并提供了输入特征和预测结果之间的清晰、可解释的联系。它也适用于小型数据集，在这些数据集中，复杂的模型如SVM和DNN容易过拟合。归一化和正则化进一步降低了这种风险。血红蛋白、脱氧血红蛋白和组织光学指数等特征展示了强大的预测能力，使逻辑回归成为最佳模型[90]。此外，DOS展示了整合到临床决策支持工具中的潜力[91]。它能够通过光吸收和散射实时评估组织生理学。为了将这些光谱数据转换为可操作的诊断决策，需要稳健的ML模型。Nachabé等人[91]的研究对应用于生理衍生宽带DOS数据（500–1600纳米）的分类器进行了全面评估。该研究没有直接将ML技术应用于原始光谱数据，而是使用基于模型的拟合技术来提取有意义的特征，如血红蛋白、β-胡萝卜素、脂质、水分含量和光散射参数。对于二元分类任务，非线性SVM（RBF核）和K最近邻（KNN）因其在复杂、重叠的生物数据上的灵活性和有效性以及其在有限数据集上的泛化性能而表现优于其他模型。对于多类设置，分类和回归树（CART）因其基于规则的可解释结构而表现出色，这种结构能够处理微妙的组织间差异，并在重复模式下仍保持高准确率。尽管逻辑回归和LDA等线性模型透明且简单，但它们无法捕捉非线性关系。尽管有前景，人工神经网络（ANN）在小型数据集上存在过拟合的风险。最终，将扩散光学光谱与适当的ML技术结合可以将其从数据采集工具转变为具有临床相关性的诊断辅助工具。这种方法对于实时组织特征化和治疗监测尤其有价值——这些领域传统技术往往缺乏特异性和敏感性。表2展示了应用于光谱数据的各种AI技术的比较。

现代乳腺癌诊断正从单一模式的点光谱转向集成多模态的方法，后者提供更高的诊断特异性。多模态融合是将光谱的功能数据与成像（例如超声波）的结构数据结合起来，从而提供对肿瘤微环境的更全面视图。例如，结合光声放射组学和临床风险因素的模型比仅使用成像的模型具有更高的AUC（0.950）。荧光成像和高光谱成像（HSI）等技术为生化特征提供了空间背景。这些超立方体需要像DenseNet169这样的深层架构来最大化从庞大的空间-光谱重叠中提取特征[83]。多模态融合的优势不仅体现在诊断准确性指标（如AUC）的提高上。单一模态方法由于无法捕捉肿瘤生物学的全部复杂性而受到本质限制，例如，光谱提供高生化特异性但缺乏空间背景，而成像模式提供结构信息但分子敏感性有限[93]。多模态融合通过整合互补的数据类型，能够同时评估分子组成、组织结构和功能动态，从而克服这些限制。这种整合减少了偏见，增强了对抗噪声和变异性的鲁棒性，并允许更准确地描述肿瘤异质性，包括血管、代谢和微环境特征。因此，多模态方法提高了临床可解释性，并提供了比单一模态系统更可靠的决策支持[94]。然而，为了有效实施多模态融合，仍有一些挑战需要克服。例如，它需要大型、带有注释的数据集和先进的机器学习结构，因为多模态融合需要高维数据和高昂的计算成本。此外，由于不同模态在时间动态、数据收集方法和空间分辨率上的差异，多模态数据配准和对齐仍然具有挑战性[95]。模型的一致性也可能受到不同模态数据质量差异的影响。在多模态融合技术的临床应用中，通常涉及更高的成本、更复杂的设备以及将技术整合到当前诊断方案中的更大难度。解决这些挑战对于充分发挥多模态光谱诊断在乳腺癌护理中的潜力至关重要[96]。

光学光谱在癌症检测方面取得了巨大进展，但仍有一些障碍阻碍其在临床环境中的广泛应用。这些障碍包括缺乏明确的采集和预处理程序、某些光谱模态的穿透深度低、由于组织异质性和设备差异导致的光谱数据变异性，以及解释复杂光谱信息的困难。此外，许多已发表的研究使用的是单中心验证或较小的数据集，这可能限制了机器学习模型的应用范围。为了使临床转化有效，必须通过标准化程序、更大的多中心数据集和增强模型的可解释性来解决这些限制。然而，将ML和DL与光学光谱结合用于乳腺癌诊断面临重大的技术和临床障碍。一个主要挑战是光谱数据质量的变异性，这既源于生物学因素也源于技术因素。患者特定的变量，如年龄、激素状态和组织异质性，会在光谱数据集中引入噪声，从而使得一致性的癌症特异性生物标志物的识别变得复杂[97, 98]。技术上的不一致性，包括仪器校准和测量期间的环境条件差异，进一步降低了可重复性。例如，基于LIBS的研究比较全血和血清样本发现，样本处理协议的微小变化显著影响模型准确性，全血的结果优于血清（91.7%的准确率对比89.7%），因为全血的发射谱更强[97]。同样，基于预处理数据训练的拉曼光谱模型比基于原始或基线光谱训练的模型表现更好，这突显了ML算法对数据预处理步骤的敏感性[98]。这些问题凸显了需要标准化采集协议以确保在不同临床环境中的稳健性[99, 100]。另一个关键限制是DL模型不透明的决策过程，这阻碍了临床信任和监管批准。虽然CNN在亚型分类方面取得了高准确率（例如，Raman研究中侵袭性癌症的敏感度为93%），但其不透明的性质掩盖了预测背后的生化原理[101, 102]。这种缺乏可解释性与简单的模型（如SVM）形成对比，后者提供了透明的特征加权机制，但在复杂数据集上可能会牺牲性能[100, 103]。此外，不同研究中的验证框架也不一致，有些依赖于无法反映人群多样性的单中心数据集[104]。例如，分类HER2阳性外泌体的拉曼模型在受控环境中达到了94%的准确率，但其对更广泛人群的泛化能力尚未得到验证[35]。这些验证差距强调了需要进行多中心试验和标准化报告指标，以弥合转化鸿沟。

临床整合挑战不仅限于技术性能。便携式系统如实时FD-DOS探针展示了有前景的术中应用（1.5 Hz处理速度），但在工作流程兼容性方面面临障碍[105]。与电子健康记录的无缝集成、对非技术人员的用户友好界面以及遵守医疗设备法规仍然未解决[106]。此外，虽然扩散光学断层扫描与超声波结合改善了结构和功能评估，但大多数研究集中在二元分类（恶性 vs. 良性）上，忽略了分子亚型或治疗耐药性表型的精细检测[99, 107]。这种狭隘的范围限制了临床实用性，因为个性化肿瘤学需要详细的预后见解。除了技术和临床挑战外，伦理问题也对光学光谱中机器和DL的整合构成了重要限制。当模型在非代表性数据集上训练时，可能会出现算法偏见，从而导致代表性不足的人群诊断准确性降低，并加剧健康差异[92, 108]。数据隐私是另一个主要问题，因为用于模型训练的光谱和临床数据可能包含敏感的患者信息，如果保护不当，会增加重新识别和误用的风险（Afrifa-Yamoah等人，2025）。许多DL模型的不透明性质也使知情同意和问责变得复杂，因为患者和临床医生可能不完全了解诊断决策是如何做出的或谁对错误负责。此外，模型开发中存在不道德的做法，如数据泄露或过度拟合特定数据集，这可能会人为夸大报告的准确率并损害临床信任[109]。解决这些伦理挑战对于确保基于ML/DL的光谱工具公平、透明和安全的广泛临床使用至关重要。表3列出了在乳腺癌诊断中使用人工智能（AI）进行光谱分析的优点和缺点。表3中还探讨了机器学习和深度学习技术在癌症诊断中的优势与劣势，并对相关文献进行了深入分析。

当前基于AI的光谱分析领域的一个主要问题是诊断性能被高估，这种现象通常被称为“乐观偏差”。尽管许多初步研究声称达到了近乎完美的准确性，但当这些结果经过严格的外部验证时，往往会被认为不可靠。这种可靠性差距通常源于技术和方法上的缺陷。高准确性可能是模型过度拟合特定噪声模式或实验条件所致，而非真正学习了具有普遍性的生物信号。这种情况通常发生在测试集的信息无意中影响到训练阶段，尤其是在小型数据集上进行不当的交叉验证时[110]。仪器校准、环境光线以及探测器灵敏度的微小变化都可能产生独特的光谱特征。模型可能通过识别这些特定于硬件的特征而非癌症组织中的实际生化变化来实现高准确性。现有的大量研究还依赖于单一中心的验证，并且使用的数据集规模相对较小。这些模型在应用于不同临床环境或不同患者群体（例如年龄或激素状态各异的患者）时往往无法保持其准确性，从而导致缺乏泛化能力[111]。最近的批评指出，许多用于光学生化的机器学习方法得出的结果不可重复。例如，样本处理方式的微小变化（如全血与血清之间的差异）就可能显著影响模型结果，这表明所报告的高准确性可能更多依赖于特定的实验室操作规程，而非稳定的病理学特征。

为了弥合这一转化差距，必须超越仅基于干净数据集的二分类方法，优先进行独立的外部验证，并使用大规模的多中心数据集来确保报告的准确性（如98%）具有临床可靠性，而不仅仅是由于特定实验条件造成的结果[112]。

为了充分发挥机器学习和深度学习在乳腺癌光谱分析中的应用潜力，有几个关键领域需要重点发展。首先是建立跨越多个临床中心、患者群体和仪器的、规模大、标注清晰且标准化的光谱数据集。这些数据集有助于模型泛化，减少偏差，并实现算法的可靠基准测试[113]。除了数据扩展外，对可解释模型的需求也在不断增加。集成可解释性AI（XAI）技术（如SHapley加性解释（SHAPs）、注意力机制和梯度加权类别激活映射（Grad-CAM）可以通过将模型预测与具体的光谱特征联系起来，提高ML/DL系统的透明度，从而增强临床医生的信任并辅助监管审查[98, 102]。此外，将光谱分析与成像、基因组学和电子健康记录等其他数据模式结合，有望提供更全面的肿瘤生物学视图。使用集成学习或先进架构（如变换器（transformers）和图神经网络（GNNs）的多模态融合方法可以提升诊断准确性和亚型分类能力[103, 104, 114]。

关于伦理问题，包括患者隐私和数据安全，越来越多地通过联邦学习和保护隐私的技术来加以解决[115, 116]。随着监管框架的不断发展，目标是将基于ML/DL的光谱分析发展成为一种可靠、安全且易于普及的工具，用于早期乳腺癌检测和个性化治疗，最终改善患者结果和生活质量。实时应用也是另一个重要的方向，特别是在术中和即时诊断场景中。开发适用于边缘计算的轻量级、低能耗模型将有助于将其集成到便携式光谱设备中，即使在资源有限的环境中也能提供床边决策支持[117,118,119,120]。此外，联邦学习和终身学习模型的应用可以在保护患者隐私的同时，实现算法的持续优化，并减少对集中式数据共享的需求。从临床角度来看，通过光谱特征和基于ML的预测建模进行长期患者监测，可以实现个性化治疗调整和早期复发检测[121]。最后，伦理和监管框架必须与时俱进，以适应这些技术进步。这包括建立模型验证的标准、确保在不同人群中的公平性，并实现与临床工作流程的无缝整合。通过解决这些跨学科挑战，未来的研究可以确保基于ML和DL的光谱分析成为早期检测、诊断和预测乳腺癌的可靠且有效的工具。

结论

将机器学习和深度学习与光谱分析相结合是一种有效的乳腺癌检测方法。这种方法为实时定义组织类型提供了新的途径。我们的综合研究显示，这些方法在诊断方面非常有效，基于CNN的模型在组织分类方面的准确率可达到97.58%，在亚型识别方面的准确率可达98.76%[79]。这些方法在多种光谱模式下都保持了优异的灵敏度（90–100%）和特异性（85–95%）。基于ML/DL的光谱分析有望超越传统诊断方法的局限。这些技术使研究人员能够在分子水平上检测到变化，甚至在常规影像学检测之前就能发现这些变化。它们能够检测到形态变化之前的代谢变化。可靠地分类乳腺癌亚型（包括难治性亚型，如三阴性乳腺癌，平均AUC为0.98）是朝着个性化肿瘤学迈出的重要一步[32]。此外，将光谱数据与临床特征结合的多模态技术比单一模态系统表现更好。尽管几十年的概念验证研究表明了许多光谱方法的诊断潜力，但由于技术、临床和经济方面的限制，其实际应用受到了阻碍。不同机构之间的数据协调、适用于临床应用的模型可解释性标准以及需要在各种患者群体中进行彻底的验证都是重要的障碍（Kelly等人，2019年）。缺乏标准化协议是一个严重问题，最近的研究表明迫切需要统一的数据收集和处理方法。设备校准方式、环境条件和样本处理方法的微小变化都可能显著影响模型的性能[86]。这凸显了在使用模型进行临床应用之前建立严格的质量控制措施和操作流程的重要性。光谱分析系统需要更严格的临床验证框架，尤其是对于能够持续学习的新模型。创建标准化的评估标准和独立的测试平台对于保证在不同临床环境下的性能一致性至关重要。未来，ML/DL与光谱分析的结合有望显著改善乳腺癌的治疗效果。随着AI架构的不断发展和硬件能力的提升以及临床接受度的提高，预计这些技术将在未来十年内从研究工具发展成为临床标准。总体而言，基于ML/DL的光谱分析在提高乳腺癌的早期检测、个性化治疗和临床结果方面具有巨大潜力。然而，通过标准化、可解释性和监管协调来解决当前的限制，我们可以确保这些强大的诊断工具能够实现改善患者结果、减少不必要的检查程序，并推动乳腺癌护理中的精准医疗发展。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部