融合条件生成对抗网络与卷积视觉Transformer集成模型的皮肤癌不平衡分类研究

时间：2026年3月12日

来源：Scientific Reports

编辑推荐：

本研究聚焦皮肤癌分类中因毛发伪影、数据集类别严重不平衡及病灶局部细微特征与全局特征协同提取困难带来的挑战。研究人员提出一种新颖的两阶段框架，首先利用条件生成对抗网络(C'GAN)为少数类生成合成图像以缓解不平衡，继而引入一个CNN-ViT集成架构，并通过基于交叉注意力的融合模块协同融合两者的特征。该模型在多个少数类上取得了卓越的分类准确率（如 Dermatofibroma 99.3%），并展现了优异的总体AUC（99.4%）与模型稳健性，为解决皮肤癌自动诊断中的类不平衡问题提供了有效方案。

尽管深度学习技术在医学影像领域高歌猛进，但在皮肤癌诊断的自动化之路上，依然横亘着几座难以轻易翻越的大山。想象一下，当你试图让AI系统通过皮肤镜图片辨认痣的好坏时，却发现图片中总有不请自来的毛发干扰视线；用于学习的图片库中，恶性黑色素瘤的样本成千上万，而一些相对少见的皮肤癌类型却寥寥无几，这让AI模型成了不折不扣的“偏科生”；更棘手的是，一张皮肤病变图片中既藏着决定生死的微观密码——如细微的纹理、色素网络、特定的血管形态，又蕴含着宏观的整体布局——如形状的不规则、边界的模糊、整体的不对称性，如何让模型同时精准捕获这两类信息，是对其“眼力”的巨大考验。正是为了攻克这些难题，一项发表在《Scientific Reports》上的研究提出了一套创新的“组合拳”，旨在提升皮肤癌分类，特别是对罕见类型的识别能力。

研究人员开展了一项两阶段的研究。首先，他们针对数据集中样本稀少的“少数派”癌症类型，请出了人工智能领域的“造假高手”——条件生成对抗网络（Conditional Generative Adversarial Network, C'GAN），用它来生成逼真的合成图像，为这些弱势类别“增兵扩员”，从而初步平衡战场。紧接着，研究进入核心阶段：构建一个融合了卷积神经网络（CNN）与视觉Transformer（ViT）优势的集成模型。CNN擅长捕捉图像的局部细节特征，而ViT则能通过自注意力机制有效建模图像的全局依赖关系。研究的关键创新在于，在两者之后加入了一个基于交叉注意力的融合模块，这个模块就像一个聪明的“协调员”，能够动态、有选择地将ViT提炼的全局“令牌”表示与CNN提取的局部特征图进行深度融合，从而生成兼具局部精细与全局视野的病灶表征。为了全面评估模型，研究不仅采用了准确率、AUC等标准量化指标，还通过基于Bootstrap的统计分析方法验证了模型的可靠性与稳定性。

本研究得出了一系列鼓舞人心的结果：

•
卓越的分类性能：在 Dermatofibroma、Vascular lesions、Basal Cell Carcinoma 和 Actinic Keratosis 这几个类别上，模型分别达到了 99.3%、99.7%、98.9% 和 98.2% 的惊人准确率。
•
优异的综合判别能力：模型的整体曲线下面积（AUC）高达 99.4%，表明其具有极强的正负样本区分能力。
•
突出的模型稳健性：Bootstrap 分析显示，模型的平均性能高达 0.93，而标准误低至 0.0003，这意味着模型的性能非常稳定，重复抽样的波动极小。

该研究成功开发并验证了一个用于皮肤癌分类的两阶段深度学习框架。结论部分强调，该框架通过C'GAN有效缓解了皮肤病学数据集中固有的严重类别不平衡问题，并通过创新的CNN-ViT集成架构与交叉注意力融合模块，协同利用了局部细微特征与全局上下文信息。最终模型不仅在多数类上表现良好，更在传统上难以准确分类的少数类上取得了近乎完美的性能，实现了真正平衡且鲁棒的分类。这项工作的意义在于，它为自动化皮肤癌诊断系统提供了一种处理现实世界不平衡数据、并综合多尺度图像特征的高效解决方案，朝着构建更公平、更可靠的AI辅助诊断工具迈出了坚实一步。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部