在传统中医(TCM)中,医生通过四种诊断方法——望、闻、问、切——来评估内脏器官、经络和气血循环的功能状态,从而推断生理和病理变化,制定治疗策略。舌诊作为望诊的关键组成部分,在临床实践中是一个不可或缺的客观诊断工具,因为它能够避免患者主诉症状的主观偏差。舌下静脉曲张(SLV)在TCM和现代医学中都是重要的客观诊断指标。根据TCM理论,这些血管异常主要归因于“血瘀”[1]。血瘀指的是血液循环受阻,与周围神经病变和妇科疾病等特定疾病相关[2,3]。1967年的一项研究表明,SLV仅仅是衰老的迹象,而非疾病的指标[4],这可能是由于当时老年人预期寿命较短且心血管死亡率较高所致。1974年和1990年的后续研究探讨了SLV与心血管疾病之间的潜在联系,但缺乏确凿的统计证据[5,6]。直到2015年,多项研究才证实了SLV与心血管疾病和高血压之间的关联[7],[8],[9],[10],[11],[12],[13],[14],[15],同时观察到下肢静脉曲张也存在类似的相关性[11,12]。2020年的一项最新研究进一步表明,肝硬化患者的SLV发病率和严重程度显著高于健康人群[16]。然而,临床医生在SLV的精确界定上仍存在观察者间差异[17]。大多数研究采用二元评估(即存在或不存在)[7],[8],[9],[10],[12],[13],[15],只有少数研究使用了三级严重程度分类[11],或基于长度、宽度或形状等参数进行更详细的形态分析[14],[18]。此外,现有的正式报告仅基于单角度的舌部图像,仅提供舌部特征的存在与否及大致位置的文字描述,缺乏精确的视觉信息。这些手动评估方法本质上具有主观性,缺乏定量精度。开发自动化的SLV分割工具有助于提高诊断的一致性和准确性,同时减少人为解释带来的变异性。
最近关于SLV图像分割的研究均采用了基于卷积神经网络(CNN)的架构[19],[20],[21],[22]。SLV分布分散且具有全局连通性,这对语义分割构成了挑战。因此,假设基于Transformer的架构[23],[24](在模拟全局上下文方面表现优异)应该比基于CNN的方法更适用于SLV分割。
模型训练前的医学图像手动标注工作既费时又费力。此外,由于医学图像资源有限,通常使用数据增强技术从原始图像生成合成变体,以增加数据集的多样性并提升模型性能。传统的增强策略包括仿射变换(如水平翻转、垂直翻转、旋转、缩放、剪切)、色彩空间调整(如亮度、对比度、饱和度调整)或cutmix操作[25]。然而,在医学图像分析中,目标区域(如肿瘤)往往具有不规则的形态,这些特征对准确识别至关重要。SLV也具有这些特性,使得传统增强策略在增加图像多样性和提高分割效果方面效果不佳。为了解决这一问题,我们在数据增强过程中加入了高强度变形技术,以提高模型的泛化能力和分割精度。据我们所知,这是早期将高强度变形增强应用于深度学习模型训练的研究。