在中医的世界里,辨证论治是其核心所在。传统中医通过望、闻、问、切收集患者信息,进而判断其所属的证型,以此来指导临床治疗。然而,这一过程高度依赖医生的个人经验和知识储备,不同医生之间的诊断结果可能存在较大差异,缺乏标准化的诊断标准使得中医辨证的准确性难以保证。
随着人工智能(AI)和自然语言处理(NLP)技术的飞速发展,将这些技术引入中医辨证领域成为了热门研究方向。利用 AI 模型可以处理大量的文本数据,包括患者的主诉、病史等,有望实现自动化、标准化的中医辨证,减少对医生主观判断的依赖,提高诊断的一致性和准确性。但中医文本中存在着大量生僻字、专业术语以及语义模糊的情况,传统的 NLP 方法在处理这些文本时困难重重。例如,一些基于 Transformer 架构的模型,如 BERT,虽然擅长捕捉长距离依赖和全局语义,但在处理像主诉这样的短文本时,容易忽略关键的局部特征。而且,其计算复杂度较高,不利于提取细粒度特征,难以满足准确辨证的需求。
为了解决这些问题,广西民族师范学院的研究人员开展了一项关于中医辨证的研究。他们提出了一种双渠道知识注意力(DCKA)模型,旨在提升中医辨证的准确性和效率。该研究成果发表在《Scientific Reports》上,引起了广泛关注。
研究人员在开展这项研究时,运用了多种关键技术方法。首先,采用了专门为中医领域设计的大语言模型 ZY-BERT,它是在 RoBERTa 框架基础上,利用大量中医相关文本数据进行预训练得到的,能够生成高质量的中医文本语义表示。其次,构建了双渠道网络,将卷积神经网络(CNN)和双向长短期记忆网络(Bi-LSTM)相结合。CNN 擅长从短文本中提取局部特征,对于捕捉中医主诉中的关键症状信息非常有效;Bi-LSTM 则通过双向传播和门控机制,能够很好地处理像病史和诊断信息这样的长文本,提取全局上下文依赖信息。此外,还引入了知识注意力机制,将中医证候知识融入模型,帮助模型更好地理解症状与证候之间的复杂关系。
研究结果如下:
- 数据集:使用目前唯一公开的大规模中医辨证数据集 TCM-SD4,该数据集包含 50000 多条去标识化的中医诊断记录,涵盖 148 种不同的中医证型,被划分为训练集、测试集和验证集,比例为 8:1:112。
- 实验参数设置:在 RTX 4090 GPU 上,基于 Windows 系统和 PyTorch 框架进行实验。设置模型维度为 1024,文本处理长度为 512,训练 30 个 epoch,采用 Adam 优化器,学习率为 1e-5 等一系列参数34。
- 实验评估指标:采用准确率(Accuracy)、精确率(Precision)、召回率(Recall)和 F1 分数作为评估指标5。
- 基线对比:将 DCKA 模型与多种模型进行对比实验,包括决策树(DT)、支持向量机(SVM)、BiLSTM、BERT 等。结果显示,DCKA 模型在验证集和测试集上均取得了最高的预测准确率,分别达到 83.12% 和 84.01%,在召回率和 F1 分数上也优于其他模型,证明了其在中医辨证任务中的优越性67。
- 消融实验:对 DCKA 模型的各个模块进行消融实验,结果表明,双渠道网络(CNN + BiLSTM)帮助模型从中医文本中捕获了更多样化的特征,使准确率相比 ZY-BERT 分别提高了 1.15% 和 1.22%;知识注意力模块则增强了模型识别复杂证候的能力,使准确率提高了 0.54% 和 0.60%8。
- 改进 CNN 实验:增加 CNN 卷积核数量至 (2, 3, 4, 5) 以及结合多种池化方法,均提高了模型性能,表明多样化的卷积核和池化策略有助于模型更好地提取信息910。
- 知识注意力实验:知识注意力机制在长文本通道中效果更明显,能够帮助模型理解长文本特征,增强证据分类性能。通过可视化知识注意力热图发现,微调后其呈现出一定规律性1112。
- 失败案例与错误分析:DCKA 模型在某些证型的预测上存在困难,主要原因是这些证型的可训练样本数量不足,且文本中含有大量罕见词,导致模型难以学习和理解1314。
- 文本分类任务验证:在其他文本分类任务(如 SST-2、R8、Ohsumed 数据集)中,DCKA 模型也表现出色,优于其他基于 BERT 的模型,证明其具有良好的泛化能力1516。
研究结论和讨论部分指出,DCKA 模型通过双渠道架构有效提取中医文本的局部和全局特征,改进的 CNN 和知识注意力机制进一步提升了模型性能。在中医辨证任务中,该模型在准确率和 F1 分数上表现卓越,为中医辨证智能化提供了新的思路和方法。然而,研究也存在局限性,如对 TCM-SD 数据集中长尾问题的处理能力有待提高。未来的研究可以朝着增强模型对罕见证候样本的识别能力方向展开,为构建更全面、更强大的中医诊断系统奠定基础。这项研究不仅在中医领域具有重要的应用价值,还为人工智能与中医的结合提供了新的视角和范例,推动了中医现代化的进程。