方面级情感分析(ABSA)旨在识别句子中特定方面所表达的情感极性(积极、消极或中性)。基于图卷积网络(GCN)的模型在该领域得到广泛应用,通常依赖从依赖树中提取的句法依赖关系。然而,此类方法在建模长距离依赖及捕捉方面词与其上下文词汇之间的交互方面存在局限。研究人员提出了一种注意力增强图卷积网络(AE-GCN),利用情感知识更准确地提取语义及情感相关依赖。该模型通过依赖树构建句法信息图,并以情感知识进行增强,进一步结合多层注意力机制以更好地捕捉语义关系。注意力机制通过自适应权重分配,使模型能够聚焦于与方面相关的上下文词汇,从而提升情感预测准确性。研究人员在餐厅与笔记本电脑评论领域的四个常用基准数据集上进行了评估。实验结果表明,AE-GCN在SemEval基准数据集上的表现优于近期多种ABSA基线模型,平均准确率提升0.44%,F1分数提升0.60%。鲁棒性分析进一步表明,这些性能提升在多个数据划分中保持稳定。
研究背景与意义
随着社交媒体平台的快速发展,情感分析与意见挖掘已成为自然语言处理的重要研究方向。方面级情感分析(ABSA)作为细粒度情感分析任务,旨在针对句子中提及的特定方面独立判定其情感极性。与传统文档级或句子级情感分析不同,ABSA能够处理同一句子中包含多个不同极性的情况。现有基于图卷积网络(GCN)的方法虽然能够利用依赖树建模句法结构,但在长距离依赖建模及方面与上下文的交互捕捉方面存在不足。此外,单纯依赖句法结构可能引入噪声,且缺乏情感层面的引导。因此,研究人员提出将句法结构、情感知识与注意力机制相结合的新框架,以提升ABSA的性能。该研究发表于《Machine Learning with Applications》。
关键技术方法
研究人员采用四个SemEval基准数据集(餐厅2014、笔记本电脑2014、餐厅2015、餐厅2016)进行实验。技术层面首先使用预训练语言模型(GloVe与BERT)生成词向量,并通过Bi-LSTM层获取双向上下文表示。随后构建基于依赖树的句法图,并利用SenticNet情感知识库对邻接矩阵进行增强,加入情感评分与方面词关联权重。通过两层GCN进行图卷积运算,并结合多层自注意力机制对节点特征进行加权聚合。最终将BERT表示与图卷积输出拼接,经全连接层与softmax分类器预测情感极性。
研究结果
1. 实验结果与比较
在四个数据集上的实验表明,AE-GCN在准确率与宏F1值上均优于传统深度学习模型、纯图神经网络模型及多数BERT基线。尤其在餐厅2016数据集上取得最高准确率92.21%与F1值79.43%。与依赖外部数据增强的BERT模型相比,AE-GCN在不增加额外计算开销的情况下实现了相当甚至更优的性能。统计检验证实其在多个数据集上的提升具有显著性(p<0.05)。
2. 消融研究
移除BERT编码器导致F1值下降约15%–25%,凸显大规模预训练的关键作用。去除注意力模块引起F1平均降低2.7%–8.5%,去除SenticNet情感增强则导致F1平均降低2.3%–5.9%,证明图结构与情感知识的贡献虽小于预训练,但仍具统计显著性与一致性。
3. 参数分析
GCN层数设为2时性能最优,增加至超过2层后出现过拟合与性能波动。注意力层数设为4时效果最佳,过多层数会导致不稳定与冗余。Dropout率0.5在大多数数据集上表现最优,平衡了正则化与模型表达能力。
4. 案例研究与可视化
对同一句子中不同方面(“氛围”与“食物”)的可视化显示,注意力权重能动态调整并聚焦于对应方面的情感词,验证了模型捕捉方面特异性与长距离语义依赖的能力。
讨论与结论
研究表明,将句法依赖、情感知识与注意力机制融合于统一框架中,能够有效提升ABSA的表示能力与预测精度。AE-GCN通过情感增强的图结构强化了方面与情感词之间的联系,并利用多层注意力优化特征选择,减少了无关信息的干扰。该方法在无需外部数据增强的情况下实现了稳健的性能,为细粒度情感分析提供了一种轻量且可解释的解决方案。未来可探索跨领域适应性与更复杂的情感知识整合方式,以进一步提升模型的泛化能力。
打赏