基于注意力的卷积残差压缩激励胶囊网络，用于马来亚拉姆语电影评论中的情感分类（基于情感维度的分析）

时间：2026年2月9日

来源：Computer Speech & Language

编辑推荐：

本文针对泰米尔语电影评论的方面级情感分析，提出了一种融合改进TF-IDF、LSA、E-BERT特征提取与A-CR-SECapNet深度学习模型的创新方法，通过Convolutional Residual模块捕捉空间关系，SE模块动态加权特征，CapNet保持词间依赖，最终在多项指标上优于传统模型，验证了其有效性。

Sharika TR | Julia Punithamalar Dhas

研究学者，卡鲁尼亚理工学院与科学学院（被认定为大学）计算机科学与工程系，印度泰米尔纳德邦哥印拜陀市卡鲁尼亚纳加尔，641 114

摘要

自然语言处理（NLP）的主要功能之一是情感分析，它能够提取关于给定主题的态度、观点或判断。互联网是一个庞大且非结构化的信息来源，其中包含大量的文本文档，包括评价和意见。首先，使用高效的NLP方法（如分词、词干提取、空集移除、停用词移除和形态学分割）对输入文本进行预处理。这些预处理后的文本成为特征提取阶段的输入。通过改进的词频-逆文档频率（ITF-IDF）方法、潜在语义分析（LSA）和来自Transformer的扩展双向编码器表示（E-BERT）三种方法，提取基于评论的特征。使用与方面相关的特征（ARF）方法从评论文本中提取与方面相关的特征。通过改进频率缩放来增强词权重，模型比传统的TF-IDF方法更具优势，能够捕捉到更微妙的上下文含义和词语之间的关系。最后，结合这两种类型的特征，创建了一个新的基于注意力的卷积残差挤压激励胶囊网络（A-CR-SECapNet）模型，用于将情感极性分类为积极、消极和中性。卷积残差模块能够捕捉空间关系，帮助模型学习更深层次的信息，从而避免梯度消失问题。SE模块通过动态重新加权与重要情感变量相关的特征通道信息来提高网络的注意力。CapNet保留了词语之间的空间关系，保持了特征之间的情感依赖性。最后，使用改进的Gazelle优化（MGO）方法对模型参数进行微调，进一步提高了模型的性能。在结果部分，将提出的模型与现有模型在精确度、f1分数、准确率、召回率和平均绝对误差（MSE）等方面进行了比较。结果表明，提出的模型表现更优。

引言

技术的快速发展使得社交媒体平台被广泛使用，人们会在其中对日常活动发表评论和意见。情感分析（SA）受到了研究人员、企业、政府和非政府组织（NGO）的广泛关注（Wankhade等人，2022年；Dashtipour等人，2021年）。情感分析是一种从文本中提取情感、情绪、反应等信息的方法。如今，人们选择YouTube、WhatsApp和Facebook等交流渠道，因此情感分析对于分析公众对事件的评论至关重要（Harish等人，2019年；Liu等人，2020年）。情感分析也称为意见挖掘，包括将评论分类为正面、负面或中性。情感分析用于判断关于人物、产品等的电影评论中的观点是积极的还是消极的。情感通常根据具体情况以多种方式表达（Bodapati等人，2019年；Tang等人，2019年）。

电影的制作量每天都在增加，这使得挑选出最佳电影变得更加困难。观众通过评论来了解高质量的电影。随着电影产量的增加，评论数量也在增加（Daeli & Adiwijaya，2020年；Sharika等人，2023年）。因此，情感分析被用来分析评论，以便观众能够快速找到最好的电影。情感分析关注的方面包括写作风格、语言、讽刺等。不同语言使用大量的词汇，其含义因领域和情境而异。目前还没有适用于所有语言的技术或资源；讽刺和反讽在情感分析中带来了重大挑战。这些挑战通过各种方法进行分析。情感分析对评价的主观和客观方面进行分类，涉及识别句子类型（Mathews & Abraham，2019年；Pramitha & Abraham，2023年）。现有的研究使用了词典以及监督和非监督方法进行情感分析。词典方法包括基于词典的、基于语料的、统计的和语义的方法。监督方法包括支持向量机（SVM）、神经网络、最大熵和朴素贝叶斯方法。非监督方法利用句法模式和情感词典及语法分析。评论根据以下类型进行分类：句子级别、方面级别和文档级别（Mehta & Pandya，2020年；Kale等人，2023年）。

在这项工作中，提取了与方面相关的特征。基于方面的情感分析（ABSA）是一种文本分析方法，它根据特征对材料进行分类，并确定每种特征所关联的情感。其他情感分析方法存在的挑战包括不规则的语法、每个词可能存在多个类别、讽刺性句子以及一个问题上存在多种意见。ABSA是一种有用的用户评论分析工具，可以识别与每条评论相关的情感，并辅助决策。在ABSA上进行了两项任务，即提取方面术语和分类情感方面。提取过程将句子中的所有特征术语进行分类，然后将其分配为积极、消极或中性（Abeera等人，2023年；Soumya & Pramod，2021年）。使用NLP方法识别方面术语。NLP方法通过研究意见、态度等来识别评论中提到的情感或情绪，这些方法用于情感挖掘、影响和极性分类应用。NLP应用于人类语言、网页、电子邮件、推文、评论、新闻等（Joseph等人，2026年；Desai & Meva，2022年）。

情感分析在分析公众意见方面已被证明是一个有效的工具。然而，逐一检查每个用户评论是一项艰巨的任务。因此，开发了有效的自动文本分类算法来从用户评价中提取相关信息。以前，情感分析使用神经网络模型进行；但在复杂的评估中，这些模型可能会丢失文本信息。目前，情感分析被认为是利用自然语言处理从文本中获取用户情感的重要步骤。根据用户评论的不同，情感分析被分为句子级别、文档级别和方面级别类别。近年来，深度学习（DL）和机器学习（ML）模型在情感分析任务中更为突出。它们的有效性提高了情感分类的准确性。与ML方法相比，DL模型因包含多个有效层而受到青睐，具有更强的处理能力和更好的结果。因此，本研究采用了混合深度学习机制来进行基于方面的情绪分析任务。

本研究的主要优点如下：

1)
创建了一种独特的混合深度学习架构，能够成功地对马拉雅拉姆语电影评论进行基于方面的情绪分析，适合提取每个方面的细粒度意见和上下文细节。
2)
为了从输入文本中去除不相关、噪声和冗余信息，在第一阶段执行了多项与任务无关的预处理任务，以清理数据，从而提高模型的分析质量。有效的自然语言处理通过确保只保留重要文本数据来提高特征提取的精确度。
3)
为了增强分类阶段，在特征提取阶段提取了关键的基于评论的特征和基于方面的特征。该模型优于传统的TF-IDF方法，通过改进频率缩放调整词权重，捕捉更复杂的上下文含义和词语之间的联系。此外，E-BERT使用基于Transformer的上下文表示来增强词义消歧，而ARF专门提取与方面相关的情感指标，以提高ABSC的准确性。
4)
为了对提取的特征进行分类，使用了一种新的基于注意力的卷积残差挤压激励胶囊网络（A-CR-SECapNet）模型。卷积残差模块能够捕捉空间关系，避免梯度消失问题，从而实现更深层次的网络训练。此外，SE模块通过动态重新加权与重要情感变量相关的特征通道信息，增强了网络对情感特征的关注度。CapNet通过保持词语之间的空间交互关系，维持了特征之间的情感依赖性。
5)
计算了多种性能评估指标来评估所提模型的有效性，并与传统深度学习模型进行了比较，以展示其准确性和鲁棒性。

组织的其余部分如下：第2节包含问题描述和相关活动；第3节是提出的方法；第4节是结果和讨论；第5节是结论和未来展望。

提出的方法论

为了收集关于马拉雅拉姆语电影评论的意见，本研究旨在创建一种基于方面的情绪分析方法。该方法涵盖了特征提取、情感分类和预处理阶段。停用词移除、词干提取、分词、空集移除和形态学分割是一些有用的NLP预处理技术。这些文本已经过处理，并被送入特征提取过程。

结果与讨论

本研究使用Python工具实现。系统配置包括一个运行在3.20 GHz频率下的Intel(R) Core(TM) i5-3470 CPU，配备8 GB RAM和64位操作系统。这是一个x64架构的处理器，不需要屏幕上的笔或触摸输入。现有的模型，如Deep CNN（DCNN）、Resnet-Bidirectional LSTM（Resnet-BiLSTM）和基于注意力的Resnet，在f1分数、特异性、召回率和精确度等方面与提出的方法进行了比较。