技术的快速发展使得社交媒体平台被广泛使用,人们会在其中对日常活动发表评论和意见。情感分析(SA)受到了研究人员、企业、政府和非政府组织(NGO)的广泛关注(Wankhade等人,2022年;Dashtipour等人,2021年)。情感分析是一种从文本中提取情感、情绪、反应等信息的方法。如今,人们选择YouTube、WhatsApp和Facebook等交流渠道,因此情感分析对于分析公众对事件的评论至关重要(Harish等人,2019年;Liu等人,2020年)。情感分析也称为意见挖掘,包括将评论分类为正面、负面或中性。情感分析用于判断关于人物、产品等的电影评论中的观点是积极的还是消极的。情感通常根据具体情况以多种方式表达(Bodapati等人,2019年;Tang等人,2019年)。
电影的制作量每天都在增加,这使得挑选出最佳电影变得更加困难。观众通过评论来了解高质量的电影。随着电影产量的增加,评论数量也在增加(Daeli & Adiwijaya,2020年;Sharika等人,2023年)。因此,情感分析被用来分析评论,以便观众能够快速找到最好的电影。情感分析关注的方面包括写作风格、语言、讽刺等。不同语言使用大量的词汇,其含义因领域和情境而异。目前还没有适用于所有语言的技术或资源;讽刺和反讽在情感分析中带来了重大挑战。这些挑战通过各种方法进行分析。情感分析对评价的主观和客观方面进行分类,涉及识别句子类型(Mathews & Abraham,2019年;Pramitha & Abraham,2023年)。现有的研究使用了词典以及监督和非监督方法进行情感分析。词典方法包括基于词典的、基于语料的、统计的和语义的方法。监督方法包括支持向量机(SVM)、神经网络、最大熵和朴素贝叶斯方法。非监督方法利用句法模式和情感词典及语法分析。评论根据以下类型进行分类:句子级别、方面级别和文档级别(Mehta & Pandya,2020年;Kale等人,2023年)。
在这项工作中,提取了与方面相关的特征。基于方面的情感分析(ABSA)是一种文本分析方法,它根据特征对材料进行分类,并确定每种特征所关联的情感。其他情感分析方法存在的挑战包括不规则的语法、每个词可能存在多个类别、讽刺性句子以及一个问题上存在多种意见。ABSA是一种有用的用户评论分析工具,可以识别与每条评论相关的情感,并辅助决策。在ABSA上进行了两项任务,即提取方面术语和分类情感方面。提取过程将句子中的所有特征术语进行分类,然后将其分配为积极、消极或中性(Abeera等人,2023年;Soumya & Pramod,2021年)。使用NLP方法识别方面术语。NLP方法通过研究意见、态度等来识别评论中提到的情感或情绪,这些方法用于情感挖掘、影响和极性分类应用。NLP应用于人类语言、网页、电子邮件、推文、评论、新闻等(Joseph等人,2026年;Desai & Meva,2022年)。
情感分析在分析公众意见方面已被证明是一个有效的工具。然而,逐一检查每个用户评论是一项艰巨的任务。因此,开发了有效的自动文本分类算法来从用户评价中提取相关信息。以前,情感分析使用神经网络模型进行;但在复杂的评估中,这些模型可能会丢失文本信息。目前,情感分析被认为是利用自然语言处理从文本中获取用户情感的重要步骤。根据用户评论的不同,情感分析被分为句子级别、文档级别和方面级别类别。近年来,深度学习(DL)和机器学习(ML)模型在情感分析任务中更为突出。它们的有效性提高了情感分类的准确性。与ML方法相比,DL模型因包含多个有效层而受到青睐,具有更强的处理能力和更好的结果。因此,本研究采用了混合深度学习机制来进行基于方面的情绪分析任务。
本研究的主要优点如下:
- 1)
创建了一种独特的混合深度学习架构,能够成功地对马拉雅拉姆语电影评论进行基于方面的情绪分析,适合提取每个方面的细粒度意见和上下文细节。
- 2)
为了从输入文本中去除不相关、噪声和冗余信息,在第一阶段执行了多项与任务无关的预处理任务,以清理数据,从而提高模型的分析质量。有效的自然语言处理通过确保只保留重要文本数据来提高特征提取的精确度。
- 3)
为了增强分类阶段,在特征提取阶段提取了关键的基于评论的特征和基于方面的特征。该模型优于传统的TF-IDF方法,通过改进频率缩放调整词权重,捕捉更复杂的上下文含义和词语之间的联系。此外,E-BERT使用基于Transformer的上下文表示来增强词义消歧,而ARF专门提取与方面相关的情感指标,以提高ABSC的准确性。
- 4)
为了对提取的特征进行分类,使用了一种新的基于注意力的卷积残差挤压激励胶囊网络(A-CR-SECapNet)模型。卷积残差模块能够捕捉空间关系,避免梯度消失问题,从而实现更深层次的网络训练。此外,SE模块通过动态重新加权与重要情感变量相关的特征通道信息,增强了网络对情感特征的关注度。CapNet通过保持词语之间的空间交互关系,维持了特征之间的情感依赖性。
- 5)
计算了多种性能评估指标来评估所提模型的有效性,并与传统深度学习模型进行了比较,以展示其准确性和鲁棒性。
组织的其余部分如下:第2节包含问题描述和相关活动;第3节是提出的方法;第4节是结果和讨论;第5节是结论和未来展望。