论文部分内容阅读
随着互联网的不断普及与发展,越来越多的用户选择互联网作为获取信息的第一渠道。与此同时,随着全面小康时代的到来,人民对精神文化娱乐的需求日益增强促进着电影文化产业蓬勃发展。面对互联网中海量的电影及评论数据,利用情感分析技术对评论数据进行分析,挖掘评论文本中隐含的情感倾向与价值趋向,一方面为消费者作出消费决策时提供参考意见,另一方面可以帮助电影创作者了解观众喜好与市场需求,从而创造出更加优秀的电影作品。由此看来,该课题具有较强的社会价值与经济效益。
本文通过对情感分析的基础知识学习,对传统的情感分析方法进行了深入的学习与研究,最终提出了一种结合传统情感分析方法与深度学习网络的有效情感分析方法。该方法针对情感分析过程中的文本向量化表示以及情感分类模型两个部分进行了改进,并通过相对应的实验对其有效性进行了验证。
在文本的向量化表示部分,本文在Word2Vec的CBOW模型基础上提出了一种结合关键词与上下文共同进行中心词预测的KWCBOW模型。KWCBOW模型打破了传统的CBOW模型在进行预测过程中对词向量窗口大小的依赖,丰富了输入层中的词间联系,使得中心词的预测在相对短的时间内不仅与上下文建立了联系,还加强了它与整篇文档之间的联系,从而提高了中间词预测结果的准确性与合理性。其中,关键词提取部分采用了结合TF-IDF算法、平均信息熵算法和传统TextRank算法的一种利用词语初始权重构建词间转移矩阵的改进算法TIHTextRank实现文本关键词提取。最后,针对TIHTextRank算法本文设计了关键词提取相关的对比实验,对TIHTextRank算法的有效性进行了验证。在此基础上,针对KWCBOW模型从语言学与情感分析任务两个方面设计并实现了对比实验,对KWCBOW模型的有效性与可行性进行了进一步的验证。
在情感分类模型部分,结合CNN卷积神经网络与Bi-LSTM双层长短时记忆神经网络分别善于提取文本局部特征和全局特征的特性,融合Self-Attention机制提出了一种混合深度学习神经网络模型SA-BLCNN。该模型首先通过CNN网络中的多次卷积、池化等操作对文本的局部信息进行提取,同时利用Bi-LSTM对评论文本的全局特征进行提取,再经过特征融合层将这两个不同方面的特征进行融合。然后,将融合后的特征向量经过自注意力机制权重调整层进行权重计算与调整,最后将其输入至全连接层经SoftMax分类器得出分类结果。针对该模型,在使用KWCBOW模型进行文本向量化表示的基础上,本文不仅设计与实现了多组单一参数作为变量的参数调优对比实验,还通过设计与CNN等常见的情感分析深度学习模型对比实验,对该模型的有效性进行了进一步的验证。
最后,将本文提出的情感分析方法应用于电影评论情感分析领域,设计并实现了对电影评论文本的自动化情感分类系统。
本文通过对情感分析的基础知识学习,对传统的情感分析方法进行了深入的学习与研究,最终提出了一种结合传统情感分析方法与深度学习网络的有效情感分析方法。该方法针对情感分析过程中的文本向量化表示以及情感分类模型两个部分进行了改进,并通过相对应的实验对其有效性进行了验证。
在文本的向量化表示部分,本文在Word2Vec的CBOW模型基础上提出了一种结合关键词与上下文共同进行中心词预测的KWCBOW模型。KWCBOW模型打破了传统的CBOW模型在进行预测过程中对词向量窗口大小的依赖,丰富了输入层中的词间联系,使得中心词的预测在相对短的时间内不仅与上下文建立了联系,还加强了它与整篇文档之间的联系,从而提高了中间词预测结果的准确性与合理性。其中,关键词提取部分采用了结合TF-IDF算法、平均信息熵算法和传统TextRank算法的一种利用词语初始权重构建词间转移矩阵的改进算法TIHTextRank实现文本关键词提取。最后,针对TIHTextRank算法本文设计了关键词提取相关的对比实验,对TIHTextRank算法的有效性进行了验证。在此基础上,针对KWCBOW模型从语言学与情感分析任务两个方面设计并实现了对比实验,对KWCBOW模型的有效性与可行性进行了进一步的验证。
在情感分类模型部分,结合CNN卷积神经网络与Bi-LSTM双层长短时记忆神经网络分别善于提取文本局部特征和全局特征的特性,融合Self-Attention机制提出了一种混合深度学习神经网络模型SA-BLCNN。该模型首先通过CNN网络中的多次卷积、池化等操作对文本的局部信息进行提取,同时利用Bi-LSTM对评论文本的全局特征进行提取,再经过特征融合层将这两个不同方面的特征进行融合。然后,将融合后的特征向量经过自注意力机制权重调整层进行权重计算与调整,最后将其输入至全连接层经SoftMax分类器得出分类结果。针对该模型,在使用KWCBOW模型进行文本向量化表示的基础上,本文不仅设计与实现了多组单一参数作为变量的参数调优对比实验,还通过设计与CNN等常见的情感分析深度学习模型对比实验,对该模型的有效性进行了进一步的验证。
最后,将本文提出的情感分析方法应用于电影评论情感分析领域,设计并实现了对电影评论文本的自动化情感分类系统。