论文部分内容阅读
近年来,随着网络与公共社交平台的日益发展,愈来愈多的人们开始在这些公共平台上吐露心声,畅所欲言,这样便会伴随着大量文本信息的产生。对这些文本内容进行情感方面的挖掘分析,不仅可以从中了解到用户的个人喜好,还可以根据这些信息进行舆论监控等,因此文本情感分析一直以来都是研究者们争相研究的热门课题。本文针对如何更准确地从文本中分析情感类别的问题,对现有的长短时间记忆网络LSTM进行了研究改进,主要工作内容如下:一、构建卷积双向长短时间记忆网络(Convolutional Bidirectional Long Short-Term Memory,ConvBiLSTM)模型来进行文本情感分类研究。该网络的构建主要是在BiLSTM网络前加入了卷积层,用来提取初级特征,重组特征图,然后以序列化形式输入到BiLSTM网络提取高级特征。本文采用的英文数据集是公共数据集imdb影评数据集,中文数据集是涉及六个领域的商品评论数据集,运用keras框架构建ConvBiLSTM网络,然后将数据按照80:20的比例,随机生成训练样本和测试样本,并且进行多次重复实验,最终结果取平均值,将结果与传统模型分类结果进行对比分析。结果表明,ConvBiLSTM网络相对于其他传统网络模型取得了较好的分类效果。二、在构造的ConvBiLSTM神经网络模型中加入注意力(Attention)机制,构建新的网络模型ACBiLSTM,对句子中的关键字给予更多的注意力,以便于更好地获取句子中的情感信息,以实现更准确的情感分类任务。实验环境与工作一中相同,最终实验结果表明,加入Attention机制后的结果优于未加Attention的分类结果。