基于深度学习的短文本情感分析研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:zhifeiji1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
短文本情感分析是通过使用采集、处理、分析等方式来获取文本的情感极性。目前,基于深度神经网络的情感分类方法能够有效克服传统方法对情感词典和复杂特征工程的依赖,并取得了显著的情感分类效果。然而,短文本情感分类研究存在以下问题:文本自身句式短小、不规范、信息丰富,且神经网络模型训练时间长、易忽视句子中的上下文依赖关系。针对上述问题,本文提出两种情感分析模型并且针对短文本构造三组情感特征,主要研究内容如下:(1)针对循环神经网络模型存在信息记忆丢失、忽略上下文非连续词之间相关性和梯度弥散的问题,提出基于自注意力机制和树形长短时记忆网络(Tree-LSTM)的情感分析模型。该模型考虑到Tree-LSTM缺乏对情感词的捕获能力,首先在Tree-LSTM的输入端添加自注意力机制,然后在Tree-LSTM模型中学习长距离节点之间的语义搭配关系,最后在输出端引入Maxout神经元解决随机梯度下降算法中存在的梯度弥散问题。将该模型与六个情感分类模型进行对比,在公开数据集COAE2014上完成情感二分类实验,实验结果表明该模型在评价指标准确率、精确率、查全率、F1值上优于所选取的对比模型。(2)针对单一文本词向量无法全面表示文本中的情感特征信息,本文进一步研究短文本自身特点,提出四种文本特征并融合成三组情感特征。四种特征分别是词特征、词性特征、情感符号特征、情感标签特征。其中词特征是最基本的特征;词性特征是对词语的词性重新标注,使神经网络增加对情感词的注意和学习;情感符号特征比情感词具有更强的情感指示作用;情感标签特征加强了文本和标签之间的联系。将四种特征融合成三组情感特征:词特征+情感符号特征+词性特征、词特征+情感符号特征、情感标签特征。将构造的三组情感特征首先映射为分布式词向量,然后输入到多通道卷积神经网络中提取情感特征,最后完成情感分类。将该模型分别与选取的情感分类模型在中英文数据集上完成粗粒度和细粒度情感分类实验,结果表明该模型在准确率、宏平均、微平均上均优于所选取的对比模型。
其他文献
<正>2019年9月21日,由上海师范大学影视传媒学院、上海师范大学戏剧与影视学一级学科主办,上海电影评论协会协办的"第二届长三角影视传媒研究生学术论坛"在上海师范大学影视
近年来,随着新课程改革和小学教育改革的深入发展,创新与发展的思想已开始渗透到小学教育管理的实践中,特别是在传统教育管理机制的改革中。在当前形势下,只有把握小学教育管
对于每个初中毕业生来说中考是他们人生中第一次至关重要的阶段性检阅,所以中考总复习显得尤为重要,我从把握考纲、分层教学、针对练习,复习计划和考试热点等方面提出教学建
利用石台县国家气象观测站(城区)及仙寓镇气象观测站2012—2018年的气候资料,根据适宜夏季旅游的气候参数,分析仙寓山景区旅游气候资源的优越性。结果表明:仙寓山景区夏季旅
离子液体是一种在室温下呈液态的新型化合物,完全由阴离子和阳离子构成。它们具有许多传统溶液无法比拟的优点,如液程宽,不易燃,不易挥发,稳定性好,可设计及可循环使用等。结
中考是每个学生人生中的一个转折点,中考的数学成绩在这个转折点里起到重要的作用,有决定性的意义。如何在短时间内提高复习的效率和质量,使我们好多数学教师为这个问题烦心,
<正>立体显微镜下,一群形如蝌蚪的细胞在培养皿中来回游动。从外形上看,它们和有着一条小尾巴的精子非常相似。世界上第一颗人造精子,2008年春天诞生在英国纽卡斯尔大学生命
<正>习近平总书记视察山西,强调要在"六新"上不断取得突破。说到"六新"之一的新产品,我们很容易想到手撕钢、笔尖钢、石墨烯、碳化硅等等。它们都是科技成果转化的结果。而科
管道运输做为五大运输方式之一,具有高效便捷的特点,是天然气、石油等能源的主要运输方式。由于管道输送具有连续性特点,若管道在输送过程中发生泄漏,管内介质将不断流失造成
生态课堂是顺应学生身心发展规律、个性发展需要的课堂,生态教育是顺应自然的教育,是实现可持续发展、创建生态文明的需要。构建生态化小学语文课堂,旨在给学生一个更加民主