论文部分内容阅读
随着互联网的迅猛发展,网络上产生了大量Web评论,这也给自然语言处理带来了新的机遇和挑战。深入挖掘蕴含在海量文本评论信息中的情感倾向潜藏了巨大的商业价值和社会价值。然而,目前基于单一深度学习模型的文本情感分类技术很难识别和总结隐藏在丰富意见资源中的情感倾向。由此,本文主要针对基于深度学习模型的Web文本情感分析展开研究,相关工作内容如下:(1)本文论述了文本情感分类的研究背景及意义,并分别阐述了情感分析、深度学习的国内外研究现状,总结了深度学习的相关理论,主要包括人工神经元、激活函数、神经网络、损失函数、梯度下降与反向传播。(2)融合卷积神经网络CNN和循环神经网络GRU,并在神经网络的基础上引入注意力机制,体现在两处:1.对原始的CNN模型进行改造,以CNN捕捉词向量的序列特征,然后将捕获的特征信息融入到词向量中,使模型能有选择的关注重要特征;2.本文采用注意力机制的Encoder-Decoder思想构建GRU网络,并且在解码时使用编码器最后一个隐藏层状态重新作为Decoder的输入,避免了不必要的干扰。注意力机制的核心是大量冗杂的信息中有选择的关注高价值的信息,在文本情感分类任务中引入注意力机制能够快速学习到句子的文本特征,捕获句子的内部结构。(3)本文借鉴基于情感词典的方法,提出构建一个情感向量引导神经网络捕获文本序列信息,进一步增加情感分类模型的可靠性,参考台湾大学ntusd(National Taiwan University Sentimental Dictionary)简体中文情感词典中的积极词词典、消极词词典,并构造了常用的否定词词典、转折词词典和主张词词典,一共5种词典,实验证明本文提出的构建情感向量辅助分类的方法确实提升了模型的准确率。