论文部分内容阅读
随着Web2.0的快速发展,用户通过社交网络、博客、在线门户网站等产生了大量具有情感的文本信息。这些文本信息通常涉及到社会热点问题、商品服务、产品评价等多个领域,对这些信息进行分析、归纳和推理,将为市场调研、产品或服务评论挖掘、网络舆情发现及预警等带来巨大的社会意义及商业价值。因此,挖掘文本的情感信息,近年来一直是工业界和学术界的研究热点。目前,文本情感分析的方法可以分为基于情感词典的方法、基于传统机器学习的方法以及基于深度学习的方法三类。其中,基于情感词典的方法,针对不同领域需要构建和维护情感词典,成本代价过高;基于传统机器学习的方法通常基于词袋模型(Bag of Words,Bo W),导致具有相同单词组成的不同语义的句子具有相同的向量表示,因此模型不能准确学习文本特征;基于深度学习的方法,可以处理并运用海量的文本数据,实现全自动地捕捉深层次的语义特征,从而实现端到端的文本情感分析任务。然而,现有的深度学习模型在中文文本情感分析任务中基本上都是基于词的网络,即将词作为基本处理单元,该网络主要考虑了词的上下文语境,但忽略了词的内部结构信息,特征提取视角单一,导致模型对文本的特征提取能力不足,进而导致模型的性能不佳。本文在研究传统情感分析方法以及现有基于深度学习的文本情感分析方法的基础上并结合中文文本的特点,分析并设计了如下两种基于深度学习的情感分析模型:(1)构建了基于双通道卷积神经网络和双向长短期记忆网络的(Dual-channel Convolutional Neural Network and Bidirectional Long-short Term Memory,DC-CNNBLSTM)文本情感分析模型。首先通过词嵌入和字嵌入的方式将文本转化为词向量和字向量。然后,将词向量和字向量分别作为模型中两个通道的输入,利用卷积神经网络(Convolutional Neural Network,CNN)从词向量和字向量两个角度进行文本隐藏特征的提取并进行特征组合,随后利用双向长短期记忆网络(Bidirectional Long-short Term Memory,BLSTM)学习文本序列特征。最后,引入Merge层将提取到两种特征进行融合,结合两种特征表示进行联合学习。实验结果表明所提方案能够有效提高文本情感分析任务的性能,其准确率、召回率以及F1值相比单通道方法、传统机器学习算法以及其他深度学习模型都有显著的提升。(2)由于文本中不同词和字对情感分类任务的关键性各不相同,为了突出关键信息对模型的影响和减少无用信息对模型的干扰,本文在上述模型DC-CNNBLSTM的基础上引入注意力机制,设计了(Dual-channel Convolutional Neural Network and Bidirectional Long-short Term Memory with Attention Mechanism,DCCNN-BLSTM-Attention)模型,注意力机制能够帮助模型得到含有注意力概率分布的语义编码,有效突出文本中对分析任务更关键的词和字。实验结果表明,引入注意力机制能够有效提高文本情感分析的性能。