基于深度学习的情感分类方法的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:sniper0928
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网持续高速的发展带来了便捷的生活方式,各种新闻、社交、娱乐、电商网站层出不穷,我们可以随时随地在网上进行阅读、购物、交流等。在这些网站中,经常会产生大量的评论性文本,即描述对某一件事情的看法或者意见的文本,对这种类型的文本进行意见挖掘和整理,有助于我们辨别产品好坏、商家提高服务水平、政府掌握舆情走向等。在这些评论文本中,大部分都包含有明显的情感倾向性信息,如何准确地对这些文本进行情感倾向性自动分类,是本文的主要工作。深度学习具有强大的特征自动提取功能,已被广泛应用到了语音识别、机器翻译、图像识别、人机交互等各个领域中。在情感分类的研究中,由于文本特征提取的困难性和复杂性,基于传统的学习方法已逐渐被深度学习所取代。本文在基本神经网络的基础上,通过加入词语的情感向量来提高情感分类的准确率,主要工作有:一是对领域相关情感词进行识别,并计算情感词语的情感强度值。不同领域的评论文本中会含有一些领域相关的情感词语,为了准确地判断文本的情感倾向性,需要对领域相关情感词进行识别。本文基于无监督学习的思想,通过构建普遍适用的情感语句规则模型来实现情感词语的自动识别。其中,识别的过程采用的是“差分共现”法,该算法是根据词语共现的特点及其在不同情感类别中出现频率的差异性来设计的。另外,为了进一步提高情感分类的准确率,本文通过分析HowNet和word2vec各自的优缺点,最终采用两者相结合的方式共同决定词语的情感强度。其中,情感强度的计算过程采用的是“基于TF-IDF的种子词”法,是根据词语相似性原理以及当前语料下词语的重要程度来设计的。二是构建了词语的三维情感向量,并将其嵌入到深度学习模型中。在基于深度学习的情感分类模型中,研究者们热衷于构建各种神经网络模型,但是情感词语对于情感倾向性的判断有着举足轻重的作用,不应完全抛弃。本文首先根据情感表达中最主要的三个特征——情感词、否定词和程度词特征构建出词语的三维情感向量,针对情感分类任务扩展了词语的情感信息,并将其嵌入到基本神经网络模型中去,提出了四种结合的方式,分别为naive-CNN,separate-CNN,naive-LSTM和separate-LSTM。实验表明,在基本神经网络模型中加入情感向量有助于提高情感分类的准确率。
其他文献
目的比较不同病因肝硬化的临床特征。方法选择该院2011年2月至2015年2月收治的肝硬化患者390例,其中乙型肝炎(乙肝)后肝硬化患者130例,酒精性肝硬化患者130例及原发性胆汁性
伊斯兰政治,既根植于伊斯兰教,又伴随于历史演进之中,是穆斯林关于政治态度、信仰、情感等政治心理倾向和政治价值取向的总和。伊斯兰式的“部落民+臣民”文化构成了伊斯兰传
<正>“绿色金融”的由来及内涵联合国大会早在1980年3月5曰就向全世界呼吁“必须研究自然的、社会的、生态的、经济的以及利用自然资源过程中的基本关系,确保全球的持续发展
运用Matlab强大的数值计算和图形处理功能,结合实际,对地形图的三维数据进行了分析处理,然后动态地显示其三维模型,它具有效率高,算法易于实现等特点。对工程设计、军事侦察
耳鸣是耳鼻喉科临床上的难治疾病之一,关于耳鸣的发病机制及其客观检查的研究一直是临床的难题,文章通过对20年来国内外有关研究报道的总结,探讨耳鸣机制研究的方向及其客观
目的比较3种方法对血清HCV RNA的提取性能,并对其作方法学评价,揭示RNA提取技术对HCVRNA定量的影响。方法使用QIAamp Viral RNA Mini Kit(Q法),NucliSens miniMag系统(M法)和
目的开发海德堡CP2000摸拟操作系统用于教学,以提高学生对CP2000印刷机的操作技能。方法通过对海德堡CP2000印刷机的大量研究与操作,采用DELPHI集成开发平台进行开发。结果软
目的:总结并分析运动神经元病的发病机制的相关学说,综合探讨运动神经元病的发病机制,从而为临床治疗上提供可靠的依据。资料来源:应用计算机检索PUBMED 1994—01/2001—12关于运
随着经济全球化的日益加深,我国融入国际经济的步伐不断加快,作为一个农业大国,加入WTO对我国农业发展的影响一直是人们十分关注的问题。回顾中国入世以来的情况,总体上表现