Web评论的文本情感倾向性分析

来源 :哈尔滨师范大学 | 被引量 : 0次 | 上传用户:seryanny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛发展,网络上产生了大量Web评论,这也给自然语言处理带来了新的机遇和挑战。深入挖掘蕴含在海量文本评论信息中的情感倾向潜藏了巨大的商业价值和社会价值。然而,目前基于单一深度学习模型的文本情感分类技术很难识别和总结隐藏在丰富意见资源中的情感倾向。由此,本文主要针对基于深度学习模型的Web文本情感分析展开研究,相关工作内容如下:(1)本文论述了文本情感分类的研究背景及意义,并分别阐述了情感分析、深度学习的国内外研究现状,总结了深度学习的相关理论,主要包括人工神经元、激活函数、神经网络、损失函数、梯度下降与反向传播。(2)融合卷积神经网络CNN和循环神经网络GRU,并在神经网络的基础上引入注意力机制,体现在两处:1.对原始的CNN模型进行改造,以CNN捕捉词向量的序列特征,然后将捕获的特征信息融入到词向量中,使模型能有选择的关注重要特征;2.本文采用注意力机制的Encoder-Decoder思想构建GRU网络,并且在解码时使用编码器最后一个隐藏层状态重新作为Decoder的输入,避免了不必要的干扰。注意力机制的核心是大量冗杂的信息中有选择的关注高价值的信息,在文本情感分类任务中引入注意力机制能够快速学习到句子的文本特征,捕获句子的内部结构。(3)本文借鉴基于情感词典的方法,提出构建一个情感向量引导神经网络捕获文本序列信息,进一步增加情感分类模型的可靠性,参考台湾大学ntusd(National Taiwan University Sentimental Dictionary)简体中文情感词典中的积极词词典、消极词词典,并构造了常用的否定词词典、转折词词典和主张词词典,一共5种词典,实验证明本文提出的构建情感向量辅助分类的方法确实提升了模型的准确率。
其他文献
随着我国现代化进程的加快,大气污染问题日益严重。大气中的污染物质、气溶胶等主要通过降雪等大气湿沉降移除,因此降雪能够较好的指示区域大气环境状况,参与地表生物地球化
图像作为现代社会中一种不可或缺的信息载体,在如自动驾驶、安防监控、卫星遥感等诸多领域里所采用的数据形式中扮演了一个必不可少的角色。图像传递信息的能力与其本身图像
作为工作经验的重要代表,从业经历能够影响对冲基金经理信息获取与决策机制,进而影响其管理的基金产品绩效。然而,中国对于对冲基金经理工作经验与基金产品绩效关系的研究并
碘化亚铜(CuI)是一种p型直接宽带隙无机半导体材料,禁带宽度~3.1eV,具有很大的激子束缚能(62meV),较高的载流子浓度和空穴迁移率,而且CuI储量丰富、价格便宜、无毒无污染,在可见光
随着如今更多的老井区的再次开发,加密井,以及深水钻井,大位移井等多种新井型的应用,轨迹的精度问题再次引起研究人员的关注,通常所用的轨迹不确定性模型在对这些情况上的应
在控制领域中,具有优良性能的传感器对提高控制精度与控制质量有重要作用。针对煤矿工业,则需要快速准确地检测出甲烷含量。本文采用了实验与仿真相结合的方法,研究了电离式
大脑是人类全身最特殊的器官,其复杂的运行机制离不开神经系统和基因等物质共同作用。影像遗传学是一门将神经影像学和遗传学相结合的新兴交叉学科,使得研究人员可以从宏观和
随着工业自动化的普及以及智能化需求的不断提升,对工业机械臂的性能要求也愈来愈严格。机械臂的工作效率、负载能力以及工作空间这三方面的性能亟待提升。机械臂的轨迹优化
作为普通高中数学课程标准(实验)要求的七种基本能力之一,数据处理能力在学生数学素养的发展中起着重要作用.但笔者在教学过程中发现,高中生的数据处理能力还存在着一些问题.
随着社会科技进步,光催化技术在有机污染物降解、废水处理等方面越来越发挥着巨大的作用。因而,合成低成本、稳定性好且催化效率高的光催化纳米材料成为现阶段科学工作者聚焦