基于深度学习的文本情感分析技术研究

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:qingqing4452638
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息爆炸的21世纪,随着信息技术应用不断深入以及信息化建设的不断展开,文本信息正爆炸式的增长,文本的情感分析也逐渐成为自然语言处理领域的研究热点。情感分析主要是针对给定文本或其中的句子或短语片段识别其情感极性或情感强弱。传统的研究方法主要是采用人工抽取特征和机器学习算法相结合构建情感分类模型,然而,人工抽取特征需要专家的领域知识和大量的人力物力,系统适应性差。  近年来,深度学习作为机器学习的一个新的研究方向,在不少领域的应用中取得了突破性进展。深度学习在自然语言处理中最基础的应用是词向量生成,即词的分布式表示,并在许多传统自然语言处理任务中得到应用。但在传统的词向量训练模型中,词向量通过上下文学习获得,虽然包含了语义和语法信息,但是对情感分析任务,缺少了情感等信息。同时,在句子级情感分析任务中,在构建句子的语义表达方面往往忽略了句子中词序信息和语义信息对最后情感分类结果的影响。  针对以上情感分析研究中存在的问题,本文主要研究内容及创新工作如下:  (1)提出了基于C&W模型的词向量改进训练模型,实现在词向量训练过程中嵌入情感信息和词性信息。该方法通过在模型训练中将句子和词中的情感类标签和词性类标签以不同的方式融入模型训练。为了验证学习得到的词向量性能,本文分别对中英文文本进行了定性和定量的对比试验,结果表明由改进训练模型生成的词向量在词向量对比实验中达到最理想的性能。  (2)提出了基于LSTM网络的情感分类模型,实现了将词向量情感语义信息扩展到句子中。该方法在利用词向量构建句子模型时,句子中的词以序列化的方式输入,使用LSTM神经单元控制前后词之间的相互关系,将句子中的词序信息融入到句子模型构建,获得句子的情感语义表达,完成情感分类。  (3)提出了基于卷积神经网络的情感分类模型,实现了对句子中的特征顺序提取、选择与过滤。该方法首先对句子中的所有词构建输入矩阵,使用不同大小窗口的卷积滤波器进行特征的提取和选择,然后用最大池化策略获得影响因子和定长输出,进而获得句子情感分类结果。  本文在中文和英文评论中进行了词向量对比实验,同时针对中文酒店评论进行了基于LSTM网络的情感分类模型、基于卷积神经网络的情感分类模型的对比实验。实验结果表明,本文改进的词向量训练模型和情感分类模型可以更好的处理情感分析任务。
其他文献
随着云计算技术的发展和成熟,应用云计算技术的企业与个人数量显著增加。随着云计算的发展,新的问题与需求,即云集成问题,也随之而来。云集成需求期望使处于不同云环境中的云服务
近年来,三维网格动画被广泛应用于在线三维游戏、远程医疗系统等不同领域。为了表现强烈的真实感,三维网格动画的细节信息不断丰富,从而导致数据量呈指数倍扩大。因此设计有效的
在机器学习的许多实际问题中数据有多个视图,各个视图间有着互补信息和相关信息,可以通过对这些信息的挖掘来提高学习的性能。然而由于先验知识的缺乏,如何在多视图学习利用多个
车辆自组织网络(Vehicular Ad Hoc Networks,VANETs)因其在智能交通方面的广阔应用前景,受到了研究人员的普遍关注,近年来不断获得重要研究成果。路径质量是车辆自组织网络重
近年来,立体成像和显示技术得到了高速的发展,市场上已经出现多种立体显示设备,观察者可以通过众多途径体验到立体效果。然而,立体成像所需的立体片源由于拍摄校准难、后期处
WebEx Meeting是思科子公司WebEx的核心产品,为客户举行网络研讨会还是在您组织中的任何地方需要网络会议用于内部业务流程,通过举行您自己的网络会议与客户、供应商、合作伙伴
随着移动通信业务多样化的不断发展,个人信用问题越来越受到移动运营商的关注。目前大多省市的移动运营商很少有客户的信誉记录,只要用户欠费,系统就会停止向客户提供服务。
随着计算机和网络技术的广泛应用,工作流已成为协调企业业务流程、提高它们应变能力和竞争力的一项重要技术。然而,工作流管理系统中有许多安全隐患,深入研究工作流管理系统
图像马赛克生成技术,通常是指将一幅输入图像分割成一系列规则或者不规则区域,再从图像数据库中选取适当的图像对其分割区域进行覆盖,目标是希望通过上述操作后生成的马赛克结果
随着Web2.0时代的到来,社会化媒体以前所未有的方式改变了人们的生活方式,尤其是微博的出现,它彻底颠覆了人们获取信息的方式,让人们不仅仅是信息的获取者,同时也可以即时发布信息