【摘 要】
:
随着互联网技术的飞速发展,网络评论空间中产生了大量的信息,这些信息主要由微博评论、商品评论、社交评论等组成。而评论往往带有比较强烈的情感色彩,因此对网络评论进行情感分析具有重大的社会价值和现实意义。本论文对情感分析领域的现状以及深度学习理论进行了深入地研究,分析了该领域存在的一些问题,从提升情感分析预测的准确率出发,首先针对单一深度学习模型存在的不足,提出了一种多模型融合文本情感的算法;其次,针对
论文部分内容阅读
随着互联网技术的飞速发展,网络评论空间中产生了大量的信息,这些信息主要由微博评论、商品评论、社交评论等组成。而评论往往带有比较强烈的情感色彩,因此对网络评论进行情感分析具有重大的社会价值和现实意义。本论文对情感分析领域的现状以及深度学习理论进行了深入地研究,分析了该领域存在的一些问题,从提升情感分析预测的准确率出发,首先针对单一深度学习模型存在的不足,提出了一种多模型融合文本情感的算法;其次,针对词向量中缺乏情感信息的问题,提出了一种情感词向量的构建方法。本论文具体的工作内容和创新点如下:(1)为了解决单一的深度学习模型难以在获取高度抽象文本特征的同时学习句子的序列特征的问题,本论文提出了一种多模型融合的深度学习算法,首先利用卷积神经网络的并行特征提取能力对数据进行特征提取。接着结合双向长短时记忆神经网络抽取句子序列特征的优点,将提取的特征送入双向长短时记忆神经网络模型进行训练,同时使用全局均值池化的方法减小模型的复杂程度。本论文在亚马逊评论数据集和SSTb数据集中进行对比实验,实验结果表明,与传统算法相比,本论文提出的算法能够有效地提升情感分析的准确性。(2)为了使词向量具有情感信息,本论文构建了情感词向量训练框架,通过改进Skip-Gram词向量训练模型,将情感信息融入词向量训练模型中,从而构建情感词向量。对于情感分析任务而言,情感词向量可以丰富文本的情感表达,提高情感分析的准确性。实验采用亚马逊评论数据集进行情感词向量的训练,而后利用SSTb数据集对不同的词向量进行对比。首先,分别计算亚马逊数据集中正负样本中的高频词,分别挑选出现词频最多的且具有强烈情感色彩的词作为正向情感词组和负向情感词组;接着通过SO-PMI算法计算剩余词情感倾向,同时使用TF-IDF对单词情感进行加权;最后使用改进的Skip-Gram模型对词向量模型进行训练,从而得到情感词向量的表达。实验证明,该方法可以有效区分诸如“good”和“bad”这一类上下文结构相近但情感相反的词,从而进一步提升情感分析任务的效果。
其他文献
随着现代互联网技术的大发展,以微博、微信、百度贴吧等为代表的自媒体在革新当代新闻传播方式的同时也衍生出一系列新闻传播的伦理问题。不论是站在净化互联网环境、促进新
1993年7月—1998年8月,我们采用顺铂(CisplatinDDP)与足叶乙甙(E-toposideVP16)联合组成EP方案治疗肺癌68例,观察其疗效与毒副反应,报告如下。1 资料与方法1.1 一般资料
传统的KCF跟踪算法利用FHOG特征对目标进行描述训练分类器从而实现预测跟踪,当出现的光照变化、目标与背景颜色相似、目标尺寸变化等问题,易发生跟踪结果不准确甚至目标丢失
目的:观察护理干预在大面积烧伤患者进行湿润暴露疗法治疗中的临床作用。方法:选取我院收治的大面积烧伤患者60例,随机分为观察组和对照组各30例,两组患者均使用湿润暴露方法
20世纪70年代以来,金融资本产生了新的特点,可称之为现代金融资本。现代金融资本概念包含两个层次的含义,在资本形态上采取货币资本和虚拟资本两种形式,其资本积累方式是资本
<正>生产企业设立的专职质检员是产品质量最直接的管理者和标准执行者,担负着产品的过程检验和出厂检验的职责,目的是把优质、合格的产品提供给客户,为企业赢得市场和效益。
体验式教学是教师创设合理的情境,有目的、有计划地展开教学活动,引导学生感知、领悟世界的丰富性,培养学生独立审视问题的能力,师生共同经历生命活动、历程的教学方式或教学
目的:探讨强直性脊柱炎患者外周血中Th9细胞水平以及相关因子的变化情况,为该病的发病机制研究提供相关参考。方法:选取于2010年7月至2013年12月间前来我院治疗强直性脊柱炎
文章分析了毕飞宇的中篇小说《玉米》主人公玉米及其他人物形象的典型性及特定的社会环境,阐释了女人在社会碰撞下无法忍受的痛点:痛点之一,贞洁、伦理是女人的致命伤;痛点之
目的:探讨老年高血压病患者的临床护理方法以及护理效果。方法:选取我院2011年1月-2014年6月收治的100例老年高血压病患者进行回顾分析,对所有老年高血压病患者进行降压药物