产品评论文本的情感分析方法研究

来源 :兰州财经大学 | 被引量 : 0次 | 上传用户:kllkll123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及和信息技术的飞速发展,海量的主观性评论出现在微博、淘宝、天猫等各种网站上,这些评论包含了发表者对评价对象的情感信息和主观观点,用户也习惯从各种评论中获取有价值的信息来辅助自己的决策。情感分析涉及到人工智能、自然语言处理以及机器学习等领域,是一门综合性研究学科。当前,对于文本情感分析研究者通常采用的研究方法是基于情感词典和基于机器学习的方法,但是传统的情感分析方法大都需要大量的人工工作,而且也不能得到很好的性能。本文所研究的情感分析是二分类(正面情感和负面情感)的,为了改善产品评论文本的情感分类效果,设置了多组对比试验来选择最优的分类模型,主要做了以下工作:(1)通过发掘新的情感词来扩展情感词典的方法,提高了情感词典的覆盖度。包括两个方法:基于近义词和规则模板进行情感词典拓展。实验把扩展前后的情感词典用于情感倾向性计算中,测试分类结果对比表明扩展以后的词典有效的改善了分类效果。(2)研究了基于机器学习的情感分析。在浅层学习中,采用改变传统的特征选择方法比如一元词组、二元词组等,而是将词向量作为特征输入,并融合情感信息和极性转移在里面,使生成的分类器获取了更深层次的语义信息,该特征表示方法避免了传统方法中用忽略语义、极性转移及特征维度高的问题。在深层学习中,考虑到长短时记忆网络的优势,选取了基于attention机制的双向LSTM模型作为深度学习分类模型。实验证明深层学习算法比浅层分类算法的情感分类效果更好。(3)研究了基于词向量技术的情感分析方法。把FastText模型和BERT模型分别用于情感分析研究中,FastText的和word2vec原理类似,BERT像是word2vec的一个加强版,他们的词级别或句子级别向量表示一样都是预训练得到的,word2vec的向量表示与上下文无关,BERT却是上下文有关的,这两个模型对比实验上结果表明,BERT在分类上表现的更好。(4)研究并实现了基于融合技术的情感分析方法。主要是基于Bagging算法对文本进行情感分类,使用多个弱分类器来共同决策分类的结果,同时,根据目前分类模型的发展情况,采用情感词典与基于attention机制的双向LSTM模型进行结合的方法作为Bagging算法的对比试验,实验结果表明,基于Bagging算法的情感分析的分类准确率比较高。
其他文献
目的:观察拯阴理劳汤加减配合心理疗法治疗绝经前后诸症的临床疗效,从而为绝经前后的妇女寻找一种有效的临床治疗途径。方法:选择绝经前后的妇女90例,采用拯阴理劳汤加减进行口
银幕是指能接受幻灯、投影、电影等设备所投射出的光束,并在其表面显示图像的白色特制平面,也称之为放映银幕.它对放映画面的亮度、清晰度、对比度、色彩还原和放映声音起着
我国是一个多民族国家,随着经济的迅速发展,各民族的生活方式、信仰、道德、价值观及价值取向都存在差异,国内各民族之间的不断融合使得很多文化冲突和矛盾也突显出来。使不
简介了海洋重防腐的由来,介绍了海洋钢桩、海底管道及特殊浮动设施及紧固件的重防腐,重点讨论了金属封闭层和非金属"封闭"涂层及其新型技术3种类型的海洋重防腐技术。并列举
主要对软弱围岩隧道的塌方原因进行分析,并针对这些原因提出了相应的处理措施,包括地表处理方案、洞内处理方案、方案调整,从而确保高速公路建设项目的安全施工,促进我国交通
目前,我国人民法院内部审判庭分为民事审判庭、刑事审判庭和行政审判庭。税务纠纷案件根据性质不同,分别由上述不同的法庭负责,没有设立专门的税务法院。在十届全国人大的五年立
稻杰(penoxsulam,五氟磺草胺)是美国陶氏益农公司最新研究开发的稻田除草剂,2004年直播水稻田间试验结果,2.5%稻杰油悬浮剂30ml/667m2、40ml/667m2、50ml/667m2、80ml/667m2,
让党满意、让人民满意,是以胡锦涛同志为总书记的党中央对组织工作提出的明确要求,为推进新形势下的组织工作指明了方向。让党满意,归根结底是为了让人民满意。我们要把提高
大学生职业生涯规划具有丰富且生动的思想政治教育资源,将其与思想政治教育有效契合,能帮助大学生正确认识和评价自我,树立正确的人生观、价值观、择业观,也能在一定程度上促
随着我国经济水平日益提高,民用商用汽车保有量急剧增加使现阶段交通运输系统的负荷日益严重。在科技水平飞速发展下,解决交通问题的有效途径之一智能交通系统应运而生并且越