基于改良SO-PMI算法的在线评论情感倾向性分析研究

来源 :东北财经大学 | 被引量 : 4次 | 上传用户:linlijun002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感是人类所具有的一种特殊的属性。本文研究的内容就是电子商务环境下用户评论文本中的情感分析。评论可以反映出用户使用商品的感受,用户可以表达赞赏也可以宣泄不满。因此,评论是其他用户购买同产品的一种主要参考。但是由于购物者数量众多且文化水平各异,难以对大量的在线评论准确分类,给用户的浏览造成不便。因此引入情感分析方法从情感倾向性入手,对评论进行分类优化,提高用户通过评论判断产品好坏的效率,以便用户高效准确的确定所需商品。本文以用户购买手机的评论作为研究范例,使用情感分析方法判断评论的情感倾向。第一步构造面向手机领域准确全面的情感词典,使用改良后的SO-PMI算法扩充情感词典,进一步,基于情感词典,对情感词及其他类别的词进行相应的计算,判断出评论的情感倾向性,并对其进行分类。主要研究内容总结如下:(1)基础情感词典合并以及修饰性词典整理。在基于情感词典的情感分析中,由于传统单个情感词典在词汇量、版本等方面的限制,对特定领域评论的情感分析效果较差,因此通过搜集整理,选择了知网情感词典、台湾大学情感词典和清华大学李军中文褒贬义词典进行合并,这样就得到了通用基础情感词典,由于本文的特定对象为手机,还添加了手机相关情感词典。并且搜集整理了修饰性词典,具体包括否定词词典、程度副词词典和关联词词典。(2)情感词典扩充。手机评论中还包含着基础情感词典中未添加的词,影响情感分析的效果,要对含有新词的手机评论进行情感倾向性判断,还需要对情感词典进行扩充。为此,本文使用了改良的SO-PMI算法对情感词典进行了扩充。主要改良工作包括:1.使用TF-IDF算法对基准词的选择进行了优化。2.基于多项式贝叶斯(MultinomiaNB)分类器确定出最佳分类维度,然后使用卡方统计量进行候选情感词的提取。(3)手机在线评论情感分类实验。在综合考虑购物平台数据量、口碑、产品的质量后,选择爬取京东网上商城手机版块的评论数据。在对评论进行去重、格式转换等处理后,就得到了带有标注的评论,然后基于情感词典对其进行分类测试,结果显示情感分类方法能够有效的对手机在线评论进行倾向性分类。用实验证明了基于改良SO-PMI算法的词典扩充方法的有效性,为情感词典的扩充提供了一种新的思路,经过验证分类的查准率、召回率以及F1值达到了较高水平。最后,根据改良SO-PMI算法的评论分类结果,设计了情感倾向程度对比实验进行二次分类,进一步对正向评论和负向评论进行细分,其中情感倾向性最高的正向评论和负向评论分类准确度最高。
其他文献
依托中国科学院近代物理研究所的重离子冷却储存环HIRFL-CSR,研制出了肿瘤组织诊断用对扇形正电子断层影像)装置。将简要介绍为其研发的后继电子学处理系统。该系统主要由放大,
作为基层党办系统的党员干部,要在严格遵守《准则》和《条例》的基础上,紧紧围绕习近平总书记提出的"五个坚持",从严要求,走在前,做在先。忠诚担当、服从落实是党员干部的政治
第一季度贵州省旅游工作调度会近日召开。据贵州省旅游局局长李三旗介绍,今年以来,全省旅游行业紧紧围绕“井喷式”增长的发展目标,加快构建全域旅游发展体系,扎实推进旅游产业化
探讨了信息化实践教学模式主要实施措施有转变观念,提高对实践教学的认识;加大对实践教学经费投入;加强实践教师队伍建设;构建实践教学信息平台;加强管理,做好规范化建设以及其他几
总结了3种常用晶体(ST-401、Nal和CeF3)在4种单能γ射线(0.622MeV、1.25MeV、2.365MeV和6.13MeV)照射下的能量响应,并对实验现象进行了合理地分析,同时给出了实验结果。
8月1日下午,浙江爱仕达电器股份有限公司不锈钢产品国家出口免验年审末次会议在该公司隆重举行,经过浙江检验检疫局专家组为期两天的认真审核,爱仕达公司通过了国家出口免验年度
在很多企业,绩效考核结束以考核结果汇总到人力资源部为标志,至于这些结果是否被告知员工,是否得到分析,是否得到运行,则很少有人关心,于是,绩效考核就成了形式表演,没有任何实际意义