基于非均衡数据分类方法的虚假评论检测研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:susan6918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网技术的快速发展和广泛普及,尤其是Web2.0概念和技术的引入,互联网中产生了海量用户生成内容,其中就包括了电子商务中的产品评论。然而,由于互联网的开放特性以及产品评论带来的巨大经济利益,电子商务中的产品评论中包含大量的虚假评论。仅仅靠人工分析具有很大的难度,因此需要引入数据挖掘中的虚假评论检测技术,对评论的虚假性进行分析。考虑到虚假评论检测存在的数据分布非均衡问题,本研究从非均衡数据分类角度对虚假评论检测进行研究。为此,本研究首先分析了虚假评论检测的背景和研究意义,对虚假评论检测和非均衡数据分类的国内外研究现状进行了系统分析;其次,本研究对虚假评论检测和非均衡数据分类的基础理论进行了系统研究,主要包括虚假评论的概念、虚假评论检测概述、虚假评论检测的难点以及虚假评论检测中的常用特征和虚假评论检测中的常用方法,非均衡数据分类概述和已有的数据层面的非均衡数据分类方法和算法层面的非均衡数据分类方法;然后在此基础上,针对虚假评论检测中存在的数据分布非均衡问题,本研究以支持向量机分类方法为基础,提出了基于支持向量取样的非均衡数据分类方法,并构建了相应的虚假评论检测模型;最后,以电子商务为应用背景,开发了面向电子商务的虚假评论检测原型系统,通过实际应用对模型的有效性和实用性进行了验证。最终表明本研究提出的虚假评论检测模型在电子商务中取得了较好的预测效果。本研究从虚假评论检测中数据分布非均衡问题入手,提出了改进的虚假评论检测方法,丰富和完善了虚假评论检测的研究体系。同时将虚假评论检测模型应用到电子商务中,开发了面向电子商务的虚假评论检测原型系统,为企业解决虚假评论问题提供了解决途径。
其他文献
目的评估临夏市6~7岁学龄儿童第一恒磨牙在局部使用氟保护漆后的防龋效果,为我国落后地区制定学龄儿童龋病预防政策提供参考依据。方法选取甘肃省临夏市6~7岁学龄儿童1 684名为
总结了美国、俄罗斯、欧盟等国家和地区的国防科技工业发展经验,概括了其国防科技工业共有的市场化、集团化、国际化、军民一体化和军火贸易高度依靠国外市场5个方面的特点,结
目的:比较电针联合透灸与生物反馈盆底肌训练治疗产后压力性尿失禁(SUI)患者的临床疗效。方法:将60例产后42天SUI患者随机分为观察组和对照组,每组30例。观察组采用电针联合
分析了在科技项目管理中存在的突出问题,运用现代项目管理的过程控制方法。讨论了科技项目实施阶段的过程控制机制和项目实施过程中质量、进度、经费3大目标的监督机制,提出了