基于二部图投影的虚假评论人群组检测算法研究

来源 :沈阳理工大学 | 被引量 : 7次 | 上传用户:yolandaguyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的急速发展,大多数消费者在决定购买某一产品前会阅读和依赖此产品的评论信息,因此网上产品的评论信息在电商网站中占有举足轻重的地位。为了利润与名誉,许多组织或个人会故意发表一些虚假评论去吹捧或诋毁目标产品,如果一个经过组织的集体共同对目标产品发表虚假评论,将会带来非常大的影响,它可从总体上控制目标产品的总评论趋势,从而给消费者提供一个错误导向,使消费者的权益受到伤害。为了检测此类虚假评论人群组,目前对于虚假评论人群组检测大都集中于使用基于频繁项集挖掘(FIM)算法生成虚假评论人候选群组,然而此算法只能检测出紧密耦合的群组,即群组内的任一评论人必须评论过群组内全部目标产品。本文中提出了一种检测松散虚假评论人群组的方法。所谓松散虚假评论人群组,即群组内任一评论人不需要必须评论群组内全部目标产品。本文使用二部图投影的方法解决此问题,同时本文提出一系列虚假评论人群组检测指标用来计算松散虚假评论人候选群组的作弊度,设计了一种基于分治思想的新颖算法最终确定松散虚假评论人群组。实验结果显示本文提出的方法不仅能够以极高的精度与召回率检测松散虚假评论人群组,并且还能生成比FIM方法更具有意义的虚假评论人候选群组,因而此方法还可以作为基于FIM的方法生成虚假评论人群组算法的预处理工具。
其他文献
肺癌的早期鉴别诊断和淋巴结转移预测,对临床医生制定行之有效的方案,提高肺癌患者的存活时间和生存质量具有重大的临床意义。然而由于肺癌具有时空异质性导致肺癌患者的预后较
随着气敏传感器在日常生活、工农业自动化等领域的广泛应用,人们对传感器的准确度、稳定性和抗干扰性有了越来越高的要求,如何从理论、实践等方面来设计低成本、高精度的气敏传
随着互联网的迅猛发展和移动互联的逐渐成熟,物联网作为一种新型的网络诞生了。为了进一步融合物联网,并使其更好地满足人们生活和工作的需要,我们对面向物联网应用的无缝迁
随着互联网技术出现至今不过短短几十年的时间,但是正是在这并不算太长的时间里经历的不断发展,使得互联网技术对每个人的生活都产生了极其深远的影响。相对于传统意义上的网
随着计算机网络技术的迅猛发展,国民经济和社会信息化的大力推进,互联网和PC机逐渐进入了人们的日常生活。视频新闻、播客、视频共享、网络电视、流媒体等一系列新技术新应用
关键词检出是语音识别中一个重要的研究领域,它是在连续语音流中识别出一组给定词的过程,具有识别率高、实用性强、时间耗费少等优点。本文的主要研究内容是连续语音中关键词
随着网络信息技术的快速发展,各大人才就业网站给就业者和用人单位提供了铺天盖地的就业信息,人们已经不必再担心信息量的匮乏。但是面对日益庞大的就业和人才招聘网站的信息
聚类是无监督的学习算法,它将数据集依照某种聚类准则,分成不同的类,其目标是使得类内的对象尽可能的相似,类间的距离尽可能的远离。在聚类分析的结果中,聚类算法是否适合给
无线传感器网络由部署在特定区域内的大量传感器节点组成,节点能够及时感知、采集和处理数据,并以单跳或多跳的方式进行通信。数据融合技术作为无线传感器网络的核心技术,是
计算机和通信技术的迅猛发展,给现代的生活和工作带来很大改变的同时,对信息安全也提出了更高的要求。访问控制在信息安全中得到了广泛的研究和应用,并取得了很好的效果。使