论文部分内容阅读
随着在线社交网络的不断发展,基于社交网络的信息传播也越来越深入和广泛。然而近年来,有组织的网络水军的出现,导致社交网络上谣言信息盛行、欺诈活动猖獗,造成巨大的社会、经济损失,严重动摇了社交网络的安全基础,最终会影响社交网络的发展前景。所以进行网络水军识别研究是一项迫在眉睫的工作。在庞大的社交网络中,传统的水军识别工作,主要是基于单个特征进行的,没有把水军团体作为识别的目标,这类方法不能全面评价一个水军的特征,识别准确率和效率有提高的空间。因此,如何检测出社交网络中的水军团体,并提高社交网络水军检测的效率和准确率是一项重要的研究课题。网络水军作为一个带有一定任务的团体,在他们的团体成员结构中会呈现出一种异常特征。基于这一思想,本文提出了一种基于结构与内容的社交网络水军团体识别方法。可以通过挖掘网络水军在社交网络中的结构特征,对社交网络中的水军团体进行识别;并结合节点本身所传播信息的内容特征,对社交网络中的水军团体进行综合分析,从而确认网络水军的身份。本文的具体工作:(1)挖掘社交网络水军的网络结构特征。根据垃圾信息出现的时间,结合社交网络用户的转发记录构建社交网络中的转发关系网络,寻找其中传播信息能力强的重叠社区结构,初步识别网络水军团体。(2)用户传播内容的特征挖掘。分析用户所发送内容的特征和垃圾信息的特征,通过度量它们之间的相似度,来判断一个用户是否传播过垃圾信息。(3)综合用户的结构特征与发布内容的特征识别网络水军团体。在已识别的重叠结构的基础上,度量重叠社区内节点的内容与垃圾信息的相似度,寻找多次传播过垃圾信息的重叠社区节点,确定为网络水军。本文基于网络水军整体结构为基点而得到的网络水军识别模式,具有全局性特征。在新浪微博数据集上,通过对比实验,验证了本文提出方法的有效性和可行性。相关成果可以为净化网络环境提供支持,因而具有一定的应用前景。