社交网络中谣言识别技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:tanleilei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络已经成为大众发布信息的一种新渠道,并得到越来越多用户的关注和使用。社交网络的流行和普及,使得基于社交网络的信息数量呈现爆炸式的增长,然而信息质量却没有得到相应的提升,各种垃圾信息尤其是谣言等虚假信息弥漫着整个社交网络。社交网络上谣言的传播给人们的生活和社会的发展带来了危害,为了减少以及避免谣言带来的不良影响,对谣言进行自动识别是目前社交网络平台亟需解决的问题。本文分别从消息内容、发布用户以及消息流行度三方面对社交网络当中的谣言自动识别问题进行研究,论文的主要贡献包括:  (1)提出了基于群体和主题的流行度预测模型,可满足在线系统对预测准确性和时间复杂度的要求,为谣言识别中流行度特征的分析与提取奠定基础。  谣言消息往往伴随很高的流行度,在流行度趋势上有较大的波动性,因此能准确预测消息的流行度及趋势有助于提升谣言识别的效果。然而现有的流行度预测方法不能很好地解决模型构建过程中的特征选择问题,导致预测准确性差、计算复杂度高,无法实现流行度的在线预测。为了解决上述问题,针对影响力相当的用户群体以及内容相近的主题下不同消息在流行度传播趋势上具有相似性的特点,本文根据影响力相似度对用户进行聚类分析获取用户的群体信息,使用主题模型推断消息的主题分布,并通过统计各个群体和主题下的消息转发量的整体变化趋势,分别构建基于群体和基于主题的预测模型;最终通过叠加的方式将两模型进行融合。实验证明,本文提出的模型在预测性能上显著优于当前代表性方法,在消息最终流行度的预测结果上,预测误差MAE和RMSE比基于传播深度和用户链接密度的方法分别降低了0.1233和0.1316,预测准确率提高了7.51%。  (2)提出了基于内容和用户特征的谣言识别方法,引入内容和用户的深层隐含特征,有效地提高了识别的准确率。  现有用于谣言识别的内容和用户特征中,主要基于内容的浅层文本特征和用户的基本属性特征,这些特征对于谣言识别的区分度不大。针对这一问题,本文结合社交网络中谣言的特点,引入内容和用户的隐含新特征。内容方面,在前人提出的浅层文本特征的基础上,引入了热点倾向性特征、内外一致性特征、情感极性特征以及评论的观点倾向性特征;在用户方面,根据用户的属性和历史微博信息,提取用户的社交特征、观点转发特征和微博匹配度特征,并结合用户的其他基本属性特征,应用于谣言识别。实验结果表明,本文提出的内容和用户特征微博谣言识别方法比主流方法的准确率和召回率,分别提高了7.1%和6.3%。  (3)提出了一种融合流行度的多特征融合谣言识别方法,首次将消息流行度及流行度趋势特征应用于谣言识别问题,识别准确率比已有方法有显著改进。  消息的内容和用户特征无法反映出消息传播过程中的流行度变化趋势,而谣言的这一特点明显区别于一般消息。为此,本文创新地从流行度出发,引入消息流行度的波动性和差异性特征,并融合消息的内容和用户特征,共同应用于微博谣言的识别。实验证明,在具有一定流行度的数据集上,多特征融合的谣言识别效果最好,比当前主流方法在识别准确率和召回率上分别提高了17.1%和18.3%,具有重要的实际意义。
其他文献
移动位置服务(LBS--Location Based Service)又称定位服务,是通过通信网络获取移动终端用户的位置信息(经纬度坐标),在电子地图平台的支持下,为用户提供相应服务的一种增值业
随着社会媒体的日渐繁荣,人们越来越多的在不同的社交网站上分享生活中的感受。简短的社会媒体内容包含了巨大的商业价值,因此,对社会媒体的情感分析越来越重要。面向社会媒体的
激光导引头电子舱是导弹探测、跟踪目标物体的关键部件,它为导弹系统的精确制导提供了重要保证。因此,导引头电子舱产品使用前的调试和检测至关重要,它们是保证电子舱的安全性和
本文在研究基于内容音乐检索基本理论和发展动念的基础上,着重研究了基于旋律的音乐检索算法及其在哼唱检索系统中的应用,主要创新性工作为: (1)提出旋律的表示模型,建立音乐
随着我国人大信息化工作的不断深入,在法律法规信息管理和使用方面逐步暴露出一些问题:其一,信息系统重复建设情况比较严重,资源利用率不高。目前我国采用统一且分级的立法制度,
货币识别与鉴别属于图像识别范畴,一直都是计算机应用领域研究的一个热点。货币自动识别在使用电子自动化设备的银行、商业、民用等众多领域内有广泛应用前景,而通过图像处理
学位
随着Internet的迅速发展和普及,电子商务(electronic commerce)迅速成为商务活动的重要形式,并且有着极为广阔的发展前景。而建立在Internet/Intranet之上的Web服务技术是电子
干涉合成孔径雷达(InSAR)技术是目前遥感成像领域的一个热点。它具有覆盖面积大,空间分辨率高,高程精度高的优点,并且可以全天时、全天候的工作,是获取三维数字高程模型(DEM)
学位
本文以“东半球空间环境地基综合监测子午链”为课题背景,进行空间环境数据共享子系统的设计与实现。   东半球空间环境地基综合监测子午链,简称子午工程,是国家发改委批
学位
行人检测技术在智能视频监控、车辆辅助驾驶、人体行为分析等方面有着广泛的应用,随着各种视频信息的飞速增长,安全意识的不断加强,大量不同场景下的行人检测任务需求变得越来越