社交网络下的垃圾信息过滤技术的研究

被引量 : 0次 | 上传用户:strongit_likai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术的发展,社交媒体已经成为最大最活跃的社交平台,为数亿用户提供优质且良好的沟通渠道。然而,当人们在社交网络分享、交流、互动的同时,垃圾信息却也不断的膨胀。当前迫切需要一种技术来净化网络空间,营造健康的社交生态体系,因此,社交网络下的垃圾信息过滤技术已经成为研究者们普遍关注的热点问题。基于机器学习的分类技术广泛应用在社交平台垃圾信息过滤上,机器学习方法具有准确率高、成本低等特点。本文以新浪微博为研究对象,主要的研究内容分为如下几个部分:首先,从社交网络服务的信息传播形态出发,分析了微博平台中垃圾信息的传播规律,设计了基于机器学习方法的过滤技术来识别新浪微博网络中的可疑账户,并实现了基于逻辑回归、支持向量机、随机森林三种模型的垃圾信息过滤系统。其次,从微博账户中提取多种具有区分性的特征,应用机器学习模型进行分类过滤。从用户行为以及内容行为两方面提取垃圾微博的属性特征,使用社交网络关系图来分析微博平台的数据流动和传播规律。以微博中的消息为主体构建信息传播图来描述用户之间的亲密度。最后通过数据分析以及实验测试评价了整个过滤系统的性能。再次,从系统的实际应用角度出发,提出采用在线主动学习的方法过滤垃圾微博,主动学习方法不仅能够减少系统对于标注数据的需求量,降低系统时间复杂度,同时也能保证良好的过滤性能。最后,垃圾信息制造者非常热衷于劫持正常用户的账号给人刷粉、帮人转发。本文提出基于序贯概率比检验的方法来检测僵尸账号,僵尸账号检测系统能够有效检测出社会网络中的僵尸账号。
其他文献
桃金娘(Rhodomyrtus tomentosa(Ait.)Hassk.),其叶浓绿、花色艳丽、秋果累累,具有很高的观赏价值、食用价值以及药用价值。从桃金娘的形态特征、生态学特性着手,介绍其利用价值、
目的:系统评价ReZOOM与ReSTOR两种多焦点人工晶状体(multifocal intraocular lens,MIOL)的临床应用效果。方法:计算机检索CENTRAL、MEDLINE、EMbase、万方医学网数据库、维普
可燃气体爆炸每年都会造成巨大的财产损失及人员伤亡,受到试验场地、测试手段、实验经费等限制,数值模拟成为研究可燃气体爆炸的重要手段。本论文在理论分析和借鉴前人研究基
本文就如何利用科学学科的特点,巧妙设计,激发学生的学习兴趣以及不间断的激发兴趣,从而养成良好的学习兴趣,提高学习效果。
我国是一个人口众多、二元结构明显的发展中农业大国,农业和农村经济在整个国民经济和社会发展中占有极其重要的地位,解决好“三农”问题是我们全部工作的重中之重。建设现代
烟草行业作为我国第一大税源,在国民经济中占有主导地位。全国各大烟草公司近年都在加强企业内部建设与管理、扩充外部客户资源、优化业务流程,保证在激烈的市场竞争中取得不败
太子城至锡林浩特铁路位于河北省北部、内蒙古中东部,是一条设计时速160km的客运专线。太子城至崇礼段是太锡铁路的一部分,该段线路走向受沿线地形、工程地质、地方规划、工
20世纪60年代,大庆精神的诞生鼓舞了全国人民,至今仍极具思想政治教育价值。通过对大庆精神的时代内涵和价值分析,将大庆精神有效地引入到高校思想政治教育中去,用独有的特色
<正>一、成分鉴定法1.原理古陶瓷是由瓷石、高岭土等天然矿物原料按照不同的配方经过各种处理手段加工成型再烧制而成,其化学组成取决于所用的天然原料、配方、粉碎、淘洗等
高一英语教学的有效性提高,其前提是要解决初高中英语教学的衔接,这一直是高中英语教学中的一大难题。本文结合笔者教学实践,分析了这一问题的成因,并从教师、学生、教材三方