基于深度学习的网络虚假信息识别研究——以新浪微博谣言为例

来源 :中南财经政法大学 | 被引量 : 1次 | 上传用户:hjjnet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的发展,网络社交平台用户活跃数呈现明显的上升趋势,人们越来越依赖网络社交平台分享和获得信息。网络社交媒介虽然方便了大众对于信息的获取,提高了人们获取信息的数量和速度,但是网络社交媒介也为虚假信息的传播提供了便捷的途径。借助网络社交平台,虚假信息可以以更低的门槛、更快的速度散播。近年来网络虚假信息的数量呈现明显的增长趋势,对于恶意虚假信息如果不能有效地识别和治理往往会造成一定的社会危害,因此虚假信息的识别问题十分迫切。目前相关机构对于虚假信息的识别主要采用人工核查的方式,这种方式成本高、检测效率低,而且只能实现对小部分信息的核查,核查周期比较长。网络虚假信息其传播速度快,影响范围广,为了解决网络虚假信息的泛滥问题,需要使用更高效的检测方法在网络虚假信息发布之初便进行核实,进而阻止其进一步散播。现有关于网络虚假信息识别的研究多是基于美国Twitter社交平台新闻数据集的研究,基于中文新闻文本的研究比较少。由于中英文新闻文本的差异,无法将英文的虚假信息识别方法直接用于解决中文的虚假信息识别问题。为了更好地解决我国网络虚假信息的识别问题,本文提出了基于中文新闻数据集的网络虚假信息的识别研究。本文以国内知名的网络社交平台微博为研究对象,通过网络爬虫技术获取微博社交平台的新闻文本作为本文研究的数据集。爬取“微博社区管理中心”经过核实的不实信息作为虚假信息,爬取“中国新闻网”“央视新闻”等微博账号的新闻作为真实数据集。首先对获取的微博新闻文本数据进行预处理,其中包括对数据进行去重、去掉噪音数据、分词和去停顿词等处理。然后通过词向量的训练来获取微博新闻文本的多维特征。最后通过分类模型进行网络虚假新闻的识别分类。在分类方法上,目前关于中文虚假信息的识别研究多采用传统机器学习的方法,其模型预测的准确率并不高,本文针对以上问题提出了基于深度学习算法的网络虚假信息的识别方法。在比较分析自然语言处理方向各深度模型特点和训练速度的基础上选择使用BiLSTM_Attention模型和Transformer两种深度学习模型来进行虚假信息的识别,同时把传统的机器学习模型朴素贝叶斯模型作为对比模型。基于所获取的微博新闻的数据,分别训练以上三种模型进行数据实验,实验结果表明,BiLSTM_Attention模型和Transformer两种深度学习模型在预测准确性上要明显优于朴素贝叶斯模型。朴素贝叶斯模型经过多次调参其准确率最高在88%左右,而深度学习模型BiLSTM_Attention其在测试集上的预测准确率可达到96%左右,Transformer模型的准确率在94%左右。
其他文献
本文梳理了公路养护管理和公路资产管理不同的概念和工作内容;阐述了公路资产货币化量化计算的基本思路;提出了公路资产管理目标和公路资产管理平台建设框架,供大家参考。
会议
2020年既是我国实现全面小康的收官之年,也是全球新冠肺炎疫情的肆虐之年,理想实现与现实挑战的碰撞,为我国推动医疗卫生服务供给侧改革提供了重要契机。同时,随着我国人口结构和居民生活方式的快速变化,对足量、优质医疗卫生资源的需求迅速扩张,而医疗卫生资源的供给仍面临较大约束。因此,如何突破发展瓶颈、保障和改善各地区医疗卫生资源供给,是我国在实现更高质量小康的进程中亟待解决的现实问题。本文以2013-2
学位
近年来,随着全国公路里程的逐年增加,公路养护管理任务日益加重,养护资金需求也在逐年加大,如何科学合理确定养护费用投入、平衡养护资金与养护质量、管理效益、社会效益等方面之间的关系成为当前一个重要的问题。基于此,从公路全寿命周期过程中养护运营期资产管理理念出发,给出了公路养护运营期资产管理系统建立的相关思考,明确了公路养护运营期资产管理体系要素、最优的养护费用投入策略和基本原则。
期刊
为了提高公路养护工作的水平,降低养护成本,提高养护质量,以公路养护单位为例,对当前公路养护单位固定资产管理中问题进行分析,比如记录账目不清晰,会计审核不到位,管理意识不强,固定资产的使用和配置监管不到位等。根据问题思考如何加强固定资产管理的工作措施,制定可靠的控制对策,有效提高固定资产管理水平。后发现观念意识、制度建立、资产利用率提高、创新方法等方式对于公路养护单位固定资产管理工作的提高有显著作用
期刊
近年来,随着我国经济的发展、政府的扶持以及汽车消费群体的改变,汽车消费信贷行业得到了迅速发展。同时,汽车消费信贷的发展降低了消费者的购车门槛,从而刺激了国内汽车的消费需求,促进了国内汽车销售量的增长,推动了汽车工业的快速发展,因此汽车消费信贷成为中国汽车工业发展的新“助推器”。然而由于国内汽车消费信贷行业发展时间短,许多车贷机构没有完善的业务流程,贷款审核效率慢,并且缺乏风控管理技术,很难在海量信
学位
2017年7月朝鲜试射导弹挑起紧张局势,2018年4月英、美、法等国对叙利亚联合实施军事打击,2019年8月美国掀起中美贸易战,2020年6月中印双方发生边境冲突。受新冠疫情的影响,世界经济增速放缓,金融市场对风险愈发敏感。不断升级的地缘政治风险影响了金融市场的资本流动,造成了市场动荡。比特币的生产机制类似黄金的生产过程,同样具有数量有限、产出低、具有一定的生产成本以及无国别属性等“类黄金”特征,
学位
随着信息全球化和互联网信息技术的飞速发展,阅读方式已经不再局限于传统的纸质书阅读。我国对电子版权的日益重视使得网络上出现了大量可以供人们阅读的优质书籍,并且电子阅读相对于传统阅读方式来说有着许多的优势,因此越来越多的人选择电子阅读的方式。电子阅读器是专门用于电子阅读的设备,电子阅读器的用户不断增加为电子阅读器提供了发展的机会,但同时也对电子阅读器产品提出了更高的要求。Kindle Paperwhi
学位
在互联网快速发展的时代背景下,社会生活的方方面面都受到巨大的影响,越来越多的人通过互联网来表达自己的观点与看法,这改变了原有的用户只能作为信息接收者这一现象。在线评论通常包含着产品的属性特征和消费者的情感倾向等内容,商家可以通过在线评论包含的信息来分析用户对产品的满意度,结合行业形势为下一步发展制定计划;消费者可以通过在线评论了解产品的优点与缺点,从而更准确地选择适合自己的产品。K12在线辅导产品
学位
期刊
随着信息时代的发展,网络社交逐渐成为人们日常传递信息、交流情感思想的重要途径。在国内,以微博为代表的社交网络平台拥有着巨大的社会影响力,其在重大热点事件、广告投放和推荐方面都发挥了重要作用,故受广泛关注和研究。微博平台信息传播过程中,用户的转发行为对传播行为影响最大,是信息扩散的主要路径。而用户对于推送的博文内容是否引起兴趣、博文的发布时间、用户自身信息以及信息源的影响力大小等因素都会使用户的转发
学位