基于分层注意力网络的早期谣言检测研究与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:xiaoluc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社交媒体的兴起,谣言所带来的问题比以往任何时候都更加严重。由于谣言涉及经济、健康、政治等公共话题,其真实性、正确性无法被及时验证或永远都没有办法被验证。这些谣言带有未经证实甚至是虚假的信息,可能会引起公众恐慌,进而造成严重的经济损失,对社会产生不良影响。面对社交媒体上的海量信息,专业人士鉴别谣言所需的时间和精力是巨大的,且存在识别滞后,覆盖不全面等问题。因此研究和设计兼具准确率,覆盖率以及及时性的谣言自动识别方法具有重要意义,能够在谣言形成有效规模前及时辟谣并删除,降低后续不良影响,防患谣言于未然。本研究正是基于这样的出发点,利用采集到的微信谣言数据集,结合分层注意力网络、深度强化学习、生成对抗学习等方法,设计并实现了混合谣言检测算法和早期谣言检测算法。本文主要进行了以下几方面的工作:(1)采集构建了微信谣言数据集,并对其进行预处理与分析。具体来说,首先,通过网络爬虫爬取微信公众号文章,获取了大量的谣言事件与真实事件的文本和社交上下文信息。其次,为了后续的分析及建模任务,进行了清洗、分词、去停词三项预处理操作。随后,我们分别从时序性和文本内容角度,分析了谣言与非谣言在分布上的差异,并讨论了呈现这些差异的原因。(2)设计了基于分层注意力网络的混合谣言检测方法。提出了 HHAN(Hybrid Hierarchical Attention Network)模型,该模型结合了社交媒体上事件的层次化语义信息和时序信息;此外,提取基于时间和基于内容的统计特征,并将其集成到模型中。通过在微信谣言数据集上进行的大量实验,验证了我们提出的HHAN模型在谣言检测任务上的有效性。(3)设计了结合分层注意力网络和强化学习技术的早期谣言检测方法。提出了 HAN-ERD(Hierarchical Attention Network-Early Rumor Detection)模型,该模型一方面利用分层注意力网络建模层次化语义信息和时序信息,保证良好的检测效果;另一方面,利用深度强化学习技术,实现检查点模块,使之能够学习触发检测模块所需的贴子数,达到早期检测的效果。并进一步地,利用生成对抗学习技术,结合前两个模块,使HAN-ERD模型既能保持良好的检测表现,又能保证检测的及时性。最后,我们在微信谣言数据集上进行了实验,验证了 HAN-ERD方法在早期谣言检测任务上的有效性。
其他文献
烟草花叶病毒(tobacco mosaic virus,TMV)病是一种危害比较严重的植物病害,常给农业生产造成巨大的经济损失。据统计,全球每年因TMV造成的损失高达上亿元。目前,在田间能够绝对控制该病毒的药剂相对匮乏。其中,宁南霉素和病毒唑作为两种常用的抗病毒剂,其自身存在一些缺点,如宁南霉素的田间防治成本高,病毒唑具有药害。因此,迫切需要开发新型、高效和低风险的抗病毒药剂。查尔酮和嘌呤作为两类
钛酸钡(Ba Ti O_3)作为ABO_3型钙钛矿化合物,因其优异的物理化学性能被广泛应用各类被动电子元器件中。随着电子元器件小型化、薄介质和高性能的发展,对钛酸钡粉体提出了粒径小、且尺寸均一,高四方相含量等要求。由于液相法制备的立方相Ba Ti O_3存在的羟基缺陷会让MLCC烧结过程中出现气孔,影响性能。因此改进传统的固相法制备高性能钛酸钡粉体是业界一直努力的方向。如日本太阳诱电通过固相合成制
那不定矿床属南冈底斯火山岩浆弧,北部紧邻沙莫勒-麦拉-洛巴堆-米拉山断裂带与冈底斯弧背断隆带,复杂的地质构造环境和优越的成矿地质条件使得那不定矿床成为冈底斯成矿带上具有一定成矿潜力的矽卡岩型铅锌矿床,但其成矿地质背景认识及成矿模式均未开展研究。因而,从区域成矿地质背景的角度出发,以西藏那不定铅锌矿为研究对象,开展综合野外地质调查、岩相学、主微量元素、硫化物S-Pb同位素、石英O-H同位素、锆石U-
为了进一步实现利用机载SAR(Synthetic Aperture Radar,合成孔径雷达)图像对沙漠、海面或者境外等难以设立地面控制点的区域内目标位置的获取,机载SAR图像定位系统应当具备在
随着社会经济的快速发展,消费升级、个性化需求、移动互联网技术等因素促使传统零售模式迫切需要进行变革。新零售模式的出现彻底改变了传统消费观念,推动了线上线下深度融合,从2016年新零售概念的提出至今,无论是企业还是资本都不断在这一领域进行着布局,对新零售主导权的争夺变得异常激烈。在竞争异常激烈的新零售市场上,FYKJ想要杀出一条血路,就必须清晰的明确自身的优势和劣势,同时科学规划发展战略,根据目前的
中小企业作为我国国民经济的重要组成部分,对社会经济的发展具有较高贡献性,这与银行等传统金融机构对中小企业的低扶持性形成了鲜明的对比,融资难、融资贵、融资慢等问题长期阻碍了中小企业的可持续发展。大数据、区块链、云计算和人工智能等高新技术的金融科技的崛起,为中小企业提供了新的技术支持,也为其开拓了新的融资渠道和融资形式。党的十九大报告明确指出:深化金融改革,服务实体经济。这一论述为我国金融科技纾解中小
本文基于线阵激光雷达的测距原理,设计了一种多通道精确延时的距离像模拟器,用于产生线阵激光雷达在现实场景下的多路回波信号。便于科研人员在室内对线阵激光雷达进行性能测
随着现代烟草农业的深入推进,国家烟草专卖局(以下简称国家局)对烟叶工作提出“守住一条红线、提高三个水平、夯实两个基础”的工作目标,为全面落实国家局工作要求,有效的考核体系是基础保障。然而,当前永州市烟草公司烟叶线考核体系存在诸多弊端,需要进一步改进完善,以促进各项工作落到实处,全面提升烟叶生产水平和生产效率。本文以永州市烟草公司烟叶线考核体系为研究对象,以激发烟叶线员工工作积极性、提升工作效率为目
当前,中国正处于转型升级的关键时期,市场环境错综复杂,为破解社会发展难题,政府高瞻远瞩,将实施大众创业为解决问题的着眼点。实施积极的创业政策有利于社会创新活力的迸发,
作为一种先进分离技术,纳滤(Nanoflitration,简称NF)广泛用于水和废水的处理。纳滤水处理过程中,为防止膜结垢需要向进水中添加阻垢剂;纳滤处理循环冷却水的排污水时,水中也是含阻垢剂的。然而,阻垢剂对纳滤工艺性能的影响尚缺乏深入研究。本文选择典型阻垢剂氨基三亚甲基磷酸(Aminotris(methylenephosphonic acid),简称ATMP),通过纳滤膜的透过实验及扫描电子显