【摘 要】
:
随着社交媒体的高速发展,以微博为代表的新兴媒体成为信息交流的重要平台。在给人们的生活带来便利的同时,开放的微博平台也成为了谣言重要发源地。传统的谣言检测方法大多通过学习转发评论信息的语义表示进行研究分析,此时谣言已经广泛传播,造成了很多严重的后果。谣言早期检测能够更大程度的减少谣言传播范围,具有更重要的现实意义。由于潜伏期的谣言暴露的特征非常有限,使得谣言的早期检测非常困难;同时传统的谣言检测忽略
论文部分内容阅读
随着社交媒体的高速发展,以微博为代表的新兴媒体成为信息交流的重要平台。在给人们的生活带来便利的同时,开放的微博平台也成为了谣言重要发源地。传统的谣言检测方法大多通过学习转发评论信息的语义表示进行研究分析,此时谣言已经广泛传播,造成了很多严重的后果。谣言早期检测能够更大程度的减少谣言传播范围,具有更重要的现实意义。由于潜伏期的谣言暴露的特征非常有限,使得谣言的早期检测非常困难;同时传统的谣言检测忽略了当前庞大的谣言数据库和潜在语义特征。针对以上问题,本文构建主题特征来增强谣言早期检测效果,在不依赖于待检测微博的评论转发信息的基础上,提出了新的谣言检测模型进行谣言早期检测,实现了实际工作中谣言早期检测的实时性需求。本文的主要工作有:(1)针对谣言复杂模糊多样化、大量重复性谣言泛滥等问题,定义了标题权重并针对同类事件谣言修正逆向文档频率改进了TF-IDF关键词抽取算法得到种子敏感词集,改进了点互信息算法得到关联词集。在此基础上,构建了特定应用于微博谣言的敏感词库,可在后续主题提取时提升文本对谣言词的语义理解和识别能力,辅助谣言识别。(2)针对当前主题模型对文本低频词的不敏感性问题,将构建的谣言敏感词库与隐含狄利克雷分布主题模型(Latent Dirichlet Allocation,LDA)融合,提出了RUM-LDA主题模型,设计了谣言主题特征提取方法。通过对比实验表明RUMLDA模型有效提高了敏感信息主题识别效率,主题特征能极大的提升后续谣言检测的准确率,降低检测时间,增强谣言早期检测效果。(3)针对微博文本长短不一、随意化等问题,设计了基于注意力机制和长短期记忆网络(Long Short-Term Memory,LSTM)融合的上下文语义特征提取方法,提出了基于潜在语义分析的微博谣言早期检测模型,将该模型命名为RUMATTLSTM模型,该模型将传统社交特征、谣言主题特征和上下文语义特征映射融合进行谣言早期检测,解决了传统网络需要应对的梯度消失和梯度爆炸问题。实验表明,该模型能更好的识别文本的潜在语义信息,有效提高了谣言早期检测的各项性能指标,可对敏感词等关键内容分配更多的注意力。
其他文献
随着大数据时代的到来,高维矩阵形式数据在各个领域中大量产生,因此,高维矩阵回归模型应运而生.考虑到数据的特殊结构会导致矩阵回归模型的解具有不同的性质(比如低秩性、稀疏性等),正则化的矩阵回归模型被大量研究.此外,含有离群点或重尾误差的数据普遍存在,因而建立可以拟合上述特点数据的模型尤为重要.为了同时刻画解的行稀疏性及处理数据中的重尾误差,本文提出稳健行稀疏矩阵回归模型,并讨论其理论性质及计算效果.
轨道不平顺是引起轮轨振动的主要根源,影响着列车运营安全性和乘坐舒适性。轨检车成本高且不能准确、及时地反映轨道不平顺状态,通过研究轨道不平顺与轴箱振动数据对应关系,利用易测得的车辆轴箱加速度评估轨道不平顺的状态,高效、经济地为线路养护维修提供有效信息并消除安全隐患具有重要意义。本文以轴箱加速度和轨道不平顺为研究对象,分析了轴箱加速度在不同速度和轨道不平顺工况下的变化规律以及轴箱加速度积分得到的位移与
车联网(Vehicle-to-X,V2X)通信技术,作为我国新基建中物联网技术在高速领域的典型应用,近年来得到了国务院、发改委和工信部等各级政府部门的鼎力支持。为推动V2X通信技术在国内的发展,打造一套成熟的V2X行业商业运营体系,国家政府协调多方部门和单位组建了V2X产业发展专项委员会。现阶段国内正在推进基于蜂窝通信系统的V2X通信技术(Long Term Evolution-Vehicle t
近年来,铁路运输在发展中不断完善,给人们出行和货物运输带来了便利。因此,许多国家都致力于推进铁路基础设施的建设。但由于加纳缺乏投资和铁路相关的维护技术,其铁路行业长期处于停滞状态;直到与中国政府签署了相关融资协议,其铁路状况才有所好转。为了确保铁路运输安全,相关部门必须制定一套科学合理的维修作业计划。但是加纳缺乏维修决策模型。本文根据现有维修作业数据,提出了适用于加纳铁路的轨枕维修线性优化决策模型
论文以国家精密重力测量项目某重点大学山洞实验室隧道工程建设为背景,针对大学校园内新山洞实验室隧道在破碎围岩地质条件、周边复杂建筑结构环境下的施工技术难题,对控制邻近隧道分别在机械施工和钻爆法施工时对周围环境影响的关键技术进行了一系列研究,以指导隧道安全快速完成施工,并将对精密实验室的影响控制在要求范围内。主要的研究内容及成果如下:(1)对国内外邻近精密实验室隧道钻爆法施工影响研究现状进行了调查研究
近年来,赞比亚国家铁路公司面对公路运输的竞争失去了大量客户,陷入经营困境。当前,赞比亚国家铁路公司试图通过改变经营策略,重新夺回一部分失去的市场份额。在这样的背景下,本论文以布拉瓦-哈拉雷通道为例,对影响货主在铁路和公路间进行选择的因素进行研究。本文使用二项Logit模型来分析货主的选择行为。该模型具有较为准确的预测效果,尤其适用只有两种选项的情况(本文研究的通道内只有铁路和公路两种运输方式)。通
工程中混凝土板类构件四边约束、承受集中力的情况比较常见,这类结构受力特点复杂,使用过程中容易开裂,且钢筋混凝土结构的耐久性较差,一旦破坏不易更换维修。近年来由于纤维增强复合材料(Fiber Reinforced Polymer)轻质高强的特点,各类形式的FRP结构应用到了土木工程领域,为解决这些问题提供了新的思路。本文设计了一种新型3D模塑FRP格栅加劲混凝土板,在板开裂时FRP结构能够为板底部提
地铁作为轨道交通的重要组成部分,承载着缓解城市客运压力的重任。近年来我国地铁线路不断扩建,服务能力不断发展,地铁越来越成为人们生活中必不可少的一部分。然而地铁车站中也存在着一些监管缺陷和安全隐患,主要体现在以下四个方面:1、地铁车站内部人员复杂,客流量大,需要对乘客进行实时监控,而目前的监控系统需要工作人员在监控画面中主动寻找目标乘客,并记录乘客行走路线,然后上传到后台信息系统。这样不仅操作复杂,
双渠道供应链的诞生满足了传统企业拓宽销售渠道的需求,能否实现双渠道供应链有效管理是现代企业有无市场竞争力的重要标志,随着互联网电子商务技术的普及和发展,消费者逐渐习惯比价购买,同时,企业品牌推广方式也从原来的单一化变得丰富多样:其中,全国性广告和联合性广告在制造企业中应用颇多。全国性广告指的是制造商承担全部广告成本在全国性媒介上做广告,此广告因影响力较大而会同时增加线上渠道和线下渠道的需求,而联合
程序合成是指根据给定问题的具体描述由计算机自动生成满足要求的程序。这是一种用底层编程语言自动合成程序的任务,其目标是通过具体的算法策略找到符合用户意图的程序。用户意图使用各种形式表示,包括逻辑规范、示例、自然语言、部分程序甚至相关程序。语法引导的程序合成问题使用逻辑规范来表达用户对于期望程序的要求。最新的研究证明,使用语法模板来补充逻辑规范对于求解程序合成问题有潜在益处,即由逻辑规范和语法规范组成