基于多模态融合的虚假新闻检测算法研究

来源 :安徽理工大学 | 被引量 : 0次 | 上传用户:nilaopopodi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体的发展,使得新闻的产生和传播变得更加容易。当前的新闻形式已不再局限于文本,而是由文本、图像、视频等多种模态结合而成,如何判断新闻的真假,只利用单模态的文本信息进行虚假新闻检测已无法快速准确的实现。另外,当前文本的虚假新闻检测主要通过对文本特征进行嵌入并训练模型,无法提取高阶的上下文语义。现有的多模态融合检测算法,对多模态新闻只是简单的特征拼接,未很好地利用多模态上下文语义之间的互补和融合。为了解决这些问题,本文针对图文场景,提出多模态融合的虚假新闻检测架构,主要研究如下:(1)为更好地获取新闻的高阶上下文语义来进行虚假新闻检测,针对文本新闻利用BERT预训练模型采用[CLS]句向量表征、最后一层词向量平均表征来获得文本的高阶上下文语义向量。针对图像新闻利用VGG19预训练模型采用最后一层输出向量、中间层特征图向量获取图像的高阶上下文语义向量。通过试验得到两个预训练模型基于高阶上下文语义的虚假新闻检测结果均较好,这为后续多模态的高阶上下文语义融合研究提供了前提基础。(2)设计了一种基于图文融合的多模态虚假新闻检测框架,框架中包含三种融合高阶上下文语义的方式,分别是向量拼接、基于注意力机制、基于Transformer的Encoder结构的方式。具体来说,向量拼接的方式就是将所上述预训练模型提取的高阶上下文语义特征向量进行拼接生成融合特征;注意力机制的方式就是先将提取到的高阶上下文语义特征向量赋予不同的权重,再进行融合生成融合特征;采用Transformer的Encoder结构的方式是将提取到的高阶上下文语义特征向量采用自注意力机制进行融合生成融合特征。最后将学习到的融合特征输入到全连接层中进行虚假新闻学习和检测。(3)设计多组消融试验,以上下文语义关联性作为检测标准,验证了该虚假新闻检测框架的有效性。其中采用Transformer的Encoder结构方式进行融合得到的融合特征经过训练学习后,在微博数据集上预测的准确率达到0.884,效果最佳。多组基于BERT模型的检测算法均取得了不错的成绩,说明BERT模型在提取高阶上下文语义特征方面有着独到之处。图[26]表[5]参[81]
其他文献
在无线传感器网络(Wireless Sensor Network,WSN)中,功率控制和覆盖优化问题至关重要,但是传统WSN在根据局部信息对功率和覆盖问题进行优化时无法达到全局最优。软件定义网络(Software Defined Network,SDN)的出现为WSN的发展提供了新思路,目前已有学者将SDN架构引入到WSN中,提出了软件定义无线传感器网络(Software Defined Wire
学位
社会化标签作为Web2.0时代由互联网用户产生的重要数据,用户在自由开放的网络平台中以自身理解为出发点对互联网Web资源进行评论与标注,产生大量资源、用户和标签(tags)的社会化标签信息。但社会化标签具有较强的独立性、自发性和公开性特点,导致其存在语义模糊、词语冗余和资源独立等问题。因此构建主题识别方法可以揭示社会化标签蕴含的潜在知识,本文针对社会化标签的主题识别问题进行以下研究工作:(1)针对
学位
目前我国煤矿行业隐患监管中存在监管重复、信息孤岛、数据失真以及信任机制匮乏等问题。针对上述问题,本文设计基于区块链的煤矿隐患数据共享方案,借助于区块链技术去中心、防篡改、可追溯等特性解决煤矿隐患信息存储的安全问题,同时实现多主体之间的数据共享功能,确保数据的真实可信、有效共享和准确追责。本文的主要工作如下:(1)提出了迭代演化机制的PBFT共识的改进算法。该算法简化PBFT共识算法中一致性环节,降
学位
近年来,深度神经网络在众多领域都取得了成功应用,比如,自动驾驶、人脸识别以及医疗系统等。但研究表明,深度学习模型在预测阶段容易受到对抗样本的攻击,导致目标模型以高置信度输出一个错误预测。该攻击给深度神经网络的应用领域带来了极大的安全威胁。为解决此问题,研究者们提出了对抗训练、输入预处理、特异性防御等防御方法。由于基于特异性防御方法往往只针对特定的对抗攻击进行防御,泛化性能较差。因此,本文从对抗训练
学位
在如今海量信息的时代,事件作为人们认知世界的基本单元,它们间存在着包含因果在内的各种语义关系。挖掘事件间的因果关系是对事件深度理解的必然要求,尤其是在突发类事件中,因为其发生的突然性,往往对社会造成不可估量的损失,所以准确的抽取突发事件中的因果关系对于预防突发事件和制定应对决策具有重要意义。目前的突发事件因果关系抽取研究中,经常存在着词特征不符合上下文语境,以及由于突发类事件文本中因果信息不足导致
学位
多形性腺瘤(PA)是一种良性肿瘤,大多起源于唾液腺,起自气管支气管的PA非常罕见,国内外文献基本为个案报道。原发性支气管肺癌现已成为全世界发病率、死亡率最高的恶性肿瘤,是男性癌症死亡的首要原因,在女性癌症死亡中成为仅次于乳腺癌的次要原因,因其症状的不典型性,往往在确诊肺癌时已处于晚期,因此造成了巨大的经济及社会压力。气管PA合并原发性支气管肺癌的病例目前未有文献报道,本文报道1例右肺下叶气管PA合
期刊
我国现有的煤矿井下辅助运输系统主要采用的是有轨电机车的运输方式,由于煤矿井下环境复杂、人员操作不当等因素,井下运输常常造成人员伤亡和财产损失。为了改善这种落后状况,必须进一步提高煤矿井下运输系统设备的智能化水平,而列车前方轨道识别技术是实现有轨电机车无人驾驶的重要技术。传统轨道识别技术对于环境明亮、形状为理想的直线型轨道有较好的检测效果,但在矿井复杂巷道环境下具有局限性,而基于深度学习技术的轨道识
学位
目的:通过临床研究,观察辛夷通窍汤治疗小儿过敏性鼻炎(肺气虚寒证)的有效性及安全性;同时基于网络药理学和分子对接技术初步探讨辛夷通窍汤治疗小儿过敏性鼻炎的生物学机制,以供临床参考。方法:本课题包括两个研究,(一、临床研究):病例选自天津中医药大学第一附属医院儿科门诊(2020年6月-2021年12月)符合过敏性鼻炎肺气虚寒证纳排标准的患儿110例,运用SPSS25.0软件随机分为两组,每组各55例
学位
共识算法是区块链技术的核心,在区块链性能与安全性等方面起决定性作用,共识算法成为区块链领域的研究热点。论文针对PBFT算法的不足之处进行全面且充分地分析,结合DPoS算法思想与评分机制对PBFT算法展开深入研究,提出一种改进的PBFT共识算法,本文的主要研究内容如下:(1)分析研究区块链不同共识算法的原理、应用领域及优劣,为联盟链共识算法的优化提供理论支撑。针对PBFT算法适用节点数少、主节点随机
学位
目的:本研究将通过回顾性分析CKD3-5期非透析患者的临床资料,从一般情况、生活方式、相关理化检查等角度分析CKD3-5期患者继发心衰的相关危险因素及中医证型分布特点,探讨CKD3-5期患者并发心衰的可控影响因素,为提高患者生活质量提供相应的理论依据。方法:采用横断面研究,收集2020年3月至2021年12月于天津中医一附院住院的CKD3-5期非透析患者,并依据纳排除标准共纳入210例患者,收集患
学位