融合情感分析的微博谣言早期检测研究

来源 :安徽财经大学 | 被引量 : 0次 | 上传用户:typ172212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的逐渐发展,各大社交媒体平台已经成为人们生活中必不可少的一部分,用户习惯于在上面发表自己的观点,互联网中的用户生成内容(User Generated Content,UGC)数量飞速增长。但是,一些问题也随之而来,互联网中的信息质量参差不齐,并充斥着各式各样的谣言,严重影响了人们的信息获取,若不及时处理,甚至会危害社会和谐与稳定,因此对于社交媒体中的谣言自动检测已成为一项重要研究内容。现有的谣言检测存在时效性低的问题,通常是对传播后期的谣言事件进行检测,由于缺乏相关线索,无法在谣言造成较大危害之前就进行预防。针对这种问题,本文选用国内目前使用最广的社交媒体平台微博作为研究对象,从微博谣言中尽可能挖掘更多的相关特征,并基于深度学习方法进行建模,实现谣言的早期检测与防治。本文的主要工作如下:1.提出一种结合双向情感词注意力机制的卷积神经网络模型(Convolutional Neural Network Based Double Sentiment Word Attention Pooling,DSA-CNN),以充分提取UGC文本中的情感特征。将注意力机制引入卷积神经网络的池化层中,并对现有的情感词典进行扩充,构建用于微博等社交媒体的情感词典;提出了两种情感词向量的预训练方法,通过构建的微博情感词典与Word2Vec预训练得到正负向情感词向量,将其作为注意力池化的查询向量,经过池化合并后获得最终的情感表示。双向注意力池化可以从积极情感和消极情感两个方面从短文本中挖掘更多的特征。实验表明,DSA-CNN模型在两个社交媒体情感数据集上与经典分类模型相比都取得了较好的性能,模型的收敛速度也有明显的提升。2.提出一种结合多特征的谣言早期检测模型(Rumor Early Detection Model,REDM)实现微博谣言的早期自动检测。首先构建了谣言事件的检测指标体系,包含外部特征Fo、谣言语料的语义特征Fs和情感特征Fe;其次,根据用户的历史发帖记录,计算历史情感倾向、情绪波动与信用度三个行为特征;再次,分别利用BERT模型和上述提出的DSA-CNN模型提取谣言语料的语义特征和情感特征;最后考虑到事件传播过程中的时序特征,采用LSTM模型进行序列建模,将提取的语义特征、情感特征和外部特征结合后,输入LSTM中并检测谣言。根据提取的用户历史信用度特征,将微博用户划分为免疫用户、脆弱用户和不良用户三类,对这三类用户的基础特征与行为特征分别进行统计分析,证明了不同类别用户属性特征具有一定差异,能有效辅助谣言检测。在微博数据集上的谣言检测实验结果表明,本文模型与其它基线模型相比,检测准确度最佳;截取谣言事件的前若干条帖子作为检测节点,证明了在模型在谣言传播早期进行检测依旧有良好的性能。
其他文献
反垄断法域外适用制度是该国有权用自己的国内法在域外进行审判和执行的制度。改革开放以来,很多跨国公司面临着涉嫌垄断的风险。目前,我国反垄断法域外适用与相关制度的衔接仍有许多的不足之处,可以总结为,民事诉讼中的域外管辖权与域外适用缺乏统一原则,其成因在于域外管辖权和域外适用分别立法,导致我国反垄断法域外适用与域外管辖权衔接不上。另一方面,域外适用和域外判决的承认与执行分别立法,这就导致了我国反垄断法域
学位
我国的债券市场的稳定发展的前提之一,就是要建立健全的债券持有人会议制度体系,这也是对债券持有人权益进行保障的重要途径。域外国家债券市场在长时间的发展下,逐渐形成了债券持有人会议制度和债券受托管理人制度,这对我国债券市场的发展具有极大借鉴意义。但由于我国经济制度较外国不同,债券市场的发展也并未到达完善的地步,所以在实践的运用中,两者存在这许许多多的问题。从两种制度在我国的发展来看,债券受托管理人制度
学位
近年来,随着全球范围内互联网技术持续高速发展,以及大数据处理技术蓬勃发展促进了数字经济繁荣,而电商平台购物更是异军突起,越来越多的消费者从线下购物转向网络购物。在当前社会生活节奏逐步加快的情形下,电商的优势十分明显,与传统线下购物相比没有时间和空间的限制,十分便利而且能为消费者节约大量的时间,受到消费者的青睐。与此同时,“信息”已成为网络经济发展的“金钥匙”,是各个企业争相挖掘的天然“富矿”。电商
学位
数据正成为除劳动力、资本、技术以外尤其重要的生产要素,数据权利已经作为一种新兴的财产权利而得到了学界的共识,对数据财产权利的研究势在必行。数据是数据财产、数据财产权利的最基本要素和概念,明确数据财产权利内涵的前提要先明确数据的内涵。但是,在梳理数据财产的法律规制现状和数据财产权利的法律属性界定现状之后,可以发现当前对数据财产权利的法律属性界定处于一个“数据财产权利专有化”的困境之中。这不但会强迫数
学位
生态环境损害赔偿磋商制度作为一种全新的应对日益严峻的生态环境问题的重要制度,拓展了生态环境损害赔偿案件的解决途径。2017年,中共中央与国务院联合颁布了《生态环境损害赔偿制度改革方案》。之后,生态环境部于2020年与2021年先后发布了两批《生态环境损害赔偿磋商十大典型案例》,要求地方政府学习借鉴其经验做法。因此,生态环境损害赔偿磋商制度的重要性不言而喻。但是,我国生态环境损害赔偿磋商制度尚处于试
学位
进入现代化社会以来,体育经济迅速发展,成为了我国国民经济新的增长点。体育赛事直播节目作为体育文化产业的核心内容,成为电视台、体育组织、网络媒体等行业组织的重要经济来源。其中,体育产业中的赛事直播之所以能够大力拉动经济增长,就是因为体育赛事直播的制作者投入了人类的智慧,这种智慧属于法学领域的知识产权。相应的与此相关的纷争也逐渐进入人们的视野。这类纠纷逐渐成为学者和实务界的重点关注。体育产业的进步使更
学位
近年来我国租赁市场发展迅速,多部有关文件相继出台。2015年,国家提出建立购租并举的住房制度,2016年《关于加快培育和发展住房租赁市场的若干意见》发布,2019年启动北京、长春、上海等16个租赁试点城市,租赁市场开始受到高度重视。作为租赁市场的新兴类型,长租房市场近年内爆发式增长,长租房模式的市场需求越来越大。多类型、多领域的长租房市场迅速发展,然而高速发展的同时监管措施并未配套,从而出现问题频
学位
2022年3月11日通过的《第十三届全国人民代表大会第五次会议关于2021年国民经济和社会发展计划执行情况与2022年国民经济和社会发展计划的决议》提出:“持续推进农村集体产权制度改革,推动农村集体经济组织立法。”近年来,中央政策文件多次强调加快集体资产股份合作制改革,推动农村集体产权制度改革。自《中华人民共和国民法典》赋予农村集体经济组织特别法人身份后,《农村集体经济组织法》的制定也成为中央的关
学位
在知识创造财富、科技引领发展的时代,知识产权成为企业、社会乃至国家的重要战略资源,随着知识产权价值在社会经济发展中的提升,随之而来的知识产权侵权现象也愈加严重,国家现行法律法规对知识产权的保护侧重于事后对侵权人的惩罚以及对权利人的补偿,这种保护方式具有一定的滞后性,而事后的救济补偿往往不能够彻底修复权利受到的损失。基于此,知识产权保险应运而生,知识产权保险的标的体现为知识产权本身以及与之相关的利益
学位
新技术的发展推动了二次创作的繁荣。尤其在互联网环境下,数字技术改变了人们传统的表达和创作方式,人们对信息的检索、利用更加便利,通过对在先作品进行摘录、转换、合成创作出了重混作品。由于国内和国际上对重混作品的立法都没有明确作出规定,重混作品在我国的法律地位还不明确,对它的保护或规制更是处于真空状态。近年来随着重混作品引发的法律争议不断增加,人们开始关注重混作品的司法认定问题。鉴于我国对重混作品缺乏明
学位