基于社交媒体的人身欺凌识别研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:lily009009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,社交媒体逐渐成为人们主动创建并分享信息的主要渠道。互联网的便捷性让越来越多的人们选择在微博、贴吧等社交媒体发表信息,或记录自己的生活,或发表自己对某些人某件事的看法。然而由于初期网络监管力度不够加之互联网的匿名性,使得许多网络用户在社交媒体对他人进行辱骂、诅咒等恶意的人身攻击,这就形成了新兴的人身欺凌方式—网络人身欺凌。这种人身欺凌给被欺凌者造成很大的伤害,受到了国内外学者的广泛关注,受语言局限性影响,多数研究面向英文社交媒体文本,缺乏中文研究语料,因此,本文针对语境丰富、信息量大的中文社交媒体进行人身欺凌识别研究。目前,已有的研究大都是基于传统机器学习,网络模型结构单一,针对中文社交媒体的人身欺凌识别工作,本文做了以下几点研究:(1)收集新浪微博平台的文本数据,构建利于人身欺凌识别任务的语料库。针对中文人身欺凌语料资源匮乏的问题,将新浪微博作为语料收集的来源,通过收集用户对帖子的评论和帖子本身,保留较多的有用信息,使得语料资源能够语境丰富、信息量大。在此基础上,本文还结合语言学知识,分析人身欺凌文本的特点,构建助于人身欺凌识别的语境体系结构,制定标注规则,并对收集到的语料进行标注。(2)提取利于人身欺凌识别的主题语境特征,并且构建以注意力机制为核心思想的识别模型。该方法通过注意力的卷积神经网络和GRU网络获取话语中的上下文语境信息和时序信息,挖掘其中隐含的深层次语义特征,融合主题语境特征,弥补了单一词向量获取语义信息时的不足,有效的完成了人身欺凌识别任务。(3)提出交互注意力机制,构建词向量注意力、词性注意力以及笔画注意力的多交互注意力深度学习模型。该模型有效利用了帖子和评论之间的关联信息,通过多交互注意力特征捕获多层次和深层的语义信息,并融合语言环境感知特征。实验结果表明基于交互注意力机制的方法使得识别性能有所提升,识别准确率达到95.38%。
其他文献
我国拥有众多太阳能、地热能、工业余热等低品位能源,有效利用低品位能源可助于解决能源短缺和环境污染问题,有机朗肯循环(Organic Rankine Cycle,简称ORC)利用低品位热能进行发电,发展前景广阔,成为国内外学者的研究重点。环境温度的变化会对ORC系统性能产生较大影响,当系统偏离设计工况运行时,系统性能恶化,本文围绕着提高变工况下系统热力学性能展开研究。可变组份非共沸工质ORC系统(O
子流形几何是微分几何的重要研究领域,国内外许多专家学者对此都作出了很大的贡献.本文主要研究共形空间中的Blaschke全脐子流形和Blaschke拟全脐子流形,通过研究Lorentz空间
内部控制是现代企业防范内外风险、依法依规经营、实现管理目标的有效途径和重要保障。因此,研究企业内部控制的有效性问题,对于企业实现其战略目标和发展具有重要意义。F农业投资公司是一家国有企业,目前面临一些发展中的问题,其中如何进一步加强企业内部控制的有效性研究,是十分迫切需要解决的问题。本文运用内部控制、委托代理、控制论等理论,根据企业内部控制五要素原理,构建了内部控制有效性研究的基本思路。文章在梳理
《战国策》源于记录纵横家言行说辞的不同册子,主要内容是计谋策略,是一部谋略文化读物。著书者以“尚谋”的逻辑来完成文本书写和对话,我们称之为“谋略叙事”。本文分为四
有关Abel群的研究成果已经十分成熟,Abel群可以看成Z-模,很自然的考虑是,关于Abel群的某些性质或定理是否可以推广到模上?带着这一问题,文章将探讨主理想整环上有限秩的无挠
生物材料的表面微纳形貌(MNT)是影响植入材料周围干细胞表型表达和骨再生的重要因素。生物材料的微纳形貌与细胞外基质有相似的物理特征,能够模拟细胞外基质调节细胞迁移、细胞成骨分化、促进骨整合。然而,微纳形貌诱导细胞成骨分化的分子机制尚未完全阐明。微纳形貌影响细胞成骨分化的分子机制的研究能够进一步为材料形貌的研究提供新的理论依据。本研究基于具有不同孔径的二氧化钛纳米管的微纳米结构,研究阳离子通道蛋白P
随着国民经济的发展,中国的航运事业进入快速发展阶段,港口工程已成为我国和平时期经济建设的重要内容。码头作为港口工程重要的组成部分,具有显著的社会、经济和政治效益。码头结构一旦失事,将给国家和人民带来巨大的损失,后果不堪设想,因此,其安全防护一直是国家总体安全战略的重要组成部分。将爆炸荷载作为一种极端荷载,研究码头结构在爆炸冲击荷载作用下的动力响应、破坏模式,可为码头结构的安全评估及抗爆防护设计提供
在互联网技术和科学信息高速发展的今天,不断创新发展的物联网致使涌现出许多组合优化问题。延长智能设备(SDs)的电池寿命一直是边缘计算系统中一个具有挑战的开放性问题,在工业生产环境中有着重要的应用。针对这个开放性问题,我们以实际网络通讯中的数据传输为背景,研究了可叠加数据传输过程中的能耗问题。对于数据在一定规模的SDs之间传输并合并,最后传输到车载基站(VBSs)或服务器这种特殊情况,本文提出了一个
有限域上的置换多项式在组合论、密码学、编码理论等领域都有广泛的应用,如在密码算法设计中经常会使用具有低差分均匀度,高非线性度的置换函数,因此,构造新的置换多项式一直
社会工作服务机构作为社会组织的重要组成部分,在当今社会建设与社会发展之中日益发挥着的独特作用,逐渐作为一个重要的途径来促进政府进行社会治理创新。近年来,随着社会工作服务机构数量的增加,其进入到公众视野的范围不断扩大,在为服务对象提供物质、精神上支持的同时,社会工作服务机构在发展的过程中各类问题、矛盾不断显现,这与社会工作在我国目前发展处于初级阶段的现状密不可分。而在社会工作服务机构的整体发展过程中