基于深度学习的文本情绪分类模型研究

来源 :山西财经大学 | 被引量 : 0次 | 上传用户:lhongbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于微博能够收集当前值得关注的事件,是一个拥有众多参与者和大量信息的社会网络平台,大众可以通过这个平台来表达他们的观点,因此受到广泛使用,并逐渐在更广泛的社会媒体领域获得了重要地位。微博评论往往是高维度的,语义稀疏,通常包含强烈的情感,对其数据进行情绪整合工作将会对网络安全管控产生重要影响。通过对某一事件的微博评论的情绪分析,可以清楚地了解人们对该事件的情绪。在文本情绪分类任务中,目前常用的三种方法分别是基于传统的情绪词典、基于机器学习和基于深度学习。但是基于传统词典和机器学习方式过分依靠人工方式建立词典和特征依赖,因此本文选择深度学习方法,它更能关注到文本的上下文信息以及深层网络训练的问题,并且准确率比前两种方法提升明显。然而,在解决情绪分类问题时,卷积神经网络、循环神经网络及其变体等方式面临一些挑战,例如,单一模型很难获得较高的准确度,并且赋予词语同样的权重等问题。从它们的内部结构和优缺点出发,本文主要研究工作如下:(1)针对常见的文本情绪分类任务将情绪分为“正向”、“负向”和“中立”,本文为了更加准确地对微博文本进行情绪分析,通过对其进行更加细致的划分,将文本情感进一步分成七个情绪类别,包括开心、伤感、震惊等,以便更好地对其进行情绪分析,进而实现更好的应用。(2)针对当前文本情绪分类模型中所面临的诸多挑战,例如上下文信息关联性差、信息缺失等,本文将改进的Transformer模型应用于情绪分类任务中。首先,将Minikeys变量加入Transformer的多头注意力机制中,可以避免数据稀疏的问题,同时也可以减少梯度消失和梯度爆炸,同时使用IN标准化方法使模型训练更加符合自然认知,进而提取全文特征信息;然后利用Text CNN进行卷积池化操作提取特征,通过激活函数获取相邻文本的局部特征,将其与引入Minikeys变量的Transformer捕获到的全文特征信息进行融合,输入全连接层,进而实现情绪分类,有效的提高了微博文本的分类准确率,模型分类的准确率相较于未改进的Transformer-Text CNN提升了2.79%。(3)由于在模型训练中,Batchsize、Epoch和Dropout的设定是非常重要的,直接影响模型的性能,因此本文设置多组参数对比实验,以选出最优的参数值,获得最佳的模型准确率,经过实验,三者的值分别设置为48,20和0.5,实验效果最佳。
其他文献
随着能源互联网技术发展,电网调度正向“源网荷储”协同优化运行模式转变,在新模式下系统利用能源优化配置、多能互补控制、大数据分析等先进技术,实现清洁能源高效利用、系统资源交互共享、电力需求响应等特性,由于物理设备与信息系统的深度耦合,针对其信息系统的网络攻击可能会导致物理故障。为了评估网络攻击对源网荷储系统的影响,解决现有研究未充分考虑实际系统网络实际运行情况的问题,文中以源网荷储系统为研究对象,首
期刊
随着从事学术研究的科研人员数量激增,科研团队的组织分工的逐步细化,在团队研究工作中,出现了一类专门从事辅助型工作的科研角色——支持型作者。作为当代科学发展中重要的生产力,支持型作者的身份界定还没有准确的定义。本研究广泛检索并梳理国内外相关研究、政策制度与数据资料,梳理其已有研究、相关概念、方法与应用,发现目前相关研究存在三点不足:(1)关于支持型作者定义的相关研究数量有限,该类作者身份界定缺乏共识
学位
<正>进入"十一五"以来,人口与计划生育工作步入了一个新的发展阶段,加强社会主义生育文化建设,培育广大育龄群众的新型生育文化观念,营造良好的人口环境,促进育龄群众进一步树立科学、文明、进步的婚育观念,成为计划生育工作的首要任务。面对新形势、新任务,人口计生干部必须适应新形势,新任务的要求,坚持以人为本的理念,要在理论和实践上不断探索、勇于创新、谋求发展。宣传人口与计划生育工作,要积极探讨计生宣教工
期刊
目的 本研究拟探讨青年男性感染新型冠状病毒奥密克戎变异株后精子质量变化。方法 对新型冠状病毒奥密克戎变异株BA.2亚型青年男性感染者完全康复后的精子质量作分析,并对睾丸、附睾超声以及血液激素水平等进行检测,共纳入70名患者。结果 患者平均年龄为(24.29±4.68)岁,BMI为(22.45±2.12)kg/m~2,患者完全康复后2个月进行随访,在52名接受精子质量分析的患者中,异常者5名(9.6
期刊
中小学教师信息技术应用能力提升工程2.0 (以下简称“能力提升工程2.0”)项目已在全国范围内开展。针对能力提升工程2.0项目培训的目标与要求,立足实践,以广州市试点校为研究对象,通过问卷调查与访谈调研,从学习目标、学习内容、学习过程、学习结果 4个维度考量能力提升工程2.0项目的学习效果。同时针对一线教师的学习实际情况,探索与总结能力提升工程2.0项目开展过程中在形式、内容、个性化、现实性方面存
期刊
作为国家海洋实力重要体现之一的无人艇已经成为国内外海洋工程领域的一个研究热点,其路径规划及避障技术是无人艇能够完成各类任务的前提,本文在综合考虑无人艇任务要求、航行环境等条件下,针对无人艇路径规划和避障技术展开了如下研究。鉴于海洋环境模型构建是后续路径规划研究必要的基础性工作且传统二值化方法容易造成海图误差的问题,本文提出了一种基于改进K-means算法的海洋环境模型构建方法,通过引入任务已知的规
学位
新媒体时代,全新技术手段在视觉传达设计中的合理应用,推动视觉传达动态化、立体化、高效化的发展,全新的非物质载体,促进多感官的更新,为视觉信息的展示和传递带来技术上的支持。面对新的发展趋势,对当前视觉传达设计的需求展开分析,并探索创新视觉传达设计方法的路径,从多个层面提出具体的实践策略,促进新媒体技术在视觉传达设计中的广泛应用。
期刊
随着信息科学和知识经济的快速发展,学科之间的堡垒被冲破,使之各学科之间的边界不再像之前那样清晰,在这样的时代背景下,不同学科之间相互影响、交叉和融合,进而对于学科交叉的研究已成为当前图书情报学领域的研究热点。图书情报学和教育学作为具有较强相关度的学科,两学科间的交叉研究有助于更好地把握这两门学科的研究热点和发展方向,挖掘学科间的内在发展规律。本研究采用多种文献计量方法与知识可视化分析等方法从宏观、
学位
本文总结了我国植物细菌性病害的类别及发病特点、植物病原细菌的侵入和传播途径,并从化学防治、生物防治、农业防治、物理防治和抗病品种选育等方面概述了现阶段我国植物细菌性病害的防治措施,最后提出植物细菌性病害的绿色防控措施,为有害生物绿色防控和植物健康可持续发展提供参考。
期刊
股票市场风云莫测,具有多维立体的特性,充满了大大小小的各种事件。其中任何一个事件,都有可能对投资者的情绪产生影响,导致其做出不同的投资行为,从而影响着股票市场。限售股解禁是一种常见的历史公开事件,可以被投资者提前获取。传统意义上投资者对限售股解禁存在着刻板印象,往往将其视为一种释放着利空信号的整体事件,从而谈虎色变,情绪紧张,以至于对市场造成负向冲击,但是事实并非如此,仍有少部分投资者在解禁事件中
学位