基于Bert模型的书评情感分析系统的设计与实现

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:saif108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的全面普及和不断发展,交流读书感悟和心得的方式也在不断变化和扩充,各种论坛的兴起和网购平台上都包含有大量的用户的书评文本信息。大数据时代,面对海量的文本信息,深入挖掘评论文本中的信息价值不仅能够为商家提供正面反馈,更好的了解消费者们的真实需求和,同时潜在的消费者在进行消费行为前也可以参考借鉴,具有重要的理论和现实研究意义。传统的基于情感词典和传统机器学习的情感分析方法在语义信息特征提取方面表现较差,难以应对网上书评文本的表达更加生活化和网络新词不断更新的情况,本文基于Bert模型设计并实现了书评文本情感分析系统,在粗粒度情感分析下使用Text CNN网络加速模型训练来加快模型更新速度,在细粒度情感分析下使用多层LSTM和注意力机制来解决评论文本语义抽象问题。本文主要工作及贡献如下:1)构建书评文本数据集。通过编写爬虫程序收集网上用户的评论文本,经过人工筛选、文本清洗后,使用jieba分词工具完成分词工作。情感标签标注部分,以机器标注为主,人工标注为辅的标注方式,最终构建共60000条书评文本数据集。2)针对Bert模型在NLP(自然语言处理)方面优异的性能但算力要求高、训练时间长的问题,提出了基于Bert预训练模型和神经网络微调的书评文本情感分析方案。在windows平台下进行仿真实验,通过实验验证,对比传统基于word2vec词向量的情感分析模型,在准确率、召回率等指标表现都要更优秀;同时相对单Bert模型实现的情感分析模型,训练时间更短,耗费的计算资源更少,从而确定系统的可行性和优越性。3)在方面级细粒度情感分析任务中,针对书评文本语义抽象无法有效提取语义信息特征的问题,本文提出一个融合Bert模型、Bi-LSTM网络和自注意力机制的情感分析模型,通过实验验证相较于基础神经网络同注意力结合的各种情感分析模型,本文设计情感分析系统具有更好的情感分析效果。在Windows系统下进行仿真,使用创建的书评数据集进行模型训练,在粗粒度情感分析算法中,使用Bert模型情感分析准确率有2%左右的提升,在连接优化后的Text CNN后模型训练时间上仅18分钟左右,有效加快模型的训练速度。在细粒度情感分析中,使用Bert模型带来1.31%左右的准确率提升,使用Self-Attention机制带来0.9%左右的准确率提升。
其他文献
在第五代移动通信技术(5G,fifth-generation)中,各种新型应用场景层出不穷,产业规模发展迅速,为了支持多种不同类型的服务以及应对垂直行业的需求,在复杂需求场景下使用网络切片技术已成为行业共识。网络切片基于SDN与NFV两大技术,根据不同的业务场景需求,将底层物理网络虚拟化,对网络资源进行适当分配,从而划分出多种网络功能。网络服务提供商根据服务用户的业务需求,将网络切片部署在移动通信
学位
随着电子信息技术的蓬勃发展,当前集成电路工艺进入了纳米时代,印刷电路板(Printed Circuit Board,PCB)上元器件集成度越来越高,引脚数目越来越多,元器件间的连接关系越来越复杂,从而导致PCB设计工作之一的布线任务越来越困难。然而,现有的自动布线算法布通率低且速度慢,当前在工业应用中仍然大量依赖于工程师手动进行PCB布线,从而导致大量的时间和人力资源被消耗在布线工作中。因此,亟需
学位
无源定位技术一直是电子侦察领域的重要研究方向。与传统两步定位方法相比,直接定位方法不通过定位参数估计而是直接对原始采样信号进行处理而获得辐射源的位置估计,减少了信息的损失,具有更高的定位精度和更强的鲁棒性,因而受到越来越多的关注。近年来,稀疏重构理论被引入辐射源定位方法中,这给辐射源定位提供了一个全新的视角。针对信号传播模型参数部分未知和off-gird模型的辐射源定位问题,本文研究了基于稀疏表示
学位
六年级小学生林果果因为脸部长了一个明显胎记而被同学嘲笑和欺负,内心自卑的他在小学毕业的时候跟爸妈敞开心扉,开启了对过往的回忆,他想起了两年前已经去世的姥爷,想起了他最心爱的口琴。可是,搁置多年的口琴被母亲收拾垃圾的时候不小心扔了,在一次玩耍中,林果果意外发现拾荒者傻亮儿捡到一个口琴,于是他跟随傻亮儿去他家中,想确定口琴是否就是他自己的。在傻亮儿家的仓库里林果果碰掉了一个烟花瓶导致火灾,傻亮儿为了救
学位
互联网上蕴含着大量有价值的信息,诸如智能问答、信息检索、舆情监控等智能信息技术具备广阔的应用前景,而基于文本的事件抽取技术作为上述任务的重要前置,仍面临着诸多挑战。事件检测是事件抽取任务的难点,也是论元抽取的前提,而论元抽取是事件结构化表示的关键。目前,事件检测任务仍存在精度不高的问题,同时,事件检测研究一般面向开放数据集,而针对实际应用场景的研究较少。本文的事件检测研究服务于实际课题。首先,提出
学位
电影剧本《幸福抉择12天》是一部具有喜剧色彩的悬疑片。影片主要讲述了临川理工学院最近发生一起在校女大学生死亡案,闹得人心惶惶,50岁宿管阿姨张春花也被迫接受警察调查。她一直想要逃离糟糕的家庭——丈夫出轨、儿子瞧不起自己。她无比羡慕那些穿着碎花裙的女大学生,也无比想要有一个可以读书的机会。一天流星划过天空,引起当地磁场紊乱,张春花为了解救20岁女学生陈小艺,张春花意外魂穿到陈小艺身上。张春花对于凶手
学位
目的:研究冠心病患者采用行为护理干预对护理效果的提升作用。方法:在我院2019年5月-2022年5月这一时间段所收治的冠心病患者中选取80例作为本研究主要对象,平均划分成观察组和对照组,每组患者均为40例,比较两组患者接受行为护理干预后的护理效果差异。结果:观察组患者接受行为护理干预后,其在自我护理能力、健康知识知晓评分、护理依从度、焦虑抑郁评分、生活质量评分等各项指标的表现上均优于对照组(P<0
期刊
随着科学技术的进步和发展,超宽带天线被广泛运用于军事和民事领域中。反射面天线、卫星导航天线都是以其各自的相位中心为基准,而在宽频带范围内天线的相位中心具有较大偏差,因此研究超宽带天线相位中心的变化规律以及寻找缩小相位中心的偏差范围的方法具有重大意义。本文首先介绍了超宽带天线及其相位中心的发展状况以及相位中心稳定的天线设计方案,然后讨论了喇叭天线的结构参数对相位中心的影响,最后根据加载透镜以修改场相
学位
深度学习已经成为一种解决视觉问题的主流技术,在大数据处理方面展现出可观的成效,但是优质的数据集和标签是训练出性能优异的深度网络的必要条件,而且一旦数据分布发生变化,就需要使用新的数据集再次训练深度网络,为了解决深度网络的标签问题和普适性问题,领域自适应的思想被引入其中。利用领域之间的相关性,深度领域自适应算法可以将在有标签源域中获得的知识用于无标签目标域的任务中,从而实现知识的重用,本文研究将主要
学位
以深度学习技术为主的行人重识别算法发展迅速,监督学习方法凭借海量数据保证算法模型性能稳步提高。然而在现实环境下,对当前场景的数据采集和标注是费时费力的,算法模型的实际表现往往较差。因此,模型的设计应注重于在有限的条件下提取和抽象数据中蕴含的信息。本文围绕弱监督场景下的行人重识别展开研究,以深度学习为基础,借助小样本学习和跨域迁移的行人重识别方法实现一种联合训练框架。该框架以单摄像头标注的数据作为小
学位