基于深度学习文本情感分类研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:forsanwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,各式各样的网络交流平台以及购物平台不断涌现,网络上出现了各种类型的文本数据,也随之产生了许多与文本处理相关的技术。文本分类作为自然语言处理任务中的基础性任务应用十分广泛,例如搜索引擎中的网页分类、购物平台中的商品分类、微博评论情感分类等等。如果仅仅依靠人力来对海量的文本数据进行分类与处理,那么不仅需要消耗大量的时间,而且效率非常低。因此本文利用现有的深度学习理论与技术研究实现文本情感的自动分类,具有十分重要的现实意义。本文的主要研究工作如下:本文首先对文本情感分类任务的研究背景与相关意义进行阐述,将传统的文本情感分类方法与现有的文本情感分类方法进行对比。使用预训练语言模型BERT完成文本情感分类任务,得到文本的句子向量表示,从而使文本能够表征出更丰富的情感语义信息。其次使用BERT作为词向量模型得到文本的词向量表示,分别与DPCNN和Bi GRU网络相结合进行文本情感分类任务的研究。通过DPCNN网络能够有效发现文本中的长距离关联以及更多全局信息,提取待分类文本中更深层次的情感特征,而Bi GRU网络能够保留文本中词与词之间的上下文关联信息,提高模型的分类效果。针对BERT与DPCNN相结合的模型在小数据集上表现效果不尽人意的情况,对模型进行进一步改进,提出一种基于注意力池化的APDPCNN模型。该模型用注意力池化层代替原有的最大池化层,根据文本中不同词对于最终情感分类结果的贡献度分配不同的权重,更加全面的关注文本情感特征,从而使模型达到更好的表现效果。其次也在BERT与Bi GRU相结合的模型上引入注意力机制,突出文本中更能表达分类结果的情感词的权重,提高情感分类的准确率。将上述几种情感分类模型分别在Acllmdb_v1和酒店评论两个公开数据集上进行测试,通过对比实验验证了这几种模型对于改善情感分类任务的有效性。最后在上述研究的基础上,设计了一个文本情感分类系统,整个系统分为算法模型训练部分和文本情感分类部分,算法模型训练部分是利用本文所设计的文本情感分类算法进行模型训练以及对算法模型参数进行调优,文本情感分类部分是实现对所输入文本进行情感的自动分类。该系统主要分为数据爬取模块、数据预处理模块、模型训练模块以及用户交互部分,最后通过用户交互界面将测试结果展示出来,进一步验证了本文文本情感分类方法的有效性。
其他文献
纳米二氧化钛具有优异的储锂性能,并在锂硫电池中具有优异的多硫化物吸附性能。但其内在的导电性能差,不利于其作为电极材料使用。与石墨烯复合是解决该问题的主要途径之一。但目前复合材料中的石墨烯采用的都是经氧化的氧化石墨烯。氧化石墨烯制备成本高,导电性能差,同时对环境污染性大。论文采用机械剥离的多层石墨烯作为基底,降低了基底的制备成本,但其表面不含活性基团,无法采用已有技术制备复合材料。论文利用多层石墨烯
学位
随着科技的发展,无人车的集群化程度不断提高,无人车集群逐渐进入大众视野,其在物流输送、环卫清洁、交通运输和军事作战等领域应用愈加广泛。但是现阶段无人车集群在定位、感知、决策和控制等多个方面仍存在着一定的技术难题,因此,无人车集群的控制和无人车轨迹分析平台的研究对无人车集群发展具有现实意义。针对无人车存在的上述技术问题,本文搭建了一个低时延、高精度定位、分布式异构、精确轨迹控制和姿态异常检测功能的集
学位
超宽带(Ultra wideband,UWB)定位技术凭借其非常具有代表性厘米级的定位精度,超高的时间分辨率和多径分辨能力强等优点,是目前最具有发展前景的室内无线定位技术之一。然而室内环境一般较为复杂,易受到非视距(Non line of sight,NLOS)环境的影响,UWB定位系统依旧存在着准确性和稳定性的问题。在无线传感器网络中,确定待定位目标在室内所处位置,通常分为测距和位置解算两个阶段
学位
Heusler合金表现出许多新颖的物理显现,比如,高居里温度磁性,高热电功率因子,超导电性等。本文重点关注其高自旋极化率的半金属特性和热电特性。采用第一性原理计算方法设计并模拟计算了新的三元和四元Co V系Heusler合金,对它们的结构特性、电子结构、磁性、力学特性和热电特性进行了研究,主要研究结果如下:(1)通过第一性原理计算预测Co2VZ(Z=Al,Si,Ga,Ge,In,Sn)在Cu2Mn
学位
阻塞型睡眠呼吸暂停综合征(Obstructive Sleep Apnea Hypopnea Syndrome,OSAHS)是一种常见的呼吸睡眠疾病,近年来各种原因导致OSAHS发病率表现出逐渐上升趋势,严重危害人们的身心健康。目前多导睡眠记录仪(Polysomnography,PSG)是医学上诊断OSAHS患病与否和严重程度的“金标准”,但是由于其检测成本高昂、检测过程繁琐复杂不易推广,同时“接触
学位
多目标检测和追踪技术为计算机视觉技术领域的研究热点问题。遇到复杂的场景,例如:物体重叠、目标形变等情况,会导致多目标检测和追踪算法的准确性降低,制约其应用。本文对目标检测和跟踪算法进行了优化,并应用在实践中。主要开展了以下几个方面的工作:1)在目标检测算法上,基于Center Net框架,引入多特征融合模块与可变形卷积(Deformable Convolution Net,DCN),提出改进的Ce
学位
近年来,GaAs pHEMT器件因其良好的高频特性、低噪声特性和功率特性已经成为微波毫米波集成电路应用领域最具发展前景的器件之一。其中GaAs双栅pHEMT器件相对于单栅pHEMT器件而言,具有增益高且可控、稳定性好、用途广等独特优势,被广泛应用于可变增益放大器、混频器等多种电路。在电路芯片的设计过程中,器件模型承担着指导性和决定性的作用。本文对国产0.25μm工艺线GaAs双栅pHEMT器件的小
学位
电源一直是各类电子产品中不可或缺的组成部分,而电源又由许多无源器件组成,这些元件大大增加了电源的占地面积。在电源小型化的趋势下,高频集成开关电源由于其性能优越而得以广泛应用。为实现开关电源的集成化(尤其是片上电源),关键在于无源器件的集成化。这其中,磁性元件,即电感/变压器的集成是最为重要的。如何在保证磁性元件性能的基础上实现集成化仍然是亟待解决的问题。基于MEMS工艺的径赛道型微变压器有效利用了
学位
随着物联网技术的蓬勃发展,无线传感器网络的应用场景和数量日益增加,对无线通信技术的各项性能如通信范围、传输速率、功耗都提出了更高要求。传统的无线通信技术如Wi Fi、蓝牙、Zig Bee等局域网技术和2G/3G/4G广域网技术,存在远距离和低功耗只能选其一的矛盾。LoRa是针对这种矛盾应运而生的一种低功耗广域网通信技术,具有远距离通信、较低功耗、高接收灵敏度能力。目前的无线传感器网络中,传感器节点
学位
近年来,掩埋物体的电磁散射研究日趋火热,这得益于其在隧道、管道探测、地球物理勘探、皮肤肿瘤检测等领域的广泛应用,同时涂覆物体的隐身与反隐身、雷达的设计与评估也是重要的研究领域。针对这一热点,本文利用镜像法、Bessel函数展开的平面波解析表达式和Bessel函数的加法定理分析了地下多层介质涂覆导体圆柱的电磁散射特性,并引入遗传算法对其隐身优化进行了研究。其中地下多层介质涂覆导体圆柱电磁散射的解析解
学位