面向用户评论的文本情感分析与研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:kupanda09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在最近的几年中,伴随着互联网在各行各业中的广泛应用,以互联网为基础的企业在当今的信息时代正在高速发展,具有代表性企业包括阿里巴巴、京东、微博、推特等,商家急切的需要了解用户对产品情感态度和对产品的需求,以便对商家的产品服务和产品质量做出相应的改进,提高效益。与此同时自媒体也是个人发表观点的重点途径,持续增加的网民对于产品、服务等的态度或者情感,积累了大量含有个人观点的评论。这些在线评论不仅数量众多、风格多样,并且都是非结构化的文本数据,对在线评论数据进行情感信息提取,判断人们对产品、服务等的评判态度,确定用户评论的侧重点和情感倾向具有十分重要的意义。在这样的背景之下,本文以用户评论作为研究对象,对文本情感分类任务中的两项子任务—文本向量表示和特征提取进行研究与分析。首先,在处理长文本序列数据时含有冗余性和噪声以至于目前的情感分类算法在特征提取阶段对长文本序列信息提取不足,分类精度准不准确的问题。针对上述问题本文提出了基于文本过滤网的改进BERT算法模型。该模型通过文本过滤网TSN在初始数据集标签构建出一个新的数据集,然后通过该模型过滤出文本评论数据中与粗粒度方面相关的语句,在上述步骤完成后采用句子对形式当作改进后的BERT模型的输入,并在输出的过程中加入注意力机制,并和当前多个文本情感分类模型进行实验比对和分析,实验结果表明本文提出的模型可以在一定程度上提升方面级文本情感分析算法在处理长文本任务的相关性能。其次,针对在文本情感分类的过程中只关注整体情感而忽略具体细节而导致的分类精度不高的问题,本文提出了一种结合文本过滤的改进BERT算法与双向门控循环单元的方面级文本情感分类模型。该层次模型首先将数据预处理后得到的分词进行文本向量转化,使其转化为句子级的低维稠密的文本向量表示,然后将上一步骤句子级的文本向量表示输入到卷积神经网络和双向门控单元中进行特征提取操作,紧接着在输出为篇章级语义信息过程中的解码阶段加入用户特征和产品特征得到最终的篇章级语义信息,最后采用分类函数进行分类。最后,为了验证整体模型的有效性,对本文所提出的模型进行了多次实验,在实验中对整体建模后的模型与相关的分类模型进行对比,证明了该方法较其它相关网络模型性能有一定提升。
其他文献
学位
学位
学位
在本文中,我们首先定义了具有平坦环扩张性质的平坦双模,研究了平坦双模下Gorenstein模的同调性质,推广了交换代数中平坦环扩张下Gorenstein同调性质的结论.其次我们研究了 Auslander模类与Bass模类在平坦双模下的性质,给出了 Gorenstein模在平坦双模下的提升;最后,定义了忠实平坦双模,研究了模的弱Gorenstein内射性质的降性.
随着分数阶微积分的研究的深入,在分数阶微分方程的边值问题的研究方面取得长足的进步,许多与整数阶微分方程边值问题相关的研究也逐渐被延伸到分数阶微分方程的研究中去,但对于一致分数阶微分方程边值问题的探讨,目前研究成果较少,因此,对一致分数阶微分方程边值问题的研究显得更为迫切.本文主要针对几类一致分数阶微分方程边值问题,研讨了其解的存在性和唯一性.论文主要由五部分组成.第一章主要先阐述了研究本课题的背景
作为描述扩散现象的重要偏微分方程(组)之一,反应扩散方程(组)广受各学科科研工作者的关注与研究.其中对这类方程(组)解的爆破性态的研究,由于能很好地预估爆破时间,已成为对反应扩散方程(组)的一个重要的研究分支.过去数十年来,通过国内外科研工作者的努力,已经取得很多重要的成果.随着研究内容与方法的不断深入和发展,近年来,大家将注意力转移到一类扩散项用卷积算子表示非局部,反应项用积分表示非局部的反应扩
地表形变的监测与分析,是掌握形变规律、评估结构健康的重要技术方向。伴随“一带一路”倡议的提出,沿线城市的建设以及可持续发展受到了广泛的关注。作为西北地区的第一个国家级新区,兰州新区是“一带一路”上的重要节点城市。近年来,兰州新区持续进行大规模的建设,城市土地利用发生了很大改变。虽然有学者在建设初期对兰州新区的形变时空特征以及形变机理进行了研究,但随着城市的快速发展,鲜有关于兰州新区形变时空特征的新
学位
我国综合实力的提升促使国内铁路交通的飞速发展,铁路的安全运输就成了一个不可忽视的问题,在人力可控范围内将危险系数降至最低,行车指挥人员就起着决定性的作用。除调度等关键位置的人员紧缺外,铁总还下发文件强调铁路职工必须持证上岗,而到岗新职员在短时间内不能快速上手业务,因此车站就得配备相应的培训系统。随着现代技术的飞速发展,铁路车务仿真培训系统也探究结合语音识别技术,用于培训专业素质过硬的技术人才,然而
图论是重要的一个数学分支,应用范围十分广泛.图的染色理论是图论的重要组成部分,其中和可区别染色问题是新兴研究的课题之一.图G的2-距离和可区别边染色是指G的一个正常边染色φ,满足对任意的u,v ∈ 当dG(u,v)≤2时,都有f(u)≠f(v),其中f(u)=∑ux∈E(G)φ(ux),使得图G存在2-距离和可区别k-边染色的最小k值称为图G的2-距离和可区别边色数,简记为χ’2-∑(G).图G的