基于变分自动编码器的半监督方面级情感分类研究

来源 :深圳大学 | 被引量 : 3次 | 上传用户:hyx19841101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,越来越多的用户在互联网平台上发表大量的评论。方面级情感分类的目的是预测文本在不同方面的不同情感,目前主要采用的是有监督学习方法,依赖大量有标签样本,因此如何利用无标签样本进行半监督方面级情感分类至关重要。本文以评论文本为研究对象,首次基于变分自动编码器进行半监督方面级情感分类研究,主要工作包括如下两个部分:(1)针对现有的方面级情感分类模型通常使用单个向量来表示每个词,而单个词向量无法区分一个词表达的不同方面和情感的问题,本文提出基于方面-情感词和注意力机制的循环神经网络模型(简称ASWAR)。该模型首先将主题视为方面,采用联合情感主题模型(JST)得到词的方面情感分配,然后在主题词嵌入模型(TWE)上以词-方面分配为输入同时考虑到词的方面和上下文来训练得到特定方面的词向量,并根据词-情感分配给每个词确定一个one-hot形式的情感向量,最后在原有基于注意力机制的LSTM模型(ATAE-LSTM)的基础上,引入每个词特定方面的词向量和情感向量,使得模型能够同时识别词的不同方面和情感,并在LSTM单元和GRU单元的循环神经网络上使用注意力机制来获取文本中对于给定方面重要的部分,建立了词的方面和情感与给定方面的相互依存关系,从而在一定程度上提高了方面级情感分类的准确率。(2)现有的半监督学习方法多基于生成模型,但是当模型假设与数据分布不一致时,模型的准确率较低。针对这个问题,本文提出基于变分自动编码器的半监督方面级情感分类模型(简称AL-SSVAE)。该模型在变分自动编码器的基础上,添加了一个方面级情感分类器,并将文本给定的方面信息引入到编码器和解码器中。AL-SSVAE模型首先使用(1)中LSTM单元的ASWAR模型(ASWA-LSTM)作为分类器并对文本进行编码,然后在解码器中使用特定方面的词向量表示词并连接情感向量,且在每一步引入标签和方面向量来重构输入,从而使模型训练时具备识别词对应的方面和情感的能力,能够准确地捕捉到丰富的全局语义信息和情感特征,实现了文本的半监督方面级情感分类。
其他文献
目的了解深圳市6~12岁儿童高血压和肥胖的流行现况,为成年期疾病的早期预防提供相关依据。方法采用随机整群抽样法,抽取深圳市4所小学1 140名6~12岁学生进行问卷调查并测量血压
在创作中,余华走上了备受煎熬的精神苦旅,但在他的精神旅途之中,我们还发现了他思考得不完备之处,也就是他对人类存在认识的局限:他对暴力与死亡的迷恋,使得其作品在指证苦难存在时
在用什么方法分析研究东欧的民主化问题上,本文的看法有四点:关于东欧与南欧之间的比较的辩论,不应该变为区域研究与比较研究之间的那种早已过时的辩论;施米特和卡尔把比较研
借助于大型CAD/CAE软件I-DEAS建立CRH5动车组动力转向架驱动系统三维几何模型,然后利用基于VRML语言的CosmoWorlds软件对其进行虚拟装配仿真,在此基础上应用HyperMesh软件建
上世纪90年代至今,经济全球化的进程和高科技术革命的发展,对传统的国际经济合作产生了深刻的影响,这个影响至今仍在继续。笔者认为,除了七八十年代已经形成的趋势,如发展中国家在
扎染,古称“绞缬”,是用绳线捆绞布料进而染色的独特手工技艺。天然不伤皮肤的染料,加上独特的扎结捆绑技法,令扎染技艺熠熠生辉。
习近平总书记强调,宪法法律的权威源自人民的内心拥护和真诚信仰。张军检察长认为,如果一个社会大多数人对法律没有信任感,认为靠法律解决不了问题,那就不可能建成法治社会。良法
报纸
插花艺术课程改革是社会需求和中职学校改革的必然结果。本文对激发学生的学习兴趣、理论教学、实践教学和课程考核等方面的改革措施进行全面阐述,以期通过课程教学改革提高
随着世界人口数量的增加和土地面积的减少,人类受到地球可利用资源的限制,在能量循环圈中的食品价格正在逐步缓慢上升;同时,少数个体养殖者为了追求动物的快速生长和较大的经济效
本文主要介绍湖南汨罗(长乐)方言中的形容词“ABB 哩”式,并就其语音特征、基本类型、语法功能、语法意义、言语色彩作了初浅的分析。