融合emoji表情的中文微博文本情感分析

来源 :西华大学 | 被引量 : 0次 | 上传用户:Vanix
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和信息技术的不断发展,微博由于其实时性和自由性的特点,逐渐成为了最广泛流行的社交平台。微博涉及的话题各种各样,用户可以方便快捷地在上面分享自己观点态度,因此微博上积累了海量具有主观性的数据。通过对这些数据进行情感分析,可以挖掘出公众对于热点话题或人物的情感态度,亦或是对于某种商品的喜恶。这对于企业生产,广告投放或是舆情监管等许多领域具有重要的价值。目前大多数关于微博情感分析的研究只关注于如何处理文本和利用文本来挖掘情感,忽略了微博语料中的非文字元素。然而大量的微博评论中包含了各式各样的emoji表情,这些表情符号和文本共同呈现出用户所想表达的态度。为了更加准确地对微博数据进行情感分析,本文基于微博评论的特点,进行了如下的研究工作:(1)emoji向量化算法研究。在当下流行的情感分析方法中,如何将emoji表情表征为模型能够识别的特征向量至关重要。本文首先利用微博评论构建了emoji网络,目的在于获取emoji之间的情感关联。同时,从多个情绪角度出发对表情符号进行了刻画。然后利用手工标注的初始情绪与emoji网络获取emoji的最终情绪值。最后通过emoji的情绪值来获得对应的情感词描述,再利用词嵌入方法对这些表情刻画词进行词嵌入,得到最终的emoji向量。同时还构建了微博语料集,由于中文微博文本情感分析的研究工作起步较晚和大部分研究工作对于表情符号的忽视,目前难以找到适用于本文研究工作的微博语料。针对这样的情况,本文收集了大量的包含emoji表情的微博评论,同时通过手工的方式对部分数据进行了情感标注,为后面的研究工作提供了数据支持。最后实验验证了表情符号所折射出的情感信息在一定程度上被保留了下来,相似情感表达的表情符号被映射到向量空间中相近的位置。这为后面将emoji信息融入到基于深度学习的情感分析模型中奠定了基础。(2)融合emoji表情的神经网络分类模型。近年来大量的研究工作证明了深度学习技术在情感分析中的优越性。因此本文提出了一个神经网络情感分析模型,利用BiLSTM来提取评论的文本表示,同时提出了一种全新的注意力机制来获取基于emoji的辅助表示。最后将基于文本的表示和基于emoji的辅助表示融合成了最终的句表示向量,将其送入情感分类器来对微博评论进行情感分析。通过一系列实验对比,验证了emoji表情在情感分类中的重要作用,同时证明了本文所提出的情感分析模型具有较好的性能。
其他文献
目的探讨上臂腋窝联合吸脂治疗副乳及上臂脂肪堆积效果。方法以2018年1月至2019年10月收治的86例副乳及上臂脂肪堆积患者为治疗对象,根据患者治疗方式设置对照组与治疗组,对
在公路工程的施工的过程中,如果管理方面不能够符合精细化标准,那么施工的质量和效率都难以符合要求。目前,对公路工程项目管理提出了更高的要求。因为在公路施工的过程中,如
通过人工气候模拟实验室对6榀剪跨比为2.6的钢筋混凝土(Reinforced concrete,RC)梁试件进行加速冻融循环试验,继而对其进行拟静力加载试验,根据试验结果分析了冻融循环作用和
通过对云彩图像纹理特征函数分析,选取16个特征函数作为云彩图像生成的依据,同时,通过对BP算法的研究,建立了有效的人工神经BP网络模型,最后形成了云彩纹理图像的合成程序。
本文主要阐述了生态理念下的城市建设用地与非建设用地的规划与管理关系,并提出一些建议以供参考。
本文概述了信息素养的概念和内涵,进而探讨了高职高专多媒体网络英语教学对学生进行信息素养培养的必要性并提出培养学生信息素养的途径和方法。
随着互联网的发展,电子商务在各行各业越来越显示出其先进生产力的作用。在建设社会主义新农村的进程中,电子商务对调整农业产业结构、提升农业产业化程度的优势和潜力更不容忽
随着经济全球化进程的加快及市场高速发展,固定资产在事业单位中占总资产的比例越来越高。制定相应的资产管理制度对固定资产进行有效管理对事业单位提高运作效率和职能履行