【摘 要】
:
随着互联网和社会媒体的迅猛发展,人们越来越多地通过社会媒体来表达对某个对象的立场。这个对象可能是一个人、一个组织、一个热点事件、一个运动、或者一个政策等。立场通
论文部分内容阅读
随着互联网和社会媒体的迅猛发展,人们越来越多地通过社会媒体来表达对某个对象的立场。这个对象可能是一个人、一个组织、一个热点事件、一个运动、或者一个政策等。立场通常分为支持、反对和无立场三大类别。立场分析就是自动识别文本中包含的用户对某个特定对象的立场。自动识别用户的立场有利于产品、服务、政策的改进,有利于政府舆情监控,也便利客户购买产品或服务。本文主要研究基于文本信息的立场分析的相关理论和应用,主要从文本内部和外部文本两个方面开展工作。本文首先针对文本的情感和用户立场并不总是一致问题,提出一个联合神经网络模型对文本中的情感和立场进行联合学习分析。其次,本文提出一个层次注意力模型用来有效融合词汇、情感、句法、以及论据等四种语言学特征对立场分析的影响。最后,针对单个对象标注样本偏少的问题,本文提出了基于多对象文本的立场分析模型。具体而言,本文主要贡献在于:(1)基于情感信息的立场分析模型。一般来说,文本的情感信息高度影响着立场,但情感和立场之间并不总是一致的。因此,本文提出了一种基于联合学习的神经网络模型同时预测立场和情感类别。该模型能同时学习情感和立场的表示以及它们之间的交互和影响。实验结果证明了所提的联合学习神经网络模型能有效地利用情感信息进行立场分析。(2)融合多种语言学信息的立场分析模型。首先基于传统的机器学习模型探索并分析了词汇、词性、语义和句法等四种语言学特征对立场分析的影响。在此基础上,提出了一个层次注意力模型,探索了不同语言学信息的表示对立场分析的影响。该模型包含语言学注意力机制和层次注意力机制,语言学注意力机制分别用于获取情感表示,依存表示,论据表示和文本表示之间共同关注的关键信息,而层次注意力机制则用于调节这四种表示的权重。在两个数据集上的实验结果表明所提的层次注意力模型能有效融合多种语言学特征进行立场分析。(3)基于多对象数据的立场分析模型。立场分析时,不同的评价对象之间有一些共同的信息可用于评价对象之间知识的迁移,以弥补单对象标注样本偏少的不足。因此,本文针对该问题研究了多评价对象文本对立场分析的影响和作用,提出了一个对抗多任务学习模型用来学习多对象数据对立场分析的影响。该模型以立场分析为主任务,对象分类和情感分类为辅助任务,同时考虑这三个任务的联合学习和对象间的对抗学习,以便获得独立于对象的特征来帮助立场识别。在四个对象上的实验结果表明,多对象的对抗多任务学习有利于立场的分析。目前,基于社会媒体文本的用户立场分析研究仍然处于初始阶段,本文的研究亦属于探索性工作。本文聚焦于文本信息,提出了有效的方法来提高立场分析的性能,期待论文取得的初步成果能够对本领域的相关研究产生一定的参考价值,促进自然语言深层理解技术的发展。
其他文献
自我伤害行为是近年来对青少年问题行为研究的重点领域,但是目前针对自伤功能的进行测量的量表还比较缺乏。目前,我国对ISAS量表并没有进行过系统性的修订,因此本次研究在中
航空座椅以试验方法表明对规章CCAR 25.562动力要求的符合性,具有经济性差、周期长等缺点,因此,以分析方法辅助或部分替代试验的意义重大。本文基于经试验验证的航空假人/座椅约束系统动态响应分析模型辨识影响假人、座椅、安全带响应的显著因素,为航空座椅以仿真分析方法符合性验证提供一定的技术支持。首先,基于滑台冲击试验,比较不同冲击载荷下假人、安全带、座椅的动态响应,在水平无偏航16g冲击下,带扣偏
目的:通过60 Coγ射线辐照肺上皮细胞后进行mi RNA测序,筛选出差异表达明显的mi RNA,并探索其可能参与肺纤维化发生发展的生物学功能;选择一条mi RNA,通过体内和体外实验探索
随着深度学习技术近年来的不断发展,计算机视觉技术也与其进行了结合,得到了飞速的发展。而目标识别是计算机视觉领域非常重要的一个部分,因此基于深度学习的目标识别技术是一个非常有价值的研究领域,并已取得诸多研究成果。在遥感图像中,对车辆目标的有效识别具有重要的意义,尤其在交通调控领域和军事侦察领域有更高的应用价值。本文采用基于深度卷积神经网络的目标识别算法,对日间和夜间航拍图像中的车辆目标进行了有效的识
在众多地质灾害中,滑坡是发生频率最高,发生后造成人员伤亡最大、经济损失最多的地质灾害之一,所以对于边坡稳定性研究一直是十分重要的课题。在实际的工程实践中,影响边坡稳定性的因素很多,主要包括滑坡的坡高坡角、岩石岩性、地震、降雨以及不合理的工程活动等。据统计有90%的滑坡是由降雨所引起的,因此有必要开展降雨入渗下边坡的稳定性分析与研究工作。论文以广西平南县寺面镇路塘村边坡作为实际工程背景,通过数值模拟
高效的优化搜索方法对于提升卫星可靠性设计优化性能具有重要作用。卫星的可靠性设计优化是卫星总体设计的重要内容,对于缩短研制周期、减少设计冗余、提高整星力、热、电磁
本文针对RBCC组合动力系统的工作特点,采用基于热力学第二定律的(火用)分析法,对RBCC引射/亚燃模态转换过程中能量利用与转化规律开展研究,深入分析了不同引射火箭推进剂混合
通过利用岩石学、地球化学等方面的理论,对研究区早侏罗世二浪河组火山岩进行了系统的研究,对火山岩的岩浆源区特征进行分析,并探讨了研究区早侏罗世二浪河组火山岩形成的构造背景。取得如下成果和认识:研究区二浪河组火山岩SiO2含量在51.00%~73.94%之间,为中酸性—酸性火山岩;A1203含量在12.76%~19.40%之间,K20含量在1.01%~6.12之间,Na2O含量在2.46%~5.33%
近年来,随着围产期保健技术的日益成熟及新生儿特别是早产儿救治水平的不断提高,越来越多的极早早产儿、极低出生体重儿得以存活。但与此同时,因早产儿各个器官系统尤其是呼
保罗·奥斯特不仅是美国当代最受欢迎的小说家之一,也是诗人、编剧、导演、翻译家、编辑、批评家。多领域的创作经验潜移默化地影响了他的小说创作。在日益开放和多元化的当