面向微博话题的立场检测和观点摘要

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:feijingzhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
越来越多的用户选择在微博上参与热点话题的讨论、表达自己的观点。微博上的热点话题往往是一个热点事件、一个争议较多的人物、一项引起广泛关注的社会政策等,因此每个热点话题背后涉及到多方面的人和事物等对象,不同的用户对于热点话题事件的议论角度不同,立场也不尽相同,观点详情也不尽相同。提取公众在微博上对这些热点话题表达的观点,研究公众的立场,并对公众的观点加以归纳总结,可以帮助微博用户在很短的时间内全面地了解热门话题的详情,帮助政府及企业开展及时有效的舆情监督。本论文采用自然语言处理技术来对微博话题下的大量观点文本进行立场检测、抽取观点摘要,以期为微博领域的舆情研究提供一些新思路。立场检测重点关注文本对于给定的目标话题是否持有支持(FAVOR)、反对(AGAINST)立场或是未表明任何立场(NONE)。但是给定的目标话题不一定会出现在文本中,微博作者可以通过表达对目标话题相关的其他对象的看法来间接地表达作者对给定目标话题的立场,因此正向的情感不一定代表支持立场,负向的情感不一定代表反对立场。本论文设计了一个共享卷积-LSTM条件编码-注意力机制混合模型来自动提取融合目标话题文本和微博文本的语义信息的特征向量,通过共享卷积层和LSTM条件编码层将目标话题和微博文本的信息进行深度融合,然后采用注意力机制让模型在处理微博文本的过程中增强目标话题的影响程度,将最终获得的(话题-微博文本)特征向量送入到输出层进行立场分类,在官方数据集上取得了较高的实验结果。本论文的立场检测模型创新之处在于:能够提取从文本本质语义层面来深度融合了目标话题和微博文本的特征,并且模型在处理微博文本的过程中能够充分有效地考虑到目标话题的语义因素;提出了一种共享卷积机制,通过让目标话题和微博文本共享相同的卷积核,既可以采用相同的标准来提取两者的n-gram语义特征,又让两者在共享卷积核的作用下得以进行语义关联和间接融合,并成功将其与LSTM条件编码模型和注意力机制相连接。是指能够从大量的观点内容中自动进行归纳总结,生成一个简洁且包含所有观点种类的没有冗余的文本摘要。本文针对给定的微博话题以及与该微博话题相关的一个包含多条观点微博文本的集合,设计了一个适用于微博短文本的观点摘要抽取模型。首先基于BTM模型提取目标话题对应的观点关键词,基于每条微博文本与观点关键词的共现关系来分析微博文本的重要性。然后在词向量表示的基础上添加PCA机制将微博文本进行语义向量化表示,接着对其自动聚类识别出给定目标话题的观点种类,最终综合考虑微博重要性、微博相似度、微博长度等因素,为各个观点类别抽取最具代表性的观点微博。所有类别的代表性观点微博共同组合形成了针对给定目标话题的抽取式观点摘要。本文的观点摘要抽取模型创新之处在于:一方面,通过抽取观点关键词从细粒度层面分析了微博文本的重要性和信息全面度;另一方面,又从文本句整体语义层面进一步识别观点类别,局部分析与整体分析相结合提升了针对短文本的观点摘要抽取的准确度。
其他文献
中国近代经济学主要是在移植西方经济学的过程中逐步发展起来的,其中留学生在近代西学传播中扮演了重要角色。20世纪20年代前后中国出现了留美热潮,中国去往美国的留学生回国
随着互联网的发展及电商的繁荣,供应链物流的价值日益凸显,其不仅是保证商流顺畅进行的物质基础,也是实现“以顾客为中心”理念的根本保证。为降低成本、提升竞争优势,促进企业发展,更多的制造型企业选择将重心倾向于产品的开发、生产、销售等核心业务,而把物流业务外包给专门从事物流管理的企业,此时,企业如何有效地综合评价与选择物流服务商即成为首先需要考虑的问题之一。目前国内部分公司多数采用的是总成本法,即对备选
高光谱图像是通过成像光谱仪获取包含数十至数百个连续光谱波段信息的图像立方体。它包含了地表物质的丰富空间信息和光谱信息,得到了国内外众多学者广泛关注并应用于环境监
多内耗镁基阻尼复合材料具有高力学性能和高阻尼性能,同时兼具密度小、比强度高及散热性能好等优点,是近几年来镁合金领域的研究热点。多内耗镁基复合材料指的是在镁或者镁合金中添加陶瓷增强相或者中间化合物制备而成的金属复合材料,它能够将材料之间的优缺点进行互补,扩大了材料进一步的应用领域和使用范围。其中颗粒增强制备金属复合材料因其制备工艺简单、成本低,易于控制等特点而成为最受关注的制备方法。在陶瓷颗粒中,S
施蒂纳是青年黑格尔主义的重要成员,其著作《唯一者及其所有物》将黑格尔纯粹思辨哲学发展到顶峰。在此著作中,施蒂纳对利己主义进行了系统的阐述,并以自己独特的方式创造了独一无二的“自我一致的利己主义者”,企图藉此超越一切旧形而上学。“自我一致的利己主义者”被他视作一切历史发展的最终目标,为了实现“自我一致的利己主义者”的利益,必须取消宗教、国家、社会等共同体的存在。施蒂纳的利己主义思想在当时产生了较大的
目的:通过临床和实验研究探究苍膝通痹胶囊治疗膝关节骨性关节炎的临床疗效以及其靶向调控ADAMTS-5保护膝关节软骨的作用机制,以期为苍膝通痹胶囊的临床使用及推广提供临床和理论基础。方法:本研究由临床研究和实验研究组成。根据临床研究的纳入、排除标准选取山东中医药大学附属医院骨科2017年10月至2018年9月门诊就诊的60例膝关节骨性关节炎患者,随机分为A、B组两组,A组应用苍膝通痹胶囊治疗,B组应
CO2是引起温室效应的主要气体之一,所以电化学还原CO2,不仅能够有效地缓解温室效应,还可以变废为宝,得到多种有商业应用价值的化合物,如乙醇、乙烯、正丙醇(三者简称为C2-C3产物)和CO等。因此研究电化学还原CO2制备小分子化合物,具有非常重要的意义。但是目前研究表明,大多数的催化剂电催化还原CO2的活性和稳定性明显不足,选择性也有待改进,所以电还原CO2面临的最大挑战是对催化剂的设计和改性,设
众所周知,国家机关工作人员是一种特殊的主体,国家机关工作人员本质上属于国家工作人员的一种,法律并没有对这个概念进行一个明确的定义,以至于司法实践中在主体认定上出现了模糊。针对该情况,随之出现了一部分立法解释和司法解释对其进行规定,在这些解释中将国家机关工作人员的范围扩大化。国家机关工作人员是渎职犯罪的主体,将该主体分析透彻才能将渎职犯罪进行判定,分析国家机关工作人员的本质才能将行为人的渎职行为得到
网络传播动力学主要关注疾病、信息、物质等在网络中的传播扩散过程,进而揭示网络传播过程的本质特征,为社会网络中的疾病防控,互联网上的谣言遏制等提供有效的理论与技术支持。经过长期的发展,复杂网络中的马尔科夫过程已经形成了一套完整的体系。然而真实网络上的很多传播过程都具有非马尔科夫特性,比如人类的社交活动的时间分布通常呈现出胖尾特征。相应地,一些研究发现对网络上的传播过程来说,等待时间的异质性在一定程度
目的:观察新生7日龄高胆红素血症大鼠海马区神经元Tau、p-Tau表达与其凋亡情况,分析Tau、p-Tau蛋白表达与神经元凋亡相关性,探讨Tau、p-Tau在高胆红素血症所致脑损伤中的可能