舆情本体概念间非分类关系抽取研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:noonbird
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着5G时代的到来,物联网、云计算、大数据等相关技术的发展,网络媒体作为一种新的信息传播形式,已经成为我们日常生活获取和发布信息的平台。面对海量的网络数据信息,如何高效的为用户提取出有价值的内容,存在巨大的挑战。本体作为一种有效的知识组织形式和表达方式,具有良好的概念层次结构和丰富的语义关系信息,并且支持逻辑推理,因而在信息检索、知识库管理、语义Web、知识图谱构建等领域得到广泛的研究和应用。本体学习包括三个任务:概念的抽取、概念之间关系(分类关系和非分类关系)的抽取,公理的抽取。非分类关系学习作为本体学习中急需解决的问题,但因其种类繁多,状态空间巨大,这也为非分类关系抽取任务带来了一定的难度。目前非分类关系的学习主要针对特定领域的关系抽取任务,多采用领域相关度和置信度或者改进的方法进行非分类关系的提取,该方法得到的非分类关系具有较强的领域特征,而舆情信息具有跨领域性,突发性等特点,因此,针对舆情本体的构建及相关研究存在一定的难度。本文对舆情本体非分类关系抽取进行研究,主要工作包括以下几个方面:针对舆情分析相关研究数据集的缺乏,本文选取百度、新浪和今日头条等中文网页的新闻信息作为语料来源,并通过去分句、去重、分词对数据进行预处理,标注语料建立小型舆情语料库,最终标注11227作为实验数据。非分类关系类别标注。针对非分类关系种类繁多、状态空间巨大的问题,结合网络舆情信息的特点,缩小非分类关系状态空间的范围。根据其特点得到舆情本体概念间非分类关系类别,共包含27种非分类关系。同时,利用位置、词性等多个特征拼接来使得文本信息更为丰富,进而提升关系抽取结果。最后,本文提出结合词性信息、词注意力和句子注意力机制来捕获中文句子的特征信息,充分利用句子的局部特征及全局特征,将词性向量和其他特征结合作为非分类关系抽取模型的输入,能够充分挖掘句子中的非分类关系信息,进一步提高非分类关系抽取的准确性。实验表明,本文方法有效地抽取舆情本体概念间非分类关系,为舆情本体的构建、知识共享以及重用奠定了基础。
其他文献
自2008年全球金融危机至2015年中国股市大震荡以来,股价异常波动机制及其防范成为学术界关注的热点。2000年“超常规发展机构投资者”被提出以来,机构投资者在我国股票市场中的投资份额占比连年攀升,投资主体地位日益凸显。机构投资者具有充足的投资阅历、庞大的资金规模及宽广的信息获取途径。相比中小投资者,更有实力监管公司治理,对公司股价会产生更大影响。那么,在我国股票市场起步较晚、发展尚未成熟,股票极
本文主要研究两个分支的Degasperis-Procesi系统和广义的Camassa-Holm方程Cauchy问题的弱解问题,这些相关的浅水波模型始于现代力学和物理学,本论文主要研究如下内容:1)研究当初始值(u_0,?_0)在空间(H1(R)(40)W,1?(R))?(L2(R)(40)L?(R))时,两个分支Degasperis-Procesi系统的Cauchy问题的弱适定性.首先用特征线方法
目的:归纳和整理失眠相关文献,概述中西医对失眠病因、治疗的认识,为研究提供充分理论依据;通过随机对照试验,探讨“引气归元”温针灸治疗心脾两虚型失眠的临床疗效及其推广意义。方法:采用随机对照的方法,将60例研究对象分为治疗组、对照组,每组各30例。治疗组予温针灸方法治疗,选取“引气归元”穴组,每周治疗3次,治疗4周;对照组予口服阿普唑仑,按需服药,治疗4周,观察并记录两组睡眠质量、症候群改变情况,治
随着我国风电迅速发展,风电装机容量不断增加,风电弃风现象也愈发严重,这一问题在“三北”地区尤为突出,其主要原因是“三北”地区能源结构以传统的煤电机组为主,且大部分是运行模式为“以热定电”的热电联产(Combined Heat And Power,CHP)机组,严重压缩了风电并网空间。针对“三北”地区风电弃风问题,论文在当前国家鼓励风电参与供热促进风电消纳的背景下,通过虚拟电厂(Virtual Po
电缆偏心的测量是电缆生产中的重要环节,直接关系到电缆质量的好坏。本文对电缆偏心检测的发展历史及现状进行了介绍,并阐述了目前四种主流在线检测方法的基本原理。介绍了X
近几年来,我国遇到的水旱灾害非常的频繁,在各个地区都存在了不同程度的水旱灾害,严重损害了人民群众的生命财产安全,随着信息技术的快速发展,为各个领域都提供了极大的便利
由于面临激烈的市场竞争压力,同时伴随严格的质量标准的出台,各大机车车辆公司的发展面临越来越多的挑战,作业车间调度作为企业生产调度管理的重要环节,受到了越来越多的关注。本文以转向架装配作业过程中的多资源约束作业车间调度问题为研究对象,先后对确定工时条件下、随机工时条件下的调度问题展开研究。主要内容如下:(1)在对转向架的结构特点、装配工艺特点进行分析的基础上,利用加工工艺网来表达其生产流程,利用正向
风能作为能源中非常重要的一部分,随着新能源发电尤其是风电行业的迅速发展,风力发电实验平台已经成为研究重点。在风电技术先进的国家比如英国和美国,风电相关的实验平台已
工程项目建设环境和项目本身的日益复杂需要充分利用各利益相关方之间的协同作用,以提升项目绩效。这就要求在选择工程项目合同模式时要考虑各方的观点以确定合适的合同模式。目前在IPD合同模式选择的研究中,对于充分考虑项目中各利益相关方观点的选择方法的研究比较缺乏。本文主要针对IPD项目合同模式下,研究项目各参与方对合同模式的偏好投票选择。本文首先通过文献查阅对三种不同的IPD合同模式进行了具体阐述。然后通
磨损是材料消耗的主要形式,在工业生产中造成了大量零部件失效,是限制机器使用寿命和造成经济损失的重要原因。通过铸渗工艺在材料表面复合一层耐磨合金层,可以大大提高材料的耐磨性能,并且具有成本低、复合层厚等优点。目前铸渗的研究主要集中在不同铸渗层体系的制备与耐磨性能方面,对铸渗层形成机理缺乏研究。CALPHAD(CALculation of PHAse Diagram)方法可以通过建立多元材料体系的热力