基于知识图谱的文本多元关系抽取系统的设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:Coolbear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从文本中进行关系抽取一直是信息检索和自然语言处理的重要研究课题,二元关系抽取的研究工作已经有了相当多的成果。而多元关系也广泛存在于文本中,针对多元关系的抽取则是一个较新的领域。在知识图谱中,多元关系以结构化的形式存在。这些多元关系由多个二元子关系组成。相对于文本,在结构化的知识图谱中寻找多元关系的工作较少。本文首先提出了一个针对知识图谱的多元关系挖掘方法,然后将知识图谱中挖掘得到的多元关系和现有的关系抽取工作结合,对文本进行多元关系抽取。本文的具体工作包括:1.提出一个针对知识图谱的多元关系挖掘方法。该方法通过多标签频繁子图挖掘算法,从知识图谱中挖掘潜在的多元关系。2.使用知识图谱的多元关系挖掘结果进行远监督学习,生成文本多元关系样本,并以此来训练文本多元关系抽取模型。3.设计并实现基于以上方法的文本多元关系抽取系统。本文通过实验将知识图谱中的多元关系应用于文本多元关系抽取,改进了基于远监督学习的文本多元关系抽取的效果,并为远监督学习样本的生成提供了新思路。本文还设计并实现了基于以上方法的文本多元关系抽取系统,方便研究人员从知识图谱中发现各种多元关系并在文本中抽取这些多元关系。
其他文献
陕北洛川塬地区地域文化深厚,吸引众多画家进行相关题材艺术创作。在新的历史条件下,本文以洛川塬题材进行主题创作,试图进行新的意义探索。首先,研究地域、文化性差异对洛川
结合参数回归模型和非参数回归模型的诸多优点,统计学家们提出了半参数回归模型。对于简单的半参数回归模型:国内外学者做了大量的研究,当随机误差序列{(?)}为不同类型的时候
随着硬件计算能力的升级,人们现在已经习惯于分析原始数据集而不是抽样得到的小样本数据集。在这样的背景下,复杂网络的大规模分析形成常规。其中,网络表示算法可以将非结构
Logistic回归模型是一种有效的处理分类数据的方法,在很多领域诸如经济学、工程技术类医学、医学、生物学、犯罪心理学都有广泛的应用。近年来越来越多的利用Logistic回归模
老化是指在许多生物过程中器质性和功能性的退化,与各种疾病如癌症、神经退行性疾病以及心脑血管相关。老化的过程开始于细胞衰老,大量的细胞衰老导致组织器官的功能紊乱或丧
2005年3月31日,联合国安理会通过了第1593号决议,根据《罗马规约》第13条(b)项的规定,将苏丹达尔富尔情势提交给国际刑事法院。紧接着,国际刑事法院第一预审分庭在2009年3月4
经济和社会的快速发展,人们愈加关注交易的风险和安全,信用的重要性也随之不断显现,个人征信业由此获得了长足发展。但是,我国征信业发展时间较短、法律制度不完善,被征信主
游戏文化理论表明,通过游戏进行的语言学习既包括“游戏中”的学习,也包括“超游戏”环境中的学习;语言学习不仅发生在玩游戏的过程中,同时也更加积极地发生在游戏结束后的社
兴国必先强师,师资是一切教育之母。当前,职业教育的发展和改革亟需一支素质高、能力强的教师队伍,而面对现实,我国的职业教育师资却存在着数量不足、质量不高,培养体系不健全等问题,成为阻碍职业教育创新发展的一大瓶颈。回溯民国时期的职业教育师资培养状况,不仅可以从历史角度追寻师资培养问题出现的根源,还可以为当代职业教育师资队伍建设提供一定的经验借鉴。清末民国时期,我国的职业教育师资培养处于萌芽阶段,政府和
深度优先搜索(DFS)是一种基本的图操作,它以深度优先的形式遍历整个图,而DFS对图G中所有节点的搜索结果是一棵生成树,称为DFS-Tree。深度优先搜索算法一直是计算机科学技术领