面向中文知识图谱本体构建系统的设计与实现

来源 :东南大学 | 被引量 : 1次 | 上传用户:fskfxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,信息抽取、知识图谱和知识库的构建等研究成为热点,本体中实体识别和实体上下位关系抽取是这些研究的基础。但是目前针对特定知识图谱本体构建并不多,本系统针对植物领域知识图谱的本体构建做了一些工作。本系统主要采用一种自下而上的构建方式,由最下层的领域实体获取出发,通过推荐算法来挖掘上位词,避免了传统构建方法中的关系抽取及关系判断这一难点,通过自动化方式获取实体上位词,再获取上位词的上位词,即将上位词层次化,最后通过信息抽取挖掘出实体的各个属性,最后构建出本体。首先,领域实体的获取,本系统通过挖掘互联网开放库数据,如搜狗,百度,腾讯等互联网公司所收集整理的各种领域词条,以此类词条为基础来丰富领域实体库。爬取百科数据,根据百科类目和开放分类获取前面收集到的实体的上位词,并清洗整理,另外通过协同过渡推荐算法获取上位词的方式作为补充,完成上位词获取。通过FP-Growth算法寻找频繁项的方法对前面所获取的上位词进行层次化,并进行循环递推,找出上位词的上位词,直至结束。对百科描述文本,进行信息抽取,挖掘出实体的相关属性,完成整个本体的构建过程,并以图谱的形式展示出来。本文通过系统性的分析,概括出系统五个主要功能模块,然后设计并实现。在整个构建系统设计和实体过程中,对百科知识爬取和算法的实现,有较深入理解,在文中也进行了详细说明,本文针对理论分析和实际应用两方面进行相关研究,设计并实现了植物领域本体构建系统。
其他文献
目的:探讨中度宫腔粘连患者宫腔粘连电切术(transcervical resection of adhesion,TCRA)后不同防粘连方式对生殖预后的影响。方法:193例中度宫腔粘连患者TCRA术后使用雌孕激
分析了并联机构工作空间的求解方法,提出用极限边界搜索法实现机构工作空间的分析,并对 3-RUU并联机构进行了分析,在matlab上对其进行了工作空间的仿真。
随着蜂窝组合梁结构的广泛应用,其抗火性能与人们的生命和财产安全息息相关,受到越来越多的关注。研究蜂窝组合梁结构的抗火性能及抗火设计方法,对推动和改进蜂窝组合梁结构的抗火性能研究具有重要的意义。在蜂窝组合梁抗火试验研究基础上,运用有限元软件建立正六边形蜂窝组合梁抗火分析模型,综合考虑高温下蜂窝组合梁抗火性能的影响因素,对蜂窝组合梁的抗火设计方法进行研究,并总结耐火极限简化计算公式和临界温度的经验公式
随着我国桥梁数量的快速增长,如何及时准确掌握在役桥梁的健康状况已经成为桥梁养护工作者及研究人员最关注的问题之一。通过桥梁结构的动力响应推测其内部损伤是近年来比较
现如今,教材要求教师教学应该以启发启发学生思考为主,提倡创新,给学生思维和想象的空间。在培养听、说、读、写等各项能力的基础上.着力提高学生分析和解决问题的能力.以培养学生
安徽庐江“金坝芹芽”系选用本地水芹品种,经过特殊方法培育的优质产品。芹芽性凉,味甘,能够理胃和中祛湿浊,除心下烦热,有散淤破结、清热平肝、降血糖、减肥等多种功效。“
<正>目的:观察血管紧张素转化酶抑制剂依那普利和β受体阻滞剂美托洛尔对自发性高血压大鼠 SHR 阴茎勃起功能的影响。方法:将18只6周龄雄性 SHR 随机分为3组:SHR 对照组、依那普
会议
中图分类号:G633.7 文献标识码:A 文章编号:1008-925X(2011)07-0143-01    新课标理念下的物理教学是科学的、前瞻的,是根据现代社会对人的发展的基本要求,培养具有主动、负责和不断开拓、创新的个性特征,培养具有我元化和批判性的思维方式,培养能与周围人达成理解和合作,从强调单纯积累知识向创新思维、创新能力、探索求知的方向转变。因此,在实施新课标理念教育的今天,必须加强对
移动互联网与人们的日常生活越来越紧密,移动智能终端已演变成为不可或缺的一部分。其中,Android智能终端的市场占比达70%以上,深受用户喜爱。然而Android操作系统存在各种漏
水力压裂作为一种利用高压流体对地下致密岩层进行压裂改造提高岩石孔隙度和渗透性的物理力学方法,在油气开采、地热资源开发、放射性核废料处置以及地应力测量等领域被广泛