面向知识图谱构建的知识融合问题研究

来源 :齐鲁工业大学 | 被引量 : 0次 | 上传用户:accessw2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速普及,如何有效地组织、利用以及挖掘数据背后隐含的知识成为一种新的挑战。知识图谱描述了客观世界所存在的实体及语义关联等,并以图结构直观地呈现,为用户提供了结构化的知识,逐渐获得了学术界和工业界的普遍关注,因此如何构建一个知识图谱成为学者们研究的热点。同时多源异构的知识之间往往会存在重复、语义歧义多样、质量参差不齐等问题,要想构建一个高质量的知识图谱,知识融合是不可或缺的关键环节。实体对齐和实体链接作为知识融合任务的两个重要子任务,现有的方法仍存在明显不足,主要表现在现有的实体对齐方法无法完全利用属性三元组包含的信息,以及现有的实体链接方法忽视了知识图谱的结构信息导致链接准确度不高,因此值得进一步研究与改进。本文将知识图谱应用于影视领域,深入研究多层次影视知识图谱构建过程中所涉及的知识融合关键技术,重点研究了知识融合环节的两个重要子任务实体对齐和实体链接,本文主要研究内容如下:(1)针对现有实体对齐方法的不足,本文提出了一种实体对齐模型—Nov EA模型。首先本模型充分利用了知识图谱中的属性三元组和关系三元组,然后依据知识图谱的领域特征对属性进行优先级排序,最后从结构和属性两个角度,利用二元回归模型对实体之间的相似度进行度量,动态地调节关系和属性之间的权重,进一步提升了实体对齐的效果。实验证明,相较于其他同任务模型,本文提出的Nov EA模型的对齐准确度有显著的提升。(2)针对现有实体链接方法的不足,本文提出了一种基于多维粒度的知识图谱实体链接模型。该模型在传统实体链接方法的基础上,重点关注了知识图谱中候选实体的邻域信息。在本方法的排序模块中,从实体名称、实体描述和图谱实体节点邻域等多个维度将待链接实体与候选实体进行相似性计算,选出最匹配的候选实体。实验证明,本文提出的多维粒度实体链接模型准确度优于其他同任务模型。(3)将本文的知识融合方法应用于影视领域,构建了多层次影视知识图谱。首先基于影片实体、影人实体、机构实体三类不同层面的实体层次分别构建相应的单层次知识图谱。其次,由于不同实体层次之间存在关联性,本文将不同实体层次构建的单层次知识图谱进行了整合,构建了内容全面、结构立体的高质量多层次影视知识图谱。最后实现了碎片化影视知识的收集,同时构成了体系化的知识。
其他文献
本文研究了三类考虑时滞系统的稳定分析与镇定问题。第一类系统为考虑网络诱导延迟的网络控制系统,针对该系统讨论了时滞网络控制系统的稳定与镇定问题。在研究过程中,引入事件触发方案来节省有限的网络资源,构造一个Lyapunov-Krasovskii泛函(LKF),利用扩展的反凸矩阵不等式,得到了事件触发网络控制系统稳定性分析和控制综合的新判据。最后,通过数值算例以及MATLAB仿真验证了该方案降低结果保守
超级电容器(supercapacitors,SCs)因其高的功率密度,长的循环稳定性以及安全环保等特点被认为是一种理想的能源存储器件,电极材料作为影响其性能的关键组件也受到了越来越多的研究。在众多的电极材料中,生物质基材料由于储量丰富,良好的可再生性以及廉价的成本受到了研究者越来越多的关注。必须承认的是,传统的生物质基材料活化工艺虽然能够有效提高其比表面积,但碳化后的产物往往介孔结构匮乏且产率较低
本课题以水飞蓟宾为模型药物,研究固化途径与工艺对水飞蓟宾纳米结晶的影响,探讨纳米结晶制剂技术与分散片剂型有序衔接的可行性。首先,通过纳米结晶技术,制备水飞蓟宾纳米结晶,以增加溶解度和溶出速率;其次,为进一步增加水飞蓟宾纳米结晶的稳定性和便于后继剂型的选择,系统研究了喷雾干燥固化和真空冷冻干燥固化对纳米结晶形态、晶型、溶解性、稳定性等的影响,并优化固化工艺,筛选赋形剂,最大限度保留纳米结晶高溶解度和
本论文主要以ZnO光催化材料为基础,然后与其他半导体、金属或碳材料形成复合材料。通过引入不同类型的材料来改善氧化锌的性能,增加氧化锌的应用。第一章,首先介绍了半导体光催化技术的研究意义,其次详细探讨了半导体光催化的应用,然后是ZnO的基本性质及需要改善的问题,最后提出了以ZnO为基体与其他材料复合形成各种异质结增强光催化性能的方法。第二章,制备了ZnO@ZnS异质结。ZnO纳米棒组成的花通过一步水
近年来,聚合物材料成为了人类生活中难以取代的重要组成部分。同时,聚合物材料难以降解,对环境造成了巨大的污染,因此,研发可降解聚合物材料是十分重要的。基于手性氨基酸合成的聚酯酰亚胺(PEI)是一种良好的聚合物材料,它有着良好的热性能和机械性能,氨基酸的引入使它拥有了优异的溶解性和生物降解性。本文的主要任务是通过改变引入氨基酸的结构和构型来探究PEI热性能和降解性能以及影响它们的因素。本文的主要工作分
随着光电子器件的逐步成熟和工程需求的持续推动,新一代的以分布反馈式光纤激光器(Distributed feedback-fiber laser,DFB-FL)作为传感元件的光纤传感器应运而生,近年来,因其具有抗电磁干扰、体积小、线宽窄、功率高、灵敏度高等特性成为了光纤传感领域的重要研究方向。采用DFB-FL进行声传感,可以实现较宽频带范围内空气声信号的探测,具有传输距离远、灵敏度高、隐蔽性好、环境
心房颤动(Atrial Fibrillation,AF)在临床上表现为颤动或不规则的心跳(心律失常),是许多心脏异常的诱发因素之一,具有高致残率和高死亡率。因此,心房颤动的精准识别具有重要意义。目前所使用的房颤检测方法主要为基于波形特征和深度神经网络的检测方法。基于波形特征的方法存在手工提取困难,P波不易检测等问题,使得房颤检测准确率一般、效率低下。基于深度神经网络的方法与深度神经网络的层数之间具
由于实际系统大多数是非线性的,如何处理非线性系统一直是研究的热点。随着模糊理论的发展,模糊控制理论用来处理非线性系统受到诸多研究人员的青睐,如T-S模糊模型能于任意精度逼近一个光滑且有界的非线性函数,将非线性系统描述为一组局部线性模型的凸组合。对于模糊系统的控制综合已进行深入研究并取得重要成果,如控制器设计、H_∞控制等,大多集中于状态反馈,然而实际系统中一些状态很难被测量或者测量的成本很高,因此
本文针对如何更好的建模上下文进行了研究。在上下文的建模和利用中存在着一些问题,本文针对低质量上下文、模糊上下文和缺失上下文三个方面进行了提高上下文质量、模糊本体建模和补全缺失上下文的研究。然后分别将它们应用在了光伏发电预测、文献摘要、文献检索的领域。研究内容如下:研究内容1:对于低质量上下文,本文提出了一种新的方法来建立了高质量本体模型,该本体模型可提高上下文质量。该本体先将上下文按照其来源的不同
心血管病已经成为威胁人类生命健康的主要疾病之一。临床上,心血管病经常伴有心律失常现象发生。有些心律失常可能导致心脏病的症状,包括头晕、昏倒和呼吸急促,还有些类型的心律失常,如房颤和心室颤动,可能会引起中风和心脏骤停,因此及时准确检测心律失常是紧急且必要的。心电信号(ECG)作为一种表征心脏状况的生理信号,对心律失常的检测和诊断具有重要意义。但由于医学数据的特殊性,其标注成本高,许多数据标注的不完全