知识图谱中的图聚集方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:ylalh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱为各种领域中实体之间的关系建模提供了强大的支撑。而近年来随着数据集的爆炸式增长,数据的传输、存储和有关知识图谱的挖掘任务也因此受到挑战。图聚集方法提供了一种面向这些问题的解决思路。图聚集方法是在保持图整体结构的同时,将节点和边进行有效地合并,从而得到更为简洁、抽象的超图的过程。与传统的图聚集方法不同,本文提出了一种无损的面向知识图谱的图聚集方法,可以有效地把一个知识图谱划分成一个规模较小,但包含核心知识的摘要知识图谱,以及由其他从属知识构成的详细知识图谱。将知识图谱中的核心部分和详细部分分离能够大大减少搜索空间从而加速挖掘任务,而详细知识图谱也可以重新加入摘要知识图谱还原为原始知识图谱。本文提出的图聚集方法包含多种图聚集策略,每种聚集策略都能有效地识别并压缩知识图谱中的特定结构,从而提高面向这些特定结构的知识图谱挖掘算法的效率。本文的主要工作包括:(1)提出了非聚焦式的聚集方法,包括对等聚集、依赖聚集和子图聚集策略,这些聚集策略分别挖掘出了数据集中的等价结构、依赖结构、模式结构。(2)提出了聚焦式的聚集方法,该方法能根据用户的需求去除无关实体,返回只包含特定类型实体的聚集图。(3)设计并通过多组实验验证了图聚集方法的压缩性能和辅助路径计算的性能,并提供了展示聚集结果的用户友好型页面。本文提出的方法提供了聚集方法辅助挖掘任务的新思路,对于图聚集方法的研究和实践具有重要意义。
其他文献
间位芳纶纤维(PMIA)纸具有高强力、柔性、阻燃性和耐腐蚀性,广泛应用于电子电器绝缘部件和航空航天工业。本文提出利用低温氧等离子体处理和化学镀银技术相结合的方法,以绝缘
对于水中有机物污染的问题,常规的处理方法有:生物法、化学氧化法、吸附法等。在这些处理技术中,光催化技术具有高效、低能耗、操作简便、反应条件温和、应用范围广、可重复
电解水是低成本、无污染、产量丰富的制取氢能源的有效方法。电解水过程包括电解水析氢和电解水析氧两个反应过程。其中,电化学析氧反应(OER)涉及4电子(4e-)传输,动力学缓慢,是电解水制备氢能源的决速步骤。而钴硫化合物(Co-S)中的钴(Co)元素因其3d轨道电子排布的一个低自旋电子接近于e02g的填充状态,而有利于OER催化反应的电子传输,经常被应用于OER电催化反应。但Co-S化合物作为电催剂用
随着社会生产力的发展及人民生活水平的提高,纺织品的意义已从防寒保暖拓展到健康环保等功能,植物染料以其生态、绿色、环境友好等优良特性再次受到人们的关注和推崇,广泛应
集中供热作为提高能源利用率,降低燃料污染排放物的供热方式,逐步取代了效率低,污染大的分散供热方式。集中供热管道直埋敷设因其热损失小、使用寿命长和造价低等优势成为集
进入21世纪以来,人类越来越发现自身面临着两大主要挑战:一是能源短缺问题,二是环境污染问题,这两个问题的存在已经严重制约了工业社会的长期性发展。出于自救目的,我们有必
剪切增稠液是一种在低剪切速率下拥有高流动性,在高剪切速率下具有硬化特性的柔性防护的材料,其在抗冲击防护方面具有较强的优势。依据目前两种剪切增稠体系(颗粒粒径在微米量
溶菌酶可以在不破坏细胞其它正常组织的情况下,有选择地溶解细菌细胞壁,这使得溶菌酶具有抗菌消炎等功效。在食品加工行业常被用作保鲜剂使用且不会对人体造成危害,在医学上
中链脂肪酸(medium-chain fatty acids,MCFA)是指链长为6-12 C的饱和脂肪酸,自然界中常以中链甘油三酯(Medium-chain triglycerides,MCT)的形式存在多种动物的乳汁、椰子、棕
近年来,我国煤炭开采深度及强度不断增加,煤层开采条件愈加复杂,冲击地压灾害日趋严峻,严重制约着我国煤矿的安全生产。老虎台煤矿主要回采剩余分层煤层,虽然冲击地压危险性