图数据库中子图查询技术研究

被引量 : 0次 | 上传用户:safemon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种通用的数据结构,图被广泛用来建模和表示多种复杂的结构化数据。近年来,对累积的大量图数据(即图数据库)的管理受到研究者的关注。子图查询是一种具有很强现实意义的查询类型,主要包括精确子图查询和相似性子图查询。具体来说,给定图数据库D,查询图q,精确子图查询返回集合{g∈D|ョg’∈g,s.t g’与q是同构图),相似子图查询返回集合{g∈D|ョg’∈g,s.tg’与q是相似图)。本文针对上述两种子图查询给出有效解决方法。对于精确子图查询,本文采用过滤验证机制,从数据库中提取出的特定频繁子图称为特征,过滤器即是由特征压缩而成的一棵索引树,由于特征之间共享诱导子图,过滤阶段多个特征所共享的诱导子图只与查询图做一次子图同构检测,所以过滤效率明显优于现有方法。考虑到提取特征开销较大,本文又提出一种高效的提取特征方法,该方法可以保证提取出的特征的过滤效果。理论分析与实验验证均表明我们提出方法优于现有方法。对于相似性子图查询,相似图定义为满足拓扑同构的两图之间编辑距离小于某一给定域值,现有方法多数采用过滤验证框架,在此框架下,这些工作主要集中精力于建立有效索引来提高过滤效果上,却很少考虑设计高效的验证方法,这些方法在验证查询图q与数据库中图g是否满足相似性子图查询要求时均需枚举g中的与q拓扑同构的子图,直至找到一个与q距离小于域值的子图为止。枚举拓扑子图计算代价巨大。本文提出方法无需枚举子图,而是将问题转化到高效计算两图编辑距离上来.通过分析问题具有的特殊性质,设计一种巧妙的计算编辑距离的启发式方法,来显著提高验证阶段的效率。另外,考虑到计算编辑距离是一个NP难问题,我们又设计一个线性规划方法来在多项式时间内快速计算编辑距离的下界,相似性子图查询算法利用此下界提前过虑部分非结果集。在真实和人造合成两类数据集上的大量实验结果表明,提出方法显著优于现有方法。
其他文献
<正>护患关系是实施医学行为过程中,医护人员与患者之间的关系,它以疾病和医学技术为基础,以医学道德为核心,是以恢复健康或预防疾病为根本目的,是以双方道德权利及义务对立
本文以人力资本理论、新增长理论和人力资源开发与管理理论为基础,综合了国内外多位学者对人力资源开发领域的研究,从吉林省经济与社会发展的宏观角度出发,对吉林省人力资源
粉煤灰和秸秆分别是工业和农业固体废物,二者在水处理中的可安全利用性为小麦秸秆-粉煤灰纤维陶粒(简称“纤维陶粒”)应用于城市污水处理提供了可能。研究利用小麦秸秆所提供
从嫩江胖头泡蓄滞洪区居民安全避洪洪水预警机制原理、目标和基础,引出了嫩江胖头泡蓄滞洪区居民安全避洪洪水预报系统研究.洪水预报系统研究包括预报站点的选定、预报的时间
塞尚重视形、线条、色彩、体积之间的关系构成。在他看来,世上一切事物都是静止的、厚重稳固的实体,艺术家的任务就在于如何用冷静的目光和头脑去分析它的体积。塞尚的几何化
目的:总结近17年剖宫产率和剖宫产指征的变化。方法:回顾性分析绍兴市妇幼保健院1998年-2014年17年间的年剖宫产率变化,以及主要剖宫产手术指征构成的变化情况。结果:17年间
期刊
以长江口细颗粒泥沙为样本进行环形水槽起动试验,给出了三组不同中值粒径泥沙的起动流速和临界起动应力,同时用湍动能法(TKE)估算不同含沙量水体的床面切应力,给出了泥沙起动
随着新浪微博的广泛使用,新浪微博传播的内容涵盖了各种领域的信息,涉及范围越来越广;同时,当用户浏览消息时,不仅能够表达自己的看法,同时能够看到别人的观点.因此,当用户无
随着科技和现代社会的飞速发展,我国的经济规模不断扩大,国民环保意识也随之不断增强。传统的交通运输方式—公路运输、铁路运输、水路运输和航空运输,已经不能满足现代社会
孙枝蔚作为明末清初关中遗民诗群中存诗量最大的诗人,他的诗歌成就甚受当时文坛的肯定。清初的文坛以王士禛为盟主,力倡盛唐,标举神韵、法度,他的诗“风华典丽”、“波澜洪阔