图数据管理中最小唯一诱导子图查询研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:xiaobangzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图是计算机科学中最重要的数据结构之一。图不仅关注数据对象本身的属性,还关注数据对象之间的相互作用关系,可用于描述复杂的网络结构,例如亚马逊商品网络、FACEBOOK社交网络以及生物的蛋白质网络,等等。近年来,图数据得到了学术界的广泛关注和深入研究,取得了大批研究成果。随着图数据量的不断增大,如何有效地回答图数据中的各种查询是图数据管理研究中最核心的问题。本文提出了一种新的图查询需求:给定一个查询顶点,返回图中包含该顶点的一个合适的子图,返回的子图不能过小以防无法看出该顶点邻域和其他顶点邻域的区别,返回的子图也不能过大以防用户被返回的信息淹没。在这种需求驱动下,本文提出了图数据中的最小唯一诱导子图(Mininal Unique Induced Subgraph,简写为MUIS)查询。MUIS查询是指给定查询顶点,在单图或图集中查询包含该顶点的顶点数最少的唯一诱导子图。MUIS查询为图数据管理提供了新的数据访问和使用手段。MUIS查询不仅可以挖掘顶点邻域的特殊结构,还可以用于顶点的可视化展示以及探索顶点的性质。本文给出了MUIS的形式化定义、探索了MUIS的性质并给出了MUIS的编码方法。提出了过滤-验证的两阶段MUIS查询求解框架,在过滤阶段通过对诱导子图空间进行搜索和剪枝产生MUIS候选集,在验证阶段使用子图同构算法检验MUIS候选集中的诱导子图是否唯一。本文提出了基于查询点的广度优先分层搜索策略保证尽早求得顶点数最少的唯一诱导子图。在单图中,提出了基于已匹配点的剪枝策略减少子图同构测试次数。在图集中,除了使用基于已匹配点的剪枝策略,还加入了利用图的匹配顺序的剪枝策略,进一步提高求解效率。在同构测试算法上,均采用了基于查询点的改进VF2算法,该算法不仅优化了顶点的匹配顺序,还优化了算法实现的数据结构,从而提高了同构测试效率。在实验阶段,在单图和图集中,分别验证了MUIS查询的基础算法和改进算法的有效性并对比了算法的性能。本文提出了平均同构时间和调用递归函数次数两个性能评价标准,使用真实数据集和模拟数据集进行了实验。在单图中,使用了YEAST和HPRD两个真实数据集。在图集中,使用了AIDS和NASA两个真实数据集。经验证,提出的算法均能完成MUIS查询任务,改进算法查询效率得到了大幅度提高,并且当查询所花时间越长时改进算法的优势越明显。此外,通过实验还探索了MUIS查询求解效率的影响因素。通常情况下,随着图中边数、图的数量增多,查询效率降低;随着顶点标签数、边标签数增多,查询效率提高。
其他文献
湖南省义务教育课程计划设置表把本省义务教育阶段的课程划分为国家课程、地方课程和学校课程三大类,意在让学校教育顺应时代的发展和社会的需求,发展学生的核心素养,培养学
近年来,随着我国城镇化的不断发展,大量的农村剩余劳动力不断涌入城市,他们在为城市发展增砖添瓦的同时,他们的子女却成了我国生活中一个特殊的群体——留守儿童.这些留守儿
  本论文是基于区位论的理论基础展开的,回溯了国内外的有关学术成果。探讨了世界发达国家主要的商务中心区发展的沿革,国内外商务中心区的理论研究概况、研究现状和研究方法
老师的批评是为了唤起学生对自身的表现行为中存在一些错误问题的警示和教育,是一种对学生身上的不良思想品德和行为的否定评价,其最终目的便是教育孩子克服自身的缺点和错误
烹饪职业教育是一门科学,在教学烹饪知识的时候,如何在教学中应用先进的教学方法、科学的教学理念等使学生更好地学习相关的知识,是近些年来,教学所关注的重点内容.文章主要
论述汉语言在教育中的重要性,再通过写景、记事、状物、写人等四个方面讲述如何让小学生习作和真情实感联系起来,最后再具体讲一讲小学习作中写真情实感是如何为以后的写作铺
该论文的主要目的是在对区域物流予以系统论述的基础上,应用区域经济学和物流学的相关理论与方法,开辟区域物流系统规划与发展的新视角,深入研究物流经营的机理,谋求区域物流
一年级上学期语文书上的课文都是有联系的,有的是主题上的联系,有的是课题上的联系,而其中以“时间”为线,贯穿始终.我们可以把每篇课文变成一个童话故事,甚至可以把整本书变
本文揭示了在当代世界范围建筑教育体系内并存着两种建筑价值思想体系——他律与自律.通过对现代主义以来西方建筑教育以及与其密切相关的建筑理论发展脉络的梳理,深入探讨两
家庭是人生的起点,幼年时期形成的德育思想主要来自家庭,因此,家长被称为孩子的第一任老师.这就说明了家庭教育对一个人一生的德育思想有着重要的影响,优质的家庭教育能够坚