基于V-index的子图查询算法的研究与实现

被引量 : 3次 | 上传用户:zhoupeng4348
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图是计算机科学技术中一种重要的数据结构。随着计算机科学技术的不断发展,出现了越来越多的以图为逻辑表达的数据。例如社会网路,蛋白质交互网络,分子化学式等等。而且,这些图数据的数量也在不断地增加,例如社交网站上的注册用户多达几千万甚至是上亿,从而产生了基于互联网的大规模社会网络数据。如何有效地管理这些数据,已逐渐成为信息化领域中热门研究问题之一。对图的操作具体包括:(1)如何建立有效地存储机制和索引策略,(2)如何在海量图数据库中进行高效的查询。在图上进行子图查询是图数据管理的基本操作之一。子图查询的定义是:给定一个查询图Q和一个数据图G,在数据图G中寻找所有与查询图Q匹配的子图。目前的子图查询算法多数采用子图同构算法,由于子图同构算法是典型的NP-完全问题,其查询效率非常低。为了改善子图查询算法的效率,本文提出了一种基于顶点编码的方式来创建数据图的索引,在这种索引基础上进行子图查询操作。为了降低查询匹配的次数,首先对索引结构进行剪枝,然后根据查询顶点信息查找顶点匹配对,最后在顶点匹配对中查找匹配子图。由于基于顶点编码的索引结构是以整个数据图为单位创建的,索引结构不易更改而且索引表所占内存空间比较大。为了减少索引空间的利用,本文对基于顶点编码的子图查询进行改进,提出了一种基于代码块的子图查询算法,这种算法的基本思想是:将数据图分割成无数小的分区,然后再在这些小的分区中查找子图。由于这种算法存在匹配过界问题,所以我们对交叉边也进行存储。并且在查询过程中,遍历交叉边索引,如果交叉边两端的顶点与查询顶点匹配,则以交叉边两端的顶点为起点进行深度优先遍历,其深度是查询图的深度,形成一个新的块,并将其放入数据图索引中。最后,调用基于顶点编码的子图查询算法,输出与查询图匹配的所有匹配子图。经过实验分析,文中提到的算法的索引创建方法比较简单,空间利用率较高,查询效率相对较高,适合海量数据图的存储以及在海量数据图中进行子图查询。
其他文献
机器视觉系统已经被广泛地应用于各个不同的领域。由于机器视觉算法的效果严重依赖于输入图像的质量,而实际得到的图像往往并不理想,因此,对图像进行复原是提高机器视觉检测
在各项存款保持快速增长的情况下,加强信贷投入是提高银行资金运用效率和经营效益的最佳选择,如何确定营销策略,有效开展中小企业信贷市场营销是我国国有商业银行面临的重要课题
近些年来,微电网受到社会各界的普遍重视,它是继分布式发电后的一种新的适合于可再生能源的发电组网形式。而作为一次能源与微电网之间电能转换的接口设备,逆变器被广泛应用
大型机械式挖掘机在目前国际国内的矿山开采及工程施工中得到了广泛的应用,大型挖掘机的性能和水平代表了一个国家的工业水平和科学技术水平。动臂是挖掘机工作装置中主要的
随着科学技术的发展,电子证据在实践中的应用越来越广,但我国相关的法律却相对滞后,没有对应的电子证据适用的规则。2013年8月新民事诉讼法颁布,电子数据作为独立的证据种类,有别
在目前经济全球化和市场国际化的背景下,积极推行现代国际管理模式是规范企业管理和提升企业竞争力的体现,但如何在欠发达国家有效落实国际管理模式是一个亟需解决的问题。尽
损害赔偿作为违约责任中适用范围最广的方式,对于合同法维护交易安全和促进交易功能的实现具有重要意义。而对于整个损害赔偿制度而言,损害赔偿范围的确定又是其关键所在。在处
目的:通过对苏州某些企业从事放射工作人员个人剂量和职业健康情况的调查,分析探讨小剂量电离辐射对放射工作人员健康状况的影响,为改善放射卫生防护条件提供科学依据。方法:对苏
随着经济全球化进程的不断深化,信息技术的迅猛发展,传统的企业经营模式日益受到严酷的挑战。为了应对瞬息万变的市场竞争,越来越多的跨国公司开始引入精益管理的理念和工具
互联网时代“数据爆炸,信息贫乏”现象的出现对数据的挖掘分析提出了新的要求,数据挖掘的目的就是把隐藏在大批看似杂乱无章的数据背后的信息采集和提炼出来,总结出所研究对