面向Web规模图数据的子图匹配算法的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:rainbow03262009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图作为计算机学科中一种抽象的数据结构,具有很强的表达能力。现实生活中的很多错综复杂的关系都用图作为数据模型来描述,例如蛋白质交互网络,化学分子结构,社交网络等。但是这种超强的表达能力也导致了图数据上的各种算法难度大大增加。图上的很多问题是NP-完全问题。近些年随着信息技术以及计算机网络的飞速发展,尤其是互联网的日益普及,各个领域的数据量猛增,而从导致了图的规模也迅速扩充。如何在这样庞大规模的图中找到所需要的信息,一方面是迫切需要解决的实际问题,一方面解决这个问题又存在严峻的挑战。所以基于Web规模图数据查询成为了研究热点。子图匹配算法是图数据查询的一项基本操作,具有重要的研究价值。本文中子图匹配是指在单一Web规模图数据库中,通过子图同构找到所有匹配集合。它面临的主要问题就是子图同构问题。子图同构问题已经证明是NP完全问题,这就意味着查询效率低。为了提高查询效率,本文主要是从建立索引结构和分布式并行处理两个方面来考虑,并进行深入研究,分别提出了基于索引的子图匹配方法和基于云环境的子图匹配方法。在基于索引的子图匹配算法中,主要针对以往算法一次匹配一点的弊端进行改进,提出一次匹配一条路径的方法,从而建立了基于最短路径索引的子图匹配算法。主要是通过为Web规模图上的每个顶点邻居信息建立压缩结构来完成,这种结构是由顶点邻居组成的最短路径所构成。由于这种索引可以一次匹配一条路径,所以对Web规模图有很好的扩展性。在基于云计算环境子图匹配算法中,采用了基于内存云的分布式图数据处理系统,此分布式系统为用户提供了透明的接口,用户可以操作Web规模图仿佛它是存储在单台机器内存中。此方法考虑到分布式环境和数据更新延迟等因素会加剧索引维护的难度,所以放弃了建立索引来加快子图匹配的速度,而是采用图探测和并行技术弥补了缺乏索引所带来的性能上的下降。
其他文献
随着计算机和通信技术的发展,Internet网络在过去的十几年中迅猛发展,拥塞问题亦越来越严重,现有的拥塞控制算法远远无法满足未来的需要,Internet的继续发展迫切需要寻找新的
  本文主要研究通过现场总线技术实现对嵌入式设备的监控和嵌入式设备的上网并对其进行远程监控,同时研究了虚拟现实技术在监控中的应用。  首先本文采用CAN现场总线组建
本文详细论述了基于计算市场的网格资源管理模型GridMart,对网格计算市场模拟器进行设计和实现,对网格资源管理的定价策略、资源可靠性等进行了深入研究。●在考察和分析国际上
网格的出现是在近些年计算机科学技术的长足发展与网络技术的广泛应用的背景下出现的,怎样利用现有资源解决大规模复杂计算问题成为计算机领域的研究重点,而网格技术就是解决这
随着汽车技术的发展和创新,人类在享受汽车带来的生活便利的同时,也越来越深切的感受到随之而来并日益严重的安全、环境、能源等问题。研究表明,不同的驾驶员驾驶同一车型的
我们的世界已经步入了信息时代,电子邮件作为信息沟通的重要方式和手段,以其方便、快捷等特点,成为互联网上的重要应用之一,将Email与Web相结合的Webmail应用模式也已经成为I
近年来以机群为代表的分布式存储超级计算机系统逐渐成为超级计算机的的主流,与共享存储超级计算机相比,分布式存储机群系统最大的区别是数据分散存储在不同的节点上的,在考虑其
  首先,本文研究了镜头转换的各种类型及其表现,分析了现有检测算法的优劣,结合电视台对视频检索实时性的要求,提出了使用平均差分强度算法检测淡出淡入和使用平均差分强度算法
本文主要研究MGCP协议在软交换中的实现。  本文首先概述了软交换以及支持多媒体和移动业务的软交换系统;接着介绍了MGCP协议的基本概念、在网络中的功能实体、协议模型、消
通过对互联网的监测发现,U盘已成为病毒和木马程序传播的主要途径之一。在已经发现的具有重大影响且造成严重损失的恶意代码中,有很大一部分恶意代码通过可移动存储设备传播