利用频繁子图支持子图近似匹配的索引技术研究

来源 :东北大学 | 被引量 : 7次 | 上传用户:hitiger
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为数学的一个新的分支,图论起源于著名的哥尼斯堡七桥问题,它以图作为研究对象。近年来受计算机科学技术飞速发展地刺激,图论的发展极其迅速。其应用范围不断拓广,出现了越来越多的以图形建模的数据,例如化合物分子,蛋白质交互网络等。随着这些数据规模不断地增大,如何有效地管理和挖掘海量的图数据成为图数据库研究的核心问题。近年来,图数据库中的近似查询逐渐引起了越来越多的关注,但由于图数据自身结构的复杂性,如何从海量的图数据中迅速找到近似满足给定查询要求的答案成为一个挑战。针对这个问题,本文通过分析图的频繁结构和拓扑关系,定义了一种新的图相似性度量的标准,并在此基础上提出了一种有效的针对近似图包含搜索的索引构造方法,极大地提高了查询的效率。本文的研究成果主要有:(1)提出了一种新的衡量图相似性的标准。本文从图编辑距离的定义入手,进而研究图之间的拓扑关系,并给出了图之间近似程度的形式化表达。该表达为本文提出的近似查询算法提供了理论基础。(2)提出一种新的基于频繁子图的索引结构—倒排频繁子图索引,进一步将两个图之间的编辑距离计算拓展到整个数据库,以避免时间效率很差的顺序查找。(3)发现了利用频繁子图性质可以加速公共频繁子图的匹配过程。提出了分层倒排频繁子图索引(LIF-Index)的方法,使用分层关联结构组织频繁子图项的索引,形成基于频繁顶点的子图查询方法。实验表明,该方法有效地提高了子图的查询效率。(4)将过滤原理进一步应用到分层倒排频繁子图索引(LIF-Index)上,提出了一种高效的子图相似性查询算法,并与目前应用广泛的另外一种方法(gIndex)作了全面的比较。实验证明,本文提出的索引技术与建立在其上的子图近似查询算法具有良好的时间性能。
其他文献
作为人类历史上信息传播的重要方式,文字直接承载着丰富而高级的语义信息。自然场景图像中的文字检测,对于场景理解、图像检索、人机交互等视觉任务都有巨大帮助。尽管电子文
近年来,随着大数据时代的到来以及IT产业的迅速发展,计算机病毒也在迅速演化,网络安全问题已经成为了一个重要的研究课题。当前,主要的安全威胁包括入侵攻击、网络蠕虫以及通
本文通过回顾办公自动化的发展历程,探讨并界定了新时期办公自动化的含义及特点。在此基础上,研究开发办公自动化系统软件的有关方法,并结合当前计算机技术、通讯技术、信息处理
说话人识别是最自然的生物特征身份鉴定方式,可分为说话人辨认和说话人确认。说话人识别根据包含在语音信号中的个性特征来自动识别说话人,其关键问题是特征参数选择与识别模
近年来,随着科技的进步,各种低功耗、低成本、多功能的传感器被生产出来,广泛应用于各种领域。无线传感器网络(Wireless Sensor Networks, WSN)正是代表了这个新兴方向的发展
传统的二维掌纹识别主要是从二维图像中提取有用信息进行身份鉴别。二维掌纹是一种快速有效的生物特征识别方法。目前在中等规模的掌纹库上的等误率(Equal Error Rate)已经降
目标跟踪是指在一序列图像的每幅图像中找到所感兴趣的运动目标所处的位置,它是计算机视觉领域的一个重要研究方向,经常应用于视频监控、人工智能、人机交互等方面。目标跟踪
以DES为代表的对称密码是信息安全领域一种重要的密码体制,与公钥密码相比,对称密码计算代价低,算法相对简单,因此在工业界得到了广泛的应用。目前,针对对称密码的攻击方法除
生产调度问题,包括离散型的作业车间调度问题(JSP),流水车间调度问题(FSP),和连续型的流程工业调度问题(PIP)都是具有强约束,多目标的NP-hard问题,以一般数学方法很难得到可行解。
Quidway NetEngine 5000E核心路由器(简称NE5000E)是华为公司推出的高端网络产品,主要应用在IP骨干网、IP城域网骨干层以及各种大型IP网络的核心位置。路由器多框集群的产品