基于C+-树的聚簇图子图检索机制研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:gjzd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图由于可以明确记录社交应用中的个体特征以及个体活动和关系而被广泛使用。由于此类数据包含有个体的信息,为了防止恶意攻击者根据个体特定的好友关系将个体还原得到个体的信息,数据拥有者在共享此类图时,采取聚簇化的措施隐藏个体信息和关系,如何在聚簇化后的图集合上实现子图的有效检索成为重要问题。  扩展于C-树的C+-树的可以用作解决聚簇化后图集合中子图检索问题的索引结构。索引建立过程:根据给定的衡量标准,将相似度较大的图联合起来,组成两图的closure;在满足参数设置的情况下,重复该过程,直到建立一个树形的索引结构C+-树。子图检索过程:根据子图的结构约束和属性约束从根节点开始层次遍历C+-树,若某节点不满足查询约束,则过滤该节点的子孙节点;若某节点满足查询要求,则继续检测其孩子节点;通过该方式过滤不满足查询约束的数据图,缩小检索范围,提高检索效率。在检索过程中,为了解决查询图与聚簇图匹配时特有的多对一的映射关系问题,提出了VFoCG算法,用于解决匹配过程中多对一的特殊映射问题。  为了测试C+-树的检索性能,在真实数据集合和合成数据集合中测试了C+-树的检索性能。测试结果显示,C+-树具有良好的检索能力,平均可过滤掉数据集合中50%的数据图;索引结构的空间开销与数据集合大小之间的线性关系证实了C+-树的良好的可扩展性。
其他文献
工作流技术是近年来在计算机应用领域中发展最为迅速的新技术之一,是一种在办公自动化应用和企业经营活动中得到充分利用的先进的流程控制技术。工作流技术的主要特点是:过程
随着湖南省国税系统的全省征管业务数据的逐渐全面集中,使得利用计算机进行全面的税收监控、辅助领导进行决策管理成为可能。邵阳市国税局信息中心在省局的领导下,开发了税收监
分布式应用程序为了降低模块相互之间的耦合程度以及更好的应对可扩展、可操作性的要求,通常引入消息队列来降低模块之间的耦合和平衡各模块处理能力,消息队列允许分布式系统模
随着计算机技术的发展和越来越广泛的应用,人们对计算机的依赖程度也越来越高。计算机的可靠性和可用性也变得越来越重要了。尽管单台计算机的性能和可靠性越来越好,但还是有
随着科学技术的进步,计算机科学已经渗透到人们生活中的各个领域,人类对计算机网络的需求越来越强烈。Internet的诞生,使分布在世界上数以千计的网络互联起来。但是各类硬件、软
作为保证软件质量、提高软件可靠性的重要手段,软件测试在软件开发过程中起着不可替代的作用,而测试数据生成则是测试阶段最关键的技术问题之一。目前已有许多测试数据自动生成
海量数据的存在,从海量数据中提取信息的应用需求,以及信息对企业战略决策的影响,使得数据挖掘无论是理论研究还是应用实践都是有意义的。本文研究了数据挖掘技术在客户关系
随着网络技术的发展,Web应用软件已成为各类大型开发项目的首要选择。而当前Web应用软件的开发并没有一种成熟、快速的开发架构和解决方案。本文所做的工作就是对这种架构和解
随着网络通信和多媒体技术的发展,人们对网上音、视频的多媒体教学内容需求日益增长,基于流媒体技术的远程学习是未来人们受教育的新方法。然而流媒体的质量并不能令人满意,主要
随着信息时代的来临,数据的爆炸式增长和人们获取数据的需求方式的灵活多变,都推动了云存储技术和产品的快速发展,与此同时,高质量存储服务也对云存储中的核心存储系统,中心存储,提