论文部分内容阅读
图由于可以明确记录社交应用中的个体特征以及个体活动和关系而被广泛使用。由于此类数据包含有个体的信息,为了防止恶意攻击者根据个体特定的好友关系将个体还原得到个体的信息,数据拥有者在共享此类图时,采取聚簇化的措施隐藏个体信息和关系,如何在聚簇化后的图集合上实现子图的有效检索成为重要问题。 扩展于C-树的C+-树的可以用作解决聚簇化后图集合中子图检索问题的索引结构。索引建立过程:根据给定的衡量标准,将相似度较大的图联合起来,组成两图的closure;在满足参数设置的情况下,重复该过程,直到建立一个树形的索引结构C+-树。子图检索过程:根据子图的结构约束和属性约束从根节点开始层次遍历C+-树,若某节点不满足查询约束,则过滤该节点的子孙节点;若某节点满足查询要求,则继续检测其孩子节点;通过该方式过滤不满足查询约束的数据图,缩小检索范围,提高检索效率。在检索过程中,为了解决查询图与聚簇图匹配时特有的多对一的映射关系问题,提出了VFoCG算法,用于解决匹配过程中多对一的特殊映射问题。 为了测试C+-树的检索性能,在真实数据集合和合成数据集合中测试了C+-树的检索性能。测试结果显示,C+-树具有良好的检索能力,平均可过滤掉数据集合中50%的数据图;索引结构的空间开销与数据集合大小之间的线性关系证实了C+-树的良好的可扩展性。