论文部分内容阅读
随着Internet技术的发展,越来越多的应用采用XML作为信息表示和数据交换的标准,这使得通过数据库技术对XML数据进行存储、查询等操作变得日益重要,同时也为数据库研究者提出了新的挑战。XML是一种半结构化语言,所以XML数据对象有着相对复杂的结构。它在本质上可以被看作一个数据树,文档的数据和内部结构在树中体现出来。
与传统数据库查询不同,XML数据库查询不仅查找数据,还查找数据之间的结构关系。路径表达式是一种能够很好地满足这些查询要求的途径。因此,基于路径表达式的查询问题成为XML数据查询的关键。而作为路径表达式中最基本的单元,“父子”和“祖先后代”关系查询也就成为XML查询的核心问题。最近,用结构连接算法处理这些结构关系十分流行。
本文在现有结构连接算法的基础上,首先利用XML文档的编码技术,提出了基于范围的签名过滤器及其结构连接算法,以提高结构连接的效率。然后,在范围签名过滤器的基础上,提出了带指针的签名过滤器以及相应的结构连接算法,有效地减少了参与连接的元素个数。最后,提出了一种优化的带指针的签名过滤器,以压缩指针的存储空间。实验结果表明,签名过滤技术可以极大地提高结构连接的效率。